MoreRSS

site iconKaiQu | 曲凯 | 42 章经修改

公众号:42章经。由xlab生成。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

KaiQu | 曲凯 | 42 章经的 RSS 预览

Figma 如何战胜 Adobe 等六篇 | 42章经 AI Newsletter

2025-10-26 21:40:00

原创 Celia 2025-10-26 21:40 北京

关于 Figma、RL、Plaud、产品惊喜感、Retention、Palantir FDE 等

AI、创投市场的信息越来越多,其中不乏很多很好的外文内容,但想找到好内容的筛选成本很高,且引进过来的中文版本大都编译得比较粗糙,所以我们决定来做一个过滤、筛选和提炼总结的工作,就有了这个 Newsletter 系列。

第一期内容,我们筛选了 300+ 篇文章和 100+ 期播客。因为 AI 始终无法达到我们的标准,所有内容都是人工筛选,也大都是纯手工古法制作。我们会尽量争取每两周更新一期,内容以观点和 insights 为主,争取能给大家带来启发。

以下,enjoy:

(一) Figma 是如何战胜 Adobe 的?

Figma 前一阵上市,吸引了很多的热度。

大家普遍的共识是,Figma 是靠「协作」取胜的,这当然是事实,但一个很有意思的问题是:协作这个点,大家都能看到,为什么资源和积累更厚的 Adobe 却做不到呢?

答案是,Adobe 不是没做「协作」的功能,而是他们对「协作」的理解和 Figma 有着本质的不同。

Adobe 的整个逻辑,是围绕着「文件」(比如 .psd 或 .ai 文件)这个原子单位来构建的。

Figma 的整个逻辑,是围绕着「元素」(比如一个按钮或一种样式)这个原子单位来构建的。

这个区别看起来很小,但决定了「协作」的形态完全不同。

在 Adobe 的世界里,「协作」更像是把一个本地文件传到云端,方便团队成员互相发送和下载,本质上还是文件的传递。

但在 Figma 的世界里,设计项目不再是一堆需要来回合并管理的文件。它变成了一个所有人都能实时进入的「画布」或「现场」。大家可以直接在同一个地方修改各自负责的元素,所有的修改都会被记录。这才是真正的「同步协作」。

Adobe 所面临的困境,其实是很多现有巨头都会重复遇到的问题。他们是基于过去的成功路径和业务包袱来做改变,很难彻底抛开原有的逻辑。这就导致他们的方案不是基于新技术的「原生」方案。

想要 Adobe 真正做到 Figma 那样,无异于重构整个公司,这种内部的阻力和难度,比从零做一家新公司还要大得多。

在类似的逻辑下,还有很多领域是技术改变了原有的「最小原子单位」,进而改变了这些领域生态系统的结构。比如音乐领域,专辑曾经是最小的原子单位,因为黑胶唱片和 CD 的架构迫使歌曲被捆绑在一起。但随着 MP3 的出现,原子单位变成了歌曲。这一简单的转变催生了全新的发行架构:Napster、iTunes,以及最终的 Spotify。

这对我们思考 AI 时代的机会也很有启发。我们也可以去想,AI 带来的最底层的改变是什么?

比如,它有没有让某个领域的「最小工作单位」发生变化?

它有没有让组织体系的性质发生变化?

又或者,它有没有让整个生态系统的结构发生变化?

找到这些更底层的改变,可能就是新机会的真正入口。

Reference:

(二) Online RL 开始跑通了?

我最近经常在想创业公司和模型本身竞争的终局是什么,到底什么才是应用公司真正的壁垒?类似 Cursor、Manus 这样的公司最终该如何和模型大厂竞争?

Cursor 最近发的一篇技术博客,也许提供了一个解答的思路。这篇文章讲的是它们怎么用在线强化学习来优化 Tab 这个代码补全功能的。

Tab 是 Cursor 的一大 killer feature,它会自动预测用户接下来要写的代码,用户只要按下 Tab 键就能自动输入。

为了让代码预测得更准,Cursor 直接把用户的每一次交互(接受 or 拒绝建议)都当成一次奖惩信号,灌回模型做实时 RL 训练。现在 Cursor 每 1.5-2h 就能上线一个新模型,建立起了一套高频的实时反馈循环。

而目前模型的建议量已经减少了 21%,但采纳率提升了 28%。

Graph showing the percentage improvement of the new Tab model

关于「实时训练」的畅想其实已经在 AI 圈存在了很久,但这回是真的第一次大规模跑通上线了,这或许预示着,AI 的数据飞轮要真正开始转起来了?

如果未来各种应用公司都可以用类似的方法来提升自身模型效果,是否会是一个很好的竞争手段?

Reference:

  • Online RL for Cursor Tab 

    http://i71i.com/19q9

(三) Plaud 教会我的事

The AI That Listens and Remembers For You (Plaud AI) - YouTube

我一直很好奇,一家录音笔公司,怎么就做成了全球最成功的 AI 硬件创业公司,2025 年的预计收入都达到了 2.5 亿美金。

所以最近我们跟 Plaud 中国区 CEO 莫子皓聊了聊,也看了创始人许高的几篇访谈,然后 get 了一些有意思的认知:

1)我觉得 Plaud 的成功核心验证了一件事情,就是 context 的价值。

他们早年一个重要的非共识判断是:Conversation is a form of intelligence(对话是智能的一种体现形式)。

对话承载了一个人多年的经验、偏好、痛点。但 99.99% 的人都没有把现实世界里的对话采集起来。这背后是一个巨大的金矿。

所以与其说 Plaud 是一个录音笔,不如说它是一个 context 收集器,它的一切设计都是围绕两个核心目的:一是在硬件上,如何更好地捕捉用户的 context;二是在软件上,如何最大化地分析和利用这些 context。

2)我印象最深的是,莫子皓在跟我们聊的时候,说了八遍「反过来」。

他喜欢「把一切反过来想」。

比如,他的思考原点不是 AI 如何服务人类,而是人类如何服务 AI。他相信 AI 的能力已经完全超越了人类,所以重要的是怎么给模型提供足够详尽、独家、个性化的 context,而 Plaud 在做的正好就是捕捉和利用用户 context,所以这是他加入 Plaud 的一个原因。

比如,他给 Plaud 加了一个新功能 —— Ask Plaud,但他来了个反向操作,不是人问 AI,而是 AI 问人。背后的逻辑是,既然现在 AI 能力已经超越绝大部分人类了,那为什么不能是 AI 主动点拨用户? (AI:我觉得你这个问题问得不好,我来问你几个问题)

比如,他们认为不仅是人类可以提示 AI 怎么分析一段对话内容,AI 也应该主动提示人类怎么分析一段对话内容。Plaud 内置了很多模板来挖掘对话中的隐含信息,比如它会根据对话内容自动推荐 2-3 个模板,告诉你可以从什么角度分析问题。其中有一些很有意思的,比如分析对话中话语权的流动,分析谈判中对方「虚张声势」的程度,分析面试过程中候选人是否有野心、有童年阴影、有言外之意等等。

(其实类似「反过来想」的思考方式,是很多伟大的商业创新的原点。比如拼多多是对「传统保险模式」的「反过来想」,无印良品是对「品牌 Logo 很重要」的「反过来想」,众筹平台是对「先生产再销售」的「反过来想」,ClassPass 是对「办了卡就只能去这家健身房」的「反过来想」...)

3)关于野心和品味

我对 Plaud 还有一个好奇点是,它给人一种比较明显的品牌感和世界第一的野心。

这对国内公司来讲并不常见。

那这种气质是怎么来的?

几条有趣的线索是:

① 许高之前有过三次失败的创业经历,在开启这次创业前,他设置了一些前提,其中一个是:要做就做世界第一的产品。

但这不来自于他的狂妄,而恰恰是来自于他的谨慎,他有一个残酷的观察:世界第二,往往只有第一名 80% 的性能,50% 的定价能力,和 10% 的盈利能力。

第一名能用更高的利润雇佣更好的人、做更好的研发,形成正循环。而第二名,很容易在追赶中和第三、四、五名陷入惨烈肉搏,最后被耗死。

所以,做不到世界第一,就干脆别做。

② 创业公司有两种模式:生存模式 vs 发展模式。公司在实现盈利之前,创始人脑子里想的都是“公司不要死掉”,这是生存模式。但 Plaud 很快跨越了这个节点,连续两年十倍增长、利润率极高,且没有投资人压力,所以整个团队的心态就进入了「发展模式」。大家开始思考 “我们有没有可能成为一家世界级的公司?” 这个心态的转变,会深刻地影响公司的战略、招聘和格局。

③ 可穿戴设备代表着一个人的身份和品味。尤其当用户群体是企业家、高管时,他们掏出的设备自然会成为一种社交语言。所以对 Plaud 来说,Taste 就是一切。比如他们在招聘时,工业设计没有找传统的 3C 电子工程师,而是找了奢侈品和珠宝行业的人;营销则专门找了来自 LV、Rimowa 的人才。

Reference:

  • Plaud 许高首次深度讲述:全球增速最快 AI 硬件,与一种创业美学|卫诗婕 商业漫谈 Jane's talk 

    http://i71i.com/1bh2

(四) 如何打造产品「惊喜感」?

再分享一期 Lenny 的播客,嘉宾 Nesrine Changuel 曾在 Spotify 和 Google 担任产品负责人。她在 Google 的 title 很有意思,叫「delight PM」,专门使产品让人有 Wow 的体验。

工作久了,她就琢磨出了一些方法,把 「打造惊喜感」 这件事拆解成了一套有迹可循的方法论。 

她首先给「Delight」下了个定义:Delight = 喜悦 (Joy) + 惊喜 (Surprise)。

那如何系统地打造 Delight?有三个抓手:

1) 超越预期: 给用户一些他们压根没想到的好处。比如,你用微软的 Edge 浏览器买东西,快付款时它不知道从哪儿自动找到了一个 15% 的折扣券,帮你白赚了一笔。

2) 预判需求:在用户开口之前,就想到他们可能需要什么。比如 Revolut 作为一个跨国转账 App,居然内置了卖 eSIM 卡的功能。因为他们知道自己的用户很多是国际商旅人士,有流量和通话的需求。

3) 消除阻力:想想用户在哪个环节最焦虑、最痛苦,然后用产品方案把这种负面情绪抹平。比如,Google Meet 团队就发现,大家之所以会「Zoom 疲劳」,一个很重要的原因是总在屏幕上盯着自己的脸看,这体验就像旁边有个人随时举着一面镜子,心理压力巨大。于是他们就开发了一个功能,让人能把自己的画面最小化,一下子就解脱了。

具体的执行流程,她也拆了四步:

第一步:重新定义用户分类。 她强调了一点,传统做产品,总喜欢按人口特征(这人是谁)或者行为(他干了什么)来区分用户,但这还不够。更有效的方法,是按动机来分。同样是打开 Spotify,有的人是想给自己的视频找个配乐(功能动机),有的人纯粹是为了排解孤独(个人情感动机),还有的人是为了转发分享,显示自己品味很好(社交情感动机)。

第二步:把动机转化为机会点。 识别出这些动机,尤其是情感层面的,再把它们变成产品可以下手的机会。

第三步:给方案分类,这里她把 「愉悦感」 分了三层:

  • 浅层愉悦 (Surface Delight),推荐占比 10%:只满足情感,不具备功能性。比如加州有一家酒店在泳池边安了部「冰棒热线」,拿起电话就能叫一根冰棒。很有趣,但用户不会因为它而订这家酒店。

Popsicle Hotline

  • 低度愉悦 (Low Delight),占比 50%:只满足功能,这是产品的基本盘,不多说。

  • 深度愉悦 (Deep Delight),占比 40%:同时满足功能和情感。比如 Spotify 的个性化歌单就是一个例子,它既能帮忙 「发现新歌」(功能),又时不时让人咯噔一下,「靠,它懂我!」(情感)。

第四步:用清单检查,避免好心办坏事。有时候,你眼里的惊喜,可能是别人眼里的冒犯。当年,法国外卖软件 Deliveroo 在母亲节那天,给用户发了个「妈妈的未接来电」形式的推送。本意是想提醒大家别忘了关心妈妈,结果被骂得很惨。因为不是每个人的妈妈都还在身边,这个「惊喜」对很多人来说,是在伤口上撒盐。

接下来,上面的技巧只解决了单点执行的问题,更深一层的问题是,如何让「创造惊喜」从一种个人技巧,变成一种可持续的组织能力?

Nesrine 也给了一些方法,比如:

  • 可以像 Google 一样,把 Delight 明确写进产品战略里,大家在做规划时不得不想着它。

  • 可以给「惊喜感」原则起个内部代号,搞得酷一点。比如 Dropbox 有个产品原则叫「纸杯蛋糕」(Cupcake),Snowflake 有个叫「超级英雄」(Superhero),本质上都在提醒团队:多做一点让人眼前一亮的事情。

  • 还可以把它变成一个日常活动。比如,Spotify 每月都会有「Hack Days」,年底还有「Hack Week」,鼓励大家跳出条条框框去创新。

最后,她还提到了一个 2B 的点,我觉得特别有风骨:

在 B 端市场,信任,是最高级的愉悦感。

比如社交媒体管理工具 Buffer,他们发现有大概 2% 的用户,长期不活跃但还在傻傻地付钱,于是 Buffer 主动给这些人发邮件说:「我们看你很久没用了,要不要我们帮你取消订阅,顺便把钱退你?」

这操作非常反商业直觉,简直是自断财路,但长期看,这种真诚反而把用户的心给锁死了,用户黏性更高了 (所以说,最高级的套路就是真诚!格局打开)。

Reference:

  • A 4-step framework for building delightful products | Lenny's Podcast 

    http://i71i.com/xg88

  • The Power of Emotional Delight in Product Design with Dr. Nesrine Changuel | Agile Mentors Podcast

    http://i71i.com/xgel

  • Nesrine Changuel - We Should All Prioritise Product Delight | One Knight in Product 

    http://i71i.com/xg8u

(五) 如何更科学地评估 AI 产品的留存率?

A16Z 上个月连发了两篇文章,讨论 AI 公司的留存问题。

起因是他们发现,现在很多 AI 公司根本不知道怎么衡量自己的留存率。

AI 产品很多是面向 Prosumer 的,既不能按 ToC 算,也没法套 SaaS 的模版。更头疼的是,AI 产品里有太多尝鲜的「游客」,早期的留存数据没有太大意义。

于是 A16Z 分析了数百个 AI 产品的数据,给了一个新的分水岭:M3(第三个月)。

他们发现,绝大多数 AI 产品的留存率会从 M3 开始变得平稳。这个时候,尝鲜的游客基本都走光了,留下来的才是产品真正的用户。所以,想知道真实的用户留存情况,最好别从第一个月开始看,把基准换到 M3,更能反映产品真实的 PMF。

顺着这个思路,算 LTV/CAC 也最好换个锚点,单独区分一下 M3 这批用户的 LTV/CAC。这才能看清你的市场花费到底换来了多少「有效用户」。

并且,基于 M3 这个新基准,他们还给出了一个新的北极星指标:M12/M3。也就是用第 12 个月的留存用户数除以第 3 个月的留存用户数,看那些熬过「游客期」的用户,在一年后还剩多少。这最终说明了你产品长期留存的质量。

  • 如果 M12/M3>85%,说明你跑赢了市场平均线。

  • 如果 M12/M3>95%,属于 Top 25% 。

  • 如果 M12/M3>100%,就是顶流水平。

Wait,看到这我愣了一下,留存率还能超过 100%?用户还会自我分裂吗?

这在移动互联网时代确实不大可能,但在 AI 时代,很多公司都出现了这种「微笑留存曲线」。因为模型在不断进化,前两个月的流失用户,可能会因为产品变强了而重新回来。最典型的例子就是 ChatGPT,比如下图是 ChatGPT 在不同时期的月留存曲线:

这还只是在谈用户留存。如果看收入留存,超过 100% 的 AI 公司更多。A16Z 的另一篇文章进一步解释了这个问题,他们认为,这背后有两个关键变化:

1) 定价模式发生了改变,从移动互联网时期的订阅制或广告模式,更多转向了基于使用量或者实际结果的收费模式,所以随着 AI 进步,用量就会增加,收入就会增长。

2) AI 天然打通了一条从个人用户到企业客户的渗透路径,比如 ChatGPT、Gamma,很多都是员工自己用着爽,然后就忍不住在工作群里分享,自然而然地就渗透进了公司。一旦同事们开始用,公司就有了付费的理由,从而能够获得更大的企业预算支出。

所以,AI 其实很大程度上改变了 ToC 产品的商业模式。

基于这个逻辑,A16Z 给 AI 创业者提了三点建议,帮助大家进一步提高产品收入:

第一,不要只搞简单的订阅制,现在越来越多的 AI 工具开始提供不同等级的订阅套餐,让用户在基础额度用完后,再单独购买 credits 来继续使用。这样一来,收入就和用户的「使用深度」挂钩,收入天花板会被打开。

第二,尽早加入「团队协作」功能。这是承接上面说的「自下而上渗透」的关键。哪怕产品还在 MVP 阶段,也要加上最基础的团队功能(比如团队文件夹、协作画布、安全验证)。 有了这些,你就能顺理成章地向价格不敏感的企业客户加收溢价(比如 ChatGPT 个人版 20 美元,企业版会收到 25-60 美元)。A16Z 甚至建议,可以把个人版当获客成本,哪怕亏钱也要做,目的就是为了抢占企业市场。Notion 在 2020 年就采用了这种策略,为个人用户提供无限的免费页面,同时对协作功能进行激进收费,这直接带动了它当年的爆发性增长。

第三,从 Day 1 就开始考虑进军 ToB 业务。

如果你的 ToC 产品也可以被企业用户采用,那就应该考虑在 1-2 年内就引进一个 ToB 的销售负责人。如果不去迅速抢占 B 端市场,很可能就会在激烈的竞争中丢掉最大的收入来源。

Reference:

(六) Palantir 的 FDE 模式,为什么突然火了?

FDE 最近有点小火。

Bob McGrew 有一期很好的播客,把这个模式讲透了。

先稍微介绍一下 Bob McGrew,他曾经是 Palantir 的高管,后来成了 OpenAI 的首席研究官,带队开发了 ChatGPT 和 GPT-4。

他在播客里提到一个很有趣的现象:他去参加 AI 创业者大会,结果没人问他 ChatGPT 的事,所有人都围着他,只想搞清楚 Palantir 的 Forward Deployed Engineer (FDE) 模式到底是怎么玩的。现在 YC 的招聘网站上,有超过 100 家 AI Agent 公司都在招 FDE,连 OpenAI 自己也组建了 FDE 团队来服务大客户。

那要理解这个模式,首先要搞清楚 FDE 到底是干嘛的。

简单来说,FDE 就是一个驻扎在客户现场的工程师,负责填补「你的产品能做什么」和「客户到底需要什么」之间的巨大鸿沟。

我听完第一反应是,这不就是咨询吗?但深究下去,会发现两者的商业逻辑并不一样。咨询模式卖的是「人时」,按小时或按项目收费。而 FDE 模式的核心是「产品探索」。FDE 在一线用定制化的方式满足客户需求,但这只是手段。目的是把这些一线的需求和解法反馈给后方,产品团队再将这些具体的解决方案抽象、沉淀,变成通用的产品功能。所以这个模式在初期往往是亏钱的,但随着产品在一次次实战中变得越来越强大,利润率就会逐渐转正。

Palantir 的 FDE 团队里,有两个关键角色:Echo 和 Delta。

  • Echo 团队更像「咨询分析师」,他们通常来自客户所在的行业,比如前 CIA 雇员、前金融分析师。他们的任务是深入客户的业务流程,挖掘出用户真正的痛点,同时负责维护客户关系。

  • Delta 团队则是「部署工程师」,负责快速写代码,把 Echo 的想法变成一个个能跑起来的原型。

这种分工,也决定了他们非常独特的招人标准。

  • 招 Echo,他们喜欢找「叛徒」——那些来自客户行业内部,但又深刻理解现有模式不行、渴望变革的人。

  • Delta 则要找擅长快速原型开发的人,而不是追求完美代码的工匠。能快速交付价值是第一位的,代码以后可能要重写甚至扔掉。

一个顶级的 FDE,身上往往有创始人的影子。他们需要独立面对高度不确定的环境,自己定义问题,然后利用手头的「产品杠杆」去创造价值。这种经历本身就是极佳的创业训练,这也是为什么 Palantir 能走出大量的创业公司。

而这种模式对后方的产品经理也提出了极高的要求。他必须具备超强的「抽象能力」,能从客户 A 的一个具体需求里,提炼出能满足未来 10 个客户的通用解决方案。Palantir 最早的关系图谱设计,就是把「人」、「钱」这些具体概念抽象成了通用的「对象」和「关系」,这才让一套系统能够灵活地服务于反恐、金融、医疗等完全不同的领域。

另外,这期播客还分享了几个 FDE 模式下常踩的坑:

1) 你必须主动承担风险。很多大企业客户内部经历过太多失败的项目,他们既不相信自己,也不相信你这个小公司能搞定事情。所以,创业公司初期应该主动承担所有风险,比如承诺「没效果就退款」,用这种方式来建立信任,换取进入客户内部的机会。

2) 警惕 FDE 沦为外包。 FDE 最大的风险之一,就是团队只是在完成客户指派的任务,而不是在主动解决对客户业务最有价值的问题。客户让你解决的,往往是他们觉得最容易让你做的,而不是对他们最重要的。不过,一旦你成功解决了客户的第一个核心问题,你就能赢得信任,并有机会发现和解决企业内部其他更有价值的问题。

3) 搞定客户的 CEO 至关重要。 FDE 模式的实施会牵动客户内部的很多流程和部门,如果没有最高管理层的支持,项目根本推不下去。Palantir 就只做 CEO 的 Top 5 concerns,否则宁可不做。

4) FDE 与产品团队的张力是必要的。FDE 的目的是快速解决眼前这一个客户的特定问题,这使得他们倾向于采用最简单的路径,而后方产品团队则要考虑通用性,所以两个团队的沟通过程通常极其痛苦,但这种内在的矛盾和张力是正常的,甚至是必要的。

铺垫了这么多,那到底什么时候该用 FDE 模式?

Bob 的答案来了个 180 度转弯:其实,能不用就别用。

如果你已经找到了 PMF,可以像传统 SaaS 一样标准化地扩张,那你简直是天选之子,千万别碰 FDE。FDE 只适用于那些产品和市场都极度不明确,需要大量共同探索的场景。

但这也就解释了,为什么 FDE 在今天的 Agent 时代突然迎来了一次大爆发。

在传统 SaaS 里,公司会刻意和客户保持距离,因为每个客户付的钱不多,想要规模化盈利就不能做得太重。

但在 AI 时代,游戏规则变了:

一方面,因为 AI 能完全替代人力,所以合同金额可以非常大(几百万甚至上亿),就算投入一支团队深度嵌入客户现场,也是值得的;

另一方面,AI 产品形态高度不确定,客户自己也说不清楚要什么,很多真正的痛点和解决方案必须通过在一线共创才能浮现。

所以,如果做个总结的话,FDE 模式的精髓,就是「doing things that don't scale at scale」 (规模化地做那些不规模的事)。这是 YC 经典建议「做不能规模化的事」的进阶版,也是为什么这个模式如此之「重」,但又如此强大的原因。

Reference:

阅读原文

跳转微信打开

一个原教旨主义产品经理眼中的世界|42章经

2025-10-20 22:07:00

原创 曲凯 2025-10-20 22:07 北京

诶?嗯!哎呦喂?!卧槽!!

本期播客对谈原文约 30000 字,本文经过删减整理后约 10500 字。

曲凯:今天我们非常荣幸请到了范皓宇。皓宇是理想的高级副总裁,应该说是目前理想最核心决策层的几个人之一。

我们今天的目标是聊得纯粹一些,不会谈太多关于理想、关于车的具体问题,而是会聊聊产品方法论,甚至是一些成长和哲学相关的话题。

请皓宇先做个自我介绍吧。

范皓宇:大家好,我是皓宇,做产品和设计这个行当已经 25 年了。

从大学开始,我先后做过手机、游戏、自媒体、操作系统。后来赶上汽车的崛起,也做过一些车的项目。再往后因为想回北京,就加入了理想,负责产品和用户体验相关的工作。

曲凯:你提到的一个点很有意思——你是因为想来北京,所以去了理想,而不是因为想去理想所以来了北京?

范皓宇:对。当时我特别喜欢北京,因为这个地方承载着很多历史,也非常神奇、多元。

你可以在这里遇到各种有趣的人,比如乐手、文青。每个人都带着理想来到这个战场,为自己想做的事情而战斗。

曲凯:但这几年你觉得北京有变化吗?我肉眼可见越来越多人离开北京。

范皓宇:确实。最近几年,尤其是疫情前后,北京已经不是 2013 年左右那种充满斗志的状态了。我有很多老朋友也离开了。

一方面,现在的发展确实没以前快了。增长快的时候,很多问题都会被掩盖,而如今大家会担心看不清未来。

另一方面,当空间收窄后,很多人的安全感也大不如前。缺乏安全感时,大家一边希望用户能消费升级,大环境却在消费降级。这种矛盾,就会让人陷入焦虑。

当大家的担忧和焦虑超过某个阈值之后,就会有人选择离开这个让自己很难受的城市。

但其实,也总有人在不断涌入北京。

每年开学季,你总能在校园门口看到拎着行李箱的年轻人。他们朝气蓬勃地冲进这座城市,想创造一些新的东西、实现自己的理想。那股冲劲,恰如我们当年。

所以北京依然充满活力。它就像纽约,庞大、多元,总能带来新的可能性。

而且,虽然现在有各种各样的问题,但我觉得我们仍然站在一片沃土之上。

因为中国的供应链极其强大,且最早一批互联网人都很原教旨主义,他们优先考虑的不是变现和增长,而是怎样让人与人之间的连接更简单、更轻松,怎样让这个世界更平权、更美好。

凡是经历过那波增长的人,哪怕如今已经四五十岁,骨子里依然有强烈的理想主义。他们一定会努力复现曾经的那种增长。那种精气神,是改革开放和 2000 年初那波浪潮留给我们的奇迹。

前两天我还和朋友聊天,说我其实特别想拍一部片子,去呈现那个波澜壮阔的年代中的各种故事。

曲凯:我以前也常想,国内其实也能拍出像《硅谷》那样的剧。

范皓宇:是。我觉得中国过去几十年的发展,可以分成三层。

最底层是城市化。比如我们父母那代人,很多人从农村进入城市,成为了工人。

第二层是供应链。从台湾省、东南沿海,到日本、韩国,再到菲律宾、泰国,这一圈构成了人类历史上最强、也最不可或缺的生产制造体系和供应链平台。

第三层,就是浮在冰面上的科技与互联网。

这三层并行发展,过程中也带来了巨大的社会流动。

你能看到,村里的同学去了沿海工厂,沿海的小企业主在国内外奔波,海外的科技人才不断回流。再加上国内大学教育的普及,一批人又迅速进入了互联网行业。

这种多向流动,创造了巨大的价值和变化。

曲凯:对,所以在不同的大环境中,每个人做出的选择都有自己的必然性。

但我在想,你过去这些年的职业经历,其实和很多人不太一样。大多数人会沿着一条主线走下去,而你做过的工作好像有某种内在的共性,可看起来却挺杂、挺跳跃。

范皓宇:对,杂家哈哈,因为好奇心重吧。

但就像你说的,我的工作经历本质上是同构的。

我是做设计出身的,所以我总在观察和收集信息,而不是靠逻辑推导来做事。

对我来说,这条主线一直没变:

做设计、做产品,本质就是资源配置。

资源配置首先要看你掌握了多少元素。越强的人,越能观察和积累到更多的元素。

其次要看你如何组合这些元素,形成一个完整、可理解、既有用又有趣的东西。

这里可以分享一个我做过的最喜欢的设计。

我大三时,给一家军工企业的保密办公室做过一个指纹识别仪。那时候我发现他们的电脑桌非常乱,经常找不到那个设备,于是我把它做成了不倒翁的形状。如果有人翻找文件,一碰到它,它就会自己弹起来。后来老板还跟我说,他们经常拿那个东西玩,因为真的很好玩。

我之所以会做出这样的设计,是因为我先观察到了他们工作环境中的混乱和无趣,才有了后面的呈现。

我经常跟人说,其实我是个「原教旨的产品经理」。

什么叫「原教旨的产品经理」?就是会通过观察—理解—组合—压缩的方式,找到达成目标的最优解。其中最耗时、也最关键的,就是压缩这一步。

但现在很多人一味求快,觉得差不多就可以了,得赶紧去 AB test、跑 PMF、做 scaling。

可我觉得,思考的过程才最值得花时间。它也是我至今仍然在工作的原因,因为那个过程太有趣了,就像破案一样。你看很多侦探片,侦探都会贴满一整块黑板的线索,在嫌犯和证据之间不停连线。

其实做产品也类似,只不过产品没有唯一解。不同的元素会在脑子里不断连接,像一个动态的模型,最终会导出非常不一样的结果。

说起来,我还蛮喜欢看《名侦探柯南》的。虽然剧情有点套路,但它总会把一些碎片整合在一起,最终还原一个令人有些意外的真相。

而那些意外,其实正是我们期待的惊喜。

我们为什么想看电影?为什么想试用新产品?为什么撕开一本书的包装时,会想先闻一下里面的味道?其实都是在寻找那一点点惊喜。

这些惊喜,是所有创造者共同努力的结果,也是我们这些年一直在追求的方向。

曲凯:那你怎么看「商业价值高的刚需」和「有趣」之间的平衡?

比如有的公司做 AB Test,就是图实用。功能测完后,大家也不知道为什么它好用,甚至可能觉得它更丑了,但数据更好,那就用它。

范皓宇:首先要看目的。如果目标是增长,那就别谈别的。

但只看增长会带来一个问题:频率会越来越高。也就是说,你迭代新版本、用户接受新版本的周期都在不断缩短。这样的高频变化,反而会带来更强的焦虑。

举个例子。我之前和一些平台的人聊天,问他们现在顶级博主的生活状态,到底是非常 chill、实现了 work-life balance,还是非常忙碌和焦虑?

得到的答案是:大多数人都在忙碌且焦虑的状态中。

因为这些博主要时刻盯着数据,想尽办法讨好用户、吸引注意力,而这些行为的节奏只会越来越快。用户在高频刺激和快速满足之下,久而久之也会麻木。麻木之后,创作者又得加大刺激、追求差异化。

这样恶性循环下去,创作者很累,用户也疲惫。

如果目标不仅是增长,而是希望产品能被用户真正感受到,那就不一样了。

就像拍电影。如果只图票房,那就去拍爆款题材、请大明星。但你会发现,最近票房好的电影,往往没有很强的阵容,而是在认真讲故事。比如前阵子的《浪浪山的小妖怪》,之所以能赢得观众的投票,就是因为它能引发共鸣。

所以我觉得现在的用户也分成两类,一拨人追求新鲜刺激,另一拨人则想认真地享受一个产品。

那我们做产品,必须先做到「有用」,否则就会无人问津。

但「有用」只是敲门砖。

衡量一个产品的好坏,关键要看它能否陪伴用户一段时间。这段时间的长短,就取决于它的「有趣」程度。

而当一个产品陪伴用户足够久之后,就会被用户内化。这可能听起来有点抽象,我举个例子。

去年我去英国设计博物馆,门口有个很大的装置,上面循环着三个单词:

Maker、User、Designer。

我看了很久,突然被击中了。

一百年前,这三个词其实是一个人。比如我需要一把锤子,于是我自己设计、自己制造、自己使用。

后来因为工业化的发展,Maker 和 User 分离了,出现了福特这样的制造企业。

再到后来,设计兴起,以苹果为代表的公司又把 Designer 从 Maker 中分离出来。

于是,Maker、User、Designer 成了三个独立的主体。

在这种情况下,用户其实很无助,因为 Designer 和 Maker 像神一样,他们给什么,用户就只能用什么。

但现在,User 崛起,成为了这三者中最核心的角色。只有被用户选择的东西才是好的。于是 Maker 和 Designer 走下神坛,变成了用户要啥他们弄啥。

接着又出现了新的变量:AI。

AI 可能会带来怎样的改变呢?

举个例子。想象一下,五十年前你要吃个包子,得查黄页、打电话、做恨不得 100 件事,最后买到的包子可能还不合口味。而现在,你只需要打开美团,几步就能吃到想要的包子。再往后发展,也许五年、十年后,你想吃包子的时候,AI 能自动理解这个场景,把你喜欢的包子送到你面前。

我认为这种改变一定会发生,也意味着未来的产品会走向个体化。

我们之所以需要设计,是因为目前无法做到点对点的服务,所以我们要找用户画像,从一群人的需求中提取最大公约数,再做成产品。

但每个人的需求都不一样。AI 的出现,可能就能很好地观察并理解每个用户的不同诉求,为每个人提供个性化服务。

到那时,Maker、User、Designer 之外,很可能还会出现一个类似于代理的角色。因为人与人之间难免有摩擦,而 AI 会全身心地为你服务,所以它可能成为与你连接最顺畅、你最信任的存在。

我觉得那个未来很美好,也将是之后产品设计最大的机会。

曲凯:那你做了 20 多年的产品,观察下来,用户大概发生了哪些变化?

现在大家经常能看到非常分化的人群,也有很多两极化的讨论。那在这样的环境下,到底该怎么做好一个大众产品?

范皓宇:用户这个词特别大,就像人民一样。中国的用户分层非常复杂。

我记得一两年前,《人民日报》做过一个几万人的调研,结果发现有 80% 的参与者都认为自己是弱势群体,其中不乏企业高管和领导。

其实现在很多人在「有用」的层面已经被过度供给了。之所以还有那么多人觉得自己弱势,是因为在「有趣」的层面,他们无比贫瘠,觉得自己没有被真正理解,也没有被关怀。

这其实是典型的一二线城市画像。

一二线城市的人,总觉得压力大、节奏快、焦虑多、没有自己的时间。他们的价值似乎只存在于完成了什么 KPI、解决了什么问题,每个人都像一块块孤立无援的电池,要不断在各自的岗位上发电。因此,他们缺乏安全感,也容易陷入虚无。

这里推荐大家去读一本书,叫《中国社会分层》。你会发现,三四线城市的人是另一种状态,他们依然生活在社会关系中,人与人之间有很多连接,但与之相伴的,是上限被锁死的无力感。

再往下沉一层,还有大量生活在城乡的人群。他们可能更为绝望,因为资源供给不足。

所以今天,如果要做大众产品,就要同时考虑两件事,一是给一二线城市的人更多被看见、被认可的可能性;二是让下沉市场的人也能获得一线城市的产品与体验。

我前两天看《十三邀》,里面许倬云先生说,中国现在挺好的,因为很多人已经不再会因为饥饿而丧失尊严。大家觉得自由、公平是理所当然的。这说明人们的基本需求已经得到满足。

但也正因为如此,人们的需求和价值判断变得分散,因为不同人群所处的状态完全不同。

曲凯:是。我自己也有一些感受。

一个是,当经济不太好的时候,好像大家会更关注实际使用价值。像我爸妈那一代人,可能觉得花 100 块钱买披萨,和花 2 块钱买个馒头夹肉是一样的,因为他们会把披萨拆解成面粉加肉,觉得完全不值那么多钱。

另外我在想,是不是用户需求也有周期性的浪潮?就像时尚潮流一样,每隔十几年、二十年就会出现一波复古风。

而且用户心里似乎也都有一条准绳。比如大家都知道每天刷太久短视频不好,但现在很多公司还在想尽办法让人多刷。

那会不会总有一天会到达一个临界点,大家突然醒悟,觉得这件事就是错的?然后新的浪潮出现,把我们重新拉回到一个更健康、更好的状态。

范皓宇:我有一点不是特别认同。我们父母那一辈也有他们的情绪价值和奢侈品,只是意义感不同而已。

在匮乏的年代,有不匮乏的玩法,在过度供给的年代,也有寡淡的玩法。

曲凯:说得好。

范皓宇:但我又非常认同你刚才说的一句话,就是用户的需求一定是循环的,「the holy order will be back」。

我们这代人的下半身,其实非常遵循规训和秩序;但因为中国入世等大事件,上半身又是消费主义的,想通过「我消费什么」来证明「我是什么」。

下半身的秩序感根深蒂固,而上半身的消费偏好一直在酝酿和变化。

最明显的标志就是,人们对好电影的标准,和十年前已经完全不同了。这意味着大众的审美和品味在提升。

不仅是电影,大家对产品的品味也在提升。

我们做出的产品越来越有质感,比如中国新能源汽车性价比高、体验好、品质强。用户也开始讨论品味这件事,我前几天路过健身房,还听到两个健身大哥在聊哪款车更有品味。

所以虽然现在很多人说经济下行,但我反而很乐观。

因为中国人对美好生活的向往,以及愿意为之努力的干劲,是刻在骨子里的。它不会被磨灭,反而始终散发着活力和生机。

如果你能做出一些东西,让他们觉得生活变得更美好,那机会老大了啊。

而且中国 A 股有那么多真正有价值的企业,价格却被低估,这里面存在巨大的利差机会。国人想要做点什么出来的那股精气神,也完全不一样。

总之,我对于中国人特别有信心。

曲凯:对。我今天还听人讲了一个点,就是在全世界这么多国家里,几乎只有和中国等少数国家的人聊天时,你能在对方眼里看到光,看到那种努力的劲儿。

范皓宇:没错,就是这种感觉,我们就是要干!

有时候我去硅谷跟人聊天,很多人聊着聊着都会被我点着哈哈。

在国内,我们真的是想改天辟地。拿到新工具,也想立刻把它用起来,因为有太多值得去做的事了。

而且我真的觉得,在中国做产品是一件很幸福的事情。因为你面对的是这样一群有血有肉的中国人:他们努力工作,白天可能在环境不太好的办公室上班;受限于房价,晚上回到家也许条件也一般。

但如果我们能为他们创造出一些好产品,让他们获得鼓励,然后生出创造动力,那正反馈就产生了。

所以我觉得未来就是那四个字母:HOPE。

曲凯:是。你前面有提到一个词叫品味,你怎么理解它?

范皓宇:品味是一种区隔。

人需要区隔,就像产品需要差异化一样。

自认为没有品位的人,会把自己划分为「实用主义」。而标榜自己很有品位的人,其实就是给自己贴上了「懂生活」、「懂设计」、「懂品质」的标签。

所以品味,本质上只是自我虚实标签的一部分。

很多人都在供给品味,而这些品味背后,其实是风格。那风格是怎么形成的?

通过内容生产。

比如小红书上有各种各样的博主,每个人都在分享各自领域的内容,从而彰显自己的品味。

而作为用户,我每消费一次某个内容,其实也是在表达一次自己的品味。

曲凯:那当数据和你的品味不一致时,你会怎么选?

范皓宇:相信自己的感受。

数据本质也是主观的。你用什么标准去收集、怎样去分类,都包含主观判断。

而感受,是最真实、最直接的东西。

所以数据只是个拐杖,真要走路,还是得靠你的两条腿。

举个例子。一个好厨师做饭时,如果察觉到味道不对,就会立刻调整;而一个差厨师,可能每一步都照着菜谱执行,最后还是糊了锅。

那怎么让感受更准?

就是要真正去和用户交流。

比如我微信里有很多用户,时常会聊聊天。聊着聊着,我就能察觉出某个产品可能哪里不对。那种体感非常强,因为你身在其中,而不是干盯着指标和数据。

曲凯:但有没有一种可能,你的品味告诉你该往左走,而所有数据都在往右走?

范皓宇:那我就往左走。

就像为什么今天我会和你录这期播客,是因为我在飞机上和你坐了一路,下飞机又聊了一会儿,觉得你这个人很有趣。于是我先做了一个判断:值得录。之后,我再给这个判断找理由就好了。

所以真正重要的是判断。

判断不是一次性的,而是像强化学习,每次判断之后都有反馈,你可以再根据反馈调整判断。如此循环,就会形成一个判断序列,而这个序列决定了你是谁。

数据当然会对这个序列产生影响,但只要你清楚自己最终想要什么,就会始终有非常明确的目标感。

曲凯:这让我想起来《老友记》里,大概有个情节是 Ross 列了一堆要选和不要选 Rachel 的理由,但最后发现,这些理由其实都没意义,因为他心里早就有了答案。

范皓宇:对。先有答案,剩下的只是证明题。

曲凯:但这里我有个问题。因为你的品味和主观判断有可能超前于市场、短期内就是得不到数据反馈。

那如果你的产品在某个评判标准里是对的,但数据就是不达预期,该怎么办?

范皓宇:接受这种结果。

人最怕摇摆、犹豫、踌躇。真正的强者有勇气和信仰,能在一个方向上一直坚持。

前两天有人问我:你们现在压力也挺大,外部环境也在变化,但你还在做各种新东西,到底怎么想的?

我只回答了三个字:意志力。

我之所以有这样的意志力,是因为我有自己的信仰。如果一个人没有信仰,Ta 的选择就会不停震荡,最终什么也沉淀不下,只是虚度时间。

而长期价值的艺术,也是信仰的艺术。

我的信仰,就是一定要去创造新的、了不起的、美好的东西,能让很多人产生共鸣,能带给很多人欢笑。

曲凯:但我觉得这里又分两种情况。

一种是,你非常笃定自己做的东西就是好,就算暂时没人认可,未来也会被认可,就像很多以前的艺术家一样。

另一种是,你对好坏的判断,取决于是否能引起你刚刚说的一个词,叫共鸣,或者说是别人的反馈。

你是哪一种?

范皓宇:都有。

在实操层面,首先你必须得是个实用主义者,否则就不配做个理想主义者。

因为现实是,我们生活在一个商业化、消费主义的世界里。如果你只是一味理想主义,就要当堂吉诃德冲向那个风车,那就是送死。

堂吉诃德固然浪漫、可歌可泣,但从实证主义角度看,我们也得讲科学、讲逻辑。

也正因为要同时兼顾理想主义和实用主义,所以会有矛盾和纠结。前者代表我们对真、善、美的追求,后者则是我们好好活下去的基础。

你得先足够「自私」,才能去帮助别人。如果你自己每天都活在苦难之中,又怎么可能去帮别人呢?

曲凯:我同意。没有实用主义的理想主义,就像空中楼阁。

范皓宇:对。所以我们当然会考虑产品当下的销量和用户反馈,但同时也要考虑它是否真的有意义、有没有长期价值。

就像我一开始说的,做产品是一个极其综合、复杂的过程。

你不能只满足 1、2、3 条需求,而是要把你观察到的无数个元素放在一起,经过极度压缩,才有可能创造出一个真正有意思的东西。

所以做产品就得「既要、又要、也要」。

我既要它性价比高,又要它能把当下的技术发挥到极致,同时还要易操作、能让用户觉得自己变得更优秀。

做出尽量周全的产品,才是产品设计的终极价值和意义。

曲凯:但当公司上市后,产品的短期数据会直接影响股价。这会让你的行为变形吗?

范皓宇:今天我要来录这期播客,不管天气怎样,我都会到达。同样,只要目标是坚定的,那无论如何,我都一定会抵达那个目的地。

曲凯:你这种精神品质,是先天的还是后天形成的?

范皓宇:是反复磨练出来的。

我刚到北京的时候是个 nobody,唯一能靠得住的就是意志力。

有时候我面试校招生,就像看到了二十年前的自己。那时候我们刚毕业,就像离弦的孤箭,充满干劲,一往无前。虽然一路上会遇到阻力、压力,甚至迷茫,但越是这样,越会在风阻中更坚定目标,向前、向前、再向前。

前两天我和许知远聊了两个半小时。聊完他说,我简直是个纯正的理想主义者,太文艺了。

曲凯:但我反而觉得不是诶。我觉得你说的很多东西都是既实干又理想。如果你只有一个目标,其实不需要意志力;反倒是在两边不断综合的时候,才最需要意志力。

范皓宇:还真挺厉害,你说得特别对。

现实与我想创造的世界之间,存在一个 Delta。所以我需要一手搭着现实,一手搭着理想,用尽力量去拉近它们,让我想象中的美好,最终在现实中呈现出来。

曲凯:是。你做了二十多年的产品,既做过软件,也做过硬件。我理解硬件的周期很长、改动难,那你实际做下来,觉得软硬件产品有什么区别?

范皓宇:本质上没太大区别。

软件架构一旦确定,很多事也改不了。特别是当软件上线后,只要形成一定的用户习惯,哪怕之前设计错了,也很难再动。而硬件每迭代一版,用户反而会默认需要适应一阵。

因为软件就像家里的物件,不能轻易乱动,而硬件更像房子本身。

曲凯:那你和用户打交道二十多年,总结下来,用户的需求到底是什么?

范皓宇:谈到用户需求,首先你得对用户有个假设。

比如拍电影,你得先预设观众是想笑、想思考,还是想看《阿凡达》那样的奇观。

但你不可能做出一个让所有人都满意的东西,所以对用户的假设,最终取决于你自己的表达。只要你有想表达的东西,就一定会有对应的用户。

怎么确定这一点呢?

就需要你带着假设去印证。你可以去问、去观察。如果用户完全不接受,那就改;如果他们接受了,就继续调优。

当你发现假设成立,再往下,就是想办法让更多人知道、产生收益,这样才能覆盖自己的生活成本,从而继续创造新的假设。

所以理解用户需求,本质上就是一个不断提出假设、反复验证的过程。

做产品有时候还挺孤独的,每天都要做很多假设。可能你冒出了 1000 个泡泡,999 个都会破掉,只有 1 个能长成真正的产品。你每天要做的事,就是顶住泡泡不断破裂的挫败感,然后坚持冒出新的泡泡。

在这个过程中,你得不断走近用户。

我以前做游戏时,有个术语叫 Level of Detail —— 离你远的东西自然是模糊的,离你近的才清晰。

做产品也是一样。你想为远处的用户提供服务,就得一点点靠近他们。

而我们和用户之间,大致存在三种关系:

第一种,我们是「神」,创造了东西,用户只能俯首使用;

第二种,我们是「仆」,用户要什么就给什么,不论对错;

但我更喜欢第三种——「友」,也就是能平等沟通。这样用户会觉得有所收获,而不是被规训或被讨好。

曲凯:那你有没有总结过自己的产品设计哲学?

范皓宇:产品设计其实是一个汤汤水水的事,如果它能用结构化的公式去做,也就不太需要这个岗位了。

但就像模型一样,产品设计也有数据集、技术架构和评测集。

这里我分享下评测集吧。一个好产品,在用户那里通常会出现四个声音。

第一个声音:诶。当一个产品与众不同、让人眼前一亮时,你会忍不住走近它,说一声“诶?”。

第二个声音:嗯。比如你买到新 iPhone 的那天晚上,彻夜装应用,体验很棒,你会说,“嗯!”

第三个声音:哎呦喂。当你用了一段时间一个产品,突然发现了某个隐藏功能,很惊喜,就会觉得,“哎呦喂?!”

最后一个声音:卧槽。这个声音会出现在一个产品生命周期的末尾。当你换上新 iPhone,连上 WiFi,过一会就感叹一句,“卧槽,全来了”。

如果能让用户发出这四个声音,那你就是神。能做到前三个,已经非常厉害;做到两个,就能大卖;做到一个,至少就能卖了。但连第一个都没做到,那可能就卖不出去。

这个评测集,其实对应着一个产品完整的生命周期。

曲凯:明白。你前面说过,做产品要既「有用」又「有趣」。但「有用」有理性的衡量指标,而「有趣」好像很难量化。那你怎么判断一个东西到底有没有趣?「有趣」的程度能比较吗?

范皓宇:首先,有趣不是被设计出来的,而是产品被使用之后自然产生的。这个过程不可逆,就像真空中就是会凭空生出电子一样。

有趣也不可比。比如打火机的功能就是打火,但形态千奇百怪,有能转的,有能翻的,有电子的。这没什么高下之分,因为人就是会用各种方式去把玩自己的打火机。

所以我觉得,最根本问题,是你想做一个有用的人,还是一个有趣的人?

如果你有用但无趣,那会很悲哀;如果你没用但有趣,那也许会很逍遥。

曲凯:但是是缺乏物质基础的逍遥(笑)。

范皓宇:嗯…对,物质这事咱回头再聊哈哈。我想说的是,当一个物体离人近了,人就会把它变得「与我更相关」。这个过程会让产品自然而然变得更有趣、更有意义。

而靠逻辑推导出的有趣其实挺无聊的。更有意思的方式,是和用户一起磨。比如我们有理想同学,有的用户说想给它找个家,那我们就真给它做了个家。

曲凯:我记得上次见面,你说过一句让我印象特别深的话:做产品一定不能只讲逻辑。

范皓宇:对。逻辑是用来传递结果的,但做的过程本身要有趣。因为在那个过程中,你能不断获得正反馈,被激发着继续往前想。

这个世界其实特别匮乏想象力。也正因为如此,很多人干脆放弃了想象,选择纯理性。但纯理性会让人过于在意 ROI,而忽略了那些美好、确信、对生活的观察和品味。

要做到「有趣」,还是得去体会生活。

曲凯:我感觉在生活中,有些人好像就是更有趣、更热爱生活,更能从细节中发现美。你有没有想过这是为什么?

范皓宇:其实我觉得每个人都很有趣。真的。

这个世界的底层逻辑,是人们鲜活的一面在下面运转,只不过上面呈现出来的是 ROI、业绩、财报。所以是我们每天扮演的角色,让我们显得无趣了。

我有时喜欢坐在路边,看形形色色的路人,想象他们背后的生活和情绪。看多了想象多了,我也会被充盈到,就是感觉自己真真切切地活在这个世界里,而不是活在一堆指标和数据里。

曲凯:但现在也有一种说法,就是当你足够成熟,或者足够认清世界之后,可能就会觉得身边的人都是 NPC,甚至连自己也是 NPC。

但我猜你完全不同意这种说法?

范皓宇:当一个人麻木到把别人当成 NPC 的时候,其实是进入了一种低功耗的运行模式。

Ta 省下这些功耗干嘛?其实是做 Ta 认为有趣的事情去了。

我举个例子。心理学里有个实验,让一对双胞胎分别和实验员聊天。在 A 房间,不管女孩说什么,对面都热情回应;在 B 房间,对面却冷漠寡言。

二十分钟后,A 房间的女孩会开始学习、模仿实验员的语气,而 B 房间的女孩则完全不会。

所以当我们能从某件事获得正反馈时,就会更投入。

你说的那种 NPC 心态,其实是因为有些人对某些事没那么投入。但我相信,每个人都有愿意投入的事情,比如和朋友聚会,或者宅家撸猫。

曲凯:其实大家都有自己的世界。

那「有趣」和「有用」,你会怎么选?

范皓宇:都选。

如果只能二选一,我就砍掉一些事情,只保留兼具二者的部分。因为只有这样,才能和用户之间形成连接与信任,才能可持续。

如果只做「有用」的东西,那你卖 5 块,有人卖 2 块,最后就免费了。要不为什么中国一直没有 To B 和 SaaS 呢(笑)。

曲凯:最后一个问题。我们这两年聊了很多做 AI 的人,大家总在问同一个问题,就是现在 AI 的壁垒到底是什么。

我现在大概有个答案。至少在中短期内,这个壁垒是「组织」。

我觉得大家低估了 AI 对组织的变革。很多大厂那套分工极细的方式,其实在 AI 里就是不适用。你怎么看?

范皓宇:完全认同。 AI 带来了一个非常重要的变化:

从需求到结果之间,没过程了。

那么 AI 时代的组织方式,必须是端到端,而不是流水线。

这也意味着个人要有更综合的能力。比如前阵子我面试一个设计师,很快就希望录用 Ta,因为 Ta 展示了一个用 AI 做的完整的切图工具,甚至连账号注册之类的细节都搞定了。Ta 一个人,就能完成以前好几个人才能做完的事。

所以未来的组织形式一定会发生巨大变革,而且大家都要自我革命。如果你不革自己的命,那就会被别人革命。

曲凯:是。那最后希望大家看完我们这次的对话,也能发出那四个声音(笑)——

范皓宇:诶?嗯!哎呦喂?!卧槽!!

42章经

思考事物本质

阅读原文

跳转微信打开

组织能力才是 AI 公司真正的壁垒|42章经

2025-09-26 16:31:00

原创 曲凯 2025-09-26 16:31 北京

我们默认所有事都由 AI 完成,而人类是为 AI 提效

本期播客前半部分是任川的单人分享,后半部分是现场交流,原文约 14500 字,本文经过删减整理后约 5600 字。

任川单人分享

我们公司成立于去年 4 月,一开始就采用了 AI Native 的组织形式,两三个月后,就把 AI 深度嵌入了研发的各个环节,这一年多实践下来,效率和效果都很好。

今天我就会从工作流、人才、组织三个维度,分享我们打造 AI Native 工程团队的经验。

先说第一部分:如何用 AI 重构研发工作流,把效率提升 10 倍。

所谓「10 倍提效」只是保守说法,实际体感远不止于此。拿 Code Review 举例,这件事即使在效率优化到极致的 Google,平均也要一两天,而我们只需 10 分钟。

我们是怎么做到的呢?

很简单:只让 AI 来做 Review。

AI 不仅能提效,还有一个意想不到的好处,就是减少摩擦。人工 Review 很容易让人觉得是在「挑刺」,但如果是 AI 指出问题,工程师反而会感谢它帮自己排雷。所以在我们团队里,大家都会相互推荐好用的 AI Review 工具。这种「好用」很难用量化指标衡量,更多取决于工程师的主观体验。

目前我们觉得最好用的工具是 CodeRabbit。只要它批准,我们就直接合并代码。

当然,即便 AI Review 的效果已经很好了,还是有可能会漏掉 bug。这听起来有点危险,因为在传统工作流里,上线后再发现 bug 很麻烦,但 AI Review 的速度极快,所以哪怕出现问题,我们也可以立刻回滚或线上修复。

通过这个例子,我想和大家分享我们用 AI 重构工作流的三条经验。

首先,我们默认由 AI 来承担所有研发工作。

这并不是说要无脑地把一切都交给 AI,而是要转变思维模式。

在传统工作流里,我们通常会默认所有事都由人类完成,只有偶尔发现 AI 能帮上忙时,才会让它介入。但这样可能会错过很多 AI 提效的机会。

我们的逻辑正好相反:我们默认所有事都由 AI 完成,只有当 AI 遇到确实解决不了的问题时,再由人类来补位。

这样思考下来,AI 其实可以直接完成很多工作,重构我们的工作流。

它不止能写代码,还可以写文档、写测试、写设计文档、做 Review、上线和监控等等。和大家分享几个场景和工具:

在 Coding 环节,我们会用 Linear 管理任务,用 Devin 生成代码。我们可能会一次性在 Linear 中创建 10 个任务,然后由 Linear 将任务自动分配给 Devin,再由 Devin 批量生成代码。整个过程中,我们甚至都不需要打开 IDE。现在,我们大约 90% 的代码都是通过这种方式生成的。

在生产监控中,我们会用 incident.io。它会收集我们的工作日志,自动分析和预警,甚至在出现问题时给出初步诊断,目前这已经能覆盖我们近一半的监控需求。现在我们已经不需要专职的运维人员了,只靠工程师配合 incident.io 就足够。

此外,我们最近还发现了一个 AI 可以重塑的工作流,就是 go-to-market。传统销售流程很长,一个客户可能从头到尾要接触四五个人,但有了 AI,整个链条将被大幅压缩,或许一个人就能 end-to-end 地完成全部工作。现在硅谷很多公司都在做 GTM 自动化,我也觉得这里面大有可为,很值得关注。

虽然 AI 现在还不能完全替代人力,比如 Infra 层还是比较依赖人工,但在前端、产品等环节,AI 的表现已经非常好了。随着 AI 的效果越来越好,我相信未来需要人类参与的部分也会越来越少。

第二条经验,就是我非常推荐大家使用 Claude Code。

这点现在讲起来有点尴尬,因为 Anthropic 最近限制了国内访问…但我们用下来,它确实还是最好用的,一是 Claude Code 能力本身就很强;二是它有 SDK,可以做大量二次开发。

而且 Calude Code 能做的事远不止写代码。Claude Code 「全球第一人」刘小排(他用 200 美元的套餐消耗掉了价值 5 万美元的 token)就说过:只要有 SOP,就没有 Claude Code 执行不了的任务。

第三条经验有点反直觉。

大家通常觉得开会、对齐很重要。但在 AI Native 的工作流里,人与人之间的交流很容易变成瓶颈。

所以我们的做法是:让每个人从头到尾独立完成工作,尽量减少对齐。如果必须要对齐,那大家就把原则和想法写进 codebase,让人和人、人和 AI 在代码里自动对齐。

讲到这里,其实大家能感受到,AI Native 的工作方式和传统的工作方式很不一样,这也对人才提出了新的要求。

那么 AI Native 的工程团队最需要什么样的人才呢?

第一,人需要成为 AI 的「Context Provider」。

我们使用 AI 有个原则,就是「人 + AI」的产出必须大于「AI 单独工作」的产出。

这听上去非常合理,但在实践中,很多时候人类的介入反而会拖慢效率。

很多人只把 AI 当提效工具,但其实大家应该转变思路:让人类为 AI 提效。这样或许反而能取得更好的效果。

因为今天模型的能力已经很强了,AI 产出效果不够好,更多是因为 Context Engineering 不够好,或者是人类没有为 AI 提供足够的上下文

所以在 AI Native 的团队里,人类很重要的价值,就是成为 Context Provider,为 AI 打造更好的上下文,提供它不具备的知识。

比如我们的产品主要是用 AI 帮餐饮行业提效,让 AI 帮忙接电话、预约、下单等等。要做好这些工作,需要对餐饮行业有很深的理解,而 AI 本身不具备这些知识。但我们有同事暑假常在餐厅端盘子,ta 所积累下来的对餐饮流程的理解,就是对 AI 极有价值的 Context。

第二,人应该做「Fast Learner」,快速掌握最少必要知识,从而与 AI 高效沟通。

现在一个人遇到新问题,已经不太可能在短时间内学得比 AI 还强了。所以在面试和日常工作中,我们不太在乎一个人已有多少技能,更在乎 ta 能否快速掌握基本知识,把目标和问题定义清楚,然后激发 AI 的潜力,用 AI 的力量去解决问题。

第三,每个人都应该是「Hands-on Builder」。哪怕一个人只负责产品中的一小部分,也要对全流程和最终结果负责。

举个例子,如果你只做前期研究,却不 Build、也不对结果负责,那你就需要和上下游反复传递 Context。而只要出现这种传递,团队效率就会显著下降。

讲完人才,最后,我们再讲讲 AI Native 工程团队的组织形式和分工模式。

首先,我们实践下来,发现更合理的方式是「按结果分工」,而不是「按流程分工」。

什么叫「按结果分工」呢?

举个例子,我们有一个对商家需求负责的小组,还有一个对消费者体验负责的小组。其实后者的日常工作更偏前端,但我们不会把它定义成前端组,而是要求这个小组具备前后端、运维等全链路能力。只要消费者体验出了问题,不管在哪个环节,都由这个小组直接解决。

甚至我们的工程师也要参与产品设计、GTM 等环节。我也非常鼓励我们的工程师自己去跑客户,获取一手反馈,而不是像在传统团队里那样,由销售去见客户、把客户的需求转达给 PM、再由 PM 转达给工程团队,因为这样层层转述下来,一来工程团队未必能实现,还要再反复沟通,二来客户的需求可能已经走样了。

「按结果分工」不一定是最佳模式,但我相信即便未来继续演变,也不会再回到工业时代、互联网时代那种「按流程分工」的模式。

原因很简单:过去需要在每个环节安排不同的人,而在 AI 时代,可能 98% 的工作都能由 AI 完成,人类只需在 AI 做不了的地方补位。到那时,还按流程来分工明显就很不合理。

第二,我们的组织以工程团队为核心,因为工程团队最容易为结果负责。

比如我们要上线一个功能时,工程团队会第一时间利用各种各样的工具,完成包括研发、产品、设计在内的基础工作,先做出一个 60 分的版本,快速上线。而其他团队,比如专业的设计师,会再在这个 60 分版本的基础上优化。

过去大家总说「talk is cheap, show me the code」,但上线一个新功能的成本很高,所以大家要开很多会,让所有人全部拉通对齐,得出一个很完善的方案再付诸行动。

但现在「talk is cheap, but code is cheaper」,生成代码的成本极低,所以我们完全可以追求「速度优先」,先上线一个 60 分的东西,大家再一起努力把它做到 100 分。

正是这种方式,让我们在一年内就能搭起一个复杂系统。

第三,未来的组织形态,可能是「少量核心合伙人 + 大量灵活合同工」。

在传统互联网公司里,每个岗位都会有 back up 员工。但在 AI Native 的组织中,每个人都按结果分工、为结果负责,所以一个人的价值和不可替代性很高。一旦一个员工离开,就会对公司产生很大的影响。

那为了留住这些人才,就需要给这些员工提供类似于合伙人的待遇。

但如果所有的员工都享受合伙人级别的待遇,成本又很高,所以全职的核心员工数量不会特别多,需要大量的灵活合同工来作为补充。这些合同工往往在某个领域有很丰富的经验,他们也更愿意和多个组织合作,而不是全职绑定在一家企业。

我们这套模式在硅谷算是比较先锋,但绝不小众,更不是最激进的。湾区初创公司各有各的做法,不过大家的思路基本都在往这个方向发展。

Q&A 精选

(活动的另一位嘉宾是上期Mercor 高速增长的秘诀与其中的聪明人|42章经的虞快,所以 Q&A 部分也有一些虞快的补充)

Q1:为什么大厂不效仿你们这种 AI Native 的组织形式?是不是这种方案只适合初创公司,一旦公司规模大起来,就很难行得通?

任川:我在 Google 的时候,内部一些小团队也会这么做,但要推行到整个公司确实非常困难,因为大厂想调整组织架构,要考虑的不只是效率,还有很多额外因素。比如微软 CEO 最近就公开道歉,说之前裁员过猛,需要重建员工信心。

不过现在很多明星 AI 公司规模都不大,甚至有人在讨论会不会出现「一人独角兽」。如果未来几个人就能做出惊人的产品,那可能也不需要 Google 这样十万人的公司了。

Q2:在你们这种组织模式下,团队的一天是怎样的?

任川:我们的工作节奏表面上可能和传统公司差不多,但实际产出效率差别很大。

我们每天会把会议集中在中间的 3–4 个小时,其他时间尽量不排会,大家分头去做事。像我最开始提到的 Code Review,每个人每天都会收到 3-5 个这种请求,然后会各自完成写代码、AI review、merge 的全流程,效率非常高。

Q3:有些代码可能已经迭代了十年,非常复杂,人类工程师都未必能完全掌握。这种情况下,AI 介入的可行性有多大?是不是 AI 更适合从 0 到 1,而不太适合从 1 到 100 的场景?

任川:这个问题特别好。你所提到的,就是典型的需要人来给 AI 做 Context Provider 的场景。

就像你说的,大模型不具备这么多年的经验积累。在这种情况下,AI Coding 的效果,很大程度上取决于人类所提供的 Context 的准确性和信噪比。如果 AI 跑出来的效果不够好,并不是因为模型能力不行,而是因为我们提供的上下文不够好。

要解决这个问题,要么就是等模型更强大,强大到上下文不够也没关系;要么就是人类想办法给 AI 提供更好的上下文。前者成本很高,也很难预期,但后者是公司和个人都可以努力的方向 。从个人角度来看,学会为 AI 提供更好的 Context,将是未来 AI 工程师非常核心的技能和价值。

Q4:PM 在你们内部是什么样的角色?

任川:我们团队现在差不多 20 个人,没有全职的 PM,基本上工程师就把 PM 的工作做了,这样工程师也可以直接拿到客户反馈,比中间隔着一层 PM 的效率更高。

而且其实对于创业公司来说,CEO 或者工程负责人就是最重要的 PM。

虞快有什么补充吗?

虞快:我觉得公司早期没有 PM 很正常。Mercor 到现在已经有大约 150 人,也只有 2 个 PM。

很多时候不是工程师做不了 PM 的事,而是他们知道有 PM 的存在后,就容易丧失 ownership,倾向于把难题推给别人。可 PM 在做决定时,又必须回过头来找工程师确认,来回沟通一大圈,最后这个决定往往还是工程师和 PM 一起下的。

所以其实只要你招的人足够聪明、善于解决问题,ta 没理由只能做工程决策、做不了产品或商业决策。

Q5:大家对工程师的固有印象可能是特别擅长写代码,但不善与人沟通,而 PM 则是懂用户、会沟通、能提炼需求。如果让工程师兼做 PM,是不是对工程师的要求特别高?这样的人好招吗?

任川:这样的人确实不太好招。现在能快速学习 AI、用好 AI 工具的工程师本就不多,还兼备产品能力的更少。

但其实现在软件工程师岗位,已经不是只有懂代码的人才能胜任了。我认识一些 PM,他们不会写代码,但现在用各种强大的 AI Coding 工具,也能独立做出产品。

所以我觉得未来可能不会再有「PM」和「工程师」的严格区分,大家都是 Builder。只要能 Build 出东西、对结果负责就可以。

Q6:怎么筛选出真正会用 AI 的人?

任川:我们有两种方式。

首先,我们不做传统的一小时面对面的面试,而是会直接给候选人一个 take-home 的任务。

比如我们会让你在两天时间内 Build 一个产品,而这个产品比较复杂,没有 AI 基本做不出来。如果你能在两天内做出这个产品,那你肯定很会用 AI 工具。如果你手搓了一个产品出来,那说明你更是技术大牛(笑)。

两天后,我们再约着聊半小时,请你讲讲过程中的思路和细节。这样我们也可以进一步判断你能不能用好 AI。

当然,有些背景很强的人可能不愿意花时间来做这个任务,那这本身也是一种双向筛选。我们可能会因此错过一些人,但这种方式整体来看效率比较高,最后也能帮我们招到想要的人。

另外,我们最近也在尝试一些新的办法。比如我们会给你一个写好的大型 project,其中埋了很多雷,然后要求你在一小时内优化它。这个项目很复杂,时间又很紧迫,你大概率只能靠 AI 来快速理解和解决问题。

Q7:该如何打造一个 AI Native 的团队?

任川:我们比较幸运,公司很新,没有历史包袱,所以一开始就在用全新的 AI Native 的方式来组建团队。

在我看来,经验在这个时代未必是优势,很多时候甚至会成为负担。

比如有一些比较 senior 的人,已经习惯了传统的工具和工作流,连 Cursor 都不愿意用,就很难适应新的组织方式。相比之下,一些刚毕业、学习能力和求知欲都很强的年轻人,反倒是更适应 AI Native 的团队。他们在读书时就已经离不开 AI,用 AI 工作对他们来说非常自然。这样的人虽然不好招,但我相信未来一定会越来越多。

Q8:公司在 10 人、50 人、100 人的规模下,分别需要设立哪些岗位?

任川:我们现在只有 20 人,所以我不敢断言 50 人、100 人的公司会怎样。但我们的底层原则始终是「按结果分工」,也就是每个人都要为某个目标或问题负责。至于怎么实现,我认为没必要通过分工设太多的限制,可以让大家自由发挥。

这里可以请虞快补充下,Mercor 扩张到 150 人之后,出现了什么新岗位?

虞快:我们一上来就是每个人负责一个 feature,公司渐渐变大了之后,开始招负责安全、QA、测试的人,后面随着平台扩张,也会需要平台工程师。

Q9:该怎么招到和留住优秀的人才?

任川:前面我有提到过一点,就是未来需要给核心员工合伙人级别的待遇。

另外,我很认同一位朋友说过的一句话:与其费劲招人,不如先提升自己。

有时候你招来两三个人帮忙,可能比你一个人干还要忙。但如果你能用好 AI 工具,那你一个人也有可能完成原本需要两三个人才能完成的工作,效率反而更高。

虞快:我补充一点。

在招人时,我发现越是强的人,越要给 ta 上面试难度。因为强者往往有天然的好奇心和挑战欲,如果你的公司名不见经传,面试流程却很特别、很有挑战,ta 可能更愿意加入。

42章经

思考事物本质

阅读原文

跳转微信打开

Mercor 高速增长的秘诀与其中的聪明人|42章经

2025-09-14 20:38:00

原创 曲凯 2025-09-14 20:38 上海

未来十年,是金融更可能涨 100 倍,还是 AI?

这次去美国,我的一大收获就是认识了 Mercor 的首位中国工程师(节目录制时也是全司唯一的中国员工)虞快。他是前金融科技独角兽工程总监,Google、Two Sigma、Citadel 工程师,也是我这次硅谷行遇到的最聪明的人之一。

本期播客对谈原文约 16000 字,本文经过删减整理后约 8000 字。

曲凯:Mercor 今年很火,国内也有不少分析和报道。我发现大家对你们的认知大致经历了两个阶段:

一开始很多人觉得你们是 AI 招聘公司,但后来发现,你们本质上是在做数据标注。

在你看来,Mercor 到底是一家什么公司?

虞快:我们的核心业务,是帮顶尖 AI 公司招各行各业的专家。

大家可能对数据标注有刻板印象,觉得就是从欠发达地区找廉价劳动力做些基础活。

但现在完全不同了。

AI Labs 需要的是医生、律师、投行顾问,甚至细分到专门写 Swift 的工程师、俄罗斯的生物学家。

因为模型已经进化到了只有专家才能标注的地步。大多数人会的题,它早就会了。再想提升模型智能,就必须请特定专家提供系统性反馈,告诉模型什么是好答案、什么是差答案。

曲凯:那这些 AI Labs 拿到你们的专家标准后,还需要再去找 Scale AI、Surge 这样的平台做人工标注吗?

虞快:不需要。某种程度上讲,我们已经完全替代了传统的数据标注平台,因为模型可以直接基于我们提供的评估标准做强化学习。

曲凯:也就是说,随着模型变强,过去的标注方式不够用了,出现了市场空白,而你们正好抓住了这个机会。

那你们是一开始就这么定位的,还是在过程中逐渐调整出来的?

虞快:我们的目标一直没变,就是「帮客户找到他们需要的任何人」。

只是我们发现,眼下最急迫、最愿意花钱的客户,正是 AI Labs。虽然 AI Labs 没有那么多,但是他们的预算很高,因为对他们来说,这笔投入非常划算:

算法的突破要靠顶级研究员,但这些人很贵,而且随时可能被竞对挖走;算力的竞争更残酷,OpenAI 也未必能打过 Google。那要让模型真正进步,数据依然是一大突破口。而为数据花的钱和模型能带来的回报相比,几乎不值一提。

曲凯:明白。那你们帮客户找到人之后,他们是自己去和这些专家谈薪资之类的吗?会不会出现飞单的问题?

虞快:客户会把钱给我们,再由我们支付给专家。

目前我们没遇到过飞单的情况。因为这件事的难点不只是「找到人」,更在于后续的管理。一个项目可能需要上百个分布全球的工程师,怎么和这些人沟通?怎么评估他们的产出?怎么结算?出了问题怎么协调?

这些琐事,AI Labs 并不想自己操心,都需要我们来帮忙打理。

曲凯:听起来你们有点像一家大型第三方人力外包公司?

虞快:其实不是。先不谈使命和愿景,单从业务层面来看,我们和外包商就有很大差别:

我们能评估人才质量。

比如一家公司要招工程师,可能会收到一万份简历。我们能用更科学的方法,帮客户筛出最优秀的那一小撮。

曲凯:这里正好可以捋一下你们的业务流程。比如你说可能会有一万人来申请,这些人都是主动来的吗?

虞快:对。我们业务流程的第一步是获客,主要方式有熟人推荐、广告投放、AI 自动发私信等。我们内部也有一个团队,会去主动搜罗一些特别难找的人。

目前我们平台上超过一半的专家都是靠熟人推荐来的。推荐人可以拿推荐费,所以甚至有人会全职在我们平台上帮忙找人,赚的还挺多的。

曲凯:相当于这些人来你们这做猎头了(笑)。

虞快:是的哈哈。专家被吸引到 Mercor 后,会上传简历、选择岗位并投递申请。过程中我们也会用一些自动化流程,规避简历造假等问题。

简历过了的人,就会进入 AI 视频面试环节。面试问题都是由 AI 基于简历和 JD 自动生成的,比如要招一个数学 PhD,AI 就会问研究方向、论文细节等问题。

面试过程也可以人工干预。像我自己在用 Mercor 招人时,就会告诉 AI 我想重点问什么,并设定评分标准,让它帮我执行。

每场面试大概 20–30 分钟,结束后会生成一份带转录文本的视频。用人方可以直接看文本,也可以点击文字跳到对应的片段,查看更多文本捕捉不到的细节。

曲凯:那如果有很多人面试,我要把每个视频都看完吗?

虞快:不用。创建岗位时,我们会请你先定义好目标和要求,相当于一套评分标准。面试结束后,AI 会根据候选人的表现自动打分并排序,方便你快速筛选。

曲凯:那把人招来之后,你们怎么评估他们的标注结果?如果有人乱做标注怎么办?

虞快:这很容易分辨。同一套题我们可能会问 50 个专家,如果有一个人的解法每次都和别人不一样,那这个项目做到一半 ta 就会被开掉。

曲凯:合理。那结算呢?你们平台上的报酬区间大概是怎样的?

虞快:我们按时薪结算,各种岗位的平均时薪超过 90 刀,但不同职业差别很大。我们会根据找人的难度、紧急程度等因素,与甲方协商定价。

比如英文语音训练的时薪大约是 21 刀,因为几乎所有英语母语者都能做。软件工程师的时薪一般在 100-200 刀之间。最夸张的一个案例,是我们招过时薪 400 刀、推荐费 5000 刀的皮肤科医生,因为人真的很难找。

曲凯:你们这真是个太好的生意了…我都想上去接单了哈哈。

那 AI Labs 会同时把需求发给很多平台吗?不同平台最后拼的是什么?

虞快:如果我是 AI Lab 的决策者,最多只会找两三家合作。只找一家风险太大,比如 Scale AI 被收购后,他们的客户就很被动;但找太多家又很麻烦,因为每家的流程都不同,结算起来很复杂,出了问题还很难归因和追责。

而不同平台最后拼的,就是谁能又快又好地找到合适的专家、赢得客户的信任。如果你找来的人靠谱,AI Labs 就更愿意与你长期合作。

曲凯:说到 Scale AI,听说他们被收购之后,业务下滑得很厉害?

虞快:对。其实在被收购之前,Scale AI 就遇到了问题。他们靠给 OpenAI 做标注起家,但随着模型能力提升,他们原来找的标注员的水平不够用了,OpenAI 的反馈也变差了。

收购之后,大家又觉得它成了 Meta 的一部分,不太敢继续跟它合作。

曲凯:所以 Meta 这次收购真就是「人才收购」?花了这么多钱,结果业务还跌了。

虞快:我个人猜测,扎克伯格主要是为了收编 Alex Wang。

Alex 很有抱负,两三年后大概率还会再创业。如果只是给他高薪,很难把他挖来,因为他很难向团队和投资人交代,等他未来再创业时,融资和组团队都会遇阻。Windsurf 创始人的经历就是前车之鉴。

所以扎克伯格干脆花 150 亿,把 Alex 的团队和投资人都安顿好,替他解决了后顾之忧。

曲凯:所以现在 Scale AI 对你们已经没什么威胁了?虽然这么说有点奇怪,毕竟他们体量还是比你们大。

虞快:从增长来看,我不觉得 Scale AI 是我们的对手,反而是 Surge 更值得警惕。

曲凯:那市场对 Mercor 的理解形成共识了吗?大家是不是普遍把你们看成数据标注公司?

虞快:我不觉得我们是数据标注公司,而是一家 Eval Provider。

其实我们核心交付给 AI Labs 的东西,就是 Evaluation 和 Benchmark 的标准,或者说是一份模型的 PRD。

我们的专家会帮模型公司设定目标,让研究员去推动模型实现那些暂时还不具备的能力。

曲凯:理解。

但我觉得 Mercor 一开始在讲的是一个很性感的平台型故事。虽然现在数据标注这条线从赚钱角度看可能更性感,增长也快,但相比之下,平台故事的想象空间是不是更大?你们现在做的,会不会只是阶段性的事情?

虞快:其实 Mercor 一直在坚持同一个愿景,就是我们相信随着 AI 能力提升,未来的工作形态会改变:

全职岗位会减少,项目制会成为主流。

所以我们现在看似是在阶段性地满足 AI Labs 的需求,本质上是在押注未来的工作方式。

未来,「用 AI 来衡量一个人」不只适用于面试,还能拓展到更多场景。比如我是 VC,要和上千个创业者交流,我也可以先设几个问题,定义什么是好答案、什么是差答案,然后让 AI 帮我去问。

曲凯:所以 Mercor 这套模式未来可以推广到更多行业?

虞快:可以复用到所有行业,因为任何行业最终都离不开「挑选」这个环节。

曲凯:明白了。也就是说,Mercor 并不是中途转型成数据标注公司,而是一直在讲同一个故事、做同一件事。只是你们在做的过程中,发现了最有钱的客户和他们最痛点的需求,然后先把资源集中到了这个方向,跑起来后,未来可以再慢慢扩展。

那你觉得国内能复制出一个 Mercor 吗?

虞快:关键要看国内的 AI 公司愿不愿意在数据上花钱。只要有预算,就一定有人能把这件事做出来,而且可以做得很成功。

曲凯:但国内外还是有差距。

比如国内的模型公司估值可能也就三四十亿美金,而美国这边已经到三四千亿美金了。

曲凯:那在你看来,数据标注的市场规模有多大?

虞快:现在看,大概有 50 - 100 亿美金。

只要 OpenAI、Anthropic 这些公司还在,这个市场就会继续扩大,因为他们会持续砸钱来换取模型的领先地位。而只要他们投入,那 Google、Meta 这些不差钱的大厂也会跟进,所以市场还会进一步扩大。

曲凯:确实。如果 Meta 在一个人身上都能花 1 亿美金,在数据上肯定更舍得花钱。

那你当时为什么选择加入 Mercor?

虞快:原因很多。

第一,我觉得好的创始人至少要在某个领域特别强,而 Mercor 的三位创始人有个共同特长:辩论(笑)。他们是全美顶尖高中辩论队的队友,反应快、说服力强。

会辩论其实很有价值。比如几个月前,我们招人时还没什么筹码,全靠创始人把 vision 卖出去,说服大家加入。再比如我要是自己做产品,也会想让他们去帮我卖,因为我相信无论客户问什么,他们都能讲到对方信服。

第二,Mercor 的增长势头实在是太好了。从 100 万到 1 亿美金 Run Rate,Mercor 只用了 11 个月,比 Cursor 12 个月的纪录还短。而公司跑得越快,就越能吸引好的人才;好的人才来了,效率更高,增长也会更快。

第三,我认为在这个时代,有特点、有话题性的创业公司更容易成功,或者更容易拿到溢价,而 Mercor 的三位创始人就很有话题性:他们都是拿到 Thiel Fellowship(Peter Thiel 创办的项目,非常难获得,其中一个条件就是必须退学)的 college dropouts,二十出头就创立了 Mercor。

其实我们团队整体都很年轻,平均年龄只有 22 岁,很多人都是 dropouts,一半的人之前都创过业。

曲凯:这里我很想和你探讨一个问题,就是中美年轻人创业的区别。

在国内,现在很多人不太看好年轻人创业。大家会觉得这波 AI 是移动互联网的延续,所以经验丰富的人更懂怎么避坑,也有更多的资源。而年轻人需要不断试错,就算拿到融资,也可能不敢花、不会花,很难做出结果。

那在你看来,为什么 Mercor 能在平均年龄这么小的情况下,跑出这么快的增长?

虞快:我觉得中美创业氛围的差别很大。归根结底,这是个 sample size 的问题。

在中国,创业失败对一个人职业生涯的打击远比在美国大,所以愿意尝试的人本身就少,成功案例就更少。而因为大家看不到太多成功的故事,所以就更不愿意选择这条路。

而硅谷有很多「创二代」。很多人从小就听着父母辈的创业故事长大,所以他们甚至会把创业当成是毕业之后的默认选项。

曲凯:确实。而且这边很多人很小就在街边卖柠檬水,上大学后也经常做 presentation,所以他们讲故事和 pitch 的能力,甚至可能强过国内一些很 senior 的创始人和高管。

虞快:是。在美国,sales 和 marketing 是非常核心的能力,而且大家也很愿意去提升这些技能,比如在美国亚马逊畅销榜上,就常年有一本叫《How to Win Friends and Influence People》的书。

曲凯:那总结下来,你觉得 Mercor 增速这么快,最核心原因是什么?

虞快:首先我们在对的时间,选中了一个特别好的赛道。而且我们一上来就从 Scale AI 招了一些核心人才,帮我们少走了很多弯路。

除此之外,最关键的一点就是快。

我们的决策速度和执行速度都很快。

曲凯:「决策快」是不是意味着,你们必须有更高效的评估和反馈机制?

虞快:对。创始人最在意的就是「what's working & what's not」。

曲凯:但你们快速做出的决策,很多时候真的是对的吗?

虞快:对错没那么重要,只要不是大错就行。

Mercor 并不是特别 data-driven,很多时候都依赖创始人和管理层的直觉。因为市场变化太快,我们没时间做特别科学的判断,所以关键是快速行动。

就算错了,能及时意识到问题、立刻修正就行。

曲凯:也就是你说的「执行快」?

虞快:对。这是我们最核心的竞争力,别人很难复制。

最直观的体现,就是我们能「说到做到」。我们一旦定下一个目标,就一定能按时交付。而且整个团队都是这样,所以大家彼此信任,也敢对客户做出承诺。

曲凯:你们是怎么做到的?我觉得很重要的一点,是你们可能比其他硅谷公司要卷。

虞快:确实很卷(笑)。我们团队里绝大多数人都是每天 7 点半上班,凌晨 1 点下班。

但工作时长不是关键,关键是我们真的在乎自己做的事,所以都是心甘情愿地在拼。

在一家每月营收都能涨 50% 的公司里,你根本不会纠结那些有的没的,只会越做越有劲。

曲凯:所以增长就是最大的激励。

那像你们这样勤奋的公司,在硅谷 AI 创业圈里大概有多少?

虞快:十几人的团队很多都是这种状态,等团队扩张到一百人,还能保持这种强度的就不多了。

曲凯:但这可能已经超出很多国内公司对硅谷努力程度的预期了。国内很多人以为美国公司很悠闲,但其实这边的很多团队也很拼。所以大家还是不能小看硅谷公司。

那你现在在 Mercor 负责 Engineer Management,也在招人,能不能讲讲你招人的一些标准?

虞快:首先技术肯定要强。

比如我们招 PM 时,也很看重候选人的技术能力,经常会问「你最近 build 过什么」,哪怕是个网站也可以,只要你能讲清楚过程中你的一些思考就行。现在 AI 工具这么多,如果一个候选人什么都没 build 过,就是个 huge red flag。

另外,我个人更看重的一个品质是 Agency。

曲凯:这个词在美国很火,有点像是「主动性」的意思,就是你能不能克服一切困难,拿到最终的结果。

虞快:对。如果我要把一个任务事无巨细地拆解给你、还要给你设定每天的工作量,那我就会觉得你没有足够高的 Agency。团队里可以有一两个只会埋头干活的人,但前提是他们的沟通和学习能力也要过硬,否则就会拖慢整个团队。

另外,我特别看重一个人是不是足够聪明。

怎么判断呢?

我常用的方法是:先抛一个新概念,然后看这个人能多快理解并融会贯通。

学习有不同层次,最基础的是机械背诵,再高一层是能理解原理,但没有内化、讲不清楚。

更高级且轻巧的思维方式,是能拿熟悉的东西去类比。举个例子,你不知道 MCP 是什么,但你很懂 API,能立刻看出 MCP 和 API 的相似点与不同点,那你就能通过类比的方式,快速消化新概念,而且理解得会比较深刻。

曲凯:其实好的哲学家、诗人都有这种能力。他们很擅长解构,然后在底层找到不同事物之间的联系。

不过你举的 MCP 的例子还挺有趣的,因为大多数人学新概念可能就是看介绍、读文章,而你的第一反应是去找类比?

虞快:对。我会在 Google 里输入「MCP vs」,看自动补全是什么。

曲凯:如果只是想粗浅地了解 MCP,用你这种方法可能只需要 1 秒钟。因为大家只要能看到自动补全的「MCP vs API」的词条、认知到 MCP 可以类比 API,那就已经很够用了。

虞快:是。另外,对我来说,学习新东西最有效的方式是看别人的评价。比如搜完「MCP vs API」,我会优先去看 Reddit 上的帖子。再比如我想快速了解 A 产品,我也不会先看官网,而是会想它的竞品是谁,然后搜索「A vs B」,看大家对这两个产品的评价。

曲凯:你的学习方法有个前提,就是脑子里得有一套结构化的框架,这样遇到新概念时,才知道该放在哪一块。不然就算能想到做类比,脑子里的知识也是一盘散沙。

然后你刚才说面试会用新概念来考察一个人聪不聪明,能举个例子吗?

虞快:比如我可能会介绍一个概念,叫「parking function」:

假设有三个人要停车,只有 3 个车位,如果这三个人都能停到自己想停的位置,就算满足条件;而只要有一辆车停不下,就不满足。

举几个例子:

如果三个人分别想停在 1、2、3 号位,显然都能停下,所以「123」是一个满足条件的 parking sequence;

如果三个人都选 1 号位,那后面的人看到 1 号位被占之后,可以向后顺延、停进后面的车位,所以「111」也满足条件;

但如果三个人都想停 3 号位,且车不能后退时,那第一个人占了 3 号位之后,后面的人既不能退回到 1、2 号位,也没有 4 号位可选。所以「333」不是一个 parking sequence。

讲完定义,我会给候选人一个数组,让 Ta 判断这个数组是不是 parking sequence。

比如我给出的数组是「231」,大多数人都会老老实实按照定义去模拟:第一辆车去 2 号位能停下,第二辆车去 3 号位也能停,而第三辆车本来就想去 1 号位,所以大家都能停下,因此这个数组是对的。

曲凯:大多数人可能这会儿已经晕了(笑)。

虞快:哈哈,而且这种列举的方式很慢。更好的做法是 take a step back,思考「在什么情况下会有人停不下」。

曲凯:稍等啊,给我几秒钟。

(大家也可以一起停下来想一想 :P)

……

我在想,如果后面的车想停下,前面的车位必须先被占满。

虞快:对,这是一个很好的观察。所以你希望大家优先选择停在靠前的车位。那么如果没有人选择 1 号位呢?

曲凯:那车位的数量就一定要大于车的数量,否则就必须得有人选 1 号位。

虞快:那需不需要一定有人选 2 号位?

曲凯:不需要,因为可以有两个人选 1 号位。

虞快:对。所以要么得有两个人选 1 号位,要么得有一个选 1 号、另一个人选 2 号。

这里还有一个观察,就是数组的顺序其实无所谓,比如「321」和「123」,最后结果是一样的。

所以最后能推出的规律就是:一个数组从小到大排序之后,第一个数必须 ≤ 1,第二个数必须 ≤ 2,第三个数必须 ≤ 3。只要满足这个条件,就是一个 parking sequence。

但很多人不会这样思考问题,而是会花很多时间去硬生生地模拟。这时我也会给大家一个 hint,比如:如果我给你一个随机数组,你觉得它大概率能不能满足条件?

曲凯:很有意思。有没有更简单的题?

虞快:我面试其实也会问一些很简单的题,但往往能从细节里看出很多问题。

比如我会给候选人「123」和「456」这两个字符串,然后让 ta 写段代码,把这两个字符串相乘的规则表示出来。有的人会卡半个小时,最后说「我忘了乘法怎么算了」。

其实忘记乘法没关系,毕竟大家现在都会用计算器。但我介意的是:你不记得规则,为什么还要在那硬耗半个小时?这半小时你在做什么?既然你不会,那为什么不直接问?

不过有时候我自己也不知道某道题的答案是什么。这种情况,我会一边听候选人推理,一边在心里想「如果是我,我会怎么做」,然后和候选人的答案做对比。如果 Ta 答得太离谱,那我可能就会直接拒掉。

曲凯:明白。前面你聊到的这些框架和思路,是什么时候开始形成的?

虞快:其实是做管理之后才开始形成的。我大概做了四五年管理,很多想法都是和我在 Two Sigma 的老板学的。

另外说起来,让我快速成长的,是在 Google 的那段时间。

我刚参加工作的第二个月,需要做一个项目,涉及到一项全新的技术。我对那个技术一无所知,所以就有点沮丧,觉得自己对团队没有贡献。但我的 Tech Lead 和我说了一番话,让我茅塞顿开,他说:

如果真有人知道该怎么做,这个项目早就做完了。所以第一,别把别人想得太强,不要以为 senior 的人一看就能搞定,其实大家都要摸索;第二,你的工作之一就是主动去搞明白这件事到底该怎么做,如果你能啃下来,那你就是组里第一个会做的人,还能去教别人。

这件事对我影响很大。在那之前,我会觉得自己只是 L3,而组里全是 L5、L6,所以自己就是不如别人。但其实很多时候不是这样的。

曲凯:所以从 Google、Two Sigma、Citadel,再到初创公司,你在各种类型的公司都待过。你感受到的核心区别是什么?

虞快:我觉得公司类型不重要,重要的是赛道。

我当时去金融公司,是因为发现周围厉害的人都在做金融。而现在,很多厉害的人都会优先去搞 AI。

你想想,未来十年,是金融更可能涨 100 倍,还是 AI?

答案显然是 AI。

所以真正值得思考的问题不是要选大厂还是创业公司,而是你要不要做 AI。

曲凯:最后,你觉得未来 AI 公司的组织形态会是什么样?PM 和工程师的角色会发生什么变化?

虞快:随着 AI Coding 能力提升,写代码会越来越省时间。比如我现在在通勤路上想到一个点子,就会把需求丢给 Cursor,等到家时,它可能已经生成了一个初版。

所以未来,工程师更重要的能力不是写代码,而是要想清楚该做什么、方向对不对。这种判断往往来自客户反馈,所以工程师也应该重视和客户的交流。

反映到组织架构上,就是工程师和 PM 的边界会越来越模糊,组织也会趋向扁平化。

这就要求公司有健康的激励机制,管理层也要有识人能力,能看出谁真的在为公司思考。

42章经

思考事物本质

阅读原文

跳转微信打开

硅谷 AI 大转弯与二级市场的牛市|42章经

2025-08-31 20:33:00

原创 曲凯 2025-08-31 20:33 北京

散户崛起!

莫傑麟已经是第五次做客我们的播客了。从 23 年底到现在,我们差不多保持着每半年一次的频率,定期复盘中美 AI 的发展趋势。最近我又来了硅谷,也再次和傑麟聊了聊今年美国的 AI 进展,以及近期二级市场的牛市。

本期播客对谈原文约 30000 字,本文经过删减整理后约 10000 字。

曲凯:今年硅谷有什么新趋势?

莫傑麟:今年大家达成了一个新共识:AI 又进入了一个高速发展的阶段。

但硅谷出现了一个大转弯,就是 AI 的核心衡量指标,从「Scaling Law」变成了「Token 消耗量」。

今年最核心的叙事,就是 Token 消耗量在持续增长,而且增速惊人,比如七月就比六月增长了 20% 以上。这非常像移动互联网高速发展那几年里,流量、留存等指标的增长曲线。

在 Token 消耗加速的背景下,从最底层的 GPU,到模型,再到最上层的应用,整个行业都有新的发展。

目前消耗 Token 最多的,还是 OpenAI、Anthropic、xAI 等几家核心 AI Labs。再细分来看,增速最快的是这些 Labs 自有的应用,比如 ChatGPT 的日活、使用时长都在上涨,其次是很多 ToC 的生产力工具。

曲凯:所以大家现在会越来越多地用大模型。但今年美国的模型并没有明显变聪明,GPT-5 的评价甚至还褒贬不一,为什么它还是有不错的增长?

莫傑麟:这背后有一个很重要的认知迭代,就是大家对 AI 的预期发生了变化。

为什么大家从 24 年开始就一直很期待 GPT-5?

因为过去大家期待模型会不断突破智能上限,实现 AGI。

但从今年 1 月开始,大家更期待的是能在日常生活中用好现有智能,因为现有智能已经解锁了很多应用场景,而且大家的需求也很强烈。B 端希望 AI 可以解放生产力、降本增效,C 端则希望 AI 可以替代搜索、辅助工作等等。

所以无论是 AI Labs、Infra 公司还是应用公司,都在想办法让现有智能更可用,释放更多需求,衡量指标自然也就从 Scaling Law 转向了 Token。

不过不同公司关注的截面不一样,比如应用端主要看 Token 的消耗量,Infra 端更关注 Token 的利用率和成本。

其实你每期播客我都有听哈哈,我看你今年请了很多做 Infra 的创业者,他们做的事情就是让 Token 响应更快、更稳定、更精细化,甚至是把成本降下来。

GPT-5 本质上也在走这条路。它没有试图证明自己更聪明,而是把很多之前分散的模型能力、信息和前端界面都整合了起来,从而追求更好的可用性和易用性。

曲凯:所以 AI 已经进入应用阶段了?

莫傑麟:我觉得已经过了应用阶段,到了逐步产业化、加快工业化的新阶段了。

AI 完整进入应用阶段的标志是 Chatbot,最后一个关键更新是 Agent。

Agent 特别像移动互联网时代的 App,以前每个产品都需要一个 App,现在每个场景可能都要有一个 Agent。

但目前 Agent 的 Token 利用效率还不够高。比如我们用 Manus,经常发现 credit 很快就用完了。

那为了让 Agent 的使用体验更好,就需要去优化 Infra,让智能更好地落地。

曲凯:那如果大家不再讲 Scaling Law,是不是意味着 AGI 不重要了,或者说实现不了了?

莫傑麟:这点很有意思。今年大家对模型和应用的分工也形成了一个新共识。

模型的地位依然很强势。并不是说模型智能不重要了,而是它必须被封装进商业环境,或者和 Infra 结合,成为一体化的解决方案,真正提供商业价值和产品价值。

在应用层面,过去大家常常争论套壳有没有价值。但随着 RL 范式的发展,大家逐渐发现目前可被验证的使用场景并不多,所以现阶段更实际的做法是先通过产品让用户把模型用起来。比如 Manus 提出的 Context Engineering,就是一个从产品层面找到的切口。越来越多的人也认识到,context layer、agentic layer 本身也很有价值。

所以今年不同位置的玩家都会以 Token 消耗量为主轴去做事,各有分工。模型公司要让 Token 本身更有价值,Infra 公司要让 Token 的使用更快、更好、更省,而应用公司则会想办法让消耗出去的 Token 换回更多的数据反馈。

曲凯:但如果模型公司不再把精力放在 AGI 上,而转向整合和应用,这是不是一种不太健康的趋势?

一方面,应用端已经卷得厉害了。就拿 AI Coding 来说,美国甚至卷得比国内还狠。如果模型公司也下场,岂不是更卷?不过可能有 PMF 的事情还是太少了,大家看到一个能跑通的事情,不去做也不太现实。

另一方面,之前 OpenAI 之类的公司专注于提升智能,每次智能有突破,就会解锁更多能力,催生一批新的套壳公司。但如果今天模型公司不再追求智能提升,而是把有 PMF 的事情顺手做掉,那好像模型和应用之间的分工反而变模糊了?

莫傑麟:我觉得这反映了一个很有趣的变化,就是今天的公司和过去的公司不太一样。

以前我们习惯用一句话来定义一家公司,比如字节就是「App 工厂」。到了 AI 这波,大家也有这种惯性,想用一句话去定义各种公司,比如 Google 就是「有很强的技术人才储备」。

但在 AI 时代,技术和产品是可以逐步融合的,可能就没必要把分工划得特别清楚。

能融合到什么程度还不好说,但从逻辑上来说,应用可以提供一部分数据给模型,所以一些有企图心的公司一定会尝试既做模型,也做产品,甚至顺带做一些 Infra,把整个链条端到端地打通。

我们也确实能看到,今年 OpenAI 招了不少创业公司的 founder 进来做产品,Google 在应用端的发力也越来越快;Manus 本身就在做一些技术工作,Cursor 也开始训练自己的模型。

所以说,今年不同 AI 公司之间的边界变得很模糊。

曲凯:如果模型和应用公司能够互相促进,形成平衡,长期看当然是好事,但前提还是要看模型本身的能力能发展到什么程度。

比如 GPT-3.5 解锁了聊天能力,才有了 C.AI 这类产品;模型具备了 RL 推理能力,就出现了一大批 Agent 公司。这也是为什么我们最近在看多模态,因为如果多模态模型解锁了新的能力,未来就可能涌现出多模态时代的 C.AI 和 Manus。

不过现在回看,其实当时 o1 出来之后,大家都觉得模型好像没变得更聪明。

最近 GPT-5 发布,似乎大家也觉得它没解锁什么新能力。在你看来,GPT-5 有没有什么被低估的地方?

莫傑麟:我觉得很有。

首先评估模型智能水平这件事的重要性已经降低了。

今年 OpenAI、DeepMind 的模型已经拿下了 IMO 金银牌,说明我们其实已经没有太多合适的工具去评估模型的好坏了。

而且现在 AI 已经进入工业化和产业化的新阶段,在这个阶段,最关键的评估指标就不是智能水平,而是成本,因为在性能差不多的情况下,只有足够便宜,产业化才能加速。

另外,我觉得大家对模型的预期经常和模型本身的能力有偏差。

比如当时大家对 o1 的预期是它一下子能解决很多问题,但回头看,大家当时并不知道它解锁了什么能力,也不知道该怎么准确评估。后来大家才慢慢意识到,RL 范式在产品上最直观的体现,是模型更懂你、情商更高,降低了用户写 prompt 的门槛。

那么我个人认为,GPT-5 是一个非常重要的转折点。它标志着大家对 AGI 的预期被大幅修正,接下来拼的就是全栈能力和效率。

GPT-5 依然是一个不错的可用的模型,更关键的是它把模型拆分成了 Instant、Thinking 等不同模式,从而能够分开计价。从商业模式上看,GPT-5 已经明显进入了加速产业化的阶段。

曲凯:但这岂不是进入了国内创业者的舒适区?假设大家都开始拼整合、拼 Infra、拼工程,那 DeepSeek 不会比 ChatGPT 差,甚至可能更好。

莫傑麟:逻辑上是这样。

因为模型确实进入了一个瓶颈期。除非 Thinking Machines 能带来新的架构创新,否则大家基本已经接受模型架构就是这样了,智能提升主要来自各个环节挤出来的增量。

不过各个环节的增量叠加起来,依然有几十个百分点的提升空间,也还有围绕 Infra 的创新余地,所以今年几家 AI Labs 在 ASIC 上的研发速度都加快了,都在围绕 Infra 下功夫。

曲凯:对,我们刚跟亦博录完一期 Infra 主题的播客,和他聊完我才意识到,原来现在 Infra 这么重要、对模型的影响这么大。

比如之前大家都在讨论 DeepSeek 为什么这么强,亦博给出了一个特别好的答案,就是因为 DeepSeek 的 Infra 足够强、梁文锋本人也特别懂 Infra。

莫傑麟:我听了那期播客,我觉得亦博讲得非常好。Infra 的作用其实很直观,但做 Infra 优化的人还不多。

在我的理解里,Infra 优化可以拆成四层:

第一层是模型和 GPU 之间的优化,也就是怎么把卡用好。我理解 DeepSeek 就是在这一层做得特别好。

第二层是模型和应用之间的优化,现在主要体现为推理加速。以前模型公司会顺手把这件事做了,但今年有了一些初创公司的机会。因为 Anthropic 不再给 Windsurf 提供 API 之后,很多应用公司不想只绑定一家模型,而是会去找 Together AI 和 Fireworks 这样的中间商,然后顺便让它们帮忙做推理优化。不过推理加速的技术壁垒不高,很多东西还是开源的,所以这一层的毛利空间还存在争议。

第三层是纯应用层的 Agentic Infra。像 Sheet0 创始人文锋雷磊在你们播客里提到过的就属于这一层。这一层做得好不好,会直接决定用户体验。比如你给 Manus 一个任务,它是只能跟你对话,还是能在前端直接调动一个优化好的模型帮你做事,用户感知差别会很大,消耗的 Token 也会完全不同。

第四层就是 context 层的 Infra。Manus CTO Peak 提到的 Context Engineering,讲的就是这一层的事。

曲凯:明白。所以未来一段时间里,模型会把更多东西整合起来,既包括已经验证过 PMF 的应用,也包括能优化 Token 消耗的 Infra。

在这个前提下,我自然会有个疑问:

为什么英伟达和一些 AI 公司还能涨得这么好?尤其是英伟达,它上一波大涨主要是靠 Scaling Law,现在大家都不讲 Scaling Law 了,为什么它还在涨?

莫傑麟:英伟达涨得好的核心原因,就是 Token 消耗量一直在增长。

英伟达的需求主要分两部分。一部分来自模型训练,尤其是 pre-training。这类需求有周期性,当模型或架构稳定后,训练用卡需求会下降。另一部分则是推理需求,来自用户的使用过程。这两种需求此消彼长,前者对应 Scaling Law 的逻辑,后者则对应 Token 消耗的逻辑。

现在 Token 的消耗越来越多,大家看到 RL 的进展、Meta 大规模招人后,对 pre-training 的需求也在回升。再加上英伟达在软件和售后服务上的优势,很多公司更愿意一站式地用他们的 GPU。各种利好因素叠加,英伟达自然还是会有不错的涨势。

但今年一些 ASIC 厂商,包括 AMD 的股价也表现亮眼。

这说明什么呢?

说明虽然英伟达依然强势,但市场和公司已经在思考怎么「节流」了。比如一些大公司会考虑在推理环节用 ASIC 或 AMD 来降低成本。而国内因为长期有卡脖子的问题,更是早已有不少替代方案。

这里面其实有一个赚钱的密码,就是大家只要解锁了 Infra 的变化趋势,可能就会在其中找到机会。今年很多英伟达产业链公司的涨幅甚至超过英伟达本身,就是因为它们是在 Infra 层做优化。

曲凯:你前面讲过 Infra 优化有四层,现在最核心的是哪一层?

莫傑麟:最核心的还是最底层,因为卡的价格依旧决定了所有事情的走向。但英伟达实在做得太好了,所以这一层的优化会是一个长期趋势,不会特别快。

曲凯:但像你说的,国外 AMD 等公司,国内的寒武纪、光模块企业也都涨得很好。那这个涨势能延续多久?

莫傑麟:逻辑上的延续性很强。大家都希望降本,也希望英伟达多几个竞争对手,至少在推理端有更多替代方案。

但关键还是要看个体公司能不能真的交付出东西来。硬件需要订单、预期和交付能力同时到位。在没到这个合力点之前,就算需求和预期再高也没用。

Infra 层还有一个很有意思的看点,就是推理加速这种事情,到底是第三方公司的机会,还是模型公司、应用公司自己就能做掉。

曲凯:但这个短期内应该很难看出来,相当长一段时间可能都会并行。

莫傑麟:是。不过这其中有一个转折点,就是现在该出现的 Infra 公司基本都出现了。所以我们也在观察这批公司里会不会长出下一个 Snowflake,或者出现一个嵌在 Palantir 里的 Snowflake。

曲凯:明白。你们今年还有看到什么比较有意思的应用吗?

莫傑麟:今年有两个点让我印象很深。

第一,RL 范式出来之后出现了一些变化。

一方面大家逐渐认识到,能给出准确 reward 的场景其实很有限,所以都争相去做 Coding、数学这些能明确验证效果的场景。

另一方面,大家也意识到很多场景依然需要人的介入,所以一些垂类公司发展得还不错,比如法律领域的 Harvey AI 就做到了很高的 ARR,医疗、金融、保险等领域也都出现了找到 PMF 的团队。这些团队借助模型去解决了一些行业 workflow、专用语言和使用环境等问题,真的把智能用了起来。

第二个亮点来自国内创业者。今年有一些国内团队解决了一部分模型和 context 之间的 Infra 问题,并且率先找到了场景,让消费者直接感受到了智能。比较有代表性的产品包括 Manus 、Genspark、Fellou 等等。

曲凯:今年美国二级市场上还有一些挺有意思的公司,比如 Meta 最近就超级火。你们最关注的几个点是什么?

莫傑麟: Google 和 Meta 这两家公司很值得研究。

Google 最值得研究的课题,是组织模式和技术储备等要素,究竟哪一个对 AI 发展来说更关键。因为大家一直认为 Google 有很强的全栈技术能力,但协作效率有问题。然而,Google 今年在文字模型、视频模型和机器人上都有所进展,依然能稳居行业前二。

这个课题很难回答,或许更适合国内的企业家去思考。因为他们经历过类似的大规模竞争,更容易理解什么才是决定性因素。他们也可以判断,如果 Google 真的能够改变组织模式,是不是有机会创造出更厉害的新东西?

Google 的问题和 Meta 也有所呼应。

Meta 当下争议最大的课题,就是砸钱招人到底有没有用。一部分人认为临时拼凑的团队缺少统一愿景,很难做出下一代模型。但另一部分人会觉得,Meta 招的人几乎都是各个 Lab 的顶尖专家,而且很多人都拥有丰富的一线工程经验。

曲凯:甚至很多人还有上镜经验,比如上过 OpenAI 的发布会(笑)。

莫傑麟:是的哈哈。所以这两个课题都非常有意思。

把它们放在一起看,可以看出一个趋势,就是大家今年的 FOMO 情绪不仅没有减弱,反而更强了。折射到行动上,就是各个公司从 23 年的「抢卡」,演变成了今年的「抢人」。

曲凯:但我觉得大家本来还好,好像是 Meta 靠一己之力把 FOMO 又带了起来。

莫傑麟:但是国内腾讯也在做类似的事。美国除了 Meta、Google,这半年里微软,甚至 ServiceNow 这样的公司,招聘动作也都很夸张。

至于为什么会这样,不同的人有不同的视角。

曲凯:所以你的视角是什么?

莫傑麟:我觉得是因为 AI 真的离产业化越来越近了。

我经常开玩笑说,现在的 AI 很像当年的移动互联网地推。过去靠地推把线下用户拉到线上,今天则靠 AI 把用户带进全新的场景。

所以那些有场景、有能力的公司,会更真切地感受到 AI 不是遥不可及的 AGI,而是能和自己的商业场景结合、贴近产业化的实在创新,那他们就会更坚定地去做判断和动作。

曲凯:明白。前面我们聊到,Token 消耗的叙事仍然带动了很多二级市场股票的增长。在我们录音的这两天里,国内也进入了一波牛市。那你觉得未来一段时间,二级市场的反馈会有什么变化?

莫傑麟:中美二级市场目前表面走势类似,但驱动逻辑完全不同。

AI 对美国整体景气度的影响占到三分之二以上,因为它决定了美国能不能在科技生产力上继续保持领先,进而影响各个产业的落地。

所以美股的走势相对更好判断,本质上取决于大家对 AI 发展的预期。过程中当然会有各种干扰和颠簸,但只要市场相信美国 AI 能持续领先,产业化、工业化在不断加速,那美股整体还是一个偏向上的局面。

中国这边则更复杂。

AI 对中国也很重要,但没有美国那样的决定性地位,因为中国宏观经济和二级市场情绪,受居民存款、投资意愿、风险偏好、制造业周期等多重因素影响,所以 A 股的表现更多反映的是大家心理预期和风险偏好的变化。

曲凯:我们先讲美国。我记得你提过一句话,说「AI 是美国所有资产里唯一的泡沫」。

莫傑麟:我现在依然这么认为。但这里的「泡沫」不是贬义,不是说 AI 是骗局、没有发展前景,而是说它的估值确实偏高。

曲凯:那比如之前英伟达到 3 万亿市值时,大家核心在验证的是模型能力能不能持续提升、Scaling Law 是否依旧有效。

现在有没有类似的待验证点,一旦被证伪,就会让市场的泡沫破掉?

莫傑麟:有两件事特别关键。

第一,Meta 为什么在这个时间点花这么多资源组建这样一个团队,以及他们能不能在 6 到 12 个月内做出更好的模型。

第二,会不会出现一些能稳定消耗 Token 的应用或场景。

美国现在有个词叫 Vibe Revenue,意思是用户知道 AI 有用,但并不清楚到底能用它干什么,所以现在很多产品的收入其实来自于用户过高的预期,甚至是跟风。

曲凯:所以你觉得以英伟达为代表的这些 AI 的 Beta,在美国二级市场会继续涨吗?

莫傑麟:会有波动。但在 Meta 推出新模型,或者发现 AI 没有真需求(如果那一天真会到来)之前,大趋势还是顺的。

曲凯:但国内二级市场的 AI 表达,更多还停留在芯片、Infra 上,比如寒武纪、英伟达的产业链公司等等。国内好像就没有 Meta、Google、微软这样的标的。

莫傑麟:其实有。

一开始大家认为最原生的 AI 公司是 DeepSeek 和字节,但这两家都没上市。今年大家找到的新标的是腾讯,过程中一度是阿里,但因为今年腾讯在 AI 上的努力程度和战略高度都强了很多,所以腾讯今年的股价也很顺。

曲凯:其实就还是大厂逻辑。只要一个大厂花钱了、让大家感觉到它在努力了,就会被列入到这类故事里面。

莫傑麟:也要看它有没有实质性进展。

其实这波 AI 的估值逻辑和移动互联网完全不同。移动互联网时代大家看的是 PMF、市场占有率和留存率这些指标。

但现在大家的商业和投研能力强了很多,不再只盯着现成的数据,而是会预判这项技术重不重要、这些人的执行力和视野是不是对的、这家公司是不是在正确的路径上等等。只要你的业务基础是健康的,市场就愿意给你希望。

这套逻辑今年在 Meta 和腾讯身上都得到了验证。

曲凯:所以这波 A 股到底是不是牛市?该怎么判断?

莫傑麟:这件事我相信谁讲都容易被打脸(笑)。

二级市场本质上是预期的投射。比如科技在美国市场之所以特别关键,是因为它代表着一种长存的预期,而且科技的毛利率也很高。

我记得 24 年初,我们录过一期关于乐观的播客。当时市场环境很悲观,但我们身边的创业者和大厂负责人并没有躺平,而是在积极向上、扎扎实实地做事。

到了今年,这批人真的找到了能比全球同行做得更好的事情,比如泡泡玛特、生物医药等等。

所以,从 24 年初到现在,我观察到的最大变化,就是 AI 已经从少数人相信的愿景,变成了真正落地的好产品,比如 DeepSeek、Manus、Genspark 等等。

那么牛市需要两个要素,一是要有一批优质公司能持续输出业绩,这一点从去年开始中国市场就具备了。二是市场的风险偏好在提高。要具备这一点,就需要市场能有正反馈,也就是大家能真正赚到钱。

曲凯:你发给我的那张有人拄着拐也要开户的照片,其实就印证了第二点哈哈。

飞书文档 - 图片

莫傑麟:是的。其实这波波动里一个很重要的群体就是散户。

现在的散户和过去相比,手里有更好的投研工具,也能接触到更优质的信息。不论他们的判断对不对,研究散户本身也很有价值。

美国最优秀的投资机构是平台型资产,靠高周转获取收益。如果市场里全是高周转资金,或者全是跟随型量化,要形成牛市反而更难,因为资金都在博弈。

相比之下,散户往往更团结,尤其是高知散户,对一家公司会有更坚定的认知。比如特斯拉和 Palantir 就是典型的由散户推动起来的公司。

曲凯:但这跟很多人的认知是反的。很多人说国内市场波动大,正是因为散户占比太高,缺少长线资金,而美股机构资金占比高,所以更稳定。

莫傑麟:但这两年的二级市场和以前已经完全不同了。

确实,美国的长线资金占比很高,但这类资金周转非常慢,不会引发 6 到 12 个月周期的剧烈波动。现在市场的波动,通常是由机构、量化资金加上散户共同引起的。

不过,就像我前面说的,机构和量化资金大多是跟随型、博弈型,其中六七成都不够团结。他们会紧盯别人的预期,一旦判断这个预期有误,就会立刻进行反向交易。

而散户通常不会有太多博弈性动作。而且在美股这种「熊短牛长」的环境里,散户更容易形成自己的投研体系,并通过正反馈不断完善。比如,有人因为看好英伟达或特斯拉而赚到钱,就会逐渐形成一套自己的投资方法论。

所以这些散户对股票的选择很有借鉴价值。

以 Palantir 为例,我们一开始看好它只是因为订单充足,但如今它已经被推到了百倍以上的估值。这背后既有基本面的支撑,也有散户的贡献。

再回到 A 股是不是真牛市这个问题。我个人相对偏乐观,但这其中有一个重要的变量,就是中国的个人投资者,尤其是那些平均股龄二十年的老股民会怎么做。

A 股的牛市相对较短,熊市更长,散户很难建立稳定的反馈系统,往往刚做对一些事,市场就转向了。但老股民们即使不炒美股,可能也从美股中学到了不少东西。如果他们能把这些经验移植到 A 股,或许会带来很有意思的变化。

曲凯:这段很有意思。确实,A 股没有长牛,所以很难形成真正的正反馈闭环,大家更多还是一种猥琐发育或竞合关系的循环。

然后过去两年,美股 AI 板块表现最好的,基本还是那几只大票。你觉得未来会有什么变化?

莫傑麟:我们把模型和算力统称为 Infra。过去一段时间,市场一直在尝试从 Infra 切换到软件。因为大家的肌肉记忆是当 Infra 成熟之后,软件应用里应该会跑出一个大牛股。

但过去两年市场一直没太切过去,因为大家发现还是 Infra 公司手里有数据、有 demo、有顶尖人才,所以大部分交易热情还是集中在 Infra 上。最多是大家看完英伟达,再去看看它的产业链、投资标的,或者更便宜的芯片替代方案。

不过今年出现了一些值得关注的应用公司。

第一个是 Reddit。它有点像美国版的知乎 + 小红书 + B 站,而且没有被过度商业化,社区数据质量很高。现在 ChatGPT 就在高频使用 Reddit 的数据。我最近也经常在想,如果知乎或小红书本身也有很强的 AI 团队,会做出什么样的产品?

第二个是 ServiceNow。这家公司会帮企业梳理 Workflow,然后把能固化的部分做成软件交付。虽然起步慢,但他们凭借着强大的交付能力和工程能力,逐渐占领了用户心智,还拓展了一些 500 强客户,拿到的软件需求越来越多,现在的增长速度也快了起来。我很推荐想做美国 ToB 业务的创业者去研究一下 ServiceNow 的路径。

第三个值得关注的公司是 Figma。当年国内研究 SaaS 时,大家都很有热情地分析过一些 PLG 公司,比如 Figma、Notion 等等。这批公司如今几乎都是 AI 的赢家,而且它们的打法也契合华人团队在增长上的优势。

不过,大家对 Figma 的评价非常两极。一种声音认为它只是设计软件,技术不够先进,容易被原生 AI 产品替代。

但在我看来,设计本身离 AGI 就还比较远,所以 Figma 最大的优势在于它的协作场景。实际上,用户使用 Figma 的一大需求,是他们的设计师可能不在同一地点工作,所以需要通过 Figma 完成协作,甚至是制作一些模版。

另外,Figma 作为一个中生代公司,既有成熟的场景和资源,也有几百亿美元的市值作为人才和资本的保障。如果它能把 AI 真正融入协作场景,或许也能给其他几百亿、几十亿美元规模的公司提供一个参照。

曲凯:明白。二级市场我们已经聊得很全了,美国一级市场有什么值得关注的吗?

莫傑麟:今年美国一级市场最明显的现象,就是模型公司的估值越来越夸张。

像 Thinking Machines,一上来就是上百亿美元的估值,全明星团队加持。再比如 Scale AI 的收购,也进一步强化了大家对模型产业的信心。

当然,这些市场变动背后的过程很复杂,不能只看结果。但它们反映出了一个大趋势,就是 AI 的个体性极强,可能只有那 1% 最特别的团队,能拿到最多的钱。

而且确实有不少人通过二手份额,从 Scale AI、OpenAI 这样的公司上赚到了钱,这种正反馈又进一步加剧了市场对顶尖 AI 公司的追捧。

在我十几年的从业生涯里,从没见过第一梯队和第二梯队之间有这么大的估值差距。

我也很好奇,国内今年的融资环境也是接近美国这种局面吗?

曲凯:有类似的趋势,也有不同点。

美国的一级市场的一个优势就是它有一个非常好的生态,也就是一个健康的闭环。而国内一级市场缺乏这种生态,所以更多是单点击破,最终只有少数几家公司拿到最多的钱、赚到最多的钱,以及投中这几家公司的少数机构,也会赚到最多的钱。

然后最近一两年,国内一级市场有两个明显的变化。

第一,不可否认的是整个市场在往下走。虽然中间有起伏,但拉长时间线看,过去两三年和过去五年、十年相比,整体还是下行的。而且国内一级市场越来越像一个偏职能型的部门。它不再是驱动增长、带来大增量的引擎,而是一种必备的基础配置。

第二,两极分化越来越严重。因为 DeepSeek 和 Manus 的大火,今年 AI 的热度可能是去年的十倍,但从实际投资数量看,和往年差别不大,绝对没有十倍那么多,不过被投中的公司可能真的能拿到十倍的资金。结果就是大家仍然想投最好的团队和公司,而且这种两极分化的趋势目前看起来还会继续。

莫傑麟:最近美国一级市场还有一个很火的概念叫 Vibe Coding。Coding 成本越来越低,个体在早期验证 PMF 变得更容易、更便宜,所以很多原本做 VC 的人开始转去做孵化器或加速器,去支持各种「一人公司」。国内有类似的趋势吗?

曲凯:国内有人在做类似的事,也有人在支持独立开发者。

但我的看法可能和大多数人不太一样。

AI 的确会让未来公司的效率更高,需要的人更少,但这并不意味着会普遍出现「一人公司」。如果两个人能把事做得更好,为什么一定要一个人?关键还是要看组织结构和人效比,而不是执着于概念。

另外,大家经常会看到新闻说美国某个独立开发者一年能赚几百万美金,但国内这样的例子很少。我觉得一方面是因为美国生态更完善,能变现的钱更多,另一方面是国内很多独立开发者工程和代码能力很强,但在商业化和产品运营上的经验相对不足。

莫傑麟:我还有个好奇的问题。你接触张月光、曹越、小红他们这些创业者这么久,你觉得国内创业者怎么看 AI?他们遇到的最大困难是什么?

曲凯:我们接触的创业者状态差不多,都是越来越相信 AI 的前景。

至于困难,首先模型的竞合始终是个问题,就是怎么能更好地利用模型去做更好的产品,但又不会被模型的迭代吃掉。

第二是市场选择。很多公司现在首选出海,因为大家觉得 AI 成本太高,只有付费能力和意愿更强的市场才能覆盖成本。

但我觉得很多人对国内市场的悲观都是感性判断。如果你真正去拆解逻辑,会发现国内市场完全可做。因为长远来看,国内 Token 成本有可能降到接近零。到那个时候,大家完全可以重走移动互联网的路径,比如做大 DAU 的产品,靠广告赚钱,或者做社交产品等等。

所以中长期来看,我认为国内市场仍然有机会。

莫傑麟:我还有最后一个问题。我发现今年视频消耗 Token 的增速非常快,不仅增速远高于文字,绝对数量也很高。我们一直在研究,到底是哪些应用在拉动这波消耗。你有看到什么有意思的应用吗?

曲凯:我们今年年初发过一篇总结与展望,其中的各种预测都在逐步被验证。

我们在文章中提到过,今年的两大重点就是 Agent 和多模态。Agent 那波已经过去,接下来就是多模态,而多模态里最突出的就是视频。

不过,目前大多数 AI 视频产品还停留在特效、剪辑,或者图片转视频阶段。这些方向虽然可能会消耗很多 Token,但还称不上是真正的多模态原生应用。

我们真正期待的,是当像 Veo3 这样的模型变得更好、更便宜时,会不会出现类似 Manus 的现象级产品。它也许是一个多模态原生的内容社区,也许是一个多模态推理产品,甚至可能是类似世界模型的探索性应用。

一旦这样的产品出现,可能就又会带动一波长达半年甚至更久的浪潮。

【莫傑麟 @ 42章经文字稿 & 播客回顾】

2025.3《世界怎么就「东升西落」了?聊聊二级市场与 DeepSeek+Manus 的热潮》 (推送文字稿传送门

2024.7《上半年 AI 市场有多差?为什么机构出手这么少?》(推送文字稿传送门

2024.3《英伟达、Sora 与 AI 的三种核心叙事逻辑》(播客传送门:https://www.xiaoyuzhoufm.com/episode/65e34a65da891a9cd9bf90f2

2023.12《为什么我们开始乐观?关于经济发展的明线暗线、AI 与最佳实践》(播客传送门: https://www.xiaoyuzhoufm.com/episode/656aeffd0500be931c4eb099

最后,莫傑麟团队最近在做一个叫 WhatIf 的项目,希望把更多投研经验与 AI 实践结合起来。他们定期组织商业和投资的 Panel 讨论,如果你对中国和美国 AI 基础设施和应用公司研究有持续稳定的视角,且对宏观/二级市场策略感兴趣,可以在公众号「WhatIf Ideas」中提交注册信息,通过后加入讨论日历名单。

42章经

思考事物本质

阅读原文

跳转微信打开

活动报名:AI 视频的模型、产品与增长实战|42章经

2025-08-10 22:02:00

原创 曲凯 2025-08-10 22:02 北京

Agent 之后,多模态能否成为下一个风口?

在 Agent 热潮之后,我们认为多模态,尤其是视频生成领域将出现下一个风口。

那么,AI 视频如今究竟发展到了什么程度?底层模型能力有哪些新突破,未来又可能出现哪些变化?与此同时,随着赛道竞争日益激烈,新入局或者想入局的人,在产品和增长上又该如何决策?

带着这些问题,我们将在下周六(8 月 16 日)上午 10:30 举办一场线上交流活动,Luma AI 模型产品 Lead 戴高乐、爱诗科技联合创始人谢旭璋、前 OpusClip 增长产品负责人谢君陶,会从模型、产品、增长三个关键维度,分享他们在 AI 视频一线的实战经验与思考。

具体报名信息请见上方海报。本次线上活动限 100 人(非投资行业),我们会优先通过回答更认真、与我们背景更匹配的朋友。最终参会资格以工作人员通知为准。

期待和大家见面!

阅读原文

跳转微信打开