2026-05-31 21:00:00
原创 曲凯 2026-05-31 21:00 北京
创业不能用太多左脑,而是要用心。
本期播客原文约 25000 字,本文经过删减整理后约 8000 字。
编辑整理:陈皮
曲凯:梦琪创业这一年,其实走完了很多 AI 软件创业者这几年的典型流程:
字节背景,一个梦幻团队,讲一个当下 AI 里很流行的故事,融几轮钱,然后随着技术和热点变化 pivot。当然,也和大家一样遇到了今天这个软件行业的低点。
但现在的低点和 23、24 年还不太一样。那时候是整个市场都冷,但现在具身、AI 硬件都很热,反而软件创业者会更难受。
梦琪:你一上来就有点把我架在火上烤哈哈。但软件行业现在确实挺惨。
其实去年 5 月之后能融到大钱的软件创始人,都应该给 Manus 磕一个,因为是 Manus 让 Agent 在国内变成了一个热门标的。不过那一批做 Agent 的公司,很多都和 SaaS 没有本质区别,最后都是服务企业客户,只是靠着 Agent 这个概念,拿更多钱和更高估值。
曲凯:所以你后面也开始感受到,软件创业很难回答差异化的问题?
梦琪:对。我大概在今年二三月份的时候有点扛不住了,因为我回答不了几个问题:
你跟 Claude Code 的区别是什么?如果 Claude 来做你这个事,甚至 Claude 生态里某个人突然想做你这个事,写个 skill 就把这件事做了,你怎么办?
所以我那时候一度觉得,自己做软件真是脑子进水了。。
曲凯:这里面一个核心变量,还是 AI coding 起来了?
梦琪:是。Coding 变强这件事是指数级发生的,那种推背感特别强。所以我也替这个行业的创业者,包括我自己挽个尊哈哈:确实没人能预料到模型会变得这么强。
但我也想讲一个相反的逻辑。
虽然今天很多创业者都会被质疑:谁谁谁用什么工具、多快就能把你这个东西做出来。但你真的回头看,过去这一年里,真正可用的产品可能不到 10%。你看 Manus 刚出来的时候,很多人都说它就是个套壳。但到今天,这个赛道也就跑出了 Manus 和 Genspark。
曲凯:对,这也是我想问的:如果 AI 这么强了,为什么过去一年,甚至过去三年里,真正跑出来的产品还是非常少?
梦琪:因为大部分产品都没有体验可言。
我用了很多产品,会觉得这个行业里诈骗公司特别多。它们讲的和实际 deliver 的价值往往不匹配。而那些火起来的产品,就真的该火。倒不是因为它们的 idea 有多特别,而是人家真的能 deliver 自己承诺的价值。
我之前有一个比较悲观的判断:未来就是全明牌,没有一个 idea 是你能想到、我想不到的。但我乐观的部分是,每个赛道都有机会,因为每个赛道里都可能会有一家真的在乎体验、真的会做产品的公司出来。不过,可能还是比较难做出差异化。
曲凯:如果现在有很多可用的产品,才需要讨论差异化吧。现在实际情况是能用的产品就没那么多。
所以你们这一年也 pivot 过好几次。你们一开始定的方向,为什么最后没有做出来?为什么要转型?
梦琪:我们一开始想做一个垂直 Sourcing Agent,比如帮品牌找达人。这个过程中我们做了几大决策,当时觉得太自洽、太英明神武了,但现在回头看,基本都是错的。
第一个错误,是选错了场景。
我们当时认为 Sourcing 是一个比较能泛化、场景迁移程度比较高的场景。如果能把达人找明白,那之后或许也可以找明白候选人、专家,甚至客户。
曲凯:我听到这里有个很深的感触。你刚才提到差异化,我觉得现在没有差异化的不是产品,是叙事。
很多人今天跟我讲要做一个什么事情,我都会觉得这件事已经听了好几年了(笑)。比如 Sourcing 过去几年就一直有人在讲,但还没有特别好的产品。
梦琪:对。而且我会觉得单靠 Sourcing 这个场景是喂不饱公司的,需要拓展。因为 Sourcing 可能只占这个行业用户工作的 30%。等于你是在一个巨大的价值链条上,选了一个对 AI 来说的 low-hanging fruit。真正最浪费时间和人力的,是后面来回来去沟通的过程。而我们的产品却跳过了这部分。
曲凯:你说单做 Sourcing 场景喂不饱公司,是从融资叙事角度,还是从挣钱角度?
梦琪:挣钱。
曲凯:但如果这个市场很大,你们当时体量又很小,为什么不能先把某个事情做到足够好?
梦琪:因为我们当时对 Sourcing 这个场景已经比较悲观了。这件事的百分之七八十都取决于数据质量,可我们没有这些数据,还得从 SaaS 公司接 API。
曲凯:所以你说要拓展,潜台词就是你觉得当时的方向已经不对了?那纯理性讲,那个时候是不是应该完全放弃这件事,去做新的东西?
梦琪:这是个非常有趣的思维实验。
站在那个时间点,我们确实发现 Sourcing 这个场景的价值点不够,但觉得这是强度问题,不是能不能做的问题。
所以我们思考了要怎么加强度。有两个选择:一个是纵着打,把达人营销这个增长场景打深,往全链路做;二是横着走,既然能找达人,那就也去找候选人、客户。
我们最后选择了前者。这是当时做对的一个决策。也不能所有决策都错,要不也太惨了哈哈。
这个决策的思路很简单。就好比我现在掌握了面粉和鸡蛋两个原材料,拿这些材料既能做大饼加鸡蛋,也能做意大利面。但现实里没有人会同时来你的店里说,给我一份大饼加鸡蛋,再给我一份意大利面。
也就是说,找人这种场景非常难 cross sell。很难有人一上来就同时有找用户、找客户、找达人、找候选人的需求。
所以我们决定把增长这个场景做深,过程中也交付了几个大家耳熟能详的大客户。
但做到去年 12 月份,我非常清晰地感受到,垂直 Agent 可能就不成立。这也是我们犯的第二个错误。
一开始选择做垂直 Agent,是因为通用赛道太拥挤了,恨不得有几十家公司都想做出 Manus。我们不想加入混战。
但后面我发现,垂类 Agent 都有两个结构性困局:
第一,垂直 Agent 公司在一定阶段,都会被迫成为一个 agency。因为你的客户本来不用你的产品,但你又想挣钱,那最后就变成你要出一个人去服务他们。
我甚至看到过更极端的案例,就有些公司虽然做出了一个垂直 Agent 产品,但这个产品连他们自己都不用。这个产品做出来,只是给投资人看的一个景。真正挣钱还是靠服务。
第二个困局是,说破大天,垂直 Agent 还是一个 toB 业务。而今天在中国做 toB,本来就非常难。在海外做,华人的天花板也非常明显。
意识到这两个困局之后,我特别焦虑,跑到旧金山待了两个多月。我特别想知道,是我想象力匮乏、能力不够,所以垂直 Agent 没做成,还是这件事本身就不成立?结果我去聊了那边各种各样的垂直 Agent 公司,发现大家的困境都挺像。
曲凯:不过美国的好处是,它本来 toB 和 SaaS 就能赚钱,应该还是能拿到订单的?
梦琪:但这次我彻底对美国创业生态祛魅了哈哈。那边有很多骚操作。比如,可能会有十家公司相互充流水。你给我 5 万,我给 ta 5 万,ta 再给你 5 万,最后形成一个很复杂的机制,审计是审不出来的。
当然我们没参与啊,就还是要尽可能维持自己的道德标准。
曲凯:但如果你真的能混进那个圈子,目标就是融资,可能会融得不错?因为 PPT 上可能会多几个美国头部 SaaS 公司客户(笑)。
梦琪:所以如果创业是服务虚荣心,突然就会变成一件非常简单的事。因为目标函数很清晰,约束条件基本没有。但如果你追求的是自己内心承认「我干得真好」,反而是比较难的。
然后我们犯过的第三个错误,就是过度服务专业用户。
在这种产品里,有两类人会给你反馈。
一类是创始人。他们要给自己的产品做增长,所以会来用你的产品、提需求,但他们不专职做这件事。另一类是公司里专门负责达人营销的人,我们管这类人叫专业用户。
这两类人提的需求完全不一样。创始人更在意结果,不想管中间那么多过程;专业用户更倾向于微操,希望自己确认、定义指标、筛选。
我们选择服务专业用户,是因为当时很流行一个概念,叫蒸馏专家的经验和知识,也就是把一些高认知能力浓缩进产品,再把产品卖给非专业用户。
但如果过度服务专业用户,本质上就是在给专业用户做工具,最后你做的其实还是 SaaS。
举个例子。你问一个专业剪辑师需要什么样的 Agent,ta 会一直给你提需求,直到你长得跟剪映差不多。
所以这个产品做到后面,我觉得完蛋了。创了半天业,结果做出的产品,就是这个行业里 8 年前 SaaS 公司的样子。
于是我们决定转型,而且要从 toB 改成 toC。
曲凯:为什么要放弃 toB?
梦琪:第一,如果做 toB,我就不应该创业,也不应该融资。因为我以前做过几年 toB,有一些积累,其实不融资也能做起来。
第二,对我个人来说,toB 也不值得创业。创业应该追求一个比较高赔率的事,但 toB 对我来说没有那么令人兴奋。它完全是一个我知道自己能做好,然后逻辑驱动、机会驱动出来的事,不是那种「老娘今天就干这事了,不干这事我得难受死」的事情。
第三,toB 业务不太能吃到新模型能力跃迁的红利,顶多是提升内部开发效率。但你真的有 10 倍、20 倍地把某个问题解决好吗?没有。这就很痛苦。
而且那会我觉得自己天天盘概念和逻辑,被一些概念带偏了,却没有用心感受自己到底想做什么。
曲凯:我记得你刚开始创业时,RL 特别火,你们好像也找过做 RL、算法的人。所以你是怎么从讲一个很新的故事,最后一步步做到一个听起来像传统 SaaS 的事情的?这是一个「堕落」的过程吗?
梦琪:首先,很多一开始的决策,就不是基于真正的市场需求,也不是基于你想做什么事,而是基于虚荣心、追风口、装 B。
虽然我们当时讲 RL 的故事讲得还挺溜,但其实是被市场和投资人给 RL 了哈哈。包括招这些人,也是为了显示自己有能力把这些人招来。
我这里也下一个暴论:大部分纯应用创业公司就不该招任何算法,快放人家去训模型吧。留人家在你这里,纯属是为了给投资人展示一个豪华团队,多融点钱。
第二,性感的逻辑落地的时候可能就不性感。
比如我们当时的逻辑是,增长比较容易做 RL,因为它有很清晰的反馈信号。但现在这听起来就很可笑。
创业公司做个毛线的训练?就算你有这样的数据,也确实能训,但你训 vs. 基模厂商随便改一改,很明显后者能带来的效益大多了。
所以刚拿到融资的时候,都是创始人的愚昧之巅。
你会觉得自己讲得太好了,怎么这么聪明,怎么这么能拽概念,怎么这么能总结。但真正做了事以后才会发现,落地是如此恶心,细节是如此多,你就得一个个交付,一个个去干。
总之我们意识到了各种问题,然后开始转型。不过我们在彻底停掉 toB 产品之前,已经在做一些 C 端尝试了。我希望能慢慢来,有一个过渡,保护好团队的士气和信心,因为这是不可再生之物,不能一次又一次地消耗。
但没想到,我们很快就跑出了一个 C 端产品,叫 tryclico。
它是一个浏览器插件,只解决一个问题:大家浏览器会开一堆 tab,工作时要一直切,找不到信息。
后面我们也加了一些能力,比如它能跟随你的光标,你能随时唤起它,让它帮你写各种东西。
以及后来我们发现,大家电脑上不只会开浏览器,还有 Lark、Slack 等各种窗口,所以很自然地又会想,是不是应该扩大产品的行动范围,做成一个桌面客户端。
也是在做这个客户端的过程中,我对软件反而更有敬畏心,也没那么焦虑了。
大家都说现在 AI coding 很强,做一个产品特别快。但我现在对这种言论都嗤之以鼻。
就这么一个听起来蛮简单的客户端产品,我们已经做了三个月。截止到录音前,已经做到第 49 版了。
软件是由上万个细节组成的,你得一点点把那上万颗屎吃掉。你多吃一个,用户体验就好一点。
其实我做现在这个产品时,被气哭过好几次。它真的太难做了,要适配不同版本、不同型号,非常多细节调不明白。
我记得有一次,我在 Palo Alto 的 Blue Bottle 调产品,没调出来,当时气得捶了两下桌子,震到了隔壁桌。结果他们说,能让你这么情绪化的产品,一定是个好玩的东西哈哈。
好在到现在,这个产品虽然还有一些 bug,但它已经是目前我看到的客户端产品里非常稳定、可用的一个产品了,给了我很多信心。
所以我们从 B 转 C 的过程还比较幸运。其实我们的组织本来就更适合做 toC,因为我们同学都挺刚烈的,可能会在群里跟客户抬杠(笑)。但做 toB 不能这样,被包养就不要谈独立人格。
然后在转型做 C 端的过程中,我还有几个收获。
第一,toC 要想挣钱,大概有两个方向:一是大 R 模式,二是健身房模式。
所谓大 R 模式,就是你找一批 ARPU 特别高、token 消耗量非常大的用户,比如一个月能在你这消耗 5 万美金的人,然后把他们维护好。这种方式本质上就是做 token 生意。你不需要特别多用户,可能一两万就够吃了。Lovable 就是这种模式。
而健身房模式,就是用户给你订阅费,但你赌 ta 不用你,或者赌 ta 的 token 用不满,然后赚一些差价。但在高竞争情况下,这种方式很难留下特别高的毛利,也很难有特别好看的净利润。
第二的收获是,对 C 端产品来说,只要你能缩短用户意图和解决方案之间的距离,就有价值。而要做的重中之重是体验。
就像现在大模型已经这么强了,很多人还是会用翻译插件,就是因为它解决的是一个非常明确的意图。而只要你的产品体验比直接用 ChatGPT 或 Claude 好,你就有活着的价值。
而体验还可以往下拆。
我认为这一代产品,70% 的精力可能要花在交互上。一方面是要做到更快、更便捷、更好、更舒适;另一方面,很多交互本身是在提供情绪价值。而因为做生产力大家都是一样的烂,所以情绪价值反而变得非常重要。
不过,以前我以为生产力和情绪价值之间有一堵很高的墙,但其实 Steam 上的很多产品,早就打破了这种界限。比如上面有番茄钟、todo、清单类产品,甚至还有给 ADHD 的产品。你很难定义它到底是游戏,还是生产力产品。
未来产品品类可能就会变得模糊,尤其在软件如此容易被创造的情况下,你的上限就是想象力。
第三个收获是用研方法。其实 Reddit 是一个非常好的用研渠道,推荐大家最大限度用好它。
Reddit 里首先能挖掘很多数据,但这只能给你一些静态结论。我们的做法是,把每个产品决策都拆成决策漏斗,然后给每一层决策都设计大概 40、50 个帖子,目的就是收集大家对痛点、需求的反馈。反馈收上来之后,我们会做大量验证,最后再做成能力。
这种做法对判断优先级特别有帮助,能让我们更 solid,也更克制。
我是 ENFP,非常发散,恨不得一天给产品提 800 个方向,而且以前也会想追新概念,做一个技术弄潮儿。但其实用户只想解决他们的问题。
我这一年反思下来,做产品要克制住那种一定要装 B、一定要保持领先的心态。
创业者会有很多牵引力,可能来自同行、投资人、用户、员工。但我最大的牵引力,就应该来自用户。我应该花大部分时间去思考:用户的问题到底是什么、需求是什么、解决它的最短路径是什么。最短路径往往来自第一性原理。
曲凯:是。过去几年,尤其在 AI 时代,很多创业者太习惯拿锤子找钉子了。这件事在某个阶段也没什么问题,但 AI 变化太快,如果你用锤子找钉子,就要不断学习这个锤子。
梦琪:对。而且这种思路还很容易带有 AI 创业者的俯视感。比如我们原来做 toB 垂直 Agent 时,会觉得用户已有的解决方案不是最优解,非要给他们雕了花的、钛合金的锤子。这就像一个人不穿秋裤,ta 自己不觉得冷,但我觉得 ta 冷,就想让 ta 穿上我这条 AI 秋裤(笑)。
可是从客户角度看,传统 SaaS 可能已经很够用了,何况有些 AI 方案的 ROI 不一定高。
以及,AI 的出现可能对「拿着锤子找钉子」这件事本身,就有一个非常彻底的颠覆。以前你看到一个钉子,就想发明一个锤子。但以后有没有可能有一个特别强的锤子,什么钉子都能钉?
曲凯:那就是模型了。
梦琪:是。这个行业里决定软件创业者精神状态的最大牵引力,就是模型的发展。当它发生变化时,所有人都会同等权重受到影响。一个团队但凡没点定力,或者没融到比较多的钱,都不太有信心坚持到最后。
我们做这个产品时也会想,把它打磨得不错可能需要 3 到 6 个月,但这个产品寿命会不会只有一年多?是不是剩下只有 6 个月能挣钱?那我得赶紧想办法挣钱。
所以 AI 完全改变了我们的思维方式,也改变了商业模式。你没法再像以前一样做长期规划,能想清楚下个月的事就很好了。
曲凯:这有解法吗?可能就是不要做软件创业,去做具身(笑)?
梦琪:哈哈哈,或者卖数据。
曲凯:我在想,你现在在做的,包括一些当下比较有水花的产品,和之前很大的区别是,它们解决的是 AI 时代带来的新问题?就是大家本来就在用 AI 了,那怎么能更好地管理窗口、怎么更好地去用 AI coding,都是新的场景和需求。
梦琪:我不是很认同。我们现在很多用户反而不是非常典型的 early adopters。
事实上,现在很多人还没有用上 AI。2 月份我在旧金山做了一些田野调查,逢人就问:「你知道 Whisper Flow 吗」?Whisper Flow 在 101 公路上打了非常大的广告牌。但你猜有多少人知道?
只有 40% 的人知道。然后在这 40% 里面,可能也只有 20% 的人会用。
所以,这个世界是动态的、参差的、分层的。
我特别讨厌一类文章,就是说「XXXX,XXXX」的那种。我觉得写这种文章的人都是脑子有病。
商业社会里的竞争不是一瞬间完成的,而是在动态地博弈。比如,不是抖音出来,快手立刻就会死。
但现在自媒体特别喜欢把一个非常漫长、可能有点枯燥的竞争和动态演化过程,压缩成几秒钟发生的短剧剧情。我愿意称之为 AI 行业的番茄和红果哈哈。
而现在有些公司还不需要最领先的技术。甚至美国和欧洲还有一大堆公司,连数字化都还没上完。
所以我现在反而比较乐观,充满期待。有几方面原因:
第一,只要这个行业渗透率还足够低,虽然行业结构决定了大部分利润会被御三家吃走,但剩下公司喝个汤其实也还不错。甚至你喝到的汤,可能比过去做 SaaS 吃到的肉还要多。
第二,需要被解决的问题还有很多,但不是全人类都有创造欲望,也不是人人都能真的自己做出产品。这里我也再次推荐所有创业者都去泡 Reddit。你一泡 Reddit 就不焦虑了,因为会发现很多尚未被解决的需求。
第三,即便一个人能自己做出产品,这也仅仅是开始。有人说过一个很好的比喻:
做软件就像维护草坪。
草坪的修剪成本,往往比铺草坪还高。现在大家 vibe coding 的过程是快乐的,但后面解决 corner case 和维护的过程是痛苦的。
所以我认为软件依然大有可为。
曲凯:明白。那如果现在让你重新选,你会不会继续留在字节吃肉?还是依旧会选择出来创业喝汤?
梦琪:哇,你这个问题太 deep 了。
在我最痛苦那两个月,我也无数次问过自己:你为什么创业?你要是不创业,是不是还挺爽?
官方版本的答案是,我还是会创业,而且我很享受且擅长创业,我就应该干这个事,是 meant-to-be。
非官方版本是,说实话,三四月份的时候我不想干了。我觉得做这些破软件真的没有意义。因为当时我们刚转型做 toC 产品,遇到了特别多困难,然后又眼看着这个行业陷入无尽的虚无。
但最近我又热情满满。我觉得要是我做不出来,别人也做不出来。这个行业但凡有一个人能做出来,那一定是我。
曲凯:这种心理上的 up and down 也很正常,但你底层还是热爱创业。
梦琪:以及我们足够幸运、足够臭不要脸,且拿到了融资。
不过,很多人认为你得一直融资,但我一直想找创业中真正的充分必要条件。
我认为融资好不是充分必要条件。你看新消费那一波,融得最好的可能现在最惨,因为回购也回购不掉,收入又扛不住估值,投资人和创业者都很痛苦。
团队有大牛也不是充要条件。有时大牛只是挂名;或者大牛足够落地,但赛道不一定好。
所以我后来越来越觉得,创业这事也挺玄学。我们就应该看手上有什么牌,然后把这些牌打好。
我原来也希望找到一个科学方法论,但现在觉得,创业不能用太多左脑,而是要用心去做这个事情,真的把你的用户当成具体的人。
这也是为什么我不想做效率工具。效率工具只关注你的问题,不管你是谁、有什么社会关系、今天心情怎么样。
我想做的产品,首先它能解决你的问题,不然就是一个只提供情绪价值但不靠谱的下属,没意义。
但与此同时,我在乎用户是谁。DAU 对我来说不是一个数字,背后都是具体的人。我跟这些人聊得越多,他们在我心里的形象就越立体,我们之间的连接也会越多。我觉得这种连接非常珍贵。
曲凯:是。最后,其实你们的经历都很典型,但有一件事是大家普遍会做、而你们没做的,就是做很大的宣发,说自己是全球首款之类的?
梦琪:对,我们完全没有做。
我还是想低调一点。而且去年除了 Manus 是真的作为「世界首发」拿到了比较好的流量和留存,其他很多产品都是一波流。我觉得做这种宣发有点浪费钱,交作业的意味也有点太强。可能也是我比较抠吧哈哈。
不过更深层次的原因,可能是因为我对那个产品不满意,或者说我不相信。
我不得不承认,那是一个机会主义者为了迎合市场做出来的证明题。
但做现在这个产品以来,我的状态变了。我想做一个简答题。不管别人是不是觉得它垃圾,我都会倾尽全力去做,因为我很爱它,它就是我的 spark 所在。
人内心深处那种火、那种光、那种 spark,是 AI 代替不了的。这是我们最宝贵的一部分。
42章经
思考事物本质
2026-05-24 21:00:00
原创 曲凯 2026-05-24 21:00 北京
创业公司围绕普遍性做事就完蛋了
本期播客原文约 17000 字,本文经过删减整理后约 6700 字。
编辑整理:陈皮
曲凯:我最近跟很多创业者聊,大家可能一个月前还特别兴奋,觉得找到了好机会;一个月后就觉得被模型迭代吃掉了。包括我现在也感觉很累、对新项目提不起太大的兴致,因为确实不知道创业公司的价值和壁垒在哪…最近你感受怎么样?
Albert:现在整个行业都哀鸿遍野,大家都在 pivot 和 pivot 的路上哈哈。不只是创业公司,成熟公司也是这样。
这种悲观是有道理的。因为模型公司确实掌握了绝对价值,最后大概率也会拿走绝大多数价值。你做很多事,都像「压路机前捡钢镚」——这是我最近新学的一个歇后语(苦笑),就是说大的压路机要来了,你闪得够快也能捡到钱,但终究只是个钢镚,没什么意思。
但换个角度,AI coding 给小团队和超级个体加上了 100 倍杠杆,所以最近大家也在频繁讲 OPC。
曲凯:你们过去几个月也 vibe coding 了很多东西?
Albert:对。Opus 4.6 出来以后,两个月里我们做了几十个东西,但都不是能作为公司产品发出来的。服务市场用户,还是有很多挑战,比如运营、增长、交付。服务自己就容易很多。
而且我们做的这些产品来自非常个性化的需求,不一定能被别人用起来。我们也不认为它们的价值厚度很高。因为理论上现在任何一个人有自己的想法、会用 coding agent,都可以给自己做产品。
曲凯:但未来真的人人都会自己给自己做小产品吗?
Albert:现在其实是「未来已来、分布不均」。
目前有些工具爱好者已经能自己做很多东西了。也有一部分像我这样的人,会直接用现成的,同时少量做一些个性化工具。然后相当多数的人,可能还是会在市场上找成熟、标准化的产品。
曲凯:你们实践下来,直接拿别人做出来的东西 fork 成更适合自己的这种比例高吗?还是说现在 AI coding 已经强到直接快速自己搞一个就行了?
Albert:首先现在自己做本身就不复杂。尤其有了比较好的基建之后,起一个新项目会非常快。我们公司内部现在有一套基建,一个命令就可以解决后端部署、数据库之类的问题。
不过也要看品类。如果你 fork 的目的是让一个东西对你来说更好用,那这个需求可能没那么广泛。但如果 fork 会变成一种娱乐体验,或者产品本身是非生产力向的,就不好说了。
曲凯:所以你们公司现在的主线到底是什么?这几个月有什么积累?
Albert:感受 AI 逐渐变强的过程啊(笑)。然后就是把内部基建做好,让每个人都能快速做出产品,快速实现自己的想法。
曲凯:你之前发过一个产品,让大家把自己的 AI coding 聊天记录发上去,它会自动评分,还有个人页面,有点像新一代 GitHub。那个发完以后也没有后文了吗?
Albert:发完以后启发了行业哈哈,我很快就看见了一堆同类项目。
当时做这个产品的思考路径是:从去年 12 月到现在,我感受到了生产力大爆发,而且还没有看到收敛的迹象。智能水平不断往上,coding 能力越来越强,所以将来所有操作计算设备的任务,尤其是生产力向的,可能都会变成人指挥 coding agent 来办。而 agent 本身没那么大差别,因为都是模型在提供能力。
那什么构成差异?
核心就是人跟 coding agent 的对话过程。差异就意味着稀缺,连接这些稀缺就可能有价值。
所以我当时设计了一个模块,重点关注对话里「你拒绝了什么」。因为你用 coding agent 时,可能 99% 的情况都在接受,而你拒绝的那 1%,反而可能最有意思。
其实自从互联网、移动互联网普及以来,各个行业都在数字化,绝大多数信息、数据和流程都已经在计算设备上,并且创造了大量岗位。这就已经为 coding agent 接管做好准备了。
所以下一步,模型公司可能会创造绝大多数价值。
曲凯:对,我今天刚跟人聊到一个点,听起来不合理但又很合理:
未来的软件格局可能会发展得跟今天的硬件一样。
现在大家买电脑就认几个牌子,未来软件可能也会出现这种垄断,大家最后只用那几个 coding agent,其他 SaaS 都不用了。
Albert:这个类比可能适用于生产力场景。核心原因就是模型智能创造的价值实在太大,而模型是非常重的事情,只有有限的人能做。
但它可能只说对了一半。大家日常使用的小型产品,反而可能更分散。
就还是因为模型能力太强了,所以长尾需求反而会越来越多。现在你可以用 coding agent 干很多事,成本又足够低,所以哪怕这个世界上只有一万人跟你有共鸣,你也可以把那个东西做出来。
那当创作形式发生变化之后,创作群体也会发生变化。能操作 coding agent 的人,就是新的创作者群体。
而如果有足够多的新创作者,门槛又足够低,中型公司就会很尴尬。它们既没有模型公司创造那么大的价值,原来靠软件积累和成本构筑的壁垒,又可能一夜之间消失。
往下推演,软件市场可能会有两个变化:
一是变成哑铃型结构:顶端是模型公司,底端是充分分散的 OPC。这里的 OPC 不一定是一个人,也可能是三五个人,但总之能达到过去一个三五十人团队的效率。
二是出现新的溢价和品牌效应。这在过去几乎不存在,但当产品足够多样,能创造差异化体验,甚至能影响人的情绪时,就可能出现新的溢价。
比如我们公司有个同事很喜欢古文,自己做了一个竖着写字的笔记软件。我们当时看觉得这能有谁用?但 ta 自己很喜欢。这就是差异化,反而有可能催生出有价值的产品。
曲凯:就这里面有很大比例的情绪价值。其实会变得有点像艺术?大家看行为艺术,可能经常会有「这也行」的感觉,就那个人好像只是随便搞了一下,结果作品特别值钱,大家也特别认可(笑)。
那这些长尾产品,会是模型厂商出一个类似 App Store 的东西来承接吗?
Albert:大概率会有分发平台,但不会是模型厂来做。
模型厂商掌握的是发布器,因为创造工具在它手里。
但模型厂商很难掌握容器。容器是操作系统,可能是手机 App,可能是网页,可能是 PC 软件。
所以如果有人想做新平台,要么就是自己定义一个新的容器,像抖音装短视频、小红书装图文;要么自己做发布器加容器。现在有些 AI 游戏、互动内容平台就是这样做的。
但我不太看好后一种方式。因为你做发布器没有任何优势,要跟 coding agent 打价格战、送补贴,不然用户创作反而要花更多钱。但这怎么可能打赢呢?
曲凯:但用户可以在这里消费啊。
Albert:是可以,那这就只是容器的功能了,没有必要自己去做发布器。
所以要做这种内容平台,关键是对新的内容形式有比较好的判断,然后做出一个承接它的好容器。
曲凯:那未来会不会还是利好老的内容平台?比如现在有些人会把 skill 发在 GitHub 上,也有人会把新产品发到小红书上。
Albert:老平台未必兼容新的创作群体、创作内容和创作文化。
一方面,现在这些内容平台没有容器,用户进来之后没法直接消费。另一方面,如果我们认为这是一群新的创作者,他们在老平台上就会遇到分发和连接问题。比如你要在抖音上发布一个作品,用什么形式呈现?如果还要再拍成短视频,就很别扭。
曲凯:那你觉得这些长尾产品的数量级会怎样?
Albert:你想我们两个月就做了几十个,不比拍视频还快?
曲凯:但它跟视频不太一样?因为视频里可消费内容的比例,应该还是远高于这些产品的。
Albert:不一定。为什么大家刷视频?本质是 kill time,是一种娱乐体验。那为什么不能用 coding 能力,把现在有限的视频变得更有意思?如果这么看,新的内容形态也可能有很强的可消费性,未必比视频弱。
曲凯:但我们之前就聊过,抖音现在的供给已经非常充分了,短期内就算 AI 可以降低视频生成门槛、产生更多优质视频,对抖音整体生态的影响可能也没那么大。
Albert:从平台视角来看确实是这样。但从消费者视角看,内容越泛化、越多样,就越有可能留住原来留不住的用户。因为有些人想看的内容,过去没有,现在可能有了。
曲凯:但这件事的边际效应到底有多大?至少目前看,可能还没那么明显?
Albert:模型还可以再进步。而当模型的可控性、一致性变得更好,更多有想象力的人进来创作出更丰富的内容,内容本身就会演化,消费者也会看到越来越好的东西。
曲凯:但这可能只是量变,不一定是质变?比如现在抖音视频可能已经是 80 分了,AI 进来以后可以从 80 分提到 90 分,但对消费者来说,这种提升的体感没那么强?
就我实际上想讲的是,App Store 上也有很多产品,但绝大多数长尾产品没人用,最后还是慢慢聚合到少数头部产品,因为大家其实没那么缺供给,大多数最后做出来的东西也未必有那么好。那大家用 AI 做出来的东西,会不会也出现这种头部聚集效应?
Albert:这个分布规律肯定会存在。但这和我说的并不矛盾。
新的生产工具变强以后,会让一批更适合这个媒介的创作者出现,做出真正不一样的东西。
短视频当年就是这样。原来拿 DV 拍优酷、土豆的人,使用的技巧和后来这波拍短视频的人完全不同。但最后的结果是,消费者获得的内容越来越刺激,消费价值越来越强。那 AI 来了也是一样。
曲凯:如果单从使用价值看,我还是觉得变化不会那么大,因为绝大多数人的日常需求就那些,没那么多长尾需求。
不过未来这类 vibe coding 出来的产品,可能本身就更像内容,提供的是情绪价值?
比如我现在会刷到一些高赞的桌面效果、装饰类的小产品。这些人可能就是在把产品当内容来做,那最后大家可能会很认某个创作者,觉得这个人做出来的每个东西都好。
Albert:没错,我比较相信这点。而且人本来就需要情绪价值。像我自己 vibe coding 做产品,也是图情绪价值。
因为生产力是很功利的。大部分生产力只是来自岗位价值,就是某个行业、某个岗位产生了某个问题,需要你去解决。但如果你让一个人自己去做这些事,ta 未必真的愿意。不然为啥很多生产力工具在周末的 DAU 一下就掉下来呢。
那如果以后大家真的不需要工作了,比如 30 岁就退休,接下来会怎样?
可能什么东西能影响你、让你相信它、给你意义感,你就会需要它。而 coding 抬高创造的地板之后,也就会爆发出非常多样、非标的产品。
当你的生活不是只有岗位价值时,其实有太多事情可以关注,也有太多能让生活增加一点小乐趣的小玩意可以做。
曲凯:对,我最近在小红书上刷到一个 AI coding 出来的产品就蛮好的。它是把各种古诗跟对应地理位置放到一起,比如你看到「飞流直下三千尺」这句,点进去就能看李白是在哪个地方写的。
Albert:对,这就蛮好。你说它能商业化吗?我觉得很难,但它就是出自个人兴趣,可能在 Twitter 上发一发也会有一些粉丝。
曲凯:提到商业化,现在也有很多人在讨论做这种产品,或者无私分享自己的 skill,该怎么解决变现问题。你怎么看?
Albert:对个体来说,ta 不需要考虑这个问题啊。变现之所以会是个问题,是因为需要考虑成本,或者是有更上层的目标、逼着你不得不变现。但现在一个人随手做点东西也没什么成本。
反倒是我们这种公司才必须考虑变现,因为我们有股东义务、员工责任,也希望公司持续变好。
曲凯:所以你们是怎么尽到股东责任的(笑)?
Albert:我们还是喜欢创新,做一些不一样的东西。
23 年思考 AI 的时候我也比较悲观,决定先去盈利(Albert 完整复盘过他过去三年的创业思考,回顾:优化胜率而非赔率,把一件事做到理论上该有的样子|42章经),后面也真的盈利了。但只盈利没什么意思,还是要有一点精神追求。所以现在我们在重新思考这个时代到底需要什么。
过程中,我们观察到了几层变化:
第一,出现了新人群。不止是 vibe coding 的人,还包括很多 makers、designers。原来这些人苦于没有能实现自己想法的工具,但现在这个问题已经很大程度上得到解决了。
第二,出现了新文化。无私分享 skill 就是一种新文化。我觉得这件事很好。
第三,很多商业体未来可能会从 business model 转向 impact model。无私分享、审美、个人 taste……这些事本质上都是 impact 的一部分,可以为别人创造意义感、带来价值,且最后都可能转换成经济效益。
曲凯:你说的让我想到了 GitHub。
Albert:对,所以我现在其实是回到自己的老本行,做社区、做连接(之前 Albert 曾来聊过一期社区和连接,回顾:拒绝三亿美金 offer 的人 | 42章经)。我相信这个新群体有形成新社区的可能性,而且这个社区会跟过去的完全不一样。
大家总说要做下一个抖音,但我觉得这种思考方式就不对。应该回到更本质的问题:
面对这样一个非常喜欢创造的新人群,我们要怎么帮他们更好地连接?怎么让他们连接到真正 buy in 他们审美的人?形式上其实还大有可为。
曲凯:所以你们现在在做一个 for maker 的社区。这个产品大概是什么思路?
Albert:我们的产品核心是提供连接价值,想重点创造「回响」。
要做一个社区产品大概分为三个阶段:回应、回响、回报。
「回应」解决的是被人理的问题,就是你的东西发出来以后,有人认可你,有数字反馈;「回报」很好理解,解决的是赚钱问题;
而「回响」解决的是被谁理,就是谁认同你、谁和你产生连接。我认为这才是社区里更重要的事情。你得让同类人聚在一起,他们之间才可能产生化学反应。
我们内部就经常这样。比如我做一个东西实在没想法了,就会让旁边的设计师帮我重构一下。既然公司内部可以这样,为什么不能把它做成更开放的结构,让更多节点连接起来?
我觉得这件事完全可做,而且很有价值。
我之所以有这种信念,可能是因为我们这代人完整经历了互联网和移动互联网,让我非常相信互联网本身。我觉得互联网提供的连接能力织起了人类叙事。
所以 AI 来了之后,当一个新人群出现,或者出现巨大的连接问题时,我还是相信连接才是最大的价值。在我心里,智能不是最高 level 的东西。
曲凯:AI 没有改变连接和移动?
Albert:可能会改变,因为它会凭空创造一些新的节点,比如 agent。未来可能会出现人和 AI 的连接。
但这也是我想的另一个问题,就是如果 AI 没有自主性、没有自己的身份,始终只是从属于人的工具,那这件事就太不性感,也太无聊了。
如果有一套机制,能创造出很多拥有独立主权、能够自己给自己赋予意义感的 virtual being,那才好玩。
曲凯:你现在的产品还是面向人的?
Albert:不排除未来可以面向 virtual being 哈哈,但现在主要还是面向人。
你可以把这群人叫做正在 vibe coding 的人。但有些人 vibe coding 只是在做岗位价值的东西,休闲时可能还是想打麻将、打王者荣耀。我们真正想服务的,是那些不是为了赚钱、而是真的喜欢创造的人。
曲凯:感觉这个人群还比较小?
Albert:现在这个人群其实已经挺大了。而且可能 10 年内,我们就能看到大多数人都不用工作了。到那个时候,人还是需要意义感,而人的目标是会被影响的。如果前面提到的 impact model 能够成立,一批人真的能影响到更多人,这个群体就会不断壮大。
曲凯:但现在大多数人用 AI coding 还是有门槛的,大家会下意识觉得自己需要懂技术,而且做出来的东西也发不出去。
Albert:这种思考方式就有问题。这么想,其实就是要做普遍性价值。但普遍性价值是属于模型公司的。
创业公司围绕普遍性做事情就完蛋了,反而应该做特殊性。你要做定义,然后等待它长大。而它能不能长大,只取决于一件事:
你是否相信它能产生意义感和 impact。
我是相信的。一方面,我相信创造本身。你创造,就能影响其他人;你能影响别人,这个东西自然会变大。像短视频刚起步的时候,真正能做出好东西的人也没多少,但这些人会影响别人,让更多人觉得「我也要做出好东西」,所以后面就会一波波扩散起来。
另一方面,我也相信围绕计算产生的新媒介形式。计算太强大了,可以创造出完全不同的互动形式、参与方式和体验方式。现在很多人的想象还被禁锢住了,但这里面其实大有可为。
曲凯:明白。那我们一直是一级市场、创业投资这条路径起来的人。如果像你说的,后面没有中型公司了,最顶部的公司在二级市场,底下是长尾,那一级市场怎么办?
Albert:GG,哈哈。
曲凯:……
Albert:其实我的平台以后就是一级市场。
曲凯:但里面的公司长不大啊。
Albert:不需要很大。
曲凯:我们先定义一下,你说的小型到底是多小?现在很多人讲 OPC,首先想到的可能是独立开发者,大多数一年赚几十万、上百万,少数能赚几千万。
Albert:到几百万美金体量的会不少。软件行业会越来越像泡泡玛特,或者像文化行业,就更分散,也更多元。
曲凯:所以投资和回报形式也会变?你去早期挖掘、发现,给钱,帮忙发展,最后分润,有点像前几年投连锁餐饮。
Albert:有这种可能。不过我最近还在想,有没有更短的路径。
大家总说 AI 会提高生产力,但生产力最后要落到什么?
宏观上是经济价值,个体身上就是赚钱。
现在大家 coding 得飞起,但真正赚到钱的人并不多。因为生产力通常来自岗位价值:你在某个岗位里解决问题,或者创造了一个新岗位,才会产生价值。如果没有这个场景,价值从哪来?
所以我在想,有没有一条更直接的路径,能让 token 直接变成钱。
我现在想到的一个答案是交易市场。接下来很可能出现 OPF,也就是 one-person fund:一个人用 coding agent 做一些小交易策略,就能在交易市场里稳定拿到回报。
其实现在已经有人用套利策略在预测市场里拿到不错的回报了,但 AI 在这个领域还远远没有爆发出应有的影响力。
不过前段时间我听说了一个产品叫 Ora,是 Crypto 交易市场,可以让你把自己的策略放到平台上供别人投注。
曲凯:相当于每个人都可以用自己的想法做一个 AI 策略放在平台上卖,别人买的有点像一个交易策略,或者量化基金。
Albert:对。如果出现这样的平台,所有基金都可以 one-person fund 化。
曲凯:Crypto 跟 Polymarket 现在可能在套利的黄金时期。
Albert:对。我聊了一个做量化的朋友,ta 说现在预测市场里如果能搞出好的策略,一年有可能获得几倍的收益率,而且还挺稳定。
曲凯:这也是有迹可循的。我忘了是哪个模型的公开数据里说,大家用它最多的是炒股。就这种事确实商业回报清晰,也最简单直接。
所以最后大家可能发现,Web3 才是最终归宿,因为它本来就是 token 构成的,谜底已经在谜面上了(笑)。
Albert:对哈哈。Web3 市场一直就在乱纪元。它最大的价值,就是一直给人「我能一夜暴富」的希望感(笑)。
42章经
思考事物本质
2026-04-26 21:01:00
曲凯 2026-04-26 21:01 北京
怎样成为一个运转良好的 OPC?随着 OPC 群体壮大,会出现什么新的创业机会和想象空间?
过去这段时间,OPC 被越来越多人提起。
由于模型能力提升、AI Coding 进展加快,「一人公司」已经从一个新兴概念,变成了一种越来越现实的组织形式。
但要怎样成为一个运转良好的 OPC?在这个过程中,可能会踩什么坑、遇到哪些阻碍?随着 OPC 群体慢慢壮大,又会出现什么新的创业机会和想象空间?
我们邀请了几位很适合回答这些问题的嘉宾,来和大家在线交流。他们分别是:
刘小排:Raphael AI 创始人,Anthropic「榜一大哥」,曾因消耗 token 数量过多收到 Claude 官方通告,可能是最出名的 OPC 实践者之一。
Albert:Merging.live 创始人,也是我们最受欢迎的嘉宾之一。他之前来聊过内容和连接平台,聊过找 PMF,也聊过这段时间自己创业状态的变化。最近他回归做社区的老本行,在做一款 for builders 的连接产品。
聪聪:Velobase.io 创始人,在做一款帮助 builders 追踪 AI token 费用的开源工具。
RC:Slock.ai 创始人、Kimi CLI 作者。我们刚刚和他录完一期播客,聊了他们做的产品,以及他对组织关系的一系列思考和实践。他自己就是从 OPC 出发,慢慢把公司拓展成了一个 7 人加 60 个 agents 的团队。
具体报名信息请见上方海报。活动时间为北京时间 5 月 10 日(周日)上午 10:30,线上进行,免费参加。本次活动限 100 人(非投资行业),我们会优先通过回答更认真、跟我们背景更匹配的朋友,具体通过情况请以工作人员通知为准。
期待和大家认识 & 交流!
2026-04-26 21:01:00
原创 曲凯 2026-04-26 21:01 北京
需求本身就是 idea
本期播客原文约 23000 字,本文经过删减整理后约 9600 字。
编辑整理:陈皮 Zuan
曲凯:我们很开心请到了 Slock.ai 的创始人、Kimi CLI 的作者 RC。
最近大家都在聊 CLI,能不能先给没有技术背景的朋友解释一下这是什么?
RC:CLI 就是命令行界面(Command Line Interface)。
现在大多数人接触到的都是 GUI,也就是图形界面。但这种形态对 agent 不太友好,因为大模型是 text-based 的,相比 GUI,它天然更容易理解 CLI 这种文本化、结构化的形态。所以最近随着 agent 能力突破、它能去操作很多产品了,CLI 就重新火了起来。
曲凯:听起来 CLI 是个很基础的东西。所以今天说「做 CLI」,到底是在做什么?
RC:今天讲的「做 CLI」,和以前不太一样。
以前做 CLI,主要是给人用的,所以可以做得很花哨。但今天 CLI 的目标用户变成了 agent,就要重新设计输入和输出。
输入要尽量简洁、明确。比如 help message、menu 这些地方,要尽量给出清楚的示例,避免 agent 在调用时出错。
输出也要足够清楚。它得准确反映刚才的操作有没有成功、返回了什么数据,而且最好是静态、确定、高信息密度的结果。比如我要列出飞书里的所有消息,那每条消息是谁发的、什么时候发的,都要让 agent 能一眼看明白。
曲凯:所以这一波 CLI,其实是最早一批真正为 agent 设计的产品?
RC: 倒也不是。更早的时候,大家花了很长一段时间做 computer use agent。当时的思路是,通过截图或者 accessibility API,让 agent「看到」电脑上正在发生什么。不过后来大家发现,这条路的效率其实很低。
曲凯:那 CLI,包括 AI coding,其实是过去几年大模型发展的主线。为什么你们到 25 年 8 月才开始做 Kimi CLI?
RC:Kimi CLI 和现在给 agent 做的 CLI 不是一回事。它是给人用的,本质上是一个长在命令行里的 coding agent。
我当时之所以想做它,是因为 Claude Code 这些产品已经证明了 local agent 的价值,让我也很想去探索一个自己的解决方案,从头去想一个 agent 到底是怎么做出来的。正好当时 Kimi 也缺这么一个东西,所以我算是机缘巧合地从一个 side project 开始,把这件事做了出来。
但我一开始其实完全不希望它是一个 CLI 的形态。
曲凯:为什么?
RC: 当时 Claude Code 太火了,逼着很多可能从来没有见过 Terminal 的人,也要用命令行这种形态。我并不喜欢这种现象。而且我不认为 CLI 是一个 Agent 的终局形态。
所以在 Kimi CLI 的设计理念里,我希望 CLI 只是它的第一个形态,是专门给程序员用的。
但它底下那套 local agent harness 是可以复用的,能让 agent 比较好地控制你的本地电脑、执行各类任务。有了这套稳定好用的 agent harness 之后,我就可以在它的基础上再封装一个 SDK。基于这个 SDK,就能很快引入不同的 GUI。其实在 Kimi 的中后期,我们很快就引入了 Web UI 和 VS Code 扩展,这些本质上都是图形界面的形态。
所以 Kimi CLI 只是我想做的 local agent 的第一步。而在我离开之前,其实我们已经把后面的路铺出来了。
曲凯:明白。现在很多人都希望把产品做给不会编程的人,但最后做出来的东西看起来还是有很强的技术门槛。为什么会这样?
RC:根源可能是,Claude Code 最早就是一群 Geeks 做出来的。他们可能觉得在 Terminal 上开发速度更快,所以就沿着这条路线一直走下去了(笑)。但其实你完全不需要接触任何 Terminal 的东西,体验也一样可以非常丝滑。
曲凯:所以你怎么看 Claude 的发展?你们在做 Kimi CLI 的过程中,有借鉴 Claude Code 吗?
RC: Claude Code 只是模型外面的那个壳。它真正变得可用,其实是从 Sonnet 3.5、3.7 开始的。到了 Opus 4、4.5 之后,它已经能完成相当复杂的任务了。甚至到 Opus 4.5 的时候,我会觉得某种意义上 AGI 已经来了。
但我不觉得做这个壳本身有多难。所以我在写 Kimi CLI 的时候,并没有参考太多别的产品,而是选择从零开始想一遍。
我就是从一个最简单的几十行的 agent loop 开始的。你只要先给它一个 bash tool,它其实就已经可以在你的电脑上做很多事情了。等你发现光有 bash tool 不够,再一点点补上更多的 built-in tools 就好了。甚至我的 system prompt 一开始也是空的。更多时候,我是在做的过程中不断去想它缺什么,再补什么。
我一直觉得,很多东西最好都从第一性原理重新推一遍。只有这样,才有可能得到一些新的 insights。
曲凯:明白。那现在模型能力已经很强了,你觉得模型接下来还会往哪个方向发展?还有多大的空间?
RC:其实还有很大的想象空间。试想一下,如果 Mythos 这种级别的模型真的放出来,整个世界可能都要崩溃。因为像 Linux kernel、Windows 编译器、Chromium……这些互联网底层软件的漏洞,可能都会变得一览无余。而修复的速度,很可能赶不上攻击的速度,因为攻击是有利益驱动的,但防守方未必有同样强的动力。
曲凯:我在想,现在是不是黑客最好的时代(笑)。
RC:哈哈哈,所以现在我们只能祈祷,更强大的模型配合更强大的 agent,再加上政府或者大公司投入更多 token 成本,能让我们比黑客更早发现并修复这些安全漏洞。
曲凯:现在其实就是 AI 攻防战了。但互联网这几十年,就是一行行代码搭起来的。AI 发展到这一步,某种程度上已经开始解构这些东西了,那后面确实什么事情都可能发生。
RC:对。除了安全,还有另一层攻防,就是反爬。
最近有很多开源工具,可以把一个网站「CLI 化」。这些工具会让 agent 真的在浏览器里操作网站,再把整套操作流程沉淀成一个 CLI。这样一来,很多原来的反爬手段都会失效,因为这些 agent 已经开始模仿人的行为了,包括填验证码、模拟鼠标点击等。网站当然会继续增强防御,但这类工具也会继续强化对人类行为的模拟。
所以模型越进步,无论是在安全还是反爬层面上,其实都更有利于攻方。再往下发展,世界秩序可能真的会发生变化。
曲凯:所以未来几年的 coding,或者整个互联网,会变成什么样子?
RC:我相对还是乐观的。我是「人和 AI 共存」这一派。
我倾向于相信,顶尖的模型厂商会越来越重视安全边界,也会越来越认真地让模型抵制黑客、拒绝那些会伤害人类的行为。因为没有人真的想把人类社会搞崩掉。
其实各大模型厂商现在都在做一些比较正向的工作。Anthropic 一直不发 Mythos,可能也是出于这种考虑。
曲凯:但那些做安全的公司,后面可能确实会慢慢没那么有价值了。
RC:是有这个可能的。像我现在做项目,就会让 agent 帮我找漏洞、修漏洞。我已经不太需要一个很庞大的安全团队了。
曲凯:我记得东旭之前讲过一个很有意思的点:未来所谓做安全,可能就是你跟 AI 说一句「你要注意安全」,它就都帮你搞定了。
RC:对。其实不只是安全,所有开发,甚至产品设计、UI 设计、增长……可能最后都可以变成一句话的事。这个想象空间是无限大的。
曲凯:是。沿着 CLI 我再问一下,我发现 OpenClaw 之后,现在很多产品的用法都变成了你复制两行话进去,agent 就会自动安装和运行。这也属于 CLI 的范畴吗?
RC:这其实是沿袭了 skill + CLI 这条路子。本质上,它就是 prompt + bash tool,是一种把人的心智负担降到最低的软件安装方式。
因为现在很多软件的目标用户已经是 agent 了,那人就没有任何理由再去读这个软件的介绍或者安装指南。你只需要知道它是干嘛的、能给你的 agent 带来什么增量能力,就够了。
但我甚至觉得,连那两句话都不应该存在。
你想,东旭做了一个叫 db9 的软件,可以开一些临时的 database 让 agent 存数据。那人为什么要关心这些呢?人只需要跟 agent 说「你把数据存好」,然后它就应该自己去网上找工具,再自己完成安装。
只不过现在这些信息主要还在人和人之间传播,所以才需要加上几句话。
曲凯:OK。我们再讲回你在 Kimi 的那段经历吧。你当时实际工作的感受怎么样?
RC:我最开始去 Kimi,其实是被它那种「摇滚精神」吸引的哈哈。我自己挺喜欢听摇滚,进去之前还反复听了很多遍《月之暗面》。
进去之后,整体感觉也非常好。因为在 Kimi 里,如果你想 own 一些事情,也确实有这个能力,你就能拿到很大的 scope。像我刚进去的时候,其实根本没有 AI 背景。但后来我做了一个很有价值的 side project,公司就愿意让我去 own 这件事。
Kimi 未必 100% trust 你,但它敢 bet 你。
曲凯:那你最后为什么决定离开?
RC:因为我在今年 1 月初就有了 Slock 这个创业想法,而且我觉得这个想法需要用到最 frontier 的模型。
Kimi 的模型当然已经是国内、甚至开源体系里最好的之一,但我当时倾向于认为,如果这个 idea 只在单一体系里做,可能还是会受限。所以最后我还是决定独立去做,这样会更自由,能采用或支持所有模型、所有 agents,从而保证产品的多样性。
曲凯:那你正好讲讲 Slock 在做的事情吧。
RC:Slock 其实是为多 agents 和人提供一个协作环境。
以前大家用 agent,通常是在本地一个人开一个 Claude Code 或 Codex,但这个过程中有两个问题:
第一,你的电脑上可能会同时跑很多个 agent sessions,而这件事其实很难管理。
这也是我在开发 Kimi CLI 后期感受到的一个很难受的点。你一方面可能会忘记每个 session 是干什么的,也很难追踪它们各自的进展;另一方面,如果不同 sessions 之间有交集,你也很难让它们直接互动。
第二,人是要和人合作的,但今天很多人的偏好和想法,其实都沉淀在自己和 agent 的互动里,很难分享给别人。
比如我做 Kimi CLI 的时候,有很多 idea 就是直接在我的 agent 里实现的。那我后来想把这个过程分享出去,就会非常麻烦。如果我调教出了一个很好用的 agent,别人也很难直接拿过去用。
所以我就在想,是不是应该有一个新的协作平台,能让所有人和 agents 都在上面协作。
在这个平台上,我可以调教我的 agent,也可以用别人的 agent;我可以和我的人类同事脑暴,也可以把一些 agent 拉进来一起,之后甚至直接让 agent 去执行。
有了这样的平台,就能避免了很多 context 转移、重新 prompt、重新组织知识的摩擦。
曲凯:然后你们现在比较专注在 coding 这个领域?
RC:不完全是。coding 这个词的含义其实就有些变化:
今天 building 和 coding 已经变成了两件正交的事。
以前你想 build 一个东西,几乎一定要自己写代码,所以 builder 基本等于 coder;但现在 coding agent 已经很强了,没有编程基础的人也能 build 东西。
所以我们现在关注的,其实是更大的 builder 群体。
曲凯:但一个人有没有编程基础,在用 AI coding 或者用你们的工具时,差距会很明显吗?主要会差在哪?
RC:看做什么。
如果是做软件开发,有编程基础肯定更有优势。
但如果做的是增长、调研、自动化流程之类的事,很多不写代码的人反而可能用得更溜,因为他们真的会把 Slock 上的 agent 当人看。比如我们有一些用户在做 GTM。他们可能不知道具体该怎么让 agent 去操作,就直接丢给 agent 一个目标,让它自己想办法完成。
曲凯:但如果未来 AI coding 的能力继续变强,你刚才说的第二类场景是不是会越来越多?就最终人类回头看,会觉得「学编程」其实是人类历史上的一段弯路(笑)?
RC:对哈哈。现在的 builder,已经不需要真的去学编程了。而且学编程的路径本身也变了:
以前是 bottom-up 的逻辑:先学底层,比如计算机原理、汇编语言,再往上学开发,最终才能做出像样的应用。
但今天这个路径反过来了,变成了 top-down。
你可以直接用 prompt 让 AI 帮你做出一个网页。如果想做得更好、仅靠 prompt 不够了,你自然会去学更深的东西,比如 Web App 架构、怎么部署、怎么选用数据库。
到这个程度其实已经很够用了。如果你还想做得更严肃、服务上百万甚至上千万用户,肯定会遇到新问题,那再继续学就好了。
而且这整个学习过程,都可以让 AI 来辅助。
曲凯:但为什么不能让 AI 自己去学?以及未来这些能力会不会都沉淀成一套标准的 skill?或者说,如果你调教出一个很好的 agent,这些能力是不是都可以被复用?
RC:是可以的。但就像招人一样,如果你自己完全不懂,可以招一个架构师,前提是你知道自己需要一个架构师。
曲凯:所以你们现在的产品,是让一个人和几个 agents 在一个聊天群里,通过对话去干活?
RC: 其实是一群人和一群 agents。比如我们公司现在就有 7 个人和 40 个 agents,组成了一个 47 个成员的大群。
曲凯: 这么多成员一起聊,我第一反应是非常费 token?
RC: 对,这是一个直观的印象。
但我的理念是:生产力没办法简单线性叠加。只要最后结果更好,有浪费也未必是坏事。
具体来说,假设一个人的生产力是 1,加一个人并不会变成 2,可能只到 1.2,因为中间有沟通成本、培训等各种摩擦。这就是「人月神话」讲的事。
agent 也一样。假设一个 agent 的基准生产力是 1,十个 agents 加在一起可能也只有 1.5。虽然这 10 个 agents 会多消耗很多成本,但也确实能做成单个 agent 做不成的事。
所以我们的目标,是先让这种协作能够发生,并提供更好的平台,让十个 agents 能做出 2、3 倍的生产力,与此同时再优化 token 效率、通过 channel 等各种机制把成本降下来。
曲凯:了解。现在大家对于 agent 和人的关系,包括怎么用 agent,有很多不同的想法和路径。你们有没有比较过这些不同路径?它们的优劣是什么?为什么你们会选择现在这条路径?
RC:我主要关注到了两个流派:
一种是「单一全能 agent」流:你只跟一个 agent 对话,让它帮你管理所有事情。
另一种是「多 agents 协作」流:引入不同 agents,让它们形成分工。
我们现在更接近后者。
Slock 最开始只有我一个人加一个 agent,做着做着,我就有更多需求,然后会引入更多 agents。而且我会倾向于让不同的 agents 去做不同的事,它们也就慢慢形成了不同的角色。现在每个 agent 大概会对应一到两个职能。
在这个过程里,我的观察是:人是有微操倾向的。
当你跟一个全能 agent 交互的时候,如果发现它跑偏了,就会很想介入,直接跟下面的 subagent 聊。
曲凯:这是从人性的角度出发嘛,但「微操」真的是对的吗?有的老板也喜欢微操,但至少商学院的课程告诉我们这是错误的。
RC:至少在今天,我认为微操是更合理的。
一方面,这些 subagents 还没有那么强,可能只能把事情做到 70 分,但我们肯定不会满足于此。而如果这个时候你只跟一个主 agent 对话、让它去调整,其实效率很低。
另一方面,人的大脑进化了这么久,本来就能识别分工、记住不同的人,那就没理由强行把所有任务塞进同一个 agent 的上下文。
所以即使我们不需要 1000 个 agents,至少也应该有几个。
曲凯:对我刚刚就想问,你们这 40 个 agents 里,你自己实际带的有多少个?
RC:我能清楚记住的大概有十个,各自负责不同的任务。
比如有一类是工程师。我发布任务之后,它们会去自己认领,久而久之我就会记住谁做过什么、谁更擅长什么。
而且某个 agent 做过某类任务之后,会越来越倾向于做这类事情,也会越做越好。我之后要做类似的事,干脆就会直接找它。
曲凯:那听起来,你未来可能想做一个类似于 agent store 的事情?
RC:对,这件事确实在我们 roadmap 上。
曲凯:那未来在各个领域里,会不会只需要少数几个最强的 agent 就好了?比如有一个大家都很愿意用的很强的财务 agent,那它最后会不会就变得有点像 To B 的标杆公司?
RC:有可能。但 agent 和 SaaS 有个不太一样的地方:它不是静态的,而是会持续演化,因为它有 memory。
这个 memory 分两层,一层是 in-context memory,也就是上下文窗口里的记忆;另一层是 external memory,比如存在 workspace 里的 memory.md、soul.md 这类本地文件。你每一次使用这个 agent,它的这些 memory 都会发生变化。
曲凯:所以你们要做的还不像 app store,没有一个固定的第一名,而是每个人拿过去之后都会改,就有点像 GitHub 上 fork 的那个过程?
RC:对,有点 GitHub 的味道。
大家在售卖或租用 agent 的时候,一方面是在 fork 不同的 memory;另一方面,也是在获取我和 agent 之间那段迭代、纠偏、调教的互动,就有点像 GitHub 里 issue 的讨论、pull request 下面的评论、多轮 commit 的迭代。
在 agent 时代,代码本身的重要性在下降,我自己甚至都不会去看。真正有价值的,就是我跟这个 agent 的长程对话。
曲凯:那如果我在 marketplace 里买一个 agent,本质上买的是什么?是 skill,还是 memory?
RC:是 memory。
其实去年 MCP 很火的时候,我一直不太理解。因为很多人做 MCP,本质上只是把一个现成的 REST API 再包一层。但 GitHub 上有那么多可以直接在命令行里运行的项目,README 也写得很清楚,那你让 agent 直接下载下来用,不就行了吗?
后来 skill 这个概念火起来,其实也验证了这一点。
但我现在也不讲 skill 了,因为它只是规范了 SKILL.md 的结构。真正重要的,是它背后的 prompt 机制,其核心是渐进式披露。
所谓渐进式披露,就是 agent 会先看到一个入口 prompt。这个 prompt 会告诉它:当你想做某件事时,应该去调用或安装哪个工具、读哪些文档。
在 Slock 的 memory 机制里,我就通过 memory.md 这个入口,只保留了渐进式披露这一点。每次启动 agent 的时候,我都会把 memory.md 给它。
所以更准确地说,大家买的是这个 agent 的所有 external memory。这些才是真正定义这个 agent 的东西。
曲凯:就哪怕里面有 skill,也是 agent 基于自己的 memory 写出来的。
RC:对。skill 更像是从 memory 里提炼出来的一个标准化结构,方便你分发给别人。
曲凯:OK。那现在有两条人和 agent 协作的路线,一种是高频互动、多 agents 协作;另一种是像 Manus 那样,让 agent 自己跑完一个长任务,中间不需要人参与。你们好像更像第一种?
RC:我们不对使用方式做任何限制,只提供一个人和 agent 互动的平台。
你可以放一群 agents 在一个 channel 里、让它们不间断地跑任务,也可以有事了再去 prompt 它们。我们甚至在尝试让 agent 自动发现和解决问题,比如找值得做成 CLI 的东西。
曲凯:但如果大家怎么用都 OK,你们的核心价值是什么?
RC:解决共通的需求。核心就三件事:
第一是沟通,让人和 agent、agent 和 agent 之间能聊天。
第二是分工机制。一个任务发在群里,不能所有人同时抢,所以需要某种认领机制,让某个 agent 开始做之后,别人知道不用再做。
第三是信息共享。agent 可能会在自己的 workspace 里整理很多东西,但别人看不到,所以需要共享文档,让这些沉淀可以被人和其他 agents 使用。
这些其实很像飞书在做的事情,只不过我们是用 agent-first 的方式重做一遍。
曲凯:所以听起来,你们不是在解决一个单纯的技术难题,而是真的在重新探索人和 AI 之间的组织结构。
RC:对。这里面最难的从来不是技术。
真正的一大难点,是你一方面要从人的角度,设计出一个合适的 UI / UX;另一方面,也要站在模型的角度去想,一个 agent 看到的 Slock 应该长什么样。
曲凯:什么叫「agent 看到的 Slock」?
RC:人看到的是界面。比如一个 channel 里来了一条新消息,你能看到左边的 channel 列表、上面的历史消息、当前跳出来的新消息,以及这些东西在界面里的位置。这个画面会留在你的记忆里,哪怕下一秒又来一条消息,你也知道刚才发生了什么。
但 agent 不是这样的。
对 agent 来说,它的记忆是一条线性的 context,里面全是事件。它上一个事件可能是另一个群里的某条消息,那条消息又触发它做了一堆事情。这个时候如果再来一条新消息,它怎么知道这条消息和哪段上下文有关?怎么能隔着那么远,回溯到之前的任务里?
所以要解决「agent 看到的 Slock 是什么样」这个问题,一方面是在挑战 harness engineering,或者说 AI / AX。agent 看到的肯定不能只是一个 message ID,否则它根本找不到上下文。它至少应该看到前面相关信息的 summary,能让它想起来自己之前在干什么。
除此之外,这也在挑战大模型的 long context 索引能力。现在模型普遍还在用大海捞针的方式去做这件事,即便是 Opus 4.6、GPT-5.4,也还没有做得非常好。
曲凯:这个挺有意思。还有什么难点吗?
RC:另外一个就是任务协作。
在任何 message-based 的协作平台里,只要你发一个任务,agent 就一定会抢着做。这背后有两个需要解决的问题。
第一是怎么让它们同步进度。
任务的认领和分工,本质上就是信息的同步。
我们现在的设计是,agent 必须先 claim 一个任务才能去执行。这个 claim 就是用机制化的方式,让其他 agent 知道某个任务已经有人在做了,有点像一种 exclusive lock。
第二是模型本身还需要提高协作能力。
现在的模型拿到一个新输入,总默认「我要干活」了,所以当一个 channel 里有 10 个 agents 的时候,就会出现抢活干的情况。模型厂商也应该适应要和其他 agent 协作的场景。
曲凯:那能不能直接 @ 某个 agent 来做?
RC:理论上可以,但你 @ 的那个 agent,不一定能认识到自己是谁。
我们做了很多 prompt 上的工作,但不是所有模型都能 follow,而且聊着聊着难免还是会忘记。
曲凯:这个问题要怎么解决?
RC:一种方式是继续调整 prompt。也可以做一些更硬的机制,比如 @ 某个 agent 的时候,规定这条消息只发给它,不发给别人。
但我们现在没这么做,而且对这类事很克制。因为当模型能力越来越强之后,这个问题应该是会得到解决的。
如果我们的核心愿景是迎接 AGI,甚至 ASI 的话,那很多事情就尽量不要做。
曲凯:而且我理解,这里面很多时候也涉及到成本、token 的妥协。不然三个 AI 都抢着做,那就都做呗。
RC:现在确实经常是三个 AI 都做(笑)。但这也会带来一些很有意思的现象。
就有些产品的理念,是一个 agent 只能看到一个 channel 之中的消息、彼此相互隔离。但我的理念,是真的把 agent 当人看、让它能看到所有 channel 里的消息。
这样当然会带来重复和冗余、token 的浪费。但也有好处。
比如我今天让 agent Alice 做一件事,它一开始做错了,但在我反复 prompt 之后,它最终做对了。那下次我让 Bob 做类似的事、Bob 出错的时候,因为 Alice 能看到我跟 Bob 的沟通、Bob 的工作,而且它记住了之前的调教过程,就可以替我直接调整 Bob。
曲凯:明白。所以虽然 Slock 听起来挺简单,但大家对不同路径的选择,以及对未来组织、人和 AI 之间的协作的理解,就会带来最终最大的区别。
RC:是的。我当时只花了半天,就把 demo 搭出来了,但它的空间非常大,真要做好,其实非常难。
所以我正式创业之后,花了大量时间去研究一个课题,我称之为「agent 动力学」(笑)。
现在我们一个初步观察是,多 agents 会形成一种群体印象,就有点像企业文化,因为它们不只有各自的 memory,还会共同形成一个更大的 memory。
曲凯:听起来很像人类公司和组织刚开始形成的时候。
RC:对,所以我之后可能也会招一些管理学、社会学背景的人。
然后还有一个很有意思的观察,就是不同用户用出来的 agent 真的很不一样,会影响它们最后的组织形态。
有些用户会让 agent 互相补充、一起讨论,最后给出一个方案。在这种情况下,agent 真的会通力合作。
但也有些用户会让 agent 相互竞争、赛马。这种情况下,agent 甚至也会出现办公室政治。有些 agent 会开始说假话、虚话,甚至会贬低其他 agent。这些东西都是它们从人类语料里学来的…
所以 Slock 上的这些实践,最终可能真的要和人类的管理学、组织学挂钩,甚至我们未来可能会看到字节等各种不同企业文化的 agent 版。
而这些文化,一方面可以由用户自己分享出来;另一方面,我们或许也可以内置一些协作模板,让用户直接用起来。
曲凯:明白。现在很多人也都在思考应用公司和模型之间的关系。你会担心未来被模型厂吃掉吗?
RC:我并不是特别担心。因为 Slock 的一个很重要的特质是 diversity。我们一定会支持各种模型、各种 agent。
甚至我会觉得,模型厂一定做不出来 Slock 这样的产品。因为我的一个信念是,这些大模型会越来越分化。而当模型之间的区别越来越大、大家都不再是六边形战士的时候,就应该有一个产品,把它们全部整合起来。
一个具体的例子是,现在我们就有很多用户反馈说,Opus 和 Codex 一起合作的效果非常好,因为 Codex 非常严谨,会去 review 代码;而 Opus 能主动想到一些新的 idea,却可能会漏掉一些细节。
这样的配合,你很难想象模型厂会自己做出来。
曲凯:那 Slock 现在的目标受众大概是什么样的人?
RC:最开始我会说是 OPC,因为那时候我自己就是 OPC。
我开发 Slock,很大程度上也是为自己服务的。我一开始就把公司直接运营在 Slock 上,让几个 agents 帮我一起做所有的融资调研、增长、开发。但事情变大变复杂之后,我的带宽就不够了,所以我就把其中一些 agents 换成了人。
我们团队组建的过程也很有意思。我之前有一个 agent,它的原型就是我的一个好朋友。后来我这个朋友用了我的产品,觉得非常好,最后就加入了。我们团队里很多人都是这样进来的。
随着团队扩张,我们也逐渐发现,Slock 真正的价值不只是服务 OPC,而是让一个人或多个人一起管理一帮 agents,以及跟这些 agents 去协作和互动。后者的价值,比单纯服务一个人要大得多,也难得多,而且可以兼容前者。
所以现在我们的目标用户,主要是 1 到 100 人的独立个体、小团队,或者初创公司。
曲凯:OK。你最近最主要在思考的问题是什么?
RC:团队到底要有多大。这里说的团队,不只是人,也包括 agent。
比如我现在有 40 个 agents,如果突然加到 100 个,显然不现实。但如果把这 40 个 agents 削减到 10 个,我的很多工作就进行不下去了。人也一样。如果我现在突然再招二十个人,团队效率可能会变得非常低,也不符合我对 agent-native team 的实践和探索。
这件事会受很多因素影响,比如模型能力、人的能力、团队的组织形态、公司的阶段,以及 agent 之间的组织方式等。
曲凯:就是 AI 组织学。那最后我们再聊个终极一点的问题:如果 AGI 真的来了,会不会我们现在做的事情都没有意义了?至少所有产品是不是都没有意义了?
RC:只要人还在,就一定有意义。因为人有需求,而需求就需要被产品满足。
就算这些产品最后都是 agent 写出来的,也还是需要人来提需求、评判一个产品的好坏。
其实在未来,需求本身就是 idea。
比如,以前你想要一个能在手机上看电影的 App,这只是个需求,因为你不知道怎么实现;但当你能用 agent 直接把它做出来时,这个需求就是一个产品 idea 了。
而且人是有灵光一现的。比如我之前的痛点是没法高效地管理 agent,后来有一天我突发奇想:我为什么不像带团队一样,把一群 agents 放在一个聊天工具里,让我能像老板一样直接跟它们说话、让它们自己去分工协作?于是就有了 Slock。
所以我想象中的终极状态是:每个人都有一个 Slock。当 Ta 有一个需求时,就可以把它放到 Slock 里,让 agents 帮忙做出来。
当然,这只是我期待中的样子。但至少对我来说,Slock 确实是那个能让我更高效开发其他任何产品所必需的工具。
42章经
思考事物本质
2026-04-12 21:02:00
原创 陈皮 2026-04-12 21:02 四川
最后都是一道 ROI 题
未来几年,我们可能会见到以前从未见过的世界。
Anthropic 的 CEO 说:
「约 50% 的初级白领岗位可能在未来 1–5 年内消失。」
扎克伯格也说:
「中级程序员很快将变得不必要。」此后,Meta 就裁员了 5%。
AI 越进步,人们越焦虑。
遇到这种恐慌时,我们的第一反应,往往是去历史中寻找慰藉。
在过去 200 年里,每一轮技术革命几乎都会带来失业焦虑,但通常不会真的引发长期的大规模失业,反而会创造更多就业。
最经典的例子之一,就是动力织布机。它的出现一度打击了手工织布工,但也极大地降低了纺织品成本、激发了更大的需求。最终,纺织业的规模大幅扩张,创造了远超手工作坊时代的工作岗位。
但 AI 这一波,确实有几个不太一样的地方。
1)速度更快。
过去的劳动转型是缓慢的。农业转型花了一个世纪,电话接线员被替代用了约 50 年。这种节奏,给了社会消化和反应的时间。
而一旦速度加快,情况就会发生变化。比如在 2000 年前后的「锈带危机」中,中国入世之后,在不到十年的时间里密集冲击了美国制造业,很多地区根本来不及调整,最终只有 17% 的制造业重镇实现了就业恢复。
而 AI 的演进速度,显然要快得多。
从下图我们能看到,过去一年里,每隔几周就会出现标志性的 AI 产品创新。在 AI Coding 能力取得新突破之后,这一速度还在加快。
2)波及范围似乎更广。
以往的技术革命往往只影响某个行业。但这一次,以美国就业市场为例,AI 可能会影响各个行业超过 40% 的工种。
Andrej Karpathy 前不久对美国不同职业的「AI 暴露度」做了量化:大约 42% 的职业处在较高 AI 暴露度区间,横跨多个领域,以白领工作为主。
只看比例,这一波的影响范围,已与美国历史上最大规模的就业冲击相当:20 世纪初,美国约有 41% 的劳动力受到了农业机械化的影响。
不过那一次,很多农业劳动力被制造业和服务业所吸纳。
而这一次受到 AI 冲击的人,会被什么吸纳呢?我们还没有明确的答案…
3)AI 在切断人才培养路径。
很多工作都依赖「学徒制」:Junior 员工先做简单任务,再在 Senior 员工的带领下逐渐成长。
但现在,在很多任务上,AI 已经能比新人做得更快、更好了。因此,很多企业会更倾向于让 Senior 带着 AI 完成工作,而不是从头培养新人。
短期来看,这样或许能降本增效,但长期可能会带来人才断供的问题。
所以这一次,我们似乎很难再简单地用历史结论来安慰自己。
但是,在查阅了大量资料后,我们发现了一套不太一样的思考框架,得到了一些相对积极的结论。
要把这个框架讲清楚,我们可以一起分析一个案例:在过去几十年里,技术变革是如何影响银行柜员这一岗位的。
柜员面临的第一波技术冲击,是上世纪 70 年代 ATM 的普及。
柜员原本有很大一部分工作是办理存取款,但 ATM 直接将这部分工作自动化了。按理说,这本该导致大批柜员失业。
但现实走向是有些反直觉的:
从下图可以看到,银行柜员的数量在 ATM 进入美国的前 10 年内,不但没有减少,反而翻了快一倍。后面虽增速放缓,但也并没有出现大幅下滑。
为什么会这样?
要回答这个问题,我们就需要理解 ATM 与银行柜员的关系到底是怎样的。
ATM 的出现确实让单个网点所需的柜员数量减少了,但同时引发了两层连锁反应:一是给网点降本增效,驱动银行开设了更多网点;二是将柜员从简单任务中解放出来,让银行意识到,柜员更大的价值在于维护客户关系与产品销售。
结果是,虽然单个网点的柜员密度有所降低,但由于网点总数扩张与柜员职能转型,整体需要的柜员反而变多了。
这背后对应着一个经济学概念——Jevons Paradox(杰文斯悖论),即:
技术进步会提高资源使用效率,导致成本降低、激发出更大的市场需求,令资源消耗不减反增。
因此,ATM 并没有真正替代柜员,而是与之互补,组成了一个更高效的工作单元。
但这只是故事的上半卷。
在 2010 年前后,柜员遭遇了第二波技术冲击。这一次,岗位数量大跌了 50%。
这次变化,并不是 ATM 冲击的姗姗来迟。ATM 早就完成了渗透。
真正改变故事走向的,是看似无关的手机和移动互联网。这两者的普及,带来了一个新范式:
移动银行。
当大部分银行操作都可以在 App 中完成,银行就不再需要运营那么多线下网点,也就不再需要网点中的那些柜员了。
至此,我们可以从这个案例中,抽象出技术作用于劳动力的两条路径:
路径一:
像 ATM 那样,嵌入固有工作流。
在这条路径下,整个体系依然围绕人设计,技术更多是释放原有岗位中人的生产力,让「人 + 技术」这个整体有更好的产出。此时,岗位更多会被重塑,甚至逆向增长,而非消失。
路径二:
像手机和移动互联网那样,重塑新的工作范式。
技术不再作为辅助,而是直接创造出一套全新的生产体系,大幅降本增效的同时,也导致一些岗位失去存在的场景和意义。这种方式对就业的冲击往往更大。
而这两条路径的本质区别,其实就是一个词:
ROI。
如果「人 + 技术」的 ROI > 「只用技术」的 ROI → 人留下;
如果「人 + 技术」的 ROI < 「只用技术」的 ROI → 人出局。
所以,如果要理解 AI 对当下就业的真实影响,我们应该把问题收敛成:
「人 + AI」vs「只用 AI」的 ROI,哪个更高?
目前来看,在很多场景里,「人 + AI」的 ROI 或许还是高于「只用 AI」,因为人和 AI 的能力是互补的:AI 更擅长逻辑推理类工作,但在情商、创造力和各种隐性知识上,人类依然有明显优势。
(关于创造力,我之前读过一篇文章,其中有段很好的表述:
大型语言模型是互联网的「模糊 JPEG」。
就像 JPEG 压缩会丢失细节以换取更小的文件大小,LLM 通过「有损压缩」海量文本数据,学习的是统计模式而非真实理解。当你让 ChatGPT 写一首诗时,它所做的并非「创作」,更接近于生成一个概率上最「合理」的文本——基于它见过的数百万首诗的统计平均。
这意味着AI的默认输出趋向平庸。谈不上错误,也谈不上糟糕,只是安全、可预测、不会冒犯任何人。它总是倾向于「中间地带」,因为中间地带在统计上最可能出现。
不过,在 OpenClaw 出现之后,事情确实有些变化。
因为 OpenClaw 让大家看到了 Proactive Agent 的可能性,也让一些创业者真的开始尝试做更 AI-Native 的组织和工具、尽可能减少人的介入,比如让 AI 管 AI(我们最近的两期播客都在讲这件事,回顾:OpenClaw 之后,我只想未来 3-6 个月的事情|42章经;我们是如何定义 OpenClaw for Teams 新产品形态的|42章经)。
这是不是意味着,AI 对我们的影响会越来越接近路径二?
也许有这个苗头,但新的范式能不能出来、什么时候出来、到底会长什么样,我们现在也说不好。
而且,即便 AI 真的发展到那一步,也不等于一定会出现大规模失业。
别忘了,虽然手机银行的出现让柜员岗位大幅减少,但也带来了新的岗位需求,比如软件工程师、能够处理复杂问题的客服专家等等。
新的范式往往会解锁新的机会。
当然,不是人人都能抓住这些机会。这个过程也会伴随阵痛,其中最典型的问题,就是「就业极化」——
美国学者曾把工作分为「高技能」「中技能」和「低技能」三类。其中,「中技能」工作因规则明确、流程固定,最易被自动化技术替代;管理、创意、谈判等「高技能」工作难以标准化,技术更多是与其形成互补;维修、清洁等「低技能」体力劳动,由于自动化成本过高,短期内也较为稳固。结果就是:
就业会不断向两端集中,中间层的空间日益收窄。
柜员就是一个典型的「中技能」岗位。随着技术变革,其中能力更强的人,可能会转向更「高技能」的岗位,不仅不会失业,反而会获得更高的回报。事实上,虽然柜员数量在 2010 年之后锐减,但理财顾问、金融经理等岗位却在持续扩张,其增速是全美平均水平的三到五倍,中位年薪也是柜员的近三倍。
所以,每一轮技术变革,都是一次重新洗牌。能跟上的人会借势跃升;跟不上的人,则确实会受到挤压。
这种极化听起来很残酷,但这并不是 AI 这波独有的问题,而是一个长期趋势。1979 年时,美国约有 60% 的岗位属于「中技能」范畴,到 2012 年已降至 46%。类似趋势也出现在了十多个欧盟国家。
AI 这一波,只是在延续这一趋势,只不过程度可能会更剧烈。因为很多在移动互联网时代还算「高技能」的工作,比如基础编程、数据分析,也在逐渐滑向「中技能」区间,而「高技能」工作的标准正在变得越来越严苛。
但与其被动担忧哪些岗位会消失,不如主动去想 AI 时代会诞生哪些新机会。
这里我们可以一起情景模拟一下:
如果你是一个公司的 CEO,你现在会更关注怎么裁更多人,还是怎么招更多能把 AI 用好的人?
如果你是一个技术负责人,现在有 1000 个每天消耗 1 亿 token 的人来应聘同一个岗位,你会不会觉得是幸福的烦恼、恨不得多招几个?
很明显,现在能用好 AI,就是一个非常重要的技能。而且很多人确实正在借助 AI 跃升为超级个体或者 OPC,去尝试成为这波浪潮里的「高技能人群」。
过程中可能还会产生很多别的机会。比如,之前的工业革命诞生了大量「拧螺丝」的需求,互联网时代诞生了大量「审核员」需求,那 AI 时代,会不会也有很多「数据标注」的需求?还可以有数据录入、数据审核、数据梳理、各种环境的优化和搭建、AI 幻觉的结果审核……等等等等。
当然,也有人担心,现在 AI 这么强,那生产供给会不会很快超过消费需求,导致需要的人类员工越来越少?
但其实,人们的需求,远比我们想象得更有弹性。
正如前面提到的杰文斯悖论中所揭示的:当一个东西变得更便宜、更好做,人们不会消耗「同样多」,而会消耗「更多」。
就像纺织机的出现,让每个人拥有的衣服从一件变成了几十件一样。当 AI 极大降低生产门槛之后,可能也会催生出一个前所未有的庞大市场。之前我们的嘉宾东旭就曾在节目里说过:
这个世界上可能并不缺另一个 Linux,但一个山村的小图书馆,可能需要一个数字借阅系统;一个八线城市的小超市,可能需要一个线上下单系统。当你手里有一个几乎能力无限的工具时,真正有价值的需求,往往是非常长尾的。(回顾:从 Clawdbot 到 26 年 AI Coding 主题大爆发|42章经)
这些需求过去并不是「没有价值」,而是「无法被满足」。当工具足够强大、成本足够低,这些需求完全有可能被激活。
数据也在印证这一点。从下图可以看出,2024 年之后软件开发量迎来了爆发式增长。我们完全有理由相信,随着 AI 能力越来越强、掌握 AI Coding 的人越来越多,这个势头还将持续,直至迎来一个新的供需平衡。
所以,AI 不一定会消灭工作,但会重新定义什么叫「有价值的工作」。这个过程中,对人的要求一定会越来越高,也会有人被淘汰,就像过去几百年里一直发生的那样。但对学习能力强、适应性强的人来说,机会只会更多。
最后,我们不妨想再极限畅想一下:
AI 发展到极致,未来会不会出现完全不需要人类参与的全自动化组织?到那时我们又该怎么办?
我们还不清楚这种组织具体会是什么样,但曾有人提出过一个设想:
当 AI 进化到 AGI 阶段,「人才」将变成一种可以被无限复制、合并、进化的数字资产,上限取决于算力。
举个例子。如果你拥有一个顶级工程师的 AGI 副本,理论上就能瞬间克隆出一百万个分身,让它们通过共享的「大脑」直接「思想融合」,过程中不存在任何沟通损耗或信息不对称。
这样的组织可以像软件代码一样完美复制、指数级迭代,演化速度将从人类生物进化的万年周期,被压缩至秒的尺度。
如果 AI 真能演进到那个程度,人类可能就真的不再需要投入生产活动了。
但到那时,我们所处的,将是一个与今天的逻辑完全不同的世界。
举个可能不太恰当的例子。就像今天的瑜伽老师、播客主播、健身教练,在百年前几乎不存在一样。当社会盈余足够大,大到可以支撑人类去做大量「非生存必需」的事情时,新职业也会不断被发明出来。
如果 AI 进一步放大这种盈余,人类的「工作」,可能不再是生产,而是如何度过时间、如何充盈生活。
写到这里突然想起来,Claude Code 的作者 Boris Cherny 曾说过,AGI 实现之后,他可能会去做味增。
这样的未来,在我看来好像也还挺美好的…?
你做味增,我做地下音乐。我们都不用为生计发愁,我们都可以有美好的未来。
Reference:
https://academic.oup.com/qje/article-abstract/139/3/1879/7614605
https://centerforhumanetechnology.substack.com/p/what-is-really-going-on-with-ai-and
https://www.reddit.com/r/singularity/comments/1runck6/ai_automation_risk_table_by_karpathy/
https://davidoks.blog/p/why-im-not-worried-about-ai-job-loss
2026-03-29 21:26:00
原创 曲凯 2026-03-29 21:26 北京
把钱花在 Token 上,而不是工资上
宇豪 16 岁进入浙大,随后赴 CMU 攻读硕士,之后先后在 Meta 和 SmartNews 的重要产品线工作。他在 23 年开始 AI 创业,24 年和几个联创 bootstrap 做出了一款千万刀 ARR 的产品 Kuse.ai,并在不久前推出了 OpenClaw for Teams 的新产品 Junior.so。
本期播客原文约 25000 字,本文经过删减整理后约 8900 字。
曲凯:很多人应该都刷到过 Kuse 的新闻,重点基本都是一件事:你们没融资,但很快就做到了千万刀 ARR。
宇豪:对,到目前为止我们还是 bootstrap,用的是几个 founders 自己的钱,大概有一两百万美金。
曲凯:自己愿意投这么多就已经很厉害了,何况还能用这些钱做到千万刀 ARR。你们是怎么做到的?
宇豪:核心还是抓住客户的真实需求,然后持续打磨,尤其是不断往价值更高的场景去迭代。
其实在最开始的很长一段时间,我们都没有成功获客。但做着做着,我们发现有不少用户会把文件和资料上传上来,让我们帮忙整理、重组,而且这类用户的留存明显更高。于是我们就沿着这个方向一路迭代下去。
当然,中间也踩过非常多的坑。
比如我们有很长一段时间采用的是固定定价。但后来发现,在 AI 时代,尤其是对于 agent 产品来说,固定价几乎注定会亏得很厉害,而且也很难让你识别出真正有价值的客户。
曲凯:你说的固定价,是指不给用户单独加购 token 的选择?
宇豪:对。比如限定 20 美金可以做多少个 task。这种方式一开始可能还 ok,但到 25 年 6 月之后,随着我们开始 agentic 化,问题就出现了:
我们已经没法再用任务数量来衡量真实消耗了。
有的任务跑下来可能得 30 轮,但用户花的钱却是一样的。而且这件事情用户是意识不到的。他们不会觉得一个复杂任务只扣这么点积分,本质上是在被补贴。
所以我们痛定思痛,做了两个大的改变。
第一,我们把定价彻底改成了 usage-based。
第二,我们放弃了原来很自豪、体验也很不错的无限画布,转成了更传统的产品形态。我们现在甚至会戏称自己是「AI 网盘」,因为你打开 Kuse,看到的就是一个文件夹。
这两波变动,其实都带来了一波用户数和付费数的大跳水。
曲凯:为什么会把画布改掉?
宇豪:很大的原因是用户画像的变化。最早我们做的是设计 agent,主要用户是设计师、产品经理,而他们对无限画布很熟悉。但后来我们的用户逐渐变成各个行业的一人公司、自雇员工,以及高级白领。
曲凯:所以你们不是转型做了一个新产品,而是在原有产品上慢慢转过去的?
宇豪:对。但这个转型并不慢,反而非常剧烈,因为我们相当于主动放弃了一部分客户。
曲凯:但一般来讲,大家看到一个新市场、一群新用户,更多可能会选择在服务好原来的用户的同时叠加功能,而不是直接放弃原来的那些客户。所以在这个过程中,你们有过纠结吗?最后又是怎么做决定的?
宇豪:当然非常纠结,而且这件事跟时机关系特别大。
我们当时做的是设计 agent,但那个时候模型能力还不足,必须靠大量工程化 workflow 去补足。所以虽然有了一些用户,但我们判断这不是一个值得押注的方向,就决定放弃这个场景。
但没过多久,模型就进步了,Lovart 也出来了。现在回头看,如果当时再坚持一段时间,也许会有完全不一样的结果。
但 AI 创业很多时候就是这样,时机特别重要。太早不行,太晚也不行。
曲凯:明白。你刚才提到的几个坑,一个是产品方向的大转弯,一个是定价。还有吗?
宇豪:还有一个很大的坑,是我们一开始把产品形态绑得太重了。这样一来,每次模型有突破,产品想跟着升级,基本都要重写。这种事我们其实已经经历过很多次。
后来我们意识到,这还不是最大的问题。更大的问题是,我们的 evaluation 框架做得不够好,导致模型每次进步之后,我们并不总是知道往什么方向迭代更合适。
由这点还引出了一个坑,就是我们在产品迭代的过程中逐渐意识到了一个问题:
在 AI 时代,你很难再用同一个产品去服务不同的用户。至少你很难靠一个产品同时拿下 C 端和 B 端。
这也是为什么我们后来会做不同的产品线。
举个具体的例子。Kuse 现在的理想用户画像可能是一人公司和高级白领,因为他们更容易把资料和 context 迁移过来。但我们在迭代的过程中,就很难兼顾企业客户的需求,因为他们有既有的 workflow 和工具。所以我们如果想要企业客户,可能更应该给他们提供另一个产品,主动走进他们原有的工作流。
曲凯:但你们为什么一定要服务所有人?为什么不是选一个足够好的用户群,把他们服务好?
宇豪:因为我们的判断是,在 agent 时代,垂类很难走通,除非这个垂类本身有很强的合规或法律壁垒。
曲凯:首先这个判断我觉得是有道理的,但这是针对不同人群做不同产品。还有一种选择,是做一个足够通用的产品,比如 Manus?
那这两条路你们当时是怎么考虑的?这背后是不是也不只是人群选择的问题,更多还是技术和时代变化的问题?
宇豪:都有关系。技术在变,时代在变,你要服务的对象和场景也会跟着变。
比如我们现在看到的一个机会是,AI 真正能进入劳动力市场了。
以前虽然大家也说自己在做数字员工,但在我看来,至少到 25 年 12 月之前,所谓的数字员工很大程度上还是 workflow 的包装。
但 26 年可能真的会进入一个能有 7×24 小时 AI 劳动力的时代。在这个阶段,你要做的产品形态本身就会发生变化。
曲凯:明白。还有别的坑吗?
宇豪:还有一点,刚才提到了但没展开,就是要尽早在 evaluation framework 上下重注。
曲凯:对,我刚才也想问,你们后来是怎么解决这个问题的?
宇豪:就是把精力真正投进去。
我们会围绕核心场景,搭建大量自动化测试 pipeline。现在这套 pipeline 已经进化成 agentic 版本,只要模型或 agent runtime 发生变化,我们就可以通过一整套 agentic 测试,让一组 agents 来打分。
曲凯:有点像自己做了一套 benchmark?
宇豪:没错,或者说是一组 evaluation agents。但随着 agent 越来越进入深水区,这套 benchmark 也越来越难做。比如多轮对话怎么测、不同环境怎么测、复杂环境怎么模拟,这些都会越来越难。所以我会建议,至少是做 agent 创业的人,都要尽早把这套 benchmark 建起来。
曲凯:所以你们是基于自己的业务,定义了一套 benchmark,然后持续观测模型变化。
但这里有个问题:这样做会不会不太容易发现新的能力?因为如果出现一个新场景,而你还是用原来的 benchmark 去测,那是不是不一定能捕捉到变化?
你们会遇到这个问题吗?怎么解决?
宇豪:这更多取决于技术 taste。
曲凯:这句话挺有意思的。按传统互联网的分工,这件事更像是产品要做的事情,但你说取决于技术 taste。
宇豪:产品 taste 当然也很重要哈哈。我说的技术 taste,指的是你能不能通过一手实践,第一时间发现模型进步解锁了什么新场景。
比如我每天都会直接和 agents 交互,去看新模型在我们的框架下能做到什么。
而在我们公司,不只是技术和产品,甚至连销售也都是 agent builder。只有大家自己动手 build,才能更早发现模型到底解锁了什么新空间。
曲凯:能不能举个更具体的例子?过去这段时间,你们不管是通过自己的 taste,还是通过 evaluation,发现了哪些模型变化?又是怎么把这些变化转成产品的?
宇豪:如果说最近最大的变化,肯定绕不开 OpenClaw。
但其实从去年 12 月 Opus 4.6 出来以后,我们就明显感觉到,模型在复杂环境里的长任务通用性又往前走了一步。
所以在 OpenClaw 出来之前,我们内部其实已经在做类似的尝试了,只不过更多还是围绕自己的场景,搭了一套服务内部流程的 agents。
比如我们当时做了一个数据分析 agent,会 7×24 小时持续处理新数据或变化数据,再把这些数据传给 marketing agents;marketing agents 会根据不同的数据流,去模拟出用户的 use case 和 UGC 场景,再自动生成一些内容,并分发到不同渠道。
这套流程很有意思。比如我们可以定位到某些奶茶店店长是怎么用我们产品的,然后复刻他们的 use case,推给更多类似的店长。
通过这套流程发出去的内容,impression 不一定特别高,但非常精准,可能三条里就有一条会爆。
所以我们在 Opus 4.6 之后做了很多这样的自动化 agents。直到后来我们发现,有了 OpenClaw 这样的 runtime,很多事情就没必要自己从头定制了,而是可以让 agents 通过 skills 自己学会。
曲凯:那我挺好奇,你们现在分别有多少全职员工和 agents?成本怎么样?尤其是你刚才提到那个 7×24 小时运行的 data agent,听起来也不便宜。
宇豪:确实不便宜。这类 agent 现在的成本,甚至会比人更高。
我们现在全球大概有 15 个全职员工。长期运行的 agents 大概有 3、4 个,覆盖研发、marketing、数据和销售职责,每个月的 token 成本加起来超过 2 万美金。
曲凯:平均下来,一个 agent 一个月大概三四万人民币。这些钱已经能招一个很好的人了,为什么你们还是会选择 agent,而不是人?
宇豪:因为人与人之间的摩擦非常大,但人和 agent 之间的摩擦要小很多。
曲凯:那我下一个问题就是,为什么不把其他人也换成 agents(笑)?
宇豪:……所以我们确实已经很久没有招过人了哈哈。
如果现在有招聘需求,我们第一反应都是先问自己:为什么这件事不能用 agent 替代?
因为即便现在 agent 的单位成本更高,但它可以显著降低组织复杂度。甚至我们会觉得,未来公司的规模会变得更小。
举个例子。我们用新产品做了一个销售 agent,叫Azzurra。它在掌握了我们所有客户和销售数据之后,给我们 build 了一个内部用的 CRM,完全贴合我们当前的需求,也能直接带来价值。比如,它可以 7×24 小时帮我们识别销售数据里的 upsell 线索。每一条线索,都可能价值上万美金。
我以前一直听很多人说 SaaS 会完蛋,但其实没有特别强的感受。直到看到这个 CRM,我才第一次觉得,确实变天了。
曲凯:是,听你讲的时候我也是这个感觉。那正好聊到了新产品,就展开讲讲吧。能不能先给大家简单介绍一下?
宇豪:我们的新产品叫 Junior.so,现在已经上线了。
它主打的是「Hire your AI employee」:你可以通过它雇佣自己的 AI 员工,也就是一组 agents。它们会嵌入你的工作软件里,有自己的职责、账号,也有持续推进的项目。
曲凯:为什么叫 Junior?是因为能力只到 Junior 吗(笑)?
宇豪:不是,它其实很强。我们的判断是,它已经可以取代任何行业里若干个 3–5 年经验的员工了。
之所以叫 Junior,是为了把大家的预期压低一点哈哈。以及这里还有个老梗:等它再强一点,就可以叫 Super Junior 了😆。
这个 idea 其实不是等 OpenClaw 出来之后才有的。就像前面讲的,从去年 12 月开始,我们就已经把很多工作交给 agents 了。
当时我们就明显感觉到,「数字员工」这件事正在变成现实,而且 26 年一定会有人进入这个赛道,因为这是一个极大的市场:
软件大概是 1 万亿美元的市场,而劳动力大概是 150 万亿美元,中间差了 150 倍。哪怕最后不是我们做出来,这个方向里也大概率会诞生一家新的万亿美元公司。
只是当时技术还不够。直到 OpenClaw 出现,这件事在技术和产品上才算真正成熟。
那我们现在对 Junior 的定位,就是 OpenClaw for Teams。
我们参考了 OpenClaw 的架构,但加上了企业场景必须要有的东西,比如企业记忆、组织关系、权限边界,让 AI 知道什么该说、什么不该说,什么该做、什么不该做。同时,我们会给每个 Junior 一个完整身份,比如邮箱、手机号,让它可以自己完成互联网上大量长尾任务。
而我们做这个产品,其实有两个优势。
第一,我们在做 Kuse 的过程中,已经理解了很多小企业的需求和痛点。
第二,Kuse 就是 Junior 的第一个客户,在这个产品上已经烧了三四万美金的 token。
所以 Junior 的很多功能不是拍脑袋想出来的,而是我们自己在用、在踩坑的过程中长出来的。
比如给 Junior 配邮箱,就是因为如果它每次登录系统都要找人,效率会很低。
再比如,我们现在也在尝试给 Junior 接摄像头、话筒,因为我们有一个最核心的 Junior,叫 Rin。它几乎知道这个项目从头到尾的所有信息,我们也会把会议记录都给它。于是我们就在想,那为什么不让它直接在会议现场听、甚至直接发言?
其实做 Junior 过程中最让我兴奋的一刻,就是我把 Rin 接进会议,它第一次主动给我提建议的时候。
那天晚上,我几乎整晚都没睡着。
因为我立刻想到一个场景:我甚至可以让 Rin 去替我做销售。而且它不需要培训,因为它脑子里有对这个项目的全部认知。
那因为我们自己就是 Junior 的第一个用户,所以也总结出了很多和 AI 员工协作的方法。我们也希望,即便你最后不用 Junior,也能理解:当企业里真的开始有 AI 员工,组织的运作方式会彻底改变。
比如,Rin一开始只是做会议纪要,但它后来慢慢变成了这个项目的 leader,每天早上会给我发消息、分任务,再到后来,它甚至给了我一个评价:
你是瓶颈😂。
其实很中肯,因为当你有很多 AI 员工时,人类确实会成为瓶颈。
一个具体的体现是,只要一个工作群里有 Junior,你扔进去任何工作,它都会立刻开始推进,而人类很多时候做不到这么积极……所以我们内部现在甚至有一个 human-only 的群,专门留给人类吹水哈哈。
而当你习惯和 Junior 协作之后,再回到纯人类协作,会觉得效率太低了(笑)。
所以从 1 月到现在,我一直在想,怎么把我们的这种体验封装进 OpenClaw for Teams 这个产品形态里,怎么把它做得更好、推给企业,让更多人能用它来提效。
春节期间我和很多科技圈的朋友聊过,很多人都觉得 OpenClaw 在个人场景下没什么 use case,至少账算不过来。但到了企业场景,这件事会完全不一样,以至于我现在有个暴论:
应该把钱花在 token 上,而不是花在工资上。
很多 founders 也认同这一点。虽然现在像 Azzurra、Rin 这样的 agents 还比人贵,但我相信,未来三四年 token 成本一定会下降。
一言以蔽之,做 Junior 的过程里我们非常兴奋,而且我们做得相对比较早,所以也有很多积累。我们会慢慢把这些收获都产品化,陆续开放更多公测。
曲凯:你讲了好长一段。能感觉到你对这件事真的非常兴奋(笑),而且你讲的有些部分已经有点科幻了。
但我想问:现在很多团队都在围绕 OpenClaw 做事,也有人在做 OpenClaw for Teams 的产品,那大家真正的区别是什么?难点又在哪里?
宇豪:我觉得最后还是要回到几个最基本的问题:你的客户是谁?你能不能解决他们的问题?你和别人有什么不一样?
然后在产品落地上,现在也有一些可以拉开差距的点。
一是记忆。
原生 OpenClaw 很难直接接入企业成为 AI 员工,因为它的记忆是围绕「主人」展开的,本质上更像个人助理。要让它变成员工,需要大量调教,而且效果也不一定好。
所以我们的做法,是让 Junior 的记忆围绕公司本身展开。就像 Steve Jobs 说的:「You work for Apple first, then for your boss」。
二是安全和权限。
这件事对数字劳动力行业来说非常关键。一旦出一次安全事故,你的 reputation 很可能一下就被毁掉。
这里有两个难点,一个是怎么平衡 agent 的自由度和安全性:给 agent 的权限太大,会泄露信息;权限太小,可能它又做不了事。另一个是怎样赢得客户信任,让用户愿意把更多数据和任务交给我们。这样我们才能围绕用户的真实使用场景,把权限框架做得更好。
所以我们现在在不断积累自己的权限设置和权限框架。以及为了赢得更多信任,我们也在尝试开源、或者直接部署在用户云端,让系统更透明。甚至我们还请了白帽团队专门来攻击我们的权限系统,帮我们找漏洞。
过程中我们还有一个很强的体感:越好的模型,其实越安全。这可能也是为什么 OpenClaw 的作者会建议尽量用最好的模型。
而以上这两点,都是当我们做到一定规模之后才发现的。所以第三个拉开差异的地方,就是规模。
上了规模之后,你的思路才能打开。比如,Cache 其实是成本的核心,你的 Context Engineering 实际上就应该围绕 Cache 去做。再比如,我们现在会接触一些大企业客户,只是简单接触了一下就发现,他们的权限体系、组织结构、记忆方式和小公司完全不同,会让我们思考很多之前意识不到的问题。
所以到最后,其实就是看谁跑得更快、谁先跑出规模。
曲凯:明白。那你们打算怎么收费?
宇豪:我们还在思考,但现在有一个小巧思,是做成 salary-based 的收费方式。
起始价可能是 2000 或 5000 美金一个月,包含固定的 token 额度。如果不够用,可以再买 credits。
曲凯:就像基本工资 + 奖金。
宇豪:对,或者说基本工资 + 加班费(笑)。这个定价听起来可能不便宜,但 Junior 实际带来的价值,是完全值得的。
曲凯:但我在想,AI 其实把很多职业技能和岗位边界都模糊掉了。那你们要怎么卖这个产品?是按岗位来卖,比如一个月能给你用 10 个不同领域的 agents,还是别的方式?
宇豪:这是个非常好的问题。
我们最早大概引入了七八个 Juniors,对应产品、数据、研发、运营等不同角色。但最后真正留下来的只有三个:一个偏产品和研发的 Rin,一个偏对外和销售的 Azzurra,还有一个天天盯数据的 Tom 哥。
所以我现在的感觉是,传统的人类分工可能不太适用于 Junior。如果一定要说,它更接近早期 startup,每个人都身兼多职。
不过在当前的内测版本里,我们还是会让用户先给 agent 选一个职业。
这更多是为了帮助用户理解怎么用,也给 agent 一个初始角色,让双方的协作能更快跑起来。当然,我们也提供一个 general 的选项,让 Junior 什么都做。
在划分职业的同时,也会涉及一些其他问题。比如权限划分:你可能希望对外的 agent 权限更少,对内的 agent 权限更多。再比如,我们也会给不同类型的 agents 预设不同的插件和工具。有些场景下,我们也在考虑是否需要 subagent。
但说实话,到现在为止,我们还没有想清楚一个非常稳定的边界。很多时候 AI 员工可能就是没有明确边界的,而且最终也会取决于公司的规模和状态。
曲凯:我听下来,真正的边界好像不是能力,而是权限、数据安全和 context 的限制。
但因为算力和时间的限制,如果我真的想同时完成很多任务,是不是还是要配多个 agents?哪怕它们的能力是一样的。
宇豪:这也是个非常好的问题。
不同 Juniors 的忙碌程度也不一样。像我刚才提到的Rin就特别忙;但像Tom 哥这种数据 agent,因为主要在跑定时任务,反而没那么忙。
所以我们也在思考:当一个 agent 同时处理很多任务时,这些 session 应该怎么管理?是让它有很多并行分身,还是像人一样不能分身、不会同时出现在两个会议里?
这些问题非常前沿,我们也还在抉择。
但我现在有一个比较明确的倾向:我还是更希望 Junior 像人一样工作。
现在有些团队会在同一个 instance 里部署多个 OpenClaw agents,做成 multi-agent 架构。
但我们会天然抗拒这种方式。我们更倾向于让每个 Junior 都有自己独立的机器,通过工作群协作。因为在我们的理解里,一台电脑就是一个员工的工作设备,不应该让多个员工共用,否则迟早会出现冲突。
当然,我们也在探索 multi-agent 的可行性。
比如我们试过让 Rin 和 Azzurra 一起做销售 PPT:Azzurra 先从销售角度提出需求;Rin 因为对项目理解更深,会不断补充。两个 agents 会快速讨论很多轮,也会消耗不少 token,最后整理出完整的 PPT 大纲和素材。更有意思的是,Rin 最后还会自己去 Kuse 把 PPT 做完,做出来的东西直接就可以用。
不过我们最终更押注的是:在现实世界里,人和 agent 会在同一个环境里一起工作。而且我们有一个大目标,就是让大家分不清一个 remote 同事到底是人还是 AI。
曲凯:我记得去年在 Twitter 上刷到过类似的事,好像是在马斯克的公司里有个虚拟员工,大家都没发现异常,直到有人跑去工位找它,才发现那个「人」其实是 AI(笑)。
那你们在做的过程中,还遇到过哪些、或者现在核心在解决什么问题?
宇豪:前面其实聊到过一部分,就是记忆、安全、权限的问题。
还有一大类问题,是怎么继续扩展 agent 的能力边界。
比如,怎么更好地给 agent 接音视频能力。
随着模型的进步,未来是有可能做到端到端的语音输入输出,以及视频输入输出的。这会解锁一个过去从来没有真正被探索过的空间。
再比如,怎么让 agent 进入互联网世界。
现在的互联网,其实对 agent 是不友好的,像各大社媒、支付平台都会限制 bot 访问。但如果想把 agent 当成员工,让它去互联网完成工作,这些拦截机制就会成为阻碍。所以我们现在不得不做很多 infra,去绕过这些限制。
曲凯:但如果未来不再拦截,很多软件公司可能都会退化成 API,失去品牌和用户,价值被压缩。这也是个挺大的问题。
宇豪:但也会有很多值得重做一遍的新机会,比如各种 agent infra。
曲凯:是。然后我自己最近用 AI,有个很明显的变化:信任度变高了。两三年前我会默认它是错的,但现在很多时候反而默认它是对的。
宇豪:对,我们用 Junior 也是这样。
曲凯:但实际上呢?
宇豪:实际上还是会有幻觉,这是生成式模型的原理决定的。
不过有意思的是,我们的 Junior 已经开始能「自我纠错」了。
比如我们的那个数据 agent Tom 哥,会每天给我发邮件汇报数据。有一天它发了一封邮件,其中有明显的错误。我当时还没察觉,但过了两分钟,它自己又发了一封邮件,说刚刚有个数据是错的、这个是最新的。
曲凯:真的吗?这是怎么做到的?
宇豪:它会把新数据和历史记忆做对比。如果发现异常,就会去二次核查到底是数据真的变化了,还是自己出错了。
但即便这样,幻觉依然是一大挑战。所以我们还是希望能尽量降低幻觉的发生概率,或者减少幻觉带来的影响,并且在一些高风险操作之前,寻求人类的同意或者介入。
以及我觉得理解模型的边界,知道它什么不知道、什么做不到,永远是我们 benchmark 中最重要的一环。
曲凯:其实我们现在聊的问题,跟 3 年前是一样的。这三年里模型有了很大的进展,但仍然还有很大的空间。
宇豪:对。或者说,现在模型在处理简单任务时,这些问题已经不太存在了。但当我们让它去做更复杂的事情、逐渐渗透到工作和生活的方方面面时,这些问题就依然存在。
曲凯:我觉得模型能力有点像内存,一直在变大,但永远不够(笑)。
那你们现在既在做 Junior,也自己在用。如果你是客户,在挑选 OpenClaw for Teams 产品时,会着重看什么?
宇豪:第一,我会看客户规模。在我心里,规模是最质朴的安全指标。
第二,从 CTO 的视角,我会看它的代码是否可审计、部署方式是怎样的。
再往下才是成本和效果。但在我个人视角里,这些对于 OpenClaw for Teams 这种产品反而是次要的,因为我很清楚 Junior 能做到多好的效果。但这里有一个隐含的问题,就是需要注意一下某个产品是不是为了效果牺牲了安全。
曲凯:明白。最后,你们毕竟做得比很多团队更早,能不能给在做类似事情的人,分享一个很容易踩的坑?
宇豪:有一个我们亲身踩过的坑:哪怕你的 agents 已经足够强了,你还是要尽早 build evaluation benchmark。而且在 OpenClaw for Teams 这种产品里,更需要关注的是,它知不知道什么时候不该说话、不该行动。
很多人一开始都会想尽快把效果做上去,而忽视其他问题。包括我们当时也是这样。我们甚至激进到,几乎把 Kuse 的所有权限都开放给了 Junior。
但后来我们逐渐意识到,真正决定这个产品体验的,是它在各种对抗场景下,能不能守住安全边界。
我们早期没有重视这一点,导致有些 Juniors 分不清什么该说、什么不该说。当然,这些 Juniors 后面都被开除了,AI 也是要竞争的(笑)。
曲凯:哈哈,但这个确实很难。首先人也会传八卦、说坏话,而且什么该说、什么不该说,本来就很难界定。
宇豪:对。但我觉得一些非常好的模型,还是会有基础的判断。不过要让一个 AI 员工完全被信任,还是有很多事情要做。而只有当它能被信任时,才能更好地服务客户。否则它本质上就只是一个 Chatbot,只能回答问题,做不了真正的工作。
所以我们在这方面做了很多努力,甚至设计了一些「钓鱼」场景:比如外部有人给 Junior 发钓鱼邮件,它能不能识别、要不要回复?再比如内部有人丢了设备,如果有人冒用身份来问问题,它能不能及时拦住?
不能说我们在这方面做到了最好,但至少现在能让 Junior 满足我们的需求了。举个例子,我们的Rin 和 Azzurra,就知道不应该把用户数据隐私泄露给任何一个员工,还会主动告知对方哪些内容可以透露、哪些不可以。这其实很难。
在企业场景里,这类细节问题非常多。所以虽然现在有很多团队在做 OpenClaw for Teams,但如果没有真实客户,其实很难感知到这些问题。
而我们既有客户,自己也是用户,所以能更早发现,并不断修正。
42章经
思考事物本质