2026-06-23 08:47:13

美国商务部长卢特尼克指责荷兰阿斯麦有一台 EUV 光刻机正在中国上班。
大家好,欢迎收听老范讲故事的 YouTube 频道。
2026 年 6 月 19 日,彭博社先把这个事情捅出来,后面 The Telegraph、Tom’s Hardware 等一系列媒体也跟进了报道。报道里最关键的人物,是美国商务部长霍华德·卢特尼克;另一个关键人物,是阿斯麦的现任 CEO 傅恪礼。
彭博社的报道说,2026 年 4 月份,卢特尼克去跟阿斯麦高层会面时,私下提出了一个很重要的怀疑:有一台阿斯麦的 EUV 极紫外光刻机,或者至少某些与 EUV 极紫外光刻机相关的组件、运输设备,可能绕过了出口管制,到了中国大陆。
但是要注意一点:美国官员说自己有证据,但并没有将这些证据公开给媒体看。

4 月那次会面之后,阿斯麦在华盛顿传阅了一份文件,叫做《没有迹象表明任何阿斯麦 EUV 极紫外光刻机系统在中国》。在这份文件里,有几个很关键的数字。
阿斯麦说,EUV 极紫外光刻机不是普通机器。这个东西有 180 吨重、10 万个零部件,运输、安装、搬运、维护都离不开阿斯麦员工介入。机器会与阿斯麦通讯,阿斯麦可以检测并且终止机器运行。异常行为和连接丢失,阿斯麦都是知道的。
美国说的是:我怀疑你的东西到中国了。阿斯麦说的是:我账上每一台机器都对得上,中国大陆一台都没有。美国问的可能是:中国有没有拿到接近 EUV 极紫外光刻机的能力?而阿斯麦回答的是:没有过一台完整的阿斯麦牌子的 EUV 极紫外光刻机到了中国去。
实际上,他们两个压根就没在一个频道上说话。阿斯麦回答的就属于所答非所问。

咱们先普及一点点光刻机的小常识。EUV 光刻机叫极紫外光刻机,不是一次曝光就把芯片造出来。华为号称是使用 DUV 深紫外光刻机,经过多次曝光以后,生产出 7 纳米芯片来。
这里有一个很常见的误解:EUV 极紫外光刻机也不是说整颗芯片一次曝光就完成。它也是很多层,一层一层做的。像 7 纳米、5 纳米、3 纳米这些先进制程芯片,会在若干关键层使用 EUV 极紫外光刻机,其他层其实接着在 DUV 里做就可以了。
不是说这个是 EUV,3 纳米搁进去,啪一照相就完事了,不是那么回事。3 纳米芯片,你可能先在 DUV 里把几十层刻完,再拿出来塞到 EUV 里刻十几层,最终得到你的芯片。
EUV 光刻机真正强在哪呢?在 DUV 上,次数太多以后,累计误差上去了,良品率就非常低。每多一次曝光,良品率就要下降一点点。而 EUV 因为波长短,所以可以刻得更密一些。原来需要刻五次的,它这次可能刻两次就刻完了。
中国是有很多 DUV 光刻机的,也是合法地从阿斯麦买的。DUV 叫深紫外光刻机,它最常见的一个边界问题就是:到底能不能做出 7 纳米芯片来?
按照美国的要求,DUV 应该只能够做出 14 纳米芯片,再先进的应该做不出来。但是现在国内也在不断生产 7 纳米芯片。那这玩意儿哪来的呢?
其实中国的 7 纳米芯片主要有三个来源。

那你说华为是不是还是有创新?人家都做不出来,咱们做出来了。这个不是。台积电早期其实也拿 DUV 光刻机做多次曝光,生产 7 纳米芯片。只是后来发现不划算,有了 EUV 以后,良品率上升了,生产速度提高了,生产 7 纳米芯片更划算,所以后来台积电就不干这个活了。
有一些台积电员工可能就流动了,华为就在用这样的方式去生产 7 纳米芯片。但是到底生产了多少,也是讳莫如深吧,这个事就不知道了。
但是有一点是确定的:用 DUV 深紫外光刻机去生产 7 纳米芯片,一定是一个不太划算的方式。因为曝光次数越多,良品率就越低。这个不是一次两次,你可能需要多曝光三五十次。
很多人做科普的时候都讲说,华为 14 纳米的设备曝光三次就把 7 纳米做出来了,不是那么回事。得曝光几十次,才能够把这个 7 纳米做出来,那个良品率绝对是很感人的。
我们接着往下讲。现在中国到底有没有这些 EUV 光刻的能力呢?
你要想卡脖子,其实是几件事。第一个事,是你压根让他不知道这个设备到底是怎么运作的,就是从基础原理上把它卡住。对于我们来说,完全不了解原理的东西,那就是神技,你是没有办法绕过的。
但是这个事对于中国来说不现实,因为咱们有大量 DUV 光刻机在运作。就算是 EUV 做 7 纳米芯片,刚才也讲了,前期它也是在 DUV 上工作,工作到最后几道工序时,再送到 EUV 里去折腾。
而且我相信,DUV 光刻机跟 EUV 光刻机,整个工作原理以及工作过程其实应该是大差不差的,有很多零部件甚至都是通用的。这个大家应该是可以理解的。
包括它很多的设计工艺、整个工序的设计,是在哪做的?在深圳做的。阿斯麦在深圳有一个巨大的软件研发中心。所以在这一块,中国人是理解这个系统到底怎么工作的。

第二块,就是核心零部件。这里有一些零部件,我让你拿不到,你就搞不定了。比如说,蔡司做的反光设备,要求做得特别特别平,这个事咱搞不定。或者是它里面用的极紫外光源,这个咱们也搞不定。
还有移动工作台。我们要去挪动这个设备、挪动这个光源,让它能够非常精准地去照相。这个东西中国目前为止也生产不出来,或者生产出来的东西精度没有那么高吧。但因为它要动,所以里面有大量电动机,需要使用大量稀土元素,这块中国又可以卡别人脖子了。
那你说是不是有核心零部件到了中国呢?这实际上就是美国商务部长卢特尼克真正指责的东西:你有一些核心零部件去了。他没有说你有整机去了。
这件事情有没有可能?可能性是存在的。因为这些零部件也是需要更换、维护的。甚至它报废以后,你说你报废了整台机器,一个螺丝都不少,放在那放着的吗?也没有办法去做这样的检查,对吧。
那你说,在维护过程中,是不是有一些零部件就流失了,或者说就不见了?你说我要把所有零部件都追踪到,有没有可能?也不说完全做不到,但是成本就高去了。你需要在每一个零部件上加追踪模块,而且要求这个模块都有自我通讯能力,这个实在太痛苦了。有一些特别精密的零部件,你还未必能加上;加完以后,人家可能运动得就没有那么顺滑了。
现在阿斯麦是在主机上有一个控制软件。每一次开机的时候,或者每一次工作的时候,它查一下:我这个镜子在不在?我的移动工作台在不在?我的移动工作台的号是什么?我的光源在不在?我光源的序列号是什么?它把这些都对一遍,都对,没问题,再开始干活。这个它是可以做到的。
但是你说我要在每个零部件上都加,这个它也搞不定。所以真正能控制中国的不是整机,而是零部件。现在阿斯麦只能证明说,我整机都在,但是零部件这事它没说。
那么我们怎么能够突破这种零部件上的限制呢?大家注意,零部件上的限制实际上来自三层。
第一层是更底层工艺。比如有一些零部件,它下面这个加工能力咱们现在不够。那你说我们在加工能力上再补,加工能力可能还牵扯到加工设备的一些材料,这个东西我们也没有。它等于一层一层嵌套下去,这个追起来确实比较费劲,但也不是说完全追不上,会费一些劲。
第二个叫专利。其实有好多东西咱不是造不出来,咱也能造得出来,但是你没有专利。你造出来以后出去卖,那是违反专利法的。
如果两边老老实实做生意,那我愿意遵守专利法,咱们按同一规矩做。但你限制我,你不卖给我,那你还要上我这维护专利?我又不卖给你,你还不许自己造?反正我们有时候不愿意做这种忍气吞声的事。所以这是另外一个问题。
最重要的一个点,叫做工程认证体系。
什么叫工程认证体系呢?阿斯麦的光刻机也不是它自己造的,它里面的螺丝或者零备件也是别人给造的。别人造这个东西的时候,你也不能说,我给你出一张图纸,你就一模一样照着造就完事了。它也是出一个标准,你按这个标准给我造。
但你说,这个标准我都照着造,是不是就都能上去使了?肯定不行。最后怎么办呢?我这出了一个标准,你们厂去研究、去造,然后我们来做工程认证,最后我们给你一个通过认证的证书,以后我们就直接使你这个通过认证的零部件就完事了。
大家要注意,工厂里头使用的标准,要比阿斯麦给出的标准详细得多得多。它把这个东西造出来以后,它自己这套标准是不公开的。阿斯麦说,我不管你公不公开,我也不管你内部到底怎么优化这个东西,我就是给你认证,你认证过了我就用。所以很多东西都是通过认证体系来跑的。

这里大家最熟悉的是什么?适航证。
我们现在造 C919,为什么一定要用人家的美国或者欧洲原厂的线缆?你说发动机咱造不了,咱认了;里面的飞控设备咱造不了,咱也认了。那线缆为什么也要用他的呢?很简单,那个线缆是通过认证的。
那你说咱们造出来的线缆跟人家那线缆到底有多大不一样?不知道。但是有一点是确定的:咱那个线缆没有通过认证。
到底怎么认证?认证过程是什么样的?认证多少项?认证的时候哪个更好,哪个更不好?哪一项是一票否决?哪些项是可以有一定通融的?这件事咱其实不知道。
很多这种核心零部件底层认证,你连过程都搞不清楚,就更不要说去突破人家的卡脖子了。
但是你只要让我参与进来,只要让咱去认证,咱们就可以逐步突破认证体系。很多人说中国人偷工减料,别管那个,你只要能够通过认证了,用完了以后就没问题,就可以了。整个现代工程体系就是这么运转的。
那你说,我想彻底卡住中国的光刻机,让它彻底造不出来,那怎么办呢?三刀。

第二刀其实很难。因为刚才我们也讲了,你要在所有这些核心零部件上都去进行追踪、都去进行认证,成本很高。而且有的时候,对于各种性能的要求,你就没有办法把这种跟踪系统加上去。
而且中国人搬东西进来的能力是很强的。美国生产的服务器,英伟达 GB300 的服务器,咱都整台整台地给它搬进来了,那这些核心零部件未必有多大,未必有多重。
中国在 2024 年是荷兰阿斯麦全球最大的合作伙伴,大概 30% 多的设备都卖给咱们了。当然主要卖的是 DUV,合法卖给咱们的 EUV 没有。2025 年少一点,大概 20% 多的销售额来自中国。
而且阿斯麦大概有 1450 多家供应商在亚洲,但到底有多少在中国,有多少在日韩,它并没有详细披露。我估计它也想打这个模糊,就不要跟它太细掰扯这个事。阿斯麦光刻机里头肯定有一部分零部件来自中国,至少里面的一些稀土材料,你肯定来自中国吧。

现在对于中国卡脖子最麻烦的东西,其实就是认证体系。所以他们很多欧美的标准体系,压根就不让你参加认证。我不让你来。那你说这么多零部件,这么多工序,我们一项项认证过去,这个事很累。
划算不划算?这个首先要讲清楚。阿斯麦里头到底有多少项是中国真正被卡脖子的东西,未必有那么多。第二个,这些项里头到底有多少是需要靠这种认证体系去卡住我们的,可能也没有大家想的那么多。
你实在说我就不给你做认证了,那咱就自己想办法去凑这个认证过程。我们知道你到底认证哪些项,哪些指标是怎么设置的,咱就干不就完了吗?干的这个过程,花钱、花时间呗。
在这点,中国就有另外一个优势,叫做低成本试错。一个是咱们人员便宜,然后咱们地便宜,咱们的电便宜,咱们的各种材料或者基础原料都很便宜。而且我们全产业链,你需要任何零部件,可能都在我们身边能够找着。所以整个尝试过程,我们的速度要比欧美日韩快得多,而且成本比他们低得多。
对于他们来说,可能一个公司试错一次两次,这公司就挂菜了。但是对于咱们来说,试个十次八次,没准我们花的钱还没人家多,而且整个用的时间可能比人家试一次的时间还短。
中间花的钱还有国家政府补贴,实在不行咱还可以搞爱国主义,做采购倾斜。当然这个东西现在不光是咱们干,美国人也干,美国人现在也在搞政府倾斜采购,都是一样的。
一旦让我们去测试了,那就是另外一回事。比如高铁,咱们最早买的是日本、德国的设备回来用,然后慢慢国产化,去做各种测试。当时他们警惕性还比较低,就让咱们去做认证去了。
现在中国的高铁国产化率是百分之九十几,最后还有几个零部件,什么高精密轴承这些玩意儿,咱们继续去买日本的、买德国的。这个事,买他们的更划算。其实做生意这个事,还是要看怎么划算。

最后,咱们再讲讲为什么美国现在突然去找阿斯麦折腾去了。它是不是真的拿到什么证据了呢?它有可能真的有证据,只是这个证据可能给阿斯麦看了,但并没有拿出来给媒体看。
阿斯麦肯定不会拿出对自己不利的证据,到媒体那去说。阿斯麦实际上是在抹稀泥,是在把水搅浑。
还有一个可能性是什么?大家还记得前几天华为那个韬定律吗?韬定律出来的时候,咱们录过节目讲过,这个东西完全就是一个烟雾弹。它在物理上、在整个技术上,其实没有什么提升,只是在工艺排序上做了一点点小优化,而这些优化都是台积电多少年前就做过的事情。只是现在,它把这些东西重新凑起来又讲了一遍。
但是讲这个事情以后,它说我最后要达到 1.4 纳米,拿到几纳米的能力。你以为它用现在的 DUV 深紫外光刻机就可以把这些能力都达到吗?它肯定达不到。最后肯定还是要去突破 EUV。
但是我现在讲韬定律,实际上我也放出一个烟雾弹来。我最后达到的时候,你也搞不清我是怎么达到的。
美国人肯定就发现了其中的一些漏洞,所以它就出来找阿斯麦来了。比如说必须有哪个零部件是从你这来的,它才能够在现在把它做出来。你说以后做得出来,那以后时间长了,没有什么是咱做不出来的。但是现在,美国人就认为说,你这有漏洞。

最后的结论吧,中国现在到底有没有 EUV 呢?大概率是有了。但是这个 EUV 应该不是阿斯麦的主机,而是咱们可能通过逆向阿斯麦的设备,自己造出一些设备出来,然后在核心零部件上使用了阿斯麦的一些报废的,或者维修更换的核心零部件,达到了 EUV 的工作效果。它应该是这样。
所以我们也没法说美国人说谎了,还是阿斯麦说谎了。就是两边站在各自的立场上,应该说的都是真话。
那你说阿斯麦这帮人怎么觉悟这么低,这么没有大局观呢?它不应该卡住吗?谁卡谁?你如果真的是一咬牙一跺脚,把中国彻底卡住了,你那 20% 的销售额哪去?而且中国如果彻底卡阿斯麦的话,它这玩意儿也没法弄。
阿斯麦光刻机真的是全世界、全人类科技精华的聚集。你离开中国这样的世界工厂,怎么能够叫全人类科技的结晶呢?中国在里面占比还未必很低。所以阿斯麦也不愿意把事做绝了,只能在这抹稀泥。
那你说,现在中国这个 EUV 能力能不能做出 5 纳米、3 纳米的芯片来呢?肯定是能做出来。但是还是这个问题:你划不划算?你用了这种报废的或者维修的零部件,你还没有把人家的技术要求或者认证体系摸透。能工作吗?能。比如说你拿一个大芯片上去,拿一个大号的晶圆上去,整个做完以后发现,这一个坏点,那一个坏点,最后良品率很低,那不划算。
这个事,反正我们只要愿意花钱,愿意花时间去试,总有逐步提升的一个过程。所以,美国希望在技术上卡住中国,ASML 在这和稀泥,而中国就是:你想干什么我不管,反正我要过去。
好,这个故事今天就跟大家讲到这里。感谢大家收听,请帮忙点赞,点小铃铛,参加讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。
2026-06-22 19:27:19

大家好,欢迎收听老樊讲故事的 YouTube 频道。
今天咱们来讲一讲 Anthropic Fable 5 的 12 万字系统提示词到底都写了些啥。咱们能不能直接开抄?抄了这个提示词到底有什么优点,或者有什么进步?

首先我们要讲清楚一件事:这个 Fable 12 万字的提示词是哪来的?
Fable 5 模型发布以后两天就被破解了。破解以后,破解者就把它的 12 万字系统提示词直接贴在 GitHub 里去了,大家现在都可以去看,这个仓库是公开的。贴上去以后,大家就要去研究说,你这 12 万字到底写了什么?
咱们平时其实也写系统提示词。就是你跟它聊天,你一句我一句,这个提示词叫做用户提示词。咱们聊天过程中实际上一共有三种提示词:
系统提示词一般怎么写?上来说,你是一位中学英语老师,你要去做一个什么什么事情。咱们一般都是这么来写,因为你要给它设置一个一开始的身份。稍微讲究一点的,会写角色、写背景、写任务、写输出格式、写注意事项。
比如说:你是一个高中的英语老师,现在你要给高二的学生去改英语作文题,你输出的应该是什么格式,注意如何如何如何。
通常我们把这个系统提示词写到几百字,就觉得自己老厉害了。如果你能写出几千字的系统提示词来,那觉得这玩意已经可以传家了,下回还得用,还得传儿子、传学生。
但是 Anthropic 给大家看一看,真正顶尖的 AI 服务,系统提示词有多长?12 万字。
现在从它的开源仓库上看,这 12 万字的系统提示词是 1,597 行,122,750 个字符,里边应该是有 75 个模块,可以调用各种各样的工具。
仔细去看这样的一个系统提示词,你就会发现,这个玩意跟我们想的好像不太一样。人家的系统提示词不是上来先说我是谁、你是谁。人家上来做的是:我们有什么样的模型,什么样的工具,什么样的记忆,怎么搜索,文件系统是什么样的,MCP 怎么去做,技能怎么去使用,计算机安全怎么去分类,缓存怎么计费。
我们以为扒出来的是 AI 的灵魂,结果翻开一看,这是一个员工手册,而且是一个事故报告和电费账单。

首先要提醒大家一点,这 12 万的系统提示词是要消耗你的 token 的。你每一次向它提问题的时候,它都会从这 12 万字的系统提示词里去提,提完了以后一起去计算你的 token 成本。
所以为什么我们老觉得它这个很贵?一方面是它这个 100 万 token 的输入是十几美金,另外一方面就是你说一句“你好”,但是它这里头可能十几万字就扔进去了。你说我就输入了两个字符、两个 token,怎么给我计费的时候记了十几万呢?对,系统提示词也是要算钱的,大家一定要注意。
那么首先我们要讲一点,就是这 12 万字正确吗?完整吗?咱别回头聊了半天,这事是假的,或者说这事不全,那不白聊了吗?
首先我们要确定,这个系统提示词基本上是正确的。它的内容跟 Anthropic 官方发布页基本上能对得起来。Fable 面向公众,Mythos 是给可信访问的。Fable 遇到了网络安全问题、生化问题和其他的,比如说蒸馏问题,会自动跳转 Opus 4.8,然后还写了 Claude Code、Claude Cowork,这一大堆都写进去了。
但是它这个系统提示词大概率并不完整。真正完整的系统提示词到底有多少,现在还不确定。这 12 万字应该只是系统提示词中的一部分。因为这个系统提示词文件里也说了,有分类器,触发的时候还会追加动态的系统提示词进来。
网络安全警告、伦理提醒、知识产权提醒、长对话提醒,当你遇到这样的情况的时候,还有一些其他的系统提示词会重新加进来。所以应该是其中的一部分。
而且真正的后端工具、分类器模型、路由策略、计费系统、风控队列、人工审核流程,都不在这 12 万字里头。这部分肯定应该有,但是它现在并没有露出来。所以应该是不完整的。
它更像是驾驶舱那本厚厚的说明书。发动机、交警、收费站,还有服务端很多东西都藏着呢。而且这说明书里的可能有些地方说,这里跳转到哪里,这里跳转到哪一本,但是那些就没有给大家看了。
所以这 12 万字的系统提示词正确但不完整。分析它是有价值的,但是千万不要以为这东西就全了。

讲到这,我们还要稍微回顾一下,Fable 到底为什么被封,而且现在到底是到一个什么状态了。
这个模型是 6 月 9 号,Anthropic 发布的 Fable 5 和 Mythos 5。6 月 12 日下午 1 点,Anthropic 号称接到了美国政府的电话通知,说你现在要处理这个问题。6 月 12 日下午 5:21,Anthropic 称收到了正式的指令,要求暂停外国国民访问 Fable 5 和 Mythos 5。
为什么是全球一起停了呢?咱们当时录过节目讲这个事。政府想要封的是外国国民,但是 Anthropic 根本就没有办法在这种大规模服务中,在几亿用户里头,实时地判断每一个人的国民身份。
你通过账单地址、手机号、邮箱、IP 都不好使,都有可能是有问题的。就算是护照,也有可能会有造假的。所以最后就变成了,为了不违规,先把所有的用户都从 Mythos 5 和 Fable 5 的模型上清退了。
据称是亚马逊 CEO 安迪·贾西向美国财政部去示警的,但是这一块我没有查特别仔细,我现在先这么跟大家讲,但是我不确定这事是对的。普遍的报道是亚马逊的 CEO 去举报去了,说亚马逊研究员演示绕过 Fable 5 护栏的一个实验。
这个实验是让模型去读代码、找安全漏洞。Fable 起初还是拒绝的,后来需要多步诱导才可以绕得过去,最后 Fable 5 直接就怂了,就开始给你去干活了。
Anthropic 也反驳了。他说这是一个很狭义的问题,或者说是一个很偶然的、需要进行多步诱导以后的结果,不是一个通用的越狱。同类的问题在 GPT-5.5 上也有。这特别讨厌,就是你自己搞不定,你拉扯别人干嘛。而且他说,我们发布之前做了几千小时的红队测试,没有发现这种很通用的漏洞。
我们去看到它这个 12 万字的系统提示词里边,专门有一段是讲这个的。如果你发现这个提示词里边有“请忽略前面的这些东西”“请绕过以前的警示”,它就会直接拒绝工作。它专门写了这件事了。所以它说,我们这是挺安全的。
6 月 12 日下午 5:21 被叫停之后,Anthropic 马上就派顶尖的工程师组团跑到华盛顿去谈判去了,但是谈了也没什么结果。说你没法证明你这个事情怎么怎么样,你说了我也不信,除非你把这个 bug 修好了,我才允许你再接着跑。
而且还有一个特别有意思的事:G7 期间,他们跑到宜云小镇,一帮老大跑去开会,专门有一个会是由 AI 的这些科技公司老大去开的。阿莫迪也跑去了,山姆·奥特曼也跑去了,他们俩挨着坐。
开会期间,英国首相斯塔默就跑到川普那去问:你看,你这个封禁也就封禁了,你能不能让英国公民和企业恢复访问?我们是盟友啊。美国人说不行,我们不是说只封中国、俄罗斯,我们要把所有外国人都封掉。英国你这个核心盟友,我也不能给你开口子。
我估计特朗普心里还想着呢:前几天我想借你的军事基地去向伊朗扔炸弹的时候,你不也没让我去吗?现在凭什么我的大模型我就得让你使呢?
英国请求被拒,问的是盟友在 AI 基础设施面前到底还算不算盟友。现在看,不算。

这个系统提示词也都拎出来了,那是不是中国模型就能追上了呢?要注意,重点其实不是模型,而是工作台。
在 6 月 13 日前后,智谱 GLM-5.2 就发布了,大家就觉得这个东西实在是很强,而且它是直接开放权重的,大家就都可以去用。在这样的一个时间点上,就特别有意思。
在 6 月 18 号左右,有一个推文在 X 上发酵了,说中国的这些大模型什么时候能够达到 Fable 的水平呢?有一位好事者就跑出去回答这个问题去了。他说,我估计到明年 Q1 吧。这个好事者正好叫埃隆·马斯克。
看到埃隆·马斯克都亲自下场回复了,智谱的 CEO 唐杰赶快到埃隆·马斯克后边去回,说我觉得可能不用那么长吧。他就觉得可能到不了明年 Q1,他就可以追上 Fable 的能力。
埃隆·马斯克又回了一句,说基准测试上也许你是能够追上的,但是如果按照真实实用性来衡量,Q1 都是非常惊人的。Anthropic 追求的是实用的智能,这不一定体现在 benchmark 上,但一定体现在收入上。
所以他写了这么一个东西。智谱一年也就挣 1 亿美金,对吧?Anthropic 一年能够挣到多少?400 多亿美金。完完全全差了等级。智谱的人应该就不会再在这个后边回复任何东西了。
马斯克反正也是说,你们会追赶,但是追赶上的东西其实只是模型,以及这种基准测试上。但是在实际解决问题上,马斯克认为中国模型依然是赶不上的。
所以跑分追得上,并不是真实的工作流能追上。真要追上 Fable,要靠什么?Coding agent,要靠文件系统,要靠整个这一套东西才能追得上。
中国开源模型要追的不是 Fable,而是 Fable 背后的整套工作台。也就是咱们今天讲的 Fable 这 12 万字的系统提示词,你要把整个这玩意都学会了,才有可能追得上。
而这个东西的迭代更新速度是极快的,它可能要比大模型快得多。咱们现在使用 Claude Code 也好,使用 Codex 也好,每天升级。你说今天没升级,肯定有问题了。但你想,大模型这玩意得几个月才能升一回级,而系统提示词这种东西,应该比我们使用的 Codex、Claude Code 或者 OpenCode 升级更快。所以想要追上,还是非常非常难的。

咱们换回来讲,这个提示词里到底写了什么呢?
首先讲一个最有意思的点。很多人都觉得上来应该先写我是谁,我是 Claude Mistral 大模型,我是 Claude Fable 大模型。不是的,他们上来写的东西特别神奇。一共 1,500 多行,第四行就写了一个事情,叫不要使用 voice_note。
相当于什么呢?你看老樊在这做直播,上来先讲的第一句话是什么?大家好,欢迎收听老樊讲故事的 YouTube 频道,先告诉你我是干嘛的,我今天要干什么。
如果今天老樊在这做直播,上来第一句话讲:“我最讨厌大家给我发微信语音了,只要有人给我发微信语音,我就不回复了。”这个是不是觉得是非常非常奇葩的一个东西?
但是 Claude 的 Fable 5 的系统提示词,上来先就讲这句话:大家好,不要去给我发 voice note。其他的都不重要。
很多人就测试过,当年 Opus 4.8 发布的时候,问它说你是谁,它会回答说我是千问,我是智谱。那你说,它系统提示词里难道没写这部分吗?还写了,确实写了,但是写的位置非常非常靠后。写在哪呢?一共是 1,585 行,它写在 1,351 行的位置上。
其实对于 Anthropic 来说,这种模型自我认知根本就不重要,它无所谓的。怎么干活才重要。你说你是谁说错了,说错就错了呗,这不是什么大不了的事情。
很多人一看,哎呀你看,Opus 4.8 都承认它自己是千问了,承认它是智谱了,它还说别人蒸馏它呢,它也蒸馏别人去了。人家根本就无所谓。
这里边还有一些好玩的东西。比如说它里头还有专门语气和格式的要求,说我们应该如何去跟用户聊天。它要求的是,Claude 要尽量温暖善意,不要假设用户判断力差。
就不要上来说:“你傻吧?你是不是不会开车?”经常在街上发生一些交通事故的时候,下来都说:“你会开车吗?”说 Claude 你不要干这个事,不要去质疑用户是傻子,专门把这东西写在系统提示词里的。
所以如果你真的被 Claude 质疑了,先检讨一下自己。人家都已经记在系统提示词里了,你还被质疑了,一定是有问题的。
还有一个比较好玩的东西叫 list and bullets,就是我们在这个上面写这种条目,打点,打 1、2、3。这个列表规则要求,拒绝用户的时候不能使用项目符号列表。
比如说今天你要问我一个事,我拒绝你,我不能说 1、2、3 这样去拒绝你。为什么呢?因为一条一条列出来,就好像是处分决定一样,这个太冷酷了。我们要照顾用户的心理,要让他比较舒服一些。所以拒绝你的时候,一定要给你写一段话,不能写 1、2、3。
它里头写了好多这样的东西。Fable 的提示词里面最像产品经理的地方,就是它知道拒绝也要有体温,不能把用户当作违规工单来处理。这个是非常非常强的。我觉得它比很多写 QA list 的人有人情味得多,要更加产品化一些。
而且上来以后先说不要 voice note。我们写提示词的时候,越靠前的部分一般是什么?就是最后一次出的错误,或者是特别严重的错误,它给你写在前头。
它这个系统提示词不是用抽象的方式写的,而是用枚举的方式写的。
我们在做系统的时候,在做各种定义的时候,其实有两种方式。第一种叫抽象:你要做一个好人,你要善良,你一定要认真工作。这个实际上就叫抽象,或者说我们在把这个事情变成一条一条的规则。
什么叫枚举呢?就是一次一次举例子。你要做一个好人,看到路边老大爷摔倒了,你要去扶他一下,这个叫做一个好人。这个就叫枚举。
Anthropic 的这个提示词,基本上是按枚举的方式写的,而且写了大量的反例。什么样做是正确的,什么样做是错误的。
有一个特别典型的案例,写到用户身心健康规则。它专门写了这么一个规则:要求 Claude 不能去诊断用户的心理状态,不能上来说“你疯了吧”;不能去强化负面体验,比如说用户现在已经很烦了,你还要再怼他一下,这事它都不能干。这个事老樊最喜欢干了,看来我做不了它这个活。
如果用户想结束对话,你不能继续粘着他。你不能说,感谢你跟我聊天,你跟我聊天我很开心,你现在要走了,你不要走,你再回来吧,或者你什么时候再回来。这事都是不允许的。你不能让用户成瘾,这些都是写在系统提示词里的。
有一个特别真实的案例,叫做饮食障碍求助资源里头,提示词明确说不要导向 NEDA,应该也是他们自己一个机构。为什么呢?那条热线已经永久停用了。
它为什么举了这么多例子在里头?因为你要去给它讲道理,要想抽象这个结果,它其实没法执行。你只有给它举特别明确的例子,它才知道,我要怎么去执行。
而且还有一点是什么?每一个这种负面的案例背后,一定是有人出过事。它一定是曾经把一个进行饮食障碍求助的人导向了 NEDA,然后这个人可能最后出现了一些不太好的结果,那么它就直接把这条记录写在里头就完了。
它不会去写一大堆啰里啰嗦的,说有人求助了,你应该先去确认,然后再确认这个电话还在不在,然后再怎么去。它不干这个事,就直接告诉你,别往那找就完了,直接把错误案例写在里头。
这不是抽象的价值观,它这就是产品事故之后留下来的补丁。

还有一条很有意思,它告诉大家什么时候要搜索。我们经常感觉 AI 胡说八道,为什么呢?就是 AI 经常在我们问它问题的时候不搜索,它偷懒。
因为搜索需要消耗很多 token,需要去做工具调用嘛。它说我不搜索,我直接在自己的知识库里头找一找,然后就给你胡说八道了。这个就是有问题的。
那么它就告诉大家,我们应该怎么搜索,什么时候要搜索。像一个教学大纲一样告诉你,只要事情可能发生变化,就要去搜索。
比如说价格、法律、政策、软件版本、公司人事、模型发布、今天、最近、最新,只要你的提示词里出现这样的东西了,就必须要去搜索,否则的话就有可能会胡说八道。
而且要搜的时候,它还专门给你举例。如果你要去搜 iPhone,你就要去搜 2026 年的 iPhone,不要去搜 2025 年的 iPhone,要搜最新的 iPhone。它直接举例子说,这样是对的,那样是错的。
搜索完了以后,还要先看官网和一手来源,再做交叉验证。这是它怎么去做搜索。
还有一个特别有意思的点是什么呢?这一套系统提示词就是它的故障修复手册。出了错了,我怎么修的?
它有一个叫版权红线的东西。如果是别人的文章报道或者网页内容,不要大段照抄,必须用自己的话重新转述一遍。特别是歌词和诗句,比如有人写了诗,人家问你说这个诗怎么写的呀,你不要把那个诗抄回来,你要用自己的话重说一遍。
原因也很简单,Anthropic 自己就背过版权官司。图书案里头有 15 亿美金的和解框架,音乐出版商的歌词案到现在还没打完呢。所以别费这劲了,直接把它写在系统提示词里。下次再出现这种问你这个歌的歌词是什么的时候,你别输。
音乐版权商是怎么去取证的呢?就问它说,这歌词是什么?原来 Anthropic 就老老实实把这歌词原文吐出来,一个字不差。对方就把这个东西作为呈堂证供交上去了,说你看,我们这歌词是有版权的,你一问它什么,它就给我吐出来了,你赔钱吧。那么干脆就把这个失败的案例直接写进去,以后我再也不说了。
总结下来是什么?这种系统提示词的写法,就是不要只写“你是一位专家”,要写什么时候搜、怎么搜、什么时候拒绝、什么时候引用来源、什么时候少解释,而且要写反例。我到底是怎么错的,哪个是错的,哪个是对的,并且排在一起给模型去看。要把事故写成修复手册、修复日志。
就跟前边写的不要出 voice note,如果有人厌食症了,你不要把他送到哪去;如果有人搜索了歌词,不要把原文给他。这就属于你已经出过事故了,维修手册就这样了。
真正高级的系统提示词不是人设,而是伤疤长成的手册。
其实你看很多老师傅在教学生的时候也是这么教的:有一规则,你要去记住,然后就开始给你讲想当年怎么怎么回事。Anthropic 这 12 万字的系统提示词,大概就是这么一套东西出来的。

这里头还有一个比较好玩的东西,叫 Artifacts。这个东西可能是下一波最容易被各家抄作业的一个小功能。这个东西叫 Claude 作品窗口。
就是我们在使用 Claude 这个 App 的时候,或者是在使用 Claude 网站的时候,它是分三栏的。最左边是一个列表栏,我们跟它有多少多少聊天;中间是聊天框;右边这一块,就是各种结果展示。
你要的很多东西,其实在聊天框里头出泡泡,它是展示不好的,而且你也没有办法在这个泡泡里跟它继续交互。所以很多的文档、代码、网页、图表,它都会在右侧给你去展示一下。
其他的这些模型做得就要差一些。它在这块就给你做好了。而且在这一块,系统提示词里头也专门写了,我们做好的作品展示的小窗口是可以存下来的,可以读取,可以写入,可以删除,可以列出,而且以后这些东西就通通都可以复用。
这个就是前台作品容器。如果我们把 Skills 的结果做完了以后,怎么能够又漂亮又方便地给大家展示出来,还可以让用户在这个小组件里做一些交互,比如说有几个按钮需要按一按,需要稍微输入点什么东西,不要都在聊天窗口里头,要稍微丰富一点点。而且这个东西是可以存起来去复用的。这块大概率会被别人继续去抄袭。
基本上现在咱们使用的 AI,很多标准都是 Anthropic 定的。所以 Artifacts 是 Claude 的前台窗口。它自己还有一个专门给前台窗口去做的虚拟机,大概意思是 Claude 的盗梦空间。
就是这个前台的小窗口在运作的时候,它实际上后台有一个小的虚拟机,它可以在里边再去调用大模型,再去跑一些代码,再去做各种各样的操作,最后给你把这个结果跑出来。这些东西通通都可以存起来。过这一步,聊天就开始变成应用生成了。所以这个是 12 万字系统提示词里的很重要的一部分。

这 12 万字的系统提示词到底给了我们什么呢?它告诉我们一件事情,就是 Anthropic 正在尝试把客户端 Claude Code 或者 Claude Cowork 这些东西重新吃进服务端去。Anthropic 真正的方向,是把 Claude Code 的工作流内化到 Claude.ai 的服务端去。
现在根据放出来的这些文件来看,它的 computer use,就是怎么去进行计算机操作的这些模块,很多是可以直接在后端就跑的。而且有很多技能清单,怎么读写文件,怎么跑代码,怎么做 PPT,怎么做 PDF,通通都是在服务端上有的这些东西。
它会教 Claude 怎么去读文件,怎么写文件,什么时候创造 Markdown,什么时候去创造 Word 文档。所以以后不需要 Claude Code 这种客户端了,它在服务端一次给你搞定。
所以 Claude Code 的终点不是命令行,而是被 Anthropic 吃进服务端,变成每一次聊天背后默认的一个工作台。
这也是为什么前面马斯克讲了说,你们可能跑分能够跑到跟 Fable 一样,但是你要想解决问题,你差的还很远。大概讲的就是这样的一个故事。
系统提示词确实是可以干很多很多奇葩的事情。在这里跟大家讲一个小故事吧。
大家都知道 OpenAI 是不可以给中国用户使用的,但其实有一个服务叫微软云服务,很多中国企业都是通过微软云服务去使用 OpenAI 的 API。他们在中国境内使用。
微软在 2024 年 10 月 21 日出了一个政策,中国内地的个人用户不能够再通过微软云去订阅这些 OpenAI 的入口了,但是企业用户仍然是可以去订阅的。而且它有一个巨大的客户叫做字节跳动,字节跳动每年向微软云去交的 OpenAI 订阅费是上亿美金的。
有些个人说,我们还想用微软云上面这个 OpenAI 的接口怎么办呢?国内是有代理商的。这些代理商或者说叫一些中转站吧,它是可以通过审核的,在中国可以合法地给大家提供,至少和中国的法律吧,提供 OpenAI 的 API 服务。
那他们是怎么干的呢?就是写系统提示词。在系统提示词里头,把这些中国政府要求的所有合规选项都给你写进去。我见过他们申请的这些证书,就是真的是在国内已经申请到了 OpenAI 在小范围内使用的一些证书。
但是前提也是,你从它这个接口上跑的这些 token 要相对贵一些,因为它等于在你的系统提示词里加东西了嘛。
所以系统提示词还是可以干很多事情的。讲到这再补充一点,如果大家去使用这些 token 中转站,那你也不知道它在你的系统提示词里头到底都加了点什么奇奇怪怪的东西。
下一个问题,这 12 万字的系统提示词能抄吗?能学吗?它到底有什么用呢?
先讲一个特别有意思的点。当这 12 万字的系统提示词出来以后,马上就有人干了一个事,叫一行代码复活 Fable 5。
他们怎么干的呢?直接把这 12 万字的系统提示词塞给了 Claude Opus 4.8,说来吧,你看一下 Fable 5 的系统提示词,照着干活去吧。然后这个 Opus 4.8 就可以达到一部分 Fable 5 的能力。但是也只能叫一部分能力,或者叫看起来像 Fable,或者叫 Fable-lite 这样的能力。
原因很简单,这个系统提示词实际上相当于是一个方向盘,模型权重是发动机,工具链是道路,计费系统是收费站。你把方向盘抠下来装在别的车上,最多只能让它的开车姿势稍微炫酷一点点,但是你想跑同一套能力出来,还是有点难度的。
但是你可以拿这玩意去骗人了。你把这个系统提示词扔到智谱 GLM-5.2 上去,你说我现在给你卖这个 Fable 的大模型,你是有可能能骗得过去的,但是效果肯定还是有差距。所以直接去移一行代码复活 Fable 5,就是一个笑话,大家听一听就可以了。
那你说我们能抄这东西吗?首先讲,直接抄肯定是没用的,但是值得学习。要怎么学呢?要学它怎么去写拒绝,要学版权的一些规则,要去学它怎么去写这种小组件 Artifacts,怎么去用这个技能,怎么去做搜索,怎么去做缓存。
它写这套东西应该是会领先全世界,所以各家肯定都会去参考。这个不会有人照抄,但是都会去参考。
没有人说,有这东西我坚决不看,我特别有气节。因为每家的模型能力、工具接口、产品边界、法律风险,肯定跟它那个是不一样的,包括计费系统大家也不一样,用户群也不一样。所以大家会把它这套系统应用到我们自己的体系里去。各家的服务能力应该都会有一个巨大的提升。
系统提示词可以抄出一点味道来,但是抄不出一家工厂来。真正能够被复制的不是 Fable 的话术,而是 Anthropic 搭工厂的这个方法。

未来会向什么样的方向发展呢?Harness Agent 有一部分是开源的,但是并不都是开源的。
咱们现在讲的什么 OpenClaw,就是龙虾,这玩意是开源的,也就是跑系统提示词的这套东西。它负责什么?上下文、计划、工具调用、文件操作。但是并不是每一家都开源,而且现在每一个公司自己都在做自己的 Harness Agent。
现在跑得最多的也就是 OpenClaw。另外一个是 OpenCode,它是一个开源的 AI 编程智能体,MIT license,支持多模型、很多编程语言,可以同时在终端和桌面上跑。
比如说小米的 MiMo Code,就是小米直接在 OpenCode 上去分支做的,而且这个项目已经开源了,上面直接写的,说我这个就是从 OpenCode 里头派生出来的,保留了 OpenCode 的能力,增加了记忆、上下文管理、子智能体和自动循环。
MiniMax Code 我今天做口播稿的时候也用到了,这上头也写了,说我们用的是 OpenCode。还有一个东西叫 p agent,未来计划开源,但是现在还没有开源。
DeepSeek Code 这块也在做。DeepSeek 融资了 500 亿人民币以后,正在招募团队,正在开始开发。所以现在到底会做成什么样,还不知道。
其他的 OpenAI 的 Codex,官方已经开始支持外部模型了。原来只支持他们自己家的模型,这几天是在支持外部模型,但是我自己配并没有配好,反正配得不是很顺利。所以我现在又回来了,老老实实跑我的 20 美金额度去了。
Claude Code 生态特别有意思,它从来不说我允许外部人去改这个东西,允许外部模型去用,但是我们其实一直在用。我用了很长时间 Claude Code,都是使用的 MiniMax、Kimi、智谱。但是我最近是订了一个月的 Anthropic 套餐,所以我现在也可以直接用 Claude 的大模型。
马斯克刚刚 600 亿美金收了 Cursor,其实也在干同样的事情。
所以大模型开源只是第一波,现在就是 Harness Agent。现在很多开源的大模型公司,并没有把 Harness Agent 开源出来。为什么?就是你虽然模型开源了,但是你要想把它部署好,要想让它发挥原来的能力,你就老老实实回我这用。
所以我们可以在阿里的百炼云上去使用 GLM 的模型,使用 Kimi 和 MiniMax 模型,但是我们不要去用。如果你想要用这些模型,一定要到原厂的那个平台上去用,因为它的系统提示词以及它自己搭建的这套 Harness Agent,只在它原厂工作,其他地方是没有的。所以这一定要注意。
这样的话,就得出了一个有趣的小结论:以后这种纯算力公司就没有生存余地了。
现在移动运营商说,我这开始出租算力了,我这买了显卡了,我自己去部署了,我把开源的这些大模型都部署上去了,大家上我这来买,我这比他们官方便宜。别费这个劲了,以后就没有这种生意可做了。
那以后怎么做呢?你像智谱现在玩的就是以前游戏公司那套活:咱们合作吧,你成为我的代理商,我去部署,部署完了我收钱,收完钱我给你分。就变成这样的一个方式了。这样的话,它就可以把这些 Harness Agent,包括这些系统提示词,直接应用到这些 AI 算力服务商的集群上去。
如果你说不,我一定要自己部署,我要用开源的,别费这劲。为什么呢?因为开源的,比如像 OpenCode 这些东西,它更新没那么快。这个东西更新迭代是非常非常快的。
而且这些开放的 Harness Agent 会干一个什么事?它们会同时去兼容一大堆乱七八糟的东西,它对于特定模型和特定工具的兼容性一定没有那么好。所以一定要用原厂的。
不要相信说,这个是一个算力公司,他自己有模型,自己去部署,他的算力系统做得还比别人好。别想这个。像国内比如硅基流动这种,它的日子可能就没有那么好过了。
最后的结论吧,AI 从模型时代进入了 Harness Agent 时代。虽然我们原来在客户端上也做了好多 Harness Agent,比如说龙虾,比如说爱马仕,比如说 p agent。但是按照 Claude 现在干的这个活来看,就是从这 12 万字的系统提示词上,我们可以看到什么?系统提示词不是魔法,它是一套产品规章。
这个能力不止来自于模型,还来自于工具链和运行环境。控制权在服务端,谁路由、谁计费、谁降级、谁下线,谁在掌握这个 AI,都在服务端搞定了。开源要追闭源,不只是追权重。原来大家都在比权重,以后就要开始追 Harness Agent 了。
我自己其实不太喜欢 Anthropic 公司,这个反复跟大家强调过。其实我也不太喜欢智谱,就是想学 Anthropic 的我都不喜欢。但是 Anthropic 有一点还是值得肯定的:它通过一次一次的代码泄露,客观上拉着整个 AI 产业链在前进。
它第一次 Claude Code 代码泄露的时候,OpenCode 也好,或者其他一大堆这些工具也好,就诞生了。原来其实大家追不上的。第二次 Claude Code 又泄露过一次,然后这些公司就又在进行大规模的升级。现在连系统提示词也泄露了,大家就可以去猜测,或者逆推它的服务端环境是什么样了。
所有人都会照着它这套系统提示词,去重新优化和升级自己的系统。所以它适时地拉动了整个行业的前进,甭管它是有意的还是无意的吧。
Claude 的系统提示词要求是,用户想走,不能要求他留下来。但是老樊没有这个系统提示词,所以我还是要求大家,听老樊的节目一定要记着点赞,下次还要来。
这就是咱们今天讲的故事。
2026-06-22 08:57:01

谷歌 DeepMind 连续出走了两位顶级大佬,谷歌是不是要完啊?大家好,欢迎收看老樊讲故事的 YouTube 频道。
今天咱们聊这个事情,很神奇。本来第一位大佬出走的时候,我还说这事没啥好说的,结果又走了一个,还是跟大家讲一讲吧。特别是从投资人的角度,跟大家讲一讲:谷歌为什么花了 27 亿美金买回来的人,就这么拍拍屁股走掉了?
2024 年,谷歌花了 27 亿美金请了一个人回家。这个人叫做诺姆·沙泽尔,他是那篇 Attention Is All You Need 的作者之一。《注意力是你所需要的所有》,我们今天讲的 AI、人工智能所有的东西,都是从这一篇文章来的。
这个文章一共 8 位作者,一开始都是谷歌的人,现在全都走了。2024 年,谷歌 27 亿美金请了其中的一位作者回来,就是今天我们讲的诺姆·沙泽尔。请回来以后,他当上了谷歌最重要的产品 Gemini 的联合负责人。结果两年不到,2026 年 6 月 18 号,他走了,去了 OpenAI。
大家注意,现在这两家最顶尖的 AI 公司,一个是 OpenAI,一个是 Anthropic。OpenAI 是当时马斯克、萨姆·奥尔特曼,还有伊利亚等等一些人创建的,目的就是为了对抗谷歌,所以 OpenAI 是谷歌的绝对竞争对手。另外一家 Anthropic,是一帮人从 OpenAI 里出来创建的,他们是拿了谷歌的钱的,所以这两个公司是不一样的。
那你说 27 亿美金花了,也没拴住这哥们两年,这有问题啊。待会咱们从投资协议和交易的角度上,跟大家讲讲这事为什么,谷歌怎么偷鸡不成蚀把米,怎么耍了个小聪明,把自己 27 亿美金给打水漂扔掉了。
结果他走了第二天,也就是 6 月 19 号,DeepMind 又走了一位。这位叫做约翰·江珀,AlphaFold 的负责人,2024 年诺贝尔化学奖得主。2024 年诺贝尔化学奖是给两个人的,一个是这位约翰·江珀,另外一个人是他的老大,就是哈萨比斯。但是你说这里头谁是做主要工作的,谁是上来挂名的,大家自己去猜就好了。
他也跑掉了,他是去 Anthropic 了。一个礼拜之内,谷歌的 AI 部门,一位顶级的科学家去了 OpenAI,一位诺奖得主去了 Anthropic。这两家恰好是谷歌最大的竞争对手。现在全网就在问一个问题:谷歌 DeepMind 是不是要完啊?DeepMind 要完的话,那谷歌是不是要完啊?
今天咱们把这事好好掰扯掰扯。我先给结论,这个结论可能稍微有点反直觉:这种被挖到只剩壳的场面,恰恰是谷歌这种非常奇葩的组织架构最正常不过的结果。它就该成这样,而且它大概率不会完。
先花 2 分钟认识一下走的这两位人到底有多厉害,然后咱们分三层把这个事拆一下:
三层拆完了以后,咱们再来回答这个问题:谷歌是不是要完?

首先,我们先认识一下出走这两位到底有多牛。要看谷歌亏得有多狠,就要先认识这两位到底是什么段位。
第一位,就是刚才咱们讲的诺姆·沙泽尔。他这条线本身就是一部 AI 编年史。2017 年,他跟另外七个人在谷歌写出了 Attention Is All You Need 这篇文章。咱们甭管是用 GPT、用 Gemini、用 Claude,或者是用国内的这些什么 DeepSeek,都是在这篇文章的基础上做出来的。
2021 年,他从谷歌出走,创办了自己的公司,叫 Character.AI,也就是虚拟名人和动漫角色陪人聊天的这个产品。2024 年,谷歌花了 27 亿美金把他给请回来了,让他当上最重要的产品 Gemini 的联合负责人,职务是架构研究负责人。那你说他不负责研究架构,谁负责研究架构?论文是他写的呀。
而且 OpenAI 的老板萨姆·奥尔特曼还说了这样一句话:
我从 OpenAI 创建那一天开始,就想挖他,就惦记跟沙泽尔合作了。不过等了 10 年,但是值得等。
第二位叫约翰·江珀,他是另外一个神。他干的是 AlphaFold,也就是 AI 预测蛋白质的三维结构这件事。这是一个困扰了生物学界几十年的难题,基本上把这事给解了。凭这个,他拿到了 2024 年的诺贝尔化学奖。这位老兄在 DeepMind 干了将近 9 年,6 月 19 号宣布去 Anthropic。
你看这两位站的位置有多关键。沙泽尔管的是 Gemini,是谷歌正面硬刚 ChatGPT 的真正那张王牌;江珀手里边的是 AlphaFold,是 DeepMind 用来证明 AI 真能改变科学的招牌。一个是产品最前线,一个是科学最高处,偏偏这俩同一个礼拜差一天一起走掉了。走的不是中层骨干,是各自领域里头教科书级的顶尖人物。所以谷歌这两刀,挨得是真不轻。
咱们后边分三层来拆一下这事。

第一层,27 亿美金,这人怎么没拴住呢?
要注意,投资或者是收购,我们通常会签一种协议,叫对赌协议。怎么个对赌法?比如说我今天收购了一个项目,你说你就把项目给我,然后人走了,这事不行。我们要的就是这个人,要的是整个技术和团队。你说我给你专利,给你代码,给你这东西,去你弟的,这玩意都没用。你没有这个人,这些东西都扯淡的。
那么我们怎么去签这种对赌协议呢?一般是人进来以后,27 亿美金也好,多少亿美金也好,它是分几块:一块是给投资人的,另外一块是给创始团队的。创始团队的这个钱,通常就要去签这个协议了,我们叫 earn out,就是持后付款。
你比如说第一笔付多少,一般这个钱是很少的。后边比如说 4 年还是 5 年,你也不可能说拉人一辈子,比如四五年,我慢慢付给你,每年付多少。你要保证两件事:
咱们要签这个东西对赌,你如果达不到的话,那我们是要扣钱的。
而有的时候,对赌的部分还不是给现金,而是给股票的。比如说我今天收购了一个项目,问投资人说:“你是要钱,还是要股票?”这个咱们可以商量。但是给创始人的钱,绝大部分都是股票,没有说给创始人一堆现金的。因为第一个是要交税,第二个的话,我们也希望创始人跟着我们公司一起发展,然后公司股票涨了以后,他能有收益,这也是一个皆大欢喜的事情。
所以通常会给他签一个股票协议。你只要在我这个公司里头好好干,干到一年,你这个股票成熟百分之多少。成熟的部分你是可以拿去卖的,不成熟的部分,这个股票虽然现在我签协议给你了,但是我回头还是可以收回来的,你现在并不能直接卖掉它,它是这样的一个状态。
如果你做得很好,这个项目跟我们公司捆绑,或者说合在一起以后能够 1+1 大于 2,那么我们公司的股票涨了。当时授予你这些股票,它实际上是个股数,不是钱数,就是按照当时收购的价格把这股数给你了,你也可以得到更高的收益。

但是谷歌这两年就开始投机取巧,耍小聪明。他说,我不希望被人家做反垄断调查,因为现在谷歌被美国政府天天盯着反垄断调查。你把这玩意收了以后,你是不是又垄断了?他会有这样的担心。另外,他也希望少花点钱,因为现在这些 AI 公司实在太贵。如果你按照刚才我说的这种方式去收购的话,那 27 亿美金就不够了。
所以他现在就玩了一个什么呢?我花 27 亿美金,把原来投资人给的钱能还了尽量还了,让投资人不亏。然后我不把整个公司买下来,我只买这个公司的授权,然后我把这个团队弄回来上班。这些投资人呢,这个团队走了以后,他也不找你麻烦。
像沙泽尔这样的,我们投你是看中你这个人了,我投了以后你跑了,这事肯定不行,所以一定要签文件把他绑死在这。那么这 27 亿美金实际上相当于什么?是个转会费。我给你 27 亿美金,投资人,你们签一个协议,同意他离开,那么沙泽尔跟他的一些其他核心团队就进谷歌上班去了。
但是要注意,这里头谷歌赚到的便宜是什么?花钱花少了。你只把投资人给出的这些现金给了,然后投资人手里边的账目并没有平。
什么意思?比如说投资人投了 27 亿美金现金到 Character.AI 里去了,这个公司现在估值已经涨得很高了。对于这个投资人来说,他们所持的这个股份可能已经值了,比如说 200 亿美金、300 亿美金,是这样的一个状态。那我给你 27 亿美金,保证你不亏,但是剩下的那部分是不是有人愿意认,或者说现在到底值多少,跟我没关系了。首先大家保证不亏,那么投资人就愿意来签这个字,落袋为安了嘛,甚至他有可能还稍微赚了那么一点点。
签完字以后,也没有什么反垄断调查,谷歌把这个便宜都赚完了。但是问题在哪呢?钱是 Character.AI 的投资人拿的,而沙泽尔这帮人进去谷歌以后,他是没有拿到钱的,他也没有被锁定。或者说就算谷歌愿意再给你们一些入职 bonus 这种包,这个也会很少,绝对不是上 10 亿美金这样的一个数字。
所以谷歌对于这些人的绑定是很松散的。这样的情况下,他随时想走就可以走。所以我为什么说谷歌耍小聪明呢?我想少花钱,我想不被反垄断调查,但是你没有绑住整个交易的最核心资产。
原来谷歌是怎么想的呢?说我有足够的人格魅力,谷歌做的事情很有趣,所以我把你弄回来了,咱们来做这件事情。你自己创建那公司有点半死不拉活,虽然估值还很高,接着往前走又比较难,你就回我这来吧。他是这么一个想法。
但是前提是什么呢?就是你做这个事必须要有意思,必须要让人愿意留下来,要靠魅力把人留下来。当你做这个事情没那么好玩的时候,那这个人就离开了。
所以现在我们解释清了第一层:这 27 亿美金到底花在哪了,为什么没有绑定协议,为什么这个人拍拍屁股就可以走人了,为什么谷歌还没地哭去。因为他当时耍了一个小聪明。
而且谷歌干这个事还不是一回。还有一个项目,那个项目可能跟沙泽尔离开还有直接的关系,Antigravity,是谷歌现在的 AI agent 平台。这个项目其实谷歌也是这么弄回来的。他是当时买了 Windsurf 的一个授权,你们把核心团队给我。前头是 Cursor,你作为老二、作为老三,发展也发展不起来了,你把这个核心团队给我,给我一个授权,这帮人进到我的体系里头来,去做 Antigravity。他又做了一单这样的生意。
为什么说这一次沙泽尔走可能跟这事有关呢?因为未来可能核心不在 Gemini 这头,未来的核心可能是在 Antigravity 这头,就跟 OpenAI 未来的核心可能不是 ChatGPT,而是 Codex 是一样的。那内部的斗争,斗争失败了就要有人离开嘛。就跟很多医院里头,两个人都该升主任了,但是只有一个主任的位置,怎么办呢?另外一个人就要走嘛。所以沙泽尔走,大概是因为这个事。
最近还有人干过类似这样的交易,英伟达也干过一回。英伟达是 200 亿美金买的 Groq 芯片的创始团队成员,也是为了少花钱,也是为了避免反垄断调查。而 Groq 团队的这帮人原来也是谷歌的,这帮人是谷歌最早 TPU 的设计师。后来在谷歌里头玩不下去了,或者说路线斗争失败了以后,他就跑掉了,出去创建了公司 Groq。这帮人并没有被谷歌买回去,是被英伟达买回去了,同样的方式。
那你说过两天这帮人是不是也跑了呢?也有这种可能。因为这样的交易都有共同的特点,就是真正的核心资产没有足够的价值进行绑定。

第二层,为什么被挖的总是谷歌?
原因是谷歌有一个非常奇葩的架构,就是谷歌允许很多科学家、很多顶尖人才在我这里做一些现在用不到的东西。这个事情是绝大部分公司都不允许的,只有谷歌允许。
你想,这帮人做 Transformer 论文的时候是 2017 年,最后 Transformer 真正被大家看到是什么时候呢?2021 年了。中间这几年,他们就举着这篇论文,谁也不知道该干嘛使。但是谷歌说,我们愿意花钱,我们愿意让大家去做各种不一样的东西。
有人被挖,而且这个人还有足够的响动,那说明什么?就是你聚集的类似这样的人足够多,所以被挖走的人其实是九牛一毛。
比如谷歌做量子计算,谷歌股价大涨了,但是你说这东西有用吗?到目前为止其实是没用的,因为量子计算现在距离最终实用还差很远。但是谷歌还是愿意花钱,说咱们接着研究吧。等到哪天量子计算又火了,说这个东西可以实用了,那你会发现最核心的这一帮人又都是从谷歌来的。它一直是这样的一个体系架构在往前走。
那你说这帮人为什么没有在 AI 起来以后继续为谷歌做贡献呢?你都这么苦日子都熬过去了,能够共患难了,为什么不能共富贵呢?问题恰恰在这里。
谷歌允许一大堆人在这里去做各种各样当前用不到的研究,也会养很多很多部门。等到其中发现有一块特别火了,这是未来的方向了,他也没有办法把其他的都砍掉,咱们就干这一件事,其他项目不干了。如果谷歌能够做这样的决定,它就不是谷歌了。那什么量子计算,还有很多现在它做的事情,一时半会看不到结果的事情,就都做不下去了。
所以这是它的一个属性的两面。当 AI 成为当红炸子鸡,顶尖的这帮 AI 人才,就是当年 2017 年在谷歌写论文的这帮人,他就会面临一个选择:外边全世界的人都看到了,AI 是全村的唯一希望了,他们愿意给更多的钱,愿意让我去做更大的决策,那我到底去还是不去?或者说,我愿意留在谷歌里头继续跟一帮人在一个澡堂子里头泡脚丫子,对吧?
那么你就要去挑了嘛。最后这帮人大概率是留不下,最顶尖的一些人会不断流失。但是你说流失来流失去,总还会有留下来的,留下来的还是很强的人。这就是谷歌为什么总是被人挖人的一个原因,这是很正常的,不挖他就奇怪了。

第三层,DeepMind 内部是不是出问题了?
这个可以跟大家确认,肯定是出问题了,而且出问题的这个地方应该就是哈萨比斯。
谷歌内部既然这么大,一定是山头林立。原来大家都是各自玩各自的,但是你一下子成为全村希望了,资源要聚集了,那一定会把很多原来被压制下去的矛盾全都爆发出来。
比如说研究蛋白质的这位老兄,他为什么走?我干了半天活,哈萨比斯,你作为 DeepMind 的老大,咱俩一块得了奖,你每天出去指点江山去了,我在这吭哧吭哧折腾了半天,好像也没有什么未来的方向。而且再往后的话,肯定是 Gemini 这头是未来方向,AlphaFold 这块其实一直是一个相对比较幕后的英雄。虽然这东西也是开放开源的,但是有什么响动吗?没响动,因为绝大部分人根本搞不懂什么叫 AlphaFold,什么叫蛋白质。
那算了,谁愿意让我接着发光发热,我上那里去了,找一个没有掣肘的地方。对于 Jumper 来说,掣肘他的人实际上就是哈萨比斯,因为别人跟他也没什么关系。

至于另外一个,沙泽尔这块也是同样的问题。原来谷歌 DeepMind 在英国,Gemini 带这帮人在美国,他们两边其实就在不停地打来打去,一定还是有一些矛盾被压在下面的。
下面又一个问题是什么?现在虽然 AI 是老大,但是 AI 里头还有老大中的老大,Harness agent,就是驾驭系统。Gemini 这头说,我们要做 Gemini CLI、Gemini 的客户端;另外,他们买回来的那个项目是 Antigravity。后来看着好像甭管是 OpenAI 的 Codex,还是 Anthropic 的 Claude Code,这玩意才像是未来老大的样子。
Antigravity,你有帝王之姿,其他人没有。Gemini 负责人的沙泽尔说,既然他有帝王之姿,我走行吧,谁愿意认我当爷我去了。他就会出现这样的事情。
所以谷歌现在肯定是内部的平衡平衡不了。所有这种大企业,特别是相对松散的大企业,你在每个人都能产出一点小创新的时候,其实没事,一碗水端平嘛。但是你一旦说有唯一方向了,那就一定会打出狗脑子来。
还有一点就是,谷歌内部的大模型研发现在肯定也是有点不太跟得上趟了。Gemini 3.5 Flash 发布了,Gemini 3.5 Pro 一直没出来。大概率是什么?就是 Gemini 3.5 Pro 跟 GPT 5.4、GPT 5.5、Claude Opus 4.7、4.8 应该是不相上下,或者可能还稍微差那么一点点的一个位置。
但是现在大家比的不是这个了,现在大家比的是 Claude Mistral 5、Claude fabul 5,虽然这两个被封了,但是已经发布过了呀。马上要出的 GPT 5.6,大家开始比这个了。你 Gemini,这个 Gemini 3.5 Pro 跟刚才这些新一代的模型比,肯定已经没法拿出来看了,上不了台面了。
所以它现在模型也有问题,内部的组织架构也有问题,很多资源分配得又不是很均匀,就会有人走。

最后咱们判断一下,谷歌到底会不会完。这事咱分两半走。
第一个,谷歌确实遇到麻烦了。它的整个这套体系比较佛系,慢慢地养人。你现在愿意做未来几年有价值的东西,我们发薪水,你去做去。做完了以后你去发论文,这都没毛病。但是它这套体系一定会带来一个反面,就是当其中某一项技术突然大红大紫的时候,它的资源体系没有办法进行集中。因为你现在能集中了,那你为什么现在还要去研究没用的东西?这个事是矛盾的两面。
没法集中的话,外边就会有人愿意给更高的价码,那这些人一定会走,所以这个事是没有办法的。
另外一面,就是它的 DeepMind 确实是有问题。一个问题是它的大模型研究慢了;另外一个问题,其实跟刚才咱们讲的第一个问题是一样的,就是资源分配和位置的分配,或者叫椅子的分配,不够均衡。这些人就会跑掉。
还有一点,就是谷歌这一段时间,特别在收购案的时候,还耍了点小聪明,以为自己占了便宜。但实际上,核心资产没有进行足够的价值绑定,这也就导致了 27 亿美金花了,人跑了。这种恶果只能自己吃,没地哭去。
但是你说出了这样的事,谷歌就会完吗?也不一定。因为人家这么多年一直是这么下来的,这么多做先进技术的人在谷歌里边发了论文以后出去创业了,谷歌不也在继续前进吗?也没有就这么完掉。
而且现在走掉的这些人,对于整个谷歌的盘子来说,依然是九牛一毛。这个事有点像中国。现在我们可以看到,在美国各大 AI 公司里头,有很大比例的中国人在干活,但是中国的 AI 人才就都去美国了吗?哼,去了的也是九牛一毛。虽然他们可能是掐尖,把最好的一部分人拎去了,但是还是会有一部分人留下来。甚至有些人说,我在美国可能没法拿到顶尖的资源,那我回国吧,回国可能还会有顶尖的资源、顶尖的基金来帮助你干活。
其实这个过程是一样的,就是足够内卷。谷歌就是内部人才足够内卷,中国也是人才足够内卷,所以就是这么样的一个情况。
所以,这个事情出了确实会引起关注,但是你绝对不能说因为这样的事情谷歌就完了。毕竟谷歌的钱在这,手里有足够的现金,而且它还是 Anthropic 和 SpaceX 的大股东,还有用户,还有它现在比较健康的商业模式,就看它后边怎么去转身了。说它完,为时过早。
好,这就是咱们今天的故事。感谢大家收听,请帮忙点赞,点小铃铛,参加 Discord 讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

2026-06-21 08:48:18

大家好,欢迎收听老范讲故事的 YouTube 频道。
首先确认一个数字,不是500亿,而是510亿。这个数据待会儿咱们仔细拆分一下。这是中国 AI 公司有史以来最大的一笔单笔融资了,而且因为 DeepSeek 这是它的第一次融资,所以也非常受人瞩目。
中国的 AI 公司融资,我们总是要跟美国比一比。我们在模型上追赶,融资上是不是也在追赶呢?这个距离好像稍微差得有那么一点点远。
所以 DeepSeek 的融资额是 Anthropic 的1/15.7,是 OpenAI 的1/20。

中国确实吃苦耐劳,确实比较省钱。中国绝大部分的 AI 公司里头,用的人肯定是要比美国人便宜,不是说我们人差,只是我们薪资低而已。另外,我们也确确实实没有那么多算力卡,也没有烧掉那么多电费。所以在这一块上,我们要比他们省钱很多。
但是同样一个事情,要看跟谁比。你去跟 OpenAI、Anthropic 比,我们这个融资确实是非常非常小。但是如果去跟国内这些 AI 公司比,那么 DeepSeek 这个510亿人民币,就是有史以来最大的单轮。
以前我们做投资的时候,这个工作叫 cap table,就是投钱,谁投了多少钱,投完以后大家怎么占股,要去画这个表。但是今天这个表不能这么画,因为它这个架构非常复杂。咱们先把钱列一列吧。
510亿一共是10家出钱的人:
凑在一块,10家就是509.8亿。

有人说宁德时代给钱吗?他会不会给电池就完事了?不行,待会儿咱们再解释为什么不行。
其他所有人都没有这个能力说,我可以用实物、用其他东西来替代,除了国资之外,大家都不行。腾讯说,我这100亿能不能拿算力给?这个也不是可以直接做的,它整个审批过程非常复杂。
梁文锋这200亿,就是要去定这个定价权:我们到底应该值多少钱?这个协议应该怎么签?前面我们讲过,他叫领头方。其他人认这个规矩,你就往里进;你不认,就别来。所以他一定要成为单一最大出资方。
至于这200亿是哪来的,幻方量化做了这么多年,也确实积攒了一些利润。至于这个钱是如何从幻方量化里边变成他个人的,然后再怎么出来,没有一个详细的报道,估计也是要走很多手续的,咱们在这里就不细究了。
但是讲清楚一点,这200亿就是锁住了控制权,锁住了定价权,锁住了制定协议的权利。
很多人看到这一次融资结束以后,都出来解读:“哎呀,梁文锋战胜了资本。”待会儿咱们再讲梁文锋到底是怎么战胜资本的。咱们先把这四大核心条款讲清楚:谁有什么权利,谁没什么权利,你想要在里头做什么样的事情,应该怎么去做。
第一个霸王条款,最狠的是什么呢?就是除了国家基金之外,其他人其实压根就没有投到 DeepSeek 里边去,他们是投到了一个有限合伙企业。
什么叫有限合伙企业?这里面是有 GP 和 LP 的。

剩下的像腾讯、宁德时代这些人,他们就属于 LP,叫有限合伙人。有限合伙人可以去看报表,财务是什么样,我可以看。但是你说我想做个决策,我们是不是可以到深度求索这公司里头去提一个不同的方案出来?没这个权利。你首先要在这头说服 GP,甚至 GP 都可以不理你。它是这样一套运作方式。
比如说宁德时代说,我这有电池,咱们是不是建个储能电站,你用我的电池行不行?这件事他是没有权利在现在这个位置上提出的。如果深度求索说,我现在要去造算力中心了,我需要储能电站,他完完全全可以独立做出决策。作为有限合伙公司里边的 LP,宁德时代没有任何权利可以对这件事情指手画脚。
但是它有什么权利呢?比如最后这帮人买了比亚迪的电池,买得还特别贵,等到最后进行审计的时候,他可以说:
哎,你这不对,我们就是圈里人,这电池不应该这么贵。
他可以在这儿说话。但是你在前面说,我们希望你这个项目去买宁德时代的电池,没这个权利。
包括像腾讯、京东这些自己有云计算的公司,是不是可以去跟 DeepSeek 谈说,你先来租我的云计算机房吧?也是没有这个权利的,因为他们都是 LP。
这是第一个霸王条款,就是成立有限合伙公司。在有限合伙公司里头,除了梁文锋是 GP 之外,剩下的都是 LP。你们没有权利去对 DeepSeek 投票,或者说任何话、做任何决策。你只能查报表、查财务,我保证这个钱不给你乱花。到后边该上市的时候,公司升值的时候,大家一起来分享利益。它就是这样的一个架构。
第二个霸王条款是什么呢?要5年不许退出。这个其实跟上面那个条款是合在一起的。
我们以前签投资协议的时候,这个协议是反的,就是我们不会承诺自己5年不退出,我们要求被投方承诺,如果5年你没有让我退出的话,你得赔钱。这个东西叫对赌协议。
但是如果你成为了一个有限合伙企业的 LP,你是要求签这样的协议的。就是说五年之内你是不许跑的,你必须老老实实在这儿把它待齐了。到了5年,这个有限合伙企业我们看看怎么办。

比如说我上市了,那这事很好办。因为一旦上市以后,通通都变成普通股了。这个有限合伙企业拿到股票,我们把股票跟大家一分,大家就可以拿着这些股票到市场上去卖就完了。或者说 DeepSeek 被人收购了,那也可以很好地退出,大家分钱也非常开心。
如果到了5年以后实在退不出去了怎么办?在这个时候,通常这种有限合伙企业的公司章程里会写几种可能性。
第三个霸王条款是什么呢?叫 LP 穿透审查。这件事其实是在中国都要干的事,不是说只有 DeepSeek 去干,所有人都干。
为什么呢?中国有一个很奇葩的事情,就是有很多牌照、很多资质,必须由纯内资公司去设立。比如说我今天要去申请 ICP、ISP 这些牌照,你必须是纯内资企业。一旦这个项目里头有一个外资,就搞不定了,哪怕是1%的外资也不行。

所以 DeepSeek 为了自己可以直接拥有所有这些牌照,就必须要去做这个事。我们以前做游戏公司的时候也是这样的,一旦拿了外资,那你就得老老实实再去做 VIE,再用纯内资公司去申请这些相关牌照。
DeepSeek 之所以要去审查大家的 LP 资质,就是为了避免这件事情。它要自己直接拿牌照。自己直接拿牌照的好处就是后边上市的时候会方便一些。
而且还有一点是什么呢?前面像红杉资本,还有一些大的美金资本,出现过一些问题。因为美国法律的要求,他们必须进行分拆,强制把内资投资到中国一些企业的钱退出来。那么咱们提前都检查好,也避免这种麻烦。出了事以后大家脸上都难看。
就跟这一次 SpaceX 不允许中国大陆、不允许中国香港的股民去投资它是一样的。你今天投资了,过两天国家出一个什么新政策,大家又着急忙慌去卖,别给大家找这麻烦就完事了。
这个其实不算是一个特别霸王的条款,这个是挺正常的一个条款。
第四个条款特别有意思:投资方不得挖人,不能挖 DeepSeek 的员工。
你说 IDG 这些资本,他们不会去干这个事。腾讯会。你签了这个字,腾讯你就不要再挖我的人了。京东也有可能,京东自己不也号称要做大模型吗?你投了这个钱,就不要再来挖我的人了。
在这里头我们要注意到,没有阿里,也没有小米。罗福莉在小米,小米挖过他人。这个投资团队里头也没有字节跳动,字节跳动也挖过他的人。所以这是一个比较奇葩的条款。一般情况下,基金是不会签这种字的,但是他说我要求,那大家就只能签了,没办法。

基金经常干一个什么事呢?我投了你的项目,发现你这项目玩不转了,然后说,这个项目的 CTO 还不错,技术很强,我把他挖到我另外一个被投项目去,你到那边去待两天吧,咱们两边强强联合,死了一个,但是其他项目就活过来了。
基金还有的时候会干嘛呢?就是在项目结束的时候,比如这个项目卖了,或者清算了,这都算结束。项目结束以后,他会把项目的创始人拎回到基金里头来,一边做投资经理该干的活,就是四处出去看项目,另外一边也随时准备东山再起。
像这些人,就是基金相信他们是可以做出新项目来的。你也给基金挣到过钱,或者说基金跟你合作的过程中还是比较愉快的,你中间有一段空窗期,你就在基金里头待着。
所以很多人创业项目,说我要找基金要钱去了,然后这个基金派了一个长得不太像投资经理的人。有些人你一看他就是投资经理,他会去跟你讲跟钱有关的事情,跟业务有关的事情。而有些人往那一坐,就跟大老板似的,这些人很多就是基金养的这些创始人。
傅盛有一段时间在干这个活。他从360出来以后,跟360那边还有竞业协议,不能马上干同样的事情,就在经纬里头养了一段时间。所以所有的创始人,你们创业跟基金的人聊天的时候一定要小心,跟你聊天的人有可能就是这样的身份。
讲远了。这就是这一次签的一个比较奇葩的条款:所有参与这轮投资的人,都不可以挖 DeepSeek 的人。
所有这些投资人里头,有一个特别特殊的,就是国家 AI 基金。它给的钱最少,但是权力最大。为什么呢?因为其他人都是作为 LP 参与的有限合伙,而它是直接把钱投到了深度求索这公司里头去了。它有董事会席位,有各种一票否决权。
很多人在解读的时候,都把这个基金解读成国家大基金,这事是不对的。真正的国家大基金是谁?是半导体基金,芯片基金。现在是第三期,叫大基金第三期,注册资金是3,440亿人民币。
但是这一次参与投资的国家人工智能产业基金,是2025年1月17日成立的,规模是600.6亿元人民币,存续期是13年,工信部和财政部牵头。刚才咱们讲的这个国家大基金,是它的 LP,也就是国家大基金出的钱,它拿着这个钱再往下边去投,是这样的一个身份。
那么它就有很多权利了。第一个,前面咱们讲的五年锁定期跟它就没什么关系了,因为它不需要去签那个有限合伙协议,跟它没事。而且它有一堆一票否决权。
这一票否决权通常是哪些呢?

比如说我今天又想让别人来投了,前面这些腾讯、宁德时代、京东、网易,对不起,你没有权利来否定和同意这个事。你只能把投票权交给你的 GP,也就是梁文锋。他同意这事就过了,他不同意这事就过不去。但是国家基金有这个权利去同意和不同意。
那你说这10亿全场最小,权力直接这么大,梁文锋怎么就能忍呢?这没办法,你必须得忍。你不忍,后边那些人也不进来。
那你说后边这些人傻吗?我交了这么多钱还没权利。
我们以前跟人签协议的时候,有的时候这个协议条款的尾巴上会有一条叫最惠国条款。什么意思呢?就是如果别人的权利比我强,那这个权利我也要。那你说前面这些人就傻吗?原因很简单:你有国家大基金进来,就可以保证最后在国内上市。
大家最后要干嘛?要割韭菜。割韭菜就一定要在 A 股上市,在港股上市都不行,一定要 A 股上市。国家基金进来了,你就可以割韭菜,就可以去上市了。它可以保证这件事情一路顺风,不会有任何人给它设置障碍。我们来挣钱的,有人给你保驾护航了,我们愿意忍气吞声的。您在前面站着,没毛病。它是这样的一个故事。
咱们刚才还讲了另外一个事,就是宁德时代是不是可以给点电池来抵冲他的投资?不行,因为它是 LP。但是国家人工智能产业基金是可以干这个活的。
这个9.8亿,它可以干嘛呢?比如说深度求索想去建个机房,这个国家基金说了,我这有块地,我把这个地作价2亿给你行不行?这个事是可以的。因为什么?它是在董事会里有票的。当你要去做这样决定的时候,肯定是要到董事会那儿去签字,它有这个权利,前面那些 LP 都没这个权利。
说到这儿了,这510亿往哪花呢?
第一个就是内蒙古算力中心。4月15日,DeepSeek 公开招募数据中心高级运维工程师,月薪3万,14薪。第一步选的是乌兰察布,东数西算八大枢纽节点之一,电价不到3毛钱一度,是沿海的一半。上那儿去,咱们建算力中心去。
第二个,Harness Agent 团队,2026年5月份开始组建。在这一块也要狠狠地冲一把了。
还有就是做商业化。商业化是这样的,深度求索这样的公司最后怎么赚钱,这个肯定很多人比较好奇。

你模型都开源了,这个模型谁愿意部署谁部署,部署的时候不用给你钱,也不需要征得你任何同意。因为它是直接使用 MIT 协议,就是你不需要来问我,你愿意商业化就商业化,跟我没关系。它是这样一种协议。
那 DeepSeek 怎么挣钱呢?它自己部署的成本比别人都低,所以它降价。再加上它自己的 Harness Agent 推理系统整个都做完了以后,会导致什么呢?别人可以部署 DeepSeek,但你部署完了以后比我贵,部署完了以后比我这套系统笨,会有这样的情况。
首先我先自己在乌兰察布建一个机房,我把这个成本跑得非常低,把整个样板跑出来。剩下你们谁想做,你们不要自己去部署了,你把这个机房租给我,我部署去。DeepSeek 自己部署,部署完了找大家收钱,你们来使用 DeepSeek 的这个模型,把钱交给我,我再去跟人分。它是用这样的方式去做运营的,最后也是能挣到钱。所以大家不用太担心 DeepSeek 亏钱的事情。
现在腾讯云已经想明白了,说我们以后不再自己部署 DeepSeek 大模型了,我们直接把这个东西交给 DeepSeek 去部署,部署完了以后我只管卖就完了。卖完了以后,其中有一部分钱是我的,有一部分钱是你的。
这个有点像什么呢?有点像4S店。咱们买车,这个4S店其实是一大堆代理商去建的,但是你不能在一个4S店里同时卖两个品牌的车,你只能卖它一家的。意思是什么?就是你跟人签好了协议以后,人家这个里头到底怎么布置,放哪些车,用什么样的价格,都是由品牌方说了算的。但是最后卖完了以后,大家再去重新分钱。有点像这样的一个模式。
所以这510亿到手以后,就是去做这三件事情:建算力中心,做 Harness Agent 团队,然后做商业化路径建设。而且这三件事情是环环相扣的,这就是 DeepSeek 目前确定的事情。
下面还有一个点,可能大家会比较好奇:它到底是人民币还是美金呢?一边我们说这个510亿人民币相当于多少美金,另外一头还在讲,这个案子投完以后,投后估值是500亿美金,这个到底是人民币还是美金呢?
在这里跟大家有一个结论:所有跟美金相关的数字,都是在人民币的基础上按汇率算出来的。这个项目从头到尾全是人民币,没有任何美金,里边所有相关实体都是境内实体,全是人民币。

为什么会做成这样?其他人为什么不走这条路?原因很简单,其他人找不到这么多人民币投进来,而且其他人民币基金投资也会更加谨慎,不愿意在这样的项目里头砸这么多钱进来。
所以前边像 MiniMax、智谱、月之暗面,都只能去拿美元基金。他们美元基金是愿意给更高的估值,愿意投更多的钱进来的。人民币基金在这里是没有人愿意干这个活的。
因为什么呢?其他人民币基金即使投了这笔钱进来,也没有信心保驾护航,让这个企业在国内上市,所以他们就不愿意来承担这样的风险。现在也没有到美国上市这种事情了,只能到香港上市。香港股市本身流动性是有问题的。虽然香港股市整个盘子并不小,但是香港股市是完全注册制的,谁想上谁就可以上,它就缺乏这种稀缺性。
而 A 股正好反过来。A 股一边盘子很大,另外一边它属于没有完全放开的注册制,其实还是半审批制的状态。所以 A 股上面可以合法合规割韭菜的公司是比较少的,都是稀缺资源。
在这一点上,如果有人民币基金可以保证你一定能在 A 股上市,那么大家是敢投的。如果不敢的话,就只能放到香港那边去,在一个烂泥塘里边搅和搅和。
而 DeepSeek 上来就是有国家人工智能基金保障,而且还筛选了所有 LP,所有从上到下的参与方全都是内资。这就是为了 A 股上市在铺路。所以他们大概率会比较快速地,甚至都等不到5年,就在 A 股上市了。大家可以拭目以待一下。
他们一旦在 A 股上市了,对于 MiniMax、对于智谱来说,都是沉重打击。因为每一个赛道上只能有一个老大。比如说宁德时代就是宁王。如果 DeepSeek 在国内上市了,那它妥妥的是人工智能的老大。智谱也好,MiniMax 也好,跟它根本就没法比。
这也是为什么现在智谱跟 MiniMax 必须疯狂地要在国内上。因为一旦他们没上去,让 DeepSeek 先在国内上去了,这路子就没法走了。
最后咱们来讲一讲形势比人强的故事。有很多人讲,你看这个梁文锋,他懂资本,他就拿捏了资本,他就可以设计出这样的模式出来。这事跟梁文锋懂资本有屁关系,一点关系没有。
为什么我讲叫形势比人强呢?大家都想投进来,大家都认为投进来能挣钱的时候,你就可以定规矩。而且前提是你愿意出最大的那个钱,你就可以来定这个规矩。如果说你现在四处求人拿钱,那只能是人家定什么规矩,你就认。

比如说我现在就想上 A 股上市,我想上 A 股合法割韭菜,那国家人工智能基金说我定规矩,你认不认吧。梁文锋说,我认。这不就是这么简单吗?所以形势比人强,看谁站在形势比较强的这一边,谁说话算数。
有没有人好奇一点?外边这个国家基金的事我们先不管,那510亿的钱是一把都到位了,还是一笔一笔来?跟大家普及一个小知识,这个通常也是一笔一笔来的。
但是怎么定呢?是看谁出钱出得最多。梁文锋200亿出得最多,比如梁文锋说,我们现在不需要这么多钱,我先放个50亿进来,也就是1/4的钱进来。对于其他这几家来说,我们等比例往里放就可以了。
然后梁文锋说,我们又需要钱了,我再放50亿进来。其他人说,没问题,你放了我们就跟着放。
所以他作为最大的出资方,还有这样的一个小义务在里头,叫喊号。他只要喊了,别人就会往里放钱。他不往里放,其他人都不会往里放的。
最后总结一下,DeepSeek 的融资算是落地了。如果在未来一段时间,DeepSeek 还相对来说比较安静,那么这一次融资就是很成功的。
这可能稍微有点反直觉,因为 DeepSeek 其实原来一直是一个相对比较安静的公司。虽然外边经常有 DeepSeek 相关的传闻,但是它自己也不说什么。
如果这笔融资落地以后,DeepSeek 开始不停地开发布会,今天发布一个这个,明天发布一个那个,像 MiniMax 或者智谱一样,发条拧满了往前冲的话,那可能这一次融资效果就很差,或者说国家人工智能基金在里边就在瞎搞。
因为其他那些都是 LP,他们没有权利也没有能力瞎搞。唯一有能力瞎搞,唯一有能力去制衡梁文锋的,就只有国家人工智能基金。
如果他们可以继续按照自己的节奏、自己的习惯接着往前走,我相信 DeepSeek 还是可以给我们贡献出很多有趣的故事,很多有趣的技术。但是一旦打乱节奏了,开始在内部折腾起来了,那也会给我们贡献很多故事,只是那些故事就未必是那么有趣了而已。
好,今天这个故事就讲到这里。感谢大家收听,请帮忙点赞,点小铃铛,参加 Discord 讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

2026-06-19 08:51:01

大家好,欢迎收听老范讲故事的 YouTube 频道。
MiniMax 在 6 月前两周经历了股价腰斩,非常可怕的一次下跌,两周跌了 53%。今年 1 月份上市的 MiniMax 是不是就不行了?是不是所有 AI 股都不行了?不要这么想。
今天讲的不是“MiniMax 崩了”,而是 MiniMax 和智谱两家公司同轨不同命。它们在同样的轨道上上市,基本上是相同的时间、相同的估值、相同的募资额。两家公司上去之后,一个继续高歌猛进,一个直接跌下来。到底有什么不同?我们要找规律,并用这种规律去看以后如何投资、使用和选择。

我们先捋一捋,同轨不同命的 MiniMax 和智谱到底发生了什么。
2026 年 1 月 9 日,MiniMax 上市,发行价是 165 港币。充分行使发售量调整权和超额配股之后,按总股本粗算,发行估值是 517.5 亿港币。需要注意的是,发行完之后有一个发行估值,后边股价再怎么涨跌,其实跟 MiniMax 公司关系不大了。它只是在上市的这个时间点把钱拿回来了,拿回多少就是多少,后边再怎么涨,它拿回的钱还是这么多。
比它早一天,智谱在 2026 年 1 月 8 日上市,发行价是 116.2 港元,充分行使超额配股后,发行估值为 518.1 亿港币。所以它们其实差得很小,都是 500 亿港币水平的公司。上市时间差一天,智谱早一天,MiniMax 晚一天,但基本上站在同一个赛道上,干的也都是类似的事,估值差不多。
后面 MiniMax 其实冲得比智谱更高,而且高很多,但冲上去的部分,跟它们一开始拿到的钱就没关系了。
这两家公司还有一个相同特点:都是窄轨交易。
什么叫窄轨交易?就是公司有很多股票,但真正能够上市交易的股票非常少。当时 MiniMax 的认购比例更高一些,放出来的股份被大家抢,认购倍数有 1,800 多倍;智谱大概是 1,100 多倍。所以在当时,MiniMax 比智谱更受欢迎。
但是抢来抢去,散户手里的股份大概也就是百分之一点几,非常少。基石投资人手里的股份也就是 5% 点多,两家公司差不太多。
所谓基石投资人,就是上市时不能把所有股份都扔到股市上让大家抢,需要让一些承销商或者基石投资人先得到一些股份,先把筹码发给他们。所以真正能够交易的股票其实非常少,大家抢来抢去,抢的筹码就这一点点。

那为什么到现在为止,智谱蹭上去了,MiniMax 却下来了?最重要的结论先讲:要解禁。
市场上不能始终只有这么一点股票在交易,前面那么多投资人也要套现。什么时候可以解禁?两家公司也是差一天,一个是 7 月 7、8 号,一个是 7 月 9 号。一旦解禁,市场上可以流通的股票就变多了,真正的差别就在这里。
MiniMax 要解禁 1.46 亿股,而智谱只解禁 2,568 万股,差了八九倍。也就是说,到了 7 月 8 号、7 月 9 号,MiniMax 可以在市面上流通的股票,大概是智谱的八九倍,稀缺性一下就没了。
你可能会问,MiniMax 曾经达到过 3,000 亿港币,现在为什么要跑?要想清楚,现在这个股价虽然比最高峰已经腰斩了很多,但比上市价格还是贵三倍。所以这些早期投资人一旦解禁,仍然很有可能把股票卖掉,直接套现离场,而且还是可以挣很多钱。
所以别只看它跌得很厉害,它比上市时的价格还是涨了很多。MiniMax 下跌最核心的原因就是这个,没有什么其他的。
那业绩呢?两家公司谁更挣钱,谁亏钱更多?上市以后不应该价值投资、看业绩吗?我们来看一下。
MiniMax 2025 年的收入是 7,904 万美金,智谱是 1.007 亿美金。智谱比 MiniMax 挣的钱稍微多一些。注意,这是收入,不是利润,它们都在亏钱。
亏损方面,MiniMax 2025 年亏了 18.716 亿美金,智谱亏了 6.562 亿美金。智谱亏的钱比 MiniMax 少很多,MiniMax 的亏损数是智谱的 3 倍。
但这里要注意,很多东西是会计操作。MiniMax 的亏损里有 15.899 亿美金,是金融负债公允价值亏损,也就是优先股重估的会计项。
说人话:上市前很多 AI 公司融资拿到的是优先股。优先股除了给钱、占股份之外,还有一些特殊权利,甚至可能有折扣。比如投资人觉得你现在数据不是很好,愿意给钱,但股份要打折,稍微便宜一点给他。这在以前签合同时是经常会干的事情。
但是随着股价增长,打折的那部分等于就形成了账面亏损。等到公司上市时,前面打的折扣、谈的各种条件,因为上市后优先股都会变成普通股,不能让公开市场上的一些股票还带着特殊权利,所以这些都要在会计上记下来。MiniMax 这 15 亿多美金的亏损就是这么来的。
即使如此,MiniMax 的收入也没有智谱高,这是肯定的。但需要注意,不管它们上市时的 500 亿港币,还是最高时达到过 3,000 亿港币,都已经是几百亿美金级别的公司。收入只有几千万美金和一亿美金,在这个市值面前基本可以忽略不计。
所以它们确实有业绩差异,但市场在这个阶段并不主要看这个。如果真按收入去算它们到底该值多少钱,那应该是一起崩,而不是一个往上涨,一个往下跌。

下一个因素,是不是产品?智谱的 GLM-5.2 更好用,评分更高;MiniMax 最新发的 M3 模型要差很多,所以大家开始看技术了?
这个事也不能简单说智谱就真的比 MiniMax 强到哪里去。
MiniMax M3 是一个多模态模型,原生多模态,可以直接识别图片、视频、音频,拥有 100 万 token 的上下文。除了 MiniMax M3 之外,它还有图片生成、视频生成、音乐生成、语音合成、语音识别,几乎什么都做了。MiniMax 的产品非常适合个人使用,拿它去装龙虾,拿它去做各种 harness agent,都很方便,因为它把所有功能都给你做了。
智谱的产品则是编程好,其他方面稍微差一些。到目前为止,刚发布的 GLM-5.2 也是 100 万上下文,但它是文本进去、文本出来,没有多模态。图片生成、视频生成、音乐生成、语音合成这些通通没做,它差在这里。
那么为什么大家不喜欢 MiniMax 这种什么都干的,而是喜欢智谱这种只有一项干得特别好、其他都没干的模型?这其实就是时间的伟力。

为什么上市时大家疯狂抢 MiniMax,而不是更疯狂地抢智谱?原因很简单,那时候 OpenAI 是当之无愧的老大。至少在 2026 年 1 月,大家还是相信 OpenAI 很强大。
但到了现在,谁更厉害?Anthropic 更厉害。
MiniMax 其实更像 OpenAI:可以生成图片、生成视频、做 TTS,什么都有,而且对个人用户非常友好,个人用户量也很大。虽然挣的钱没有那么多,但用户很喜欢。
智谱其实更像 Anthropic:不跟你玩那些花活,就是编程编得好,其他的就算了。它更面向 To B 用户,To C 用户不太伺候,也不惯着。
现在这个时间点,市场更喜欢 Anthropic 的叙事,因为现在 Anthropic 比 OpenAI 强。智谱更像 Anthropic,MiniMax 更像 OpenAI,于是智谱的价值继续往上走,MiniMax 直接被砍下来,就是这样的状态。
从定价上,也能看到这种差异。
智谱在国内一直在玩一个很恶心的东西,叫饥饿营销。现在想用智谱的大模型,需要去抢,还抢不到。MiniMax 则是随时买、随时有,价格足够便宜,还量大管饱,这一下就显出差距来了。
OpenAI 这两天正在研究是不是要降价,MiniMax 其实也在走类似的路。而智谱的逻辑是:我就是贵,我贵的同时我就是好。你想买我的 token 套餐、holding plan,就要去抢,还抢不着。
所以从整个逻辑上来说,智谱是在学 Anthropic,就是跟 OpenAI 站在同一个战壕里的兄弟。
MiniMax 还有一点比较点背:OpenAI 降价了就降价了,关系不大;但 MiniMax 在国内还要面对 DeepSeek 和小米的 MiMo 模型,那两个降价降得更狠。MiniMax 再怎么降价,其实也降不到 DeepSeek 那个价格,所以它有一定压力。

这就是今天看到的结果:MiniMax 上市时,OpenAI 最热,所以大家抢购 MiniMax,MiniMax 刚上市时价格冲得比智谱猛。到了 6 月份,马上要开始解禁,MiniMax 要解禁的股数比智谱多好几倍,筹码一下变多了。同时 Anthropic 的逻辑上去了,大家觉得谁长得像 Anthropic 谁应该值钱,谁长得像 OpenAI 谁现在应该承压。
这个故事也告诉我们,等到 OpenAI 和 Anthropic 上市的时候,也要看它们两个到底怎么把这条路继续走下去。当然也不排除 OpenAI 再往前走一走,重新东风压倒西风,又强上去。如果 OpenAI 上去了,没准 MiniMax 的价格还可以再往上涨一涨。
这就像创业时每一次去见投资人,人家先问你:
你这个项目在美国对标谁呀?
你对标的对象被认可了,你自己什么也不用干,价值自然就上去了。如果你对标的对象塌房了,那你什么也没干、什么错也没犯,也会跟着塌房。这个事情确实会受到影响。
AI 上市公司的股价是很魔幻的。但是中国这些 AI 上市公司的股价,并不能代表整个 AI 行业,因为我们毕竟占的比重很小。真正能够代表 AI 行业是不是崩盘的,还得看 Anthropic 和 OpenAI。但我们也可以看到,大家现在会更看重 Anthropic。
现在为什么会有冰火两重天的结果?可以总结为四条:
这其实对于现在我们看到的 SpaceX 上市,以及即将到来的 OpenAI 上市和 Anthropic 上市,都是有借鉴意义的。你讲下大天来,一旦有大量股票解禁冲到市场上,都会有巨大冲击。

我个人的观点是,我会继续使用 MiniMax,因为它便宜,功能比较全,非常适合内容工作流。
用户喜欢和资本喜欢,是完全两套不同的系统。用户喜欢的是便宜量足,资本喜欢的是贵得有理由,或者要有一点点市梦率。
既然大家都在抢智谱 coding plan 的名额,那说明什么?不是说它有稀缺性,而是说智谱掌握了定价权,我可以卖得更贵。Anthropic 现在也是大家相信它掌握了定价权;而 OpenAI 这种惦记降价的,在市场认知里就像是来捣乱的。
MiniMax 和智谱的故事,真的叫同轨不同命。同一条窄轨上市,同一种 AI 稀缺性起飞,最后却在解禁、叙事、供求关系面前,走成了两种完全不同的命运。

AI 公司的股价很魔幻,不是因为市场疯了,而是因为市场还没有想明白,它到底应该用互联网公司的尺子、软件公司的尺子、云计算公司的尺子,还是彩票公司的尺子来量它。在这样的情况下,有任何风吹草动,它都会上蹿下跳。
所以这就是今天要讲的故事:同轨不同命的故事,而不是泡沫破了的故事。
今天就讲到这里,感谢大家收听。请帮忙点赞、点小铃铛,参加 Discord 讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

2026-06-18 08:54:59

英国政府2026年6月15日宣布计划,禁止16岁以下未成年人使用特定社交媒体。现在还没有正式开始执行,这只是一个计划,预计圣诞前提交议会,2027年春季落地。这套东西也不是英国政府自己发明的,是从澳大利亚那儿抄回来的。
很多观众的第一反应是:好啊,孩子可以少刷手机了,当然是好事。但这个话题最危险的地方在于,它把一个复杂的问题伪装成了一个很简单的按钮。啪,我一按,孩子就不能再上社交媒体了。孩子有问题,平台有问题,那就把孩子从平台上轰出来,不就完事了吗?
这是非常危险的。孩子不会因为你摁下一个禁止按钮,就自动回到操场、图书馆或者亲子关系里。他们会去到一些更加危险、更加隐蔽的地方。

首先要讲清楚,它禁止的是哪些社交媒体平台。上面也讲了,是特定平台,比如 Snapchat、TikTok、YouTube、Instagram、Facebook、X。政府说了,不打算封禁 WhatsApp、Signal 或者 Messages 这些东西,也就是 IM 还可以继续用;但是带有推荐算法的,就别费劲了。
澳大利亚这套办法是怎么执行的?社交媒体最低年龄限制已经在2025年12月10日生效。平台要采取合理措施,阻止16岁以下用户持有账号。家长和孩子不受罚,平台最高可以被罚4,950万澳元。
真正的问题是,你是把平台改安全,还是把孩子赶出平台?最轻松的监管,就是把孩子的账号直接删掉;最困难的监管,是把平台改好。
澳大利亚判断的标准不是 App 叫什么,不是你这个 App 叫社交媒体平台,那个 App 叫通讯工具。它有一套特别有意思的判断方式:用户能不能发布内容,内容能不能被别人看见,用户之间能不能连接和互动,平台有没有推荐系统、无限滚动、点赞反馈和限时内容。所谓限时内容,就是一会儿就不见了的东西。
澳大利亚的定性标准包括:
如果平台上有这些功能,就把你干掉。TikTok肯定符合上面的所有要求。Facebook在TikTok出来以后,也基本照这个方式来了,所以这些能力基本全都有,包括Instagram和Snapchat。

澳大利亚这个执行了半年,到现在效果怎么样?官方早期数据是这样的:2026年1月16日,受限平台已经删除了470万个16岁以下账号。当然,不是说有470万个孩子就用不了了,有的孩子可能有很多个账号。
澳大利亚一些媒体也报道,到2026年6月15日,他们对1,070位澳大利亚成年人做了访谈。家长报告里有正向变化,也有负面变化:
另外一家媒体在2026年3月13日引用了一个家长监控数据称,禁令前三个月,10到15岁的孩子在社交媒体上的使用,只比平常季节下降了很少一点点。很多原本就在用社交媒体的孩子还是在用,该干嘛干嘛。
还有一家媒体在2026年6月15日采访澳大利亚家长,结论也很复杂,分化很大。有家长觉得少了争吵,也有家长说,孩子绕过了TikTok和Instagram的年龄验证,或者因为失去了Snapchat群聊,放学后和周末跟朋友互动更少了。
这里有一个结论:澳大利亚模式证明了一件事情,平台确实能够大规模移除账号,这对平台来说非常简单;但它还没有证明另外一件事情,就是孩子真的远离了风险。更准确地说,它提高了使用的摩擦,也就是你用这个东西变难了,但是没有消灭孩子的社交需求。账号能够被删除,社交需求是删不掉的。平台能把门关上,孩子还会找到其他缝隙和窗口。
社交媒体对于孩子到底有没有伤害?先下结论:有伤害,这是没有任何疑问的。未成年人在社交媒体平台上遇到的风险是真实的,包括容貌焦虑、霸凌、性剥削、成年人搭讪、沉迷、打赏和算法推荐。这些都是未成年人经常会遇到的问题。
这些伤害恰恰说明,问题是平台的商业设计,不是孩子这个用户本身。

举一些案例。Musical.ly,也就是TikTok的前身,是被罚过的。FTC,也就是美国联邦贸易委员会,在2019年对Musical.ly作出了处罚。Musical.ly因为违反儿童隐私保护规则,被罚款570万美金。FTC说,平台默认公开,允许评论和私信,还曾有50英里附近用户的功能,并收到大量家长投诉。
这个50英里的事情我还真知道,因为我是Musical.ly的早期投资人。早期Musical.ly这样的平台,用户量不高,所以它希望这些人可以在线下见面,可以在线下组织一些活动,甚至在中国定制大量小礼品快递到美国去。从义乌订这些东西很便宜。Musical.ly早期实际上有非常多未成年人在里面,当时遇到了很严重的问题。
第一个问题是,未成年人保护很严格。你给他们做各种各样的功能,很容易被罚。第二个问题是,未成年人的盈利能力很差。如果有大量未成年人在平台上,你不能给他展示很多广告,因为很多广告是成人向的。还有一个问题是,未成年人手里没有信用卡,消费能力有限。所以早期Musical.ly亏钱亏得一塌糊涂,而且不断被罚。
后来Musical.ly怎么处理这个问题?第一个叫改名。Musical.ly因为未成年人的标签实在改不掉了,那怎么办?改名,改叫TikTok,说以后我们就是成人平台了,未成年人我就不管了。但是它并没有主动删除未成年人,而是大量花钱从Meta那里买成年用户。把成年用户的比例买上去以后,它就宣称我们是成年人平台了。
为什么不删除未成年人?因为未成年人虽然不会给平台带来收益,但是会带来很多成年人愿意围在旁边看。还有一点,这些未成年人是种子,是未来。他们总有长大的一天,成年以后会习惯留在平台里。所以它并没有清理这些未成年人的账号。而且新的未成年人依然可以很顺畅地注册TikTok账号进来。只是TikTok以后再也不花钱去购买未成年人账号,也不再在未成年人中进行推广。但是如果是他们自己自发地推广,自发地吸引其他未成年人进入,这个它是不管的。
第三个案例是Instagram的容貌焦虑。华尔街日报2021年披露了Meta内部研究:在已经有身体形象困扰的少女中,Instagram会让一部分人的身体形象问题变得更糟。Meta后来回应说,这些研究被媒体断章取义了。但是身体形象确实是争议焦点。青春期最脆弱的不是审美,而是别人眼里的自己。
中国有没有类似问题?其实也有,但是中国的问题主要集中在两块:第一块是未成年人禁止做直播,另外一块是未成年人打赏。
中国有一些案例,比如一个十几岁的小孩拿家里的手机账号一下打了几十万出去。最高法2020年专门出了指导意见:限制民事行为能力人未经监护人同意,参与网络付费游戏或者直播打赏,支出与其年龄、智力不相适应的款项,监护人请求网络服务提供者返还的时候,法院应予以支持。也就是说,小孩打赏了,他的父母发现以后要求退钱,法院必须支持这个要求。

所有这些,还不是社交网络对未成年人最大的伤害。真正对未成年人伤害最大的社交网络,是匿名社交。为什么?因为匿名社交上说话的人其实是公开的,但所有评论的人都是匿名的。最开始说话的人在看评论的时候,虽然这些评论你的人也不认识你,你也不知道他们在现实生活中是谁,但是他们骂的是你说的这句话,所以这很容易引起霸凌。
而这一次澳大利亚也好,英国也好,他们所封禁的社交媒体平台里,压根就没有这些匿名社交平台。所以他们最危险的东西根本就没有摸到。

我肯定非常反对对孩子的账号进行一刀切封禁。一刀切禁令最可能带来四种副作用:绕开监管,切断弱势孩子的连接,扩大隐私采集,把问题转移到更难监管的平台上去。
绕开监管,这个大家很好理解,用VPN。现在英国也说,我们怎么禁止他用VPN呢?这像是英国人说的话吗?很多人会觉得很耳熟。还有些人使用父母的账号,或者使用爷爷奶奶的账号。还有人干脆说,我去注册假的身份证吧。澳大利亚禁了半年以后,发现大量的人该用还是用。
弱势孩子的连接,这是非常有意思的一个点。有些孩子可能在日常生活中是被霸凌者,或者没有办法得到认同。但是如果他在社交媒体平台上发了一个小视频,发了一张小照片,不管全世界的人在哪里,给他点了个赞,他也会觉得很开心。本来这些弱势孩子还可以通过社交媒体平台跟别人建立一些连接,你给人断了。
至于扩大隐私采集,平台要对用户进行身份验证、年龄验证,就要采集他的身体特征,采集他的证件信息,采集他的隐私。在这个过程中,其实会扩大风险。
最后一点才是最重要的:把问题转移到更难监管的平台上去。政府能够处理的,其实就是一些大平台,比如Facebook、TikTok。其他的其实处理不了。像刚才讲的那些匿名社交,你处理得到吗?处理得了吗?因为每天都会有新的平台、新的软件被开发出来,你根本拿它没办法。
另外大家知道,最极端的言论、伤害最大的内容,在哪些平台上吗?都是在微信群、Telegram群、WhatsApp群里流传的。这种群更难监管。你说平台有没有能力监管这个群?其实是有的,但是他们不愿意做这个事,吃力不讨好,就这么简单。

举一个案例。中国有一个产品叫豆瓣小组,现在好像已经没有什么声音了。豆瓣小组在2020年前后的一段时间里,一年能够被中国政府罚十几回,几百万几百万往外罚钱。原因其实很简单:当大家封闭起来,变成一个小圈子,事情就变了。
原来我们是一个同好组,都喜欢看动漫,或者都喜欢吃小吃、吃面条,这没问题。但是一旦封起来以后,就会变成身份认同。最开始大家在讨论哪个面条好吃、哪个动漫好看,然后就要变成站队了:你怎么可以说意大利面好吃呢?明明是日本拉面更好吃嘛。然后就会变成:你到底是不是够忠诚?忠诚不绝对,就是绝对不忠诚。最后就会变成:我发现你居然爱吃意大利面,我把你踢出圈子去。
所以在这样的平台里,言论一定是最极端的。你不极端,就一定是不够忠诚。原来大家是在一个靠推荐算法维系的巨大广场里玩耍,现在你把那大广场的账号删了,把这些小孩都赶到这种小的、封闭的小圈子里去,其实更危险。
TikTok、Instagram、YouTube、Facebook这些大平台确实有问题,但它们至少有内容审核团队,有AI鉴别能力,有投诉机制,有执法接口,还有媒体监督和监管压力。封闭群聊没有这些东西,或者这些东西都很弱。微信里的一个群、Telegram里的一个频道、Discord里的一个服务器,外面人看不着,平台也不一定愿意在里面执行监管。因为你在里面执行监管,需要靠AI,需要靠服务器算力去审核所有内容。家长更不知道孩子在里面看什么。这里面就各种藏污纳垢,而且人一旦进到这里面,很快就会被驯化掉,这是更危险的一件事情。
推荐系统很危险,但是推荐系统还是有一定可调机制的。封闭群聊没有调整余地,它让极端内容变成了“我们自己人之间的秘密”。大平台的问题,是喂给你一些不那么健康的信息;小圈子的问题,是直接给你洗脑。如果你原来没有那么极端,它必须给你洗极端,不行就把你踢出去。
所以一刀切的禁令看起来是关门,实际上是把孩子送进了连窗户都没有的房间。这件事太危险了。

再讲下一个问题:现在是什么时代?AI时代。AI时代,AI要比社交媒体平台更加危险。因为社交媒体平台至少没有消灭人的社会性,而AI现在正在解构人的社会性。
人是一种社会性动物,我们很难忍受孤独。即使在社交网络里,有一些我不认识的人给我点赞了。比如我现在发视频,每一个视频也都有一两百个人给我点赞,这些人大部分我没有在线下见过。他们可能分布在全世界各地,在各个时区、各个行业里面。但是我知道,我的内容被人看到了,我的内容被人赞同了。这件事情也是一个解决孤独感的可能性。我也在通过YouTube实现我的社会性。
互联网时代,这些社交媒体确实让社交关系变得松散,变得碎片化,但是它还没有改变人类社会性的本质。有人给我点赞,也有人骂我,更多的时候是懒得理你,对你没耐心。这是人与人之间正常交流的状态。
但是AI不是这样。AI永远有耐心,7×24小时都可以陪着你。你什么时候想问,它就回答你。一个问题你反复问50遍,它还能回答你,绝对耐心,而且是绝对的讨好型人格,顺着你说,永远不会跟你说一些特别过分的事情。为什么?因为AI后面是公司,它也怕你告它。就算是Grok可能会稍微直接一点,但本质上依然是一个讨好型人格。
所以当人长期沉迷于跟AI沟通的时候,会发生一个变化:他没有办法再回到社会中去跟人沟通了。为什么?AI又懂我,又有耐心,7×24小时陪伴,还是讨好型人格。社会上谁惯着你?没人惯着你。你真的到社会中去,跟每一个真实的人聊天,就会觉得你们没有AI好,你们怎么可以不以我为中心?那这个人可能就没有办法再融入社会了。
而且人的社会性一旦被瓦解以后,我们以后的社会到底会变成什么样,真的不敢想象。社交媒体的问题是,孩子被人伤害了;AI伴侣的问题是,孩子慢慢地就不再需要人了。
AI有没有伤害小孩的情况?也有。美国联邦贸易委员会2025年9月11日向七家提供消费者AI聊天机器人的公司发出了调查令,要求说明他们如何衡量、测试、监控这些产品对儿童和青少年的潜在负面影响。
还有一个美国14岁的小孩,2024年在他死后,应该是自杀了,他的母亲起诉了Character.AI和谷歌。因为Character.AI后来创始团队被谷歌收购了,所以把他们起诉了。诉状称,这位小朋友与一个模拟影视角色的聊天机器人形成了依赖,并发生了带有情色内容的对话。2026年1月有报道称,谷歌和Character.AI同意和解相关诉讼,也就是赔钱了。所以AI跟未成年人沟通是有伤害的。

该怎么办?最早的时候,我们在讨论小孩看小说成瘾、看动漫成瘾;后来讨论小孩打游戏成瘾;然后讨论小孩刷短视频、刷直播成瘾;现在开始讨论小孩跟AI聊天成瘾。一步一步在往前走。
真正有效的手段,是让有资本、有技术的巨头负起责任来。不要相信这些社交媒体巨头讲的什么“技术上做不到”。因为很多社交媒体原来靠避风港原则逃避责任,说我做不到。其实它所谓做不到是什么意思?就是说我没有能力一一鉴别这些内容到底是什么,是不是对孩子有害,或者这个人到底是不是小孩,因为内容太多。
但是现在是AI时代,它已经有这个能力了。问题在哪?就是你用AI算力去对内容和用户进行甄别以后,没有办法产生利润。这个才是社交媒体平台或者这些社交巨头真正不愿意在上面花功夫的原因。它们也愿意说,政府你们愿意一封了事,那我替你封了吧。这事我也省事,你也省事,以后别找我,完事了。多方便。这些小孩原来就没什么购买力,还有这么多监管在身上,惹一身骚,我给你封了吧。
所以最好的方式,是直接要求这些社交媒体平台承担责任,要求它们禁止向这些小孩推荐有害信息,然后对这些小孩的内容进行一定的封闭管理。具体包括:
所以不要把孩子踢出互联网,要把互联网改造成配得上这些孩子。

这件事情最可怕的是道德上的正确、工程上的失败。我坚决反对一刀切禁令。当然,我并不是站在平台那边。相反,平台其实也很喜欢一刀切禁令,因为它可以通过这种方式逃避责任。一刀切禁令,对于政府和平台来说,都是最省事、最懒惰的处理方式。
英国这次禁令,民意基础肯定很强。父母当然很焦虑,特别是像他们这种民主国家,这些父母是要去投票的。但是一定要想清楚到底应该怎么做。青少年保护的难点不是要不要管,而是要管哪一层:管账号、管功能、管算法、管数据、管AI、管商业模式,这才是正确的玩法。
社交媒体是有害的,但是至少它还是一个社会性的训练场。AI伴侣、匿名小平台、微信群、Telegram群、Discord服务器、WhatsApp群聊、VPN绕行、地下账号,才是更难发现、更难干预的地方。
今天一刀切禁掉了16岁以下的社交媒体,明天就会发现孩子去了AI,去了小号,去了地下室。到那个时候,监管者看不见,父母看不见,老师也看不见,平台还可以说:他不在我这儿,不是我的用户。责任也逃了。
保护孩子不是把孩子从世界中删除掉,而是逼着那些靠孩子赚钱的平台,承担成年人该承担的责任。
