MoreRSS

site iconlukefan | 范路修改

硕鼠的博客站,互联网老兵,内容较杂。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

lukefan | 范路的 RSS 预览

哪 8 家电车厂被约谈了?AI 时代的猎巫故事!

2026-05-12 10:44:31

一个巨大的 AI 机械手把“8家”“3家”“2家”数字标签贴到一排模糊新能源车剪影上,旁边媒体标题气泡和问号四散飞出,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

因为锁电,8家车企被约谈,两家撤回了更新,3家情节严重被立案了。他们到底是谁?

你们真的关心它到底是谁吗?这其实是一场彻头彻尾的、由 AI 引发的鸡飞狗跳的猎巫事件。

这条新闻其实是一条旧闻,最早在 4 月份就开始传播了,但是当时并没有爆。5 月 8 号,因为改了一个标题,而且大概率是由 AI 改的标题,这件事情就直接爆了。它变成了“8 家新能源车企被约谈,3 家被立案,两家撤回 OTA”。OTA 就是一种线上升级。

更离谱的是,AI 还帮你补齐了 8 家的名单。最后,比亚迪、小鹏、蔚来、理想、特斯拉、问界、极氪、广汽埃安,一堆车企出来辟谣,说不是我,我最近没有被约谈。甚至还有人问我,小米被约谈了没有。

这个事是这样:要想锁电,通常这个车要卖很长时间以后才有这样的需求,新车是不需要锁电的。小米属于后来者,在这个行业里卖车没卖几天,所以小米没有那种特别旧的车需要去做锁电操作。这一次,小米也没有出来辟谣。至于小米有没有被约谈过,谁也不知道,因为从来就没有公布过名单。

所以这一期压根讲的就不是锁电的事情,真正要讲的是:AI 怎么把一条没有名单的旧报道,变成了一场整个车圈鸡飞狗跳的猎巫事件?

原始报道到底说了什么

一张央媒报道页面放在桌面中央,旁边突出显示“1.2万件”和“273%”两个数字,远处有一辆电动车和12315投诉窗口图标相连,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

首先说一下原始报道到底是怎么回事。这个报道是 4 月 17 号发的,由央视网微信公众号发布。这确实是央媒发的,标题是《一个月内投诉超过 1.2 万件,同比上涨 273%,新能源车这个顽疾到底该怎么治?》

这里头有一些数字:第一个是 1.2 万件,第二个是同比上涨 273%。而且这个数据是 2026 年 3 月份一个月在 12315 平台上的投诉。它报道的事情叫锁电。大家注意,它在标题里压根就没有写“锁电”这件事,标题里写的是“新能源车这个顽疾到底该怎么治”。

主要讲的是,有些人早上起来,厂家推送了一个 OTA 安装包,他就给安装了。安装上去以后发现不对:我原来可以续航 500 公里的车,怎么就变成只能跑 300 公里了?

当时这个文章没有火的原因,是大家觉得这个事跟我没什么关系。新能源车圈里有一个东西叫锁电,而锁电又不是特别新鲜的事情。因为大家最早了解到锁电,应该是从苹果那来的。苹果因为锁电被欧洲罚过,在国内应该也被约谈过。

苹果每过一段时间,就会把比较陈旧的苹果手机的电池容量锁住,让待机变得稍微短一些。一方面是保护电池,保护手机;另外一方面也是让你去买新机器。而且苹果还特别过分,它不光会锁电,还会让你的机器变得很慢。它可能通过升级系统,让你的机器整个变慢,就是逼着你去买机器。

现在车企也开始锁电。车企锁电被约谈,比较确认的一个是广汽,另外一个是特斯拉。特斯拉不光在中国被谈过,在海外也被约谈过。

车企锁电到底是怎么锁的

一块电动车电池被分成充电上限、放电深度、放电功率、热管理四个模块,每个模块上都有小锁和温度计图标,旁边车辆仪表盘显示续航下降,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

那么锁电是怎么个锁法?它锁几样东西。

  • 锁上限。原来一块电池,比如能够充 100 度电进去,现在就只让你充 80 度,剩下 20 度不让你往里充。这个可以很好地保护电池,因为电池充放电很多次以后,如果你继续想让它充 100 度进去,是有可能出问题的。
  • 锁放电深度。原来我可以把这个电池彻底放干净,然后再往里充。现在我就不让你彻底放干净了,里头还有比如 10 度电,我就不让你放了,我直接告诉你车没电了。这个也算是一种保护电池,因为电池如果充放电次数很多以后,你彻底把电放干净,有可能充不进去了,或者充电的时候会造成一些过热的情况。
  • 锁放电功率。
  • 锁热管理和安全阈值。这两个搁一块讲,实际上就是锁充放电。

电池在充电的时候会发热,在放电的时候也会发热。放电如果是慢慢地放,问题不大;如果快一点放,那一定会发热。我们以前使用干电池的时候,如果电池短路了,你把电池正极负极接一块,那个电池很快就会热起来,然后会流汤。后来锂电池这块会好一点。

另外一个电池发热的时间点,就是充电的时候。现在都在拼命搞快充,800 伏快充、1000 伏快充。怎么快充?就是把电压提高,提高以后快速把电流充进去,这个时候电池一定在疯狂发热。

那怎么做热管理?就是在电池里头搁一个温度计,如果发现温度上升了,原来比如可以让它上升到 50 度,上升到 50 度以后再把充放电功率下降。现在可能上升到 40 度,就给你把充放电功率下降下来,给你锁住。

所以用户经常会遇到这样的问题:

  • 升级以后发现,原来可以开 500 公里的车,现在续航只剩 300 公里了。
  • 原来这车可以四处出去崩别的油车,现在崩不动了,车没劲了。
  • 原来比如 20 分钟可以把电充满,现在需要充一小时。

标题一改,新闻就爆了

4 月份没有爆,因为这个事跟每个人有关系吗?也有点关系,但关系并没有那么大。它选用的两个数字,1.2 万件和 273%,数字虽然很大,但是并没有引起大家的共鸣。这个标题并不好传播。

但是到 5 月 8 号,事情就发生了改变。5 月 8 号,有一个媒体叫 IT 之家。我以前还跟他们做过好多活动。IT 之家把这一篇央视网微信公众号的文章拿回来改写了一遍,后边还写了引用出处,说引用了央视网的文章。因为现在要求你必须写出处。

写完以后,它就把标题改了。标题变成了《8 家新能源车企 OTA 锁电被约谈,工信部明确四大禁令》。

两张新闻标题卡片并排对比,左边是平淡的“1.2万件投诉”标题,右边是醒目的“8家车企被约谈”标题,点击量箭头从左低右高急速上升,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

你看,这里第一个是“8 家”,它给了一个非常明确的数字,不是 1.2 万,不是 273%,而是 8 家。而且它把这个事到底是怎么回事说出来了,叫“OTA 锁电被约谈”。央视网那个叫“新能源车顽疾”,没有告诉你具体是什么事。

“8 家”,事情告诉你了,后边还写了一个“工信部明确四大禁令”。其实后半截这个标题起得并不好。再往后传播,这个标题就又变了。因为“8 家”这个文章出来以后,事情就开始爆发了。再往后改,标题就变成了“8 家被约谈,3 家被立案,两家撤回 OTA”。这些数字放上去以后,这个新闻一下就爆发了。

这个标题典型是 AI 写的。其实前面央视网的标题应该也是 AI 写的。因为我自己做 YouTube,每一条视频也需要写标题,我的标题经常是让 GPT 去写。每一次它给我写四五个标题,里头比如有反差感标题,有知识型标题,每一次一定会有一个标题叫数字标题。就是你要尽量在标题里写数字,因为人比较手贱,一旦看见标题里有数,就喜欢点进去,它的点击率会上升。

但是一定要注意,这个数字要跟人有关系。你如果像前面那个写 1.2 万件的标题,大家点进去的感觉就会少一些。那你说只有数字就会火吗?当然不是。前面那个数字没火,这次改成 8 家就火了。真正燃烧起来的其实并不是数字,而是人的心理。

大家真正想知道的:到底该怪谁

我记得在 HBO 神剧《切尔诺贝利》开头的时候,有一段很重的独白,是主人公在自杀之前念的一段独白:

谎言真正可怕的地方,不是我们一时把假话当真,而是因为听过太多谎言之后,我们会失去辨别真相的能力。当真相已经被谎言淹没,人们就会放弃追问真相,而满足于一个个故事。在这些故事里,谁是英雄并不重要,大家真正想知道的只剩下一件事情:到底该怪谁?

一群读者围着一块写着“到底该怪谁”的大屏幕指向中央模糊车企剪影,屏幕背后有真相文件被灰色雾气遮住,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

这次就是这样的一个事情。前面想给大家普及一些事情,想给大家说一些数据,想告诉大家这个事情有多么严重,没有人关心。当告诉大家说有 8 家被约谈的时候,观众一看就说:到底是谁?我们到底应该骂谁?

所以为什么我前面说,这是一次猎巫事件。用户不关心真相,不关心什么是锁电,不关心 12315 投诉到底说了什么,不关心车企锁电到底是怎么回事。大家只在问:

  • 8 家被约谈的是谁?
  • 3 家被立案的是谁?
  • 两家撤回 OTA 升级的是谁?
  • 我应该骂谁?
  • 到底是谁应该被拉出来示众?

这就是数字标题真正可怕的地方。它一旦击中了用户的心理,马上就会爆发。

那你说现在是不是一个谎言满天飞的时代,大家已经分不清真相了?因为 AI,你真的搞不清楚哪个是真的,哪个是假的。

为什么不点名反而更加可怕

为什么不点名反而更加可怕?这里跟大家讲一个学校的故事。

某大学因为在校生怀孕和堕胎的数字不断上升,老师每次都苦口婆心地劝这些大学生:你们要洁身自好,千万不要去做一些事情,要注意防护。讲到这样的程度了,但是没有效果。年轻人嘛,总是要去犯错误的。

有一次,学校的教导主任说,来,我去试试。开学就开始讲:今年我们招收的学生里,有两个人,大家注意,不是一个,是两个人,是艾滋病病毒的携带者。但是为了保护他们的隐私,我们就不公布名字了。

校园公告栏上贴着“两名匿名风险者”的通知,学生们围成半圆彼此保持距离,通知上的人名位置被空白框遮住,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

他搞这么一个事情,后面就是寒蝉效应了。大家还敢不敢再随随便便地发生一些事情?肯定不敢了。谁也不会在脑门上贴着说我是艾滋病。那么你再去跟别人发生关系之前,你说你是吗?我不是。你信吗?这事就会变成这样。

所以不公布名字反而会更能够传播,大家心里都会记住这个事情,而且更有效。像这一次,如果央视网直接告诉大家到底是谁,那么这个被点名的今年就别卖车了,一下就臭名声了。如果不点名,那么所有车企都倒霉。

所以为什么我反复强调这次叫猎巫事件。猎巫的时候,你知道谁是女巫吗?你也不知道。他们只是写上《女巫之锤》这样一本书,然后告诉你,如果你发现身边的女性有文化、识字,或者什么样的情况,她就有可能是女巫,她可能在诅咒你。所以不公布名字更可怕。

最后这些车企没办法,只能出来辟谣。而且辟谣的效果其实也很一般。你现在辟谣也只能讲,我最近没有被约谈,我最近没有被立案。你说你造了这么多年车,中间有没有被约谈过,有没有被立案过,这事其实谁也说不清楚。

你说我做了这么多年车企,从来没有跟政府打过交道,这不是扯淡吗?特别是比如比亚迪,现在在街上看到出事,大家猜比亚迪一般都没问题,为什么?它卖的车多,一个月卖 30 多万辆车,整个占有量是最高的。至于特斯拉,这个事可能性更大。为什么?因为它是开山鼻祖,从最早开始就是它出各种问题,在它身上出的概率都是最高的。

最后大家辟谣也辟了,但也就这样,没什么效果。

央视网为什么也要出来解释

出了这样的问题以后,央视网也得出来解释。我原来发了一篇文章,现在造成了巨大的社会影响。大家注意,在中国,这些媒体希望自己发的文章火,但是又不希望自己发的文章太火。一旦出了圈,你控制不住了,大家都出来找你来了,那这事你也没法整。最后它也需要去收拾这个东西。

那你说把这名单公布了不就完了吗?它公布不了,因为都给过钱了。这些媒体写文章以后,要点名一定是要跟人说的,说我要点你的名了。车企也是要上来公关的,我要上你这来打广告,给钱实际上是通过打广告,并不是贿赂。我打了广告,你就不能点我的名字。会出现这样的情况。

媒体编辑台上左侧放着被遮住名字的车企名单,右侧堆着汽车广告合同和投放牌,编辑在两者之间为难地按住稿件,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

都给过钱。而且现在汽车行业,特别是新能源汽车行业,是所有新闻媒体的大广告主。现在可能他们是最大的广告主,谁也不能得罪。得罪了你以后,你不在我这打广告了,那我这个媒体就混不下去了。你别看它叫央视网,它也是要靠广告费来盈利的。所以这个名字是不能写的。

继续往下混,这个事又过不去了。最后央视网出来讲,说我们澄清一下。不是澄清是谁,它说这个名字我们就不公布了,但是“8 家被约谈、两家撤回 OTA、三家被立案”的企业,是我们统计了 6 年的数据,是从 2020 年到 2026 年这 6 年多的数据,不完全统计,不止这 8 家,还有其他人。

所以我说那个数有可能也是 AI 写的,它压根也不知道具体是谁,反正就写了这么个数。前面那些辟谣,也只能辟说我近期没有被约谈,我近期没有被立案。所以最后大家抹了一把稀泥,算是抹过去了。事情也就这样结尾了。

AI 时代,模糊信息会自动长出獠牙

但是这件事情真正给我们的启示是什么?AI 时代,模糊信息会自动长出獠牙来。

一团写着“模糊信息”的云雾从 AI 标题机器里钻出并长出獠牙,旁边散落数字标题卡片和被拼接的车企剪影,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

你让 AI 帮你起标题,你要求的是什么?你不会要求 AI 给你起一个最贴切的标题。你的提示词一定会写上:请 AI 帮我起一个高点击率的标题吧。即使你不这么写提示词,腾讯也好,字节跳动也好,他们会自动帮你起标题。起完以后会进行 AB 测试,到底哪个标题好,哪个标题不好,然后会选一个点击率最高的标题给你。

像我现在 YouTube 的视频,每次都是起三个标题。在视频公开以后,大概两个小时左右,YouTube 会给我统计哪一个点击率高,然后把这个标题留下来,剩下两个标题删掉。

现在 AI 就会自动给你起这种带反差、带数字的标题,想着怎么命中用户的心理点,让这个新闻能够爆起来。而且你给了一个模糊信息之后,AI 还会有幻觉。它会把过往谁谁谁被约谈的这些信息都找出来,找完以后去拼凑,说有可能是张三被约谈了,李四被约谈了,特斯拉被约谈了,比亚迪被约谈了。它会把这些东西都拼起来,甚至还给你拼出 8 家来。

特别是你使用豆包这种不是那么聪明的模型的时候。因为我就是这么干的。5 月 8 号那天,问豆包到底是谁,当时还没有出来辟谣,它就给我列了这个名单。而且我前两天在 X 上还说这件事:怎么说有 8 家被约谈,也不说是谁呢?然后一帮人还在下头骂,说你不仔细看吗?人家都写了,就这 8 家,而且两家是谁、三家是谁都给我列出来了。他们也都被 AI 骗了。

看到信息时,先别急着找人骂

所以这个故事真正给我们的启示是,AI 时代已经来了。我们再看到任何信息的时候,不要着急跳起来说我要去骂人,不要干这个事情。而是要想一想:这个数据是怎么来的?这个信息、这个内容是怎么来的?

我们现在所看到的内容,200%、1000% 都经过 AI 的处理。目的不是为了让数据更准确,让内容更完整,而是为了让我们能够有更高的点击,有更高的完播。就是你要把这个视频看完,要把整篇文章读完。它在做这样的事情。因为你看完视频的过程可以多放两条广告,看完文章的过程也可以多放两条广告。

所以我们所有人看到的这些信息,都是被“多放两条广告”这样一个非常朴素的目标修改过的信息。

一个读者拿着手机停在“转发开骂”按钮前,屏幕背后露出 AI 算法齿轮、广告条和点击率仪表盘,旁边有“先查来源”的小路标,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

结论:一次由 AI 带来的车圈猎巫

最后的结论,这就是一次由 AI 带来的、一地鸡毛的猎巫行动。

大家知道猎巫是怎么来的吗?黑暗的中世纪,对有知识女性的一次迫害。黑暗的中世纪,由宗教裁判所带来的,对有知识女性的一次整个社会的迫害。

猎巫跟这一次有一个很一致的点,就是猎巫来自于信息传播方式的革命。这一次是 AI 革命,上一次是印刷术的普及。印刷术普及以后,确实有很多科技文献、文学作品、《圣经》被印刷,但是这些书并没有被大量传播。真正被大量传播的一本书叫《女巫之锤》。

画面左侧是中世纪印刷机吐出《女巫之锤》,右侧是 AI 推荐算法屏幕吐出车圈数字标题,两条传播链在中间汇成“猎巫”旋涡,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

那是一本非常低俗的书,上面写的是你应该如何去鉴别身边的女性是不是女巫。如果你怀疑她是女巫了,你可以如何对她们进行刑讯逼供。它写得非常具体:应该如何处罚这些女巫,如何消灭她们。

这本书被广泛传播以后,带来了中世纪的猎巫。那么这一次,由 AI 和推荐算法带来的变化,带来了这一次车圈猎巫。


Vibe Coding治网瘾?孩子为何越写越上瘾?

2026-05-11 21:40:54

一个沉迷游戏的孩子坐在电脑前,屏幕左侧漂浮游戏手柄和短视频图标,右侧漂浮 AI 助手、代码积木和一个正在成形的小应用页面,箭头表示注意力从消费转向创造,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

以毒攻毒:用 Vibe Coding 治疗网瘾,AI 时代的新选择

大家好,欢迎收看老范讲故事的 YouTube 频道。今天咱们来讲一讲“以毒攻毒”:用 Vibe Coding 治疗网瘾,AI 时代的新选择。

大家注意,这个名字听起来稍微有点标题党。网瘾是一个很严肃的问题:孩子沉迷游戏,或者刷短视频,昼夜颠倒,不写作业,不出门,不社交,家长急得不行。你现在说再给他一个 AI 编程工具,让他继续坐在电脑前面,继续盯着屏幕,继续熬夜折腾,这不是火上浇油吗?

所以我要先把今天的核心观点讲清楚。我不是说 Vibe Coding 能够完全替代程序员,这不是今天的主题;也不是说孩子学了 Vibe Coding 以后,明天就可以上硅谷年入百万。今天咱们要讨论的是:如果一个孩子已经沉迷游戏了,已经刷短视频、沉迷二次元,很难从屏幕世界里边直接揪出来了,那么有没有可能,不是先把他从屏幕前头拉走,而是把他的注意力从一种消费型的成瘾,迁移到一种创造型的成瘾上?

所以咱们的标题叫“以毒攻毒”,咱们也没说 Vibe Coding 就是一个多么健康的事情。游戏和短视频给的是即时反馈,Vibe Coding 其实给的也是即时反馈。游戏和短视频让人沉浸、让人上瘾,Vibe Coding 其实也让人上瘾。游戏和短视频会把人困在平台设计好的反馈回路里头,Vibe Coding 则是把人带到一个现实世界的创造反馈回路里。还是要不断给他一些强刺激,说你干得不错,然后他会继续留下来。

这个话题也不是老范自己拍脑袋想出来的,而是一位硅谷著名的传奇投资人的播客给了我一些启示。这个人叫纳瓦尔。他最新的一期播客里,其实并没有直接讲这个话题,而是讲自己怎么在这么多年以后重新回去写程序。他这个播客的名字叫 A Return to Code,就是“我又回到写程序这个事情上去了”。

这哥们是学计算机的,但是做投资人,肯定很长时间不接触代码了,现在又回来写程序。他讲到,真正有创造力、有自驱力、有表达能力、有清晰愿景的人,会有新的工作机会。今天咱们要讲的 Vibe Coding 像电子游戏一样容易上瘾,但是它的奖励不是假的,而是真实世界里边真实有价值的东西。

为什么说 Vibe Coding 可能成为一种“成瘾迁移”

一张左右对照的信息图,左边是游戏等级、短视频点赞和虚拟奖励围成闭环,右边是 AI 编程工具把需求转化成网页、小工具和小游戏,中央用迁移箭头连接两种反馈回路,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

我们以前讨论网瘾,总是想着怎么把孩子从游戏里边揪出来。但是游戏为什么能让孩子上瘾?包括短视频,现在短视频其实比游戏还上瘾,短视频为什么能够让人停不下来?本质上,有几个因素凑在一起:

  • 低门槛;
  • 即时响应;
  • 难度可以动态调节;
  • 持续奖励;
  • 社群身份认证;
  • 亚文化归属;
  • 逃避现实中的挫败。

Vibe Coding 居然也具备所有这些特征,甚至比这个还要更强一些。Vibe Coding 跟前面这些网瘾的唯一区别就是,它产出的东西不是游戏等级,不是短视频里的赞,而是一个真实的网页、一个小工具、一个小游戏、一个小脚本,甚至是一个小应用。它产生真实的价值。

网瘾到底怎么治:粗暴戒断为什么常常无效

首先,治疗网瘾这件事一直是一个很有争议的事情,因为它没有一个特别有效、特别科学的方法,甚至还出现过一些让人没法看的事情。先说一个很现实的问题:网瘾到底怎么治?

过去 20 多年,很多家庭都在被这个问题所困扰。我们回头来看,所有所谓的治疗网瘾的方法,其实都非常粗暴。有些地方搞封闭式训练,把孩子关起来,体罚、羞辱、强制劳动、军事化管理,还有一些更极端的案例,直接进行电击、暴力管教,训练营据说还有死亡事件发生。

这些事情为什么会发生?因为家长焦虑。家长看着孩子沉迷游戏,会觉得这个孩子要完了。特别是在中国,输在起跑线上了,他不读书、不工作、不社交、不运动、不睡觉,这怎么行?家长当然就慌了。

但是问题是什么?焦虑的家长很容易相信一个简单粗暴的方案:把手机抢走,把电脑砸了,把孩子关起来,强行戒断。他以为这东西像戒毒一样,其实真的不太一样。因为很多时候,孩子的问题不是屏幕本身,屏幕只是个出口。真正的问题可能是,他在现实世界里长期得不到正反馈,在学校里只有失败和羞辱,在家里也只有指责和比较。“你看别人家小明怎么怎么样。”他不知道自己擅长什么,也没有一个可以投入的现实目标。他一离开游戏,就只剩下空虚了,啥也没剩下。

所以你把游戏给他拿走,问题并不会自动消失,你只是把一个出口堵住了。如果没有新的出口,他可能会转向短视频;短视频堵住了,他可能会转向小说;小说堵住了,他可能再转向饭圈,或者彻底躺平。现在很多人说:“我没有任何欲望,我就准备躺这了。”

这就是为什么我要说,治疗网瘾一直没有一个特别简单、特别有效、特别科学的方法。它不是一个按钮,按下去就好了。它更像是一个迁移过程:从低价值的反馈迁移到高价值的反馈,从纯消费迁移到半创造,从算法喂养迁移到主动提出问题,从“我今天刷到了什么”,迁移到“我今天做出了什么”。这才是今天咱们要讨论 Vibe Coding 的意义。

一个家庭教育场景的信息图,左侧家长用锁和剪刀堵住游戏、短视频、小说三个出口,右侧孩子沿着箭头走向写着“我今天做出了什么”的创作工作台,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

什么才算网瘾:不要把所有数字兴趣都病理化

那么到底什么是网瘾?这个定义本身其实也有一些争议。网瘾这个词在中文语境里经常被滥用,好像孩子开始打游戏了,家长就说他有网瘾;孩子周末多刷了几条短视频,家长就说他有网瘾。但是从医学和公共卫生角度上,这个事情是有严格标准的。

世界卫生组织专门有这个病,叫做游戏障碍。它有三个核心条件:

  1. 控制力受损:明明知道我应该停下来,就是停不下来。
  2. 游戏优先级越来越高:学习、工作、睡眠、社交、家庭责任都被挤在它后边去了。
  3. 即使已经造成明显负面后果,仍然持续或者升级:比如成绩已经严重下滑了,工作已经失控了,关系破裂了,健康受损了,但是仍然要继续玩,甚至越玩越多。

这点非常重要,因为我们不能把所有孩子对数字娱乐的兴趣都病理化,都认为这事有病。一个孩子喜欢游戏、喜欢动漫、喜欢刷视频,未必是病。问题在于这件事情有没有挤压他的现实生活,有没有破坏他的自我控制,有没有让他长期丧失学习、工作、社交和生活的能力。如果没有,那就是兴趣;如果有,那可能就稍微需要干预一下了。

所以今天我们说用 Vibe Coding 治疗网瘾,不是说 Vibe Coding 是医疗疗法,更不是说它可以替代专业的心理咨询、精神科诊疗、家庭关系修复。我说的是一个家庭教育和数字习惯迁移的思路:当一个孩子已经被低价值的数字产品牢牢吸引住的时候,不要只想着强制断网或者抢他手机,要尝试着引导他到一个同样有吸引力,但是能产生现实价值的方向上去。这个方向就是今天咱们要讲的 Vibe Coding。

游戏和短视频为什么会让人上瘾

一个孩子站在巨大的反馈机器前,机器由任务、等级、随机奖励、社群身份和推荐算法五个齿轮组成,屏幕不断吐出游戏胜利提示和短视频卡片,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

常见的网瘾机制,就是为什么大家觉得游戏和短视频这些数字产品会让人上瘾?因为这些东西都是靠数学模型拿捏人的能力边界的。真的是世界上最聪明的一帮人在研究怎么让你上瘾。

游戏有任务、有等级、有装备、有队友、有技能,它是一套完整的世界观。短视频没有那么复杂,它也不要求让你循序渐进,而是给你一个更短、更快的反馈。刷一条不喜欢,我再给你一条你喜欢的;刷完以后再接着刷。它的反馈更快,但是没有形成完整世界观,没有这种梯度。它们是两个不同的玩法,但底层有类似的东西,就是即时反馈和持续调整。

调整什么?游戏不是随便设计的。它会让你刚开始的时候很容易赢:新手村、新手引导,给你简单任务,怪物也很弱,奖励也很密集,让你快速建立起“我能行”的感觉。刚才咱们讲了,很多小孩形成网瘾的原因是他们在外边没有办法得到认可,那你到游戏里头说:“哎,我行了。”

等你熟悉了以后,等级和难度会逐渐上升,怪会变强,副本会变复杂,装备会更加精细,角色成长线会拉长。你会不断遇到一个刚好能够得着的目标,这叫能力边界。它会不断摸索你的能力边界。太简单,你觉得没劲;太难,你直接有挫败感。现实生活已经这么难了,我为什么要到游戏里受折磨?就直接弃坑了。所以它一定要找到“刚刚好”,你稍微努努力就能够得着。

其实很多教育学也在讲这个事,我们要设置一个能力边界,让他刚刚好够得着。但是通常老师没这个耐心,老师也有自己的 KPI。

短视频跟游戏这套东西不太一样。它不会要求你升级,它只是每一次来猜,你下一条最喜欢看什么。我尽可能更集中、更快速地给你进行反馈。所以短视频的危害形式要比游戏大,要注意这一点。

游戏和短视频厉害的地方就在于,它不只是一个娱乐产品,它是一个非常巨大规模的反馈机器。它通过即时满足、随机奖励、社群身份、等级系统、算法推荐,不断把人留在系统里边。

最后的问题就来了:孩子们不是简单地不自律,他是在用一个普通人的意志力,对抗一个由产品经理、游戏设计师、增长团队、推荐算法、商业化团队共同打造的超级系统。甚至这些超级系统里很多人,都是年薪好几百万的科学家。你要让人从这里边逃出来,不能简单靠一句“你别玩了”,这个事是很难成功的。

从历史看“替代成瘾”:卷烟替代鸦片的类比

我们必须要找一个更聪明的办法。你说有没有这种聪明办法?其实有过。

清末虽然鸦片战争已经打过了,虎门销烟也过去了,清朝也禁烟了,甚至英国也跟我们一块去开了禁烟大会。当然英国跟中国开禁烟大会的原因比较奇怪,因为后来中国反向出口鸦片,把英国也祸害了,英国说不行了,我们禁烟吧。

但是清朝政府自己的治理能力和治理效率是比较低下的,所以鸦片依然泛滥。最后没有办法,一方面这东西很上瘾,另外一方面,地方政府和很多门阀势力要靠鸦片赚钱,所以必须要种鸦片。最后他们用了一个什么方法把这个事情解决掉,或者说部分解决掉?上卷烟。

上了卷烟以后,你也可以上个瘾,稍微替代一下,没有鸦片的危害那么大。而且各级政府相对来说还有收入,因为卷烟可以收税,卷烟是一个税很重的产业。所以它算是一个成瘾替代的过程。

这也是我们今天讲这个故事的一个原因。小孩有网瘾了怎么办?我们希望立刻把孩子拎出来,变成一个热爱学习、热爱运动、热爱社交,每天早睡早起、积极向上的完美青年,这可能吗?家长们,你自己照照镜子,你自己是这样的人吗?我们大部分人其实也做不到这一点,那么就别要求孩子干成这样的事情。

所以我们今天就要稍微让他换一下,让他用 Vibe Coding 来替代打游戏。很多人说,写程序这事看着挺痛苦的,程序员都是秃头。当然像老范这个头发还是不错的。很多程序员都是未老先衰,很年轻的程序员看着都很老。你怎么说 Vibe Coding 或者写程序上瘾呢?

其实写程序真的是上瘾。如果你没写过程序,你可能很难理解,因为写程序是一种心流状态,它在不断解决问题。而 Vibe Coding 要比写程序还要上瘾。就像卷烟替代鸦片一样,我们现在就希望用它来替代打游戏。

一座成瘾替代的天平,左侧是沉重的游戏手柄和短视频漩涡,右侧是较高阶的 AI 编程工作台、问题清单和作品成果,旁边有“替代而非拔除”的箭头路径,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

Vibe Coding 为什么会上瘾

一个孩子对 AI 对话框说出“帮我做一个记账小程序”,旁边的屏幕从一句话生成按钮、表格和运行中的网页,孩子表情从犹豫变成兴奋,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

下面咱们来讲今天真正的核心:Vibe Coding 为什么会上瘾?很多不写代码的人其实很难理解,他们以为写程序是一件特别枯燥的事情,屏幕上甭管是白底黑字还是黑底白字,看着就头大。你需要学编程语言,需要学语法、变量、函数、对象,要学一大堆东西。

现在你只需要跟 AI 说:“我要一个什么什么东西。”就像上帝说要有光,于是就有了光那样的感觉。所以 Vibe Coding 等于直接把第一道门槛去掉了。它可以让人从一句话开始:“帮我做一个记账的小程序。”“帮我做一个背单词的小游戏。”第一版可能比较粗糙,但是它能跑,也能有一些效果。这不就是一个正反馈吗?跟打游戏那过程不是一样吗?

它一旦跑起来,这个人就觉得:“我是不是改一改?按钮不太好看,有点丑,咱改一下吧。这个颜色太丑了,咱改一下吧。”当你改的时候,你就相当于在游戏里从新手村出来,稍微往前走一走,在周围稍微探索一下。你的编程任务就可以一个一个地像游戏那样进行下去。而每一次任务的成功,就相当于你解决了一个问题,又得到了一个反馈,相当于又打了一个怪。

所以 Vibe Coding 是非常成瘾的,而且它把前面这些基础知识的门槛给你去了。小孩也都可以很好地使用 Vibe Coding 写出程序来。而且你直接跟它说中文、说英文、说各种语言,它都老老实实给你写程序,这还是非常爽的一件事情。

为什么传统少儿编程很难坚持

过去其实也有少儿编程课,但是门槛很高。我也投过少儿编程的项目,比如编程猫,我还给我儿子报过。报了以后他也没什么兴趣,学了半天,你的付出跟反馈不匹配。我折腾了半天,最后做出来那个小程序不好玩。

为什么会不好玩?原因很简单,它需要把课程设计得适合所有人,每个人的进度是不一样的。你需要学一堆基础知识,很快兴趣就没有了。所以当时编程猫的课程付了费以后也没上完。

原来这些东西有价值,不能说没有价值。但是问题是什么?真正长期坚持下来的孩子非常少。原因是你还是要去学编程语言,还是要去学符号系统。即使是 Scratch 这种用积木拖的代码,它确实很形象,就是一堆积木拼起来,但是你还是要了解加减乘除、赋值、排序、存储、循环、判断,还是要搞这些东西,还是很麻烦。而且你用 Scratch 这种积木语言拼出来的代码,能干的事情很有限,大部分事情干不了。

不像现在,我可以提一个很现实的问题:我现在想要一个记菜谱的程序,或者我现在追星,我特别喜欢哪个明星,请帮我把这个明星的所有信息都搜集起来,让我可以给他做一个明星记事本。一句话我就可以把这事搞定了。以前你学了半天 Scratch,你要想做出这样的东西来,得学几年。

所以孩子还没有看到成就,就直接被复杂的编程语言把兴趣给磨没了。现在的话,你会说就可以了,语法也不需要严谨。即使是 Scratch 那种拼积木的,你的语法还是要严谨,还是要 debug,还是会出错。更别说 Python、JavaScript 或者其他语言。现在我写中文跟 AI 聊天,写英文跟 AI 聊天,我语法错了,写错别字了,单词拼错了,有什么关系?没关系。

AI 提供了安全的表达环境

这个事情对孩子非常重要。很多孩子不是没想法,只是他觉得不太敢表达:我说了,万一说错了怎么办?这个叫挫败感。他也害怕我万一把这个想法说出来,老师说你这怎么这么幼稚,或者同学笑话他,或者父母说这玩意有什么用。这个对于他来说压力是很大的。

但是 AI 不会干这活。你跟 AI 说什么,AI 都不会笑话你。AI 会说:“行,我给你做一版。”很多孩子在现实世界里最缺的其实不是知识,而是一个愿意把他的想法当回事的对象。在这件事情上,AI 要比父母、比老师、比他的同学做得都要好,所以更容易上瘾一点点。

而且 AI 会不停地告诉他:“你这个想法可以实现,没问题的。”这对一个长期沉迷游戏、觉得现实世界没有正反馈的孩子来说,非常重要。

Vibe Coding 的“动态难度”机制

一条打怪升级式学习路径,起点是“能跑的小工具”,依次经过“手机适配”“本地存储”“云服务器”“域名和登录”,每一级都有 AI 助手递出提示卡片,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

游戏让人上瘾的还有一个原因,就是难度刚刚好。Vibe Coding 也是一个天然具备难度适配结构的东西。

一个好游戏,动态难度一定是动态设定的。太容易了,玩家就跑了;太难了,新手就不来了。所以游戏设计里有很多机制,就是为了让不同程度的玩家有他们自己可玩的东西。

但是游戏比较麻烦的是什么?因为它一发售就写死了,有些人可能会高不成低不就,没法找到自己合适的地方,那他就会离开。Vibe Coding 这件事,一个完全不懂计算机的人,让 AI 帮他做个小工具,第一版就出来了,第一波奖励到手了。

然后他发现,我这个程序在电脑上好好的,怎么到手机上就这么丑?你把这个问题提给 AI 以后,AI 会告诉你,有一个东西叫响应式设计,就是在不同的屏幕大小上会自动适应。你原来没用这个东西,这个东西大概是怎么回事。然后你说我们用一用吧,它等于就升了一级,而且是你自己提出的问题,不用让 AI 猜你到底会什么、不会什么。

再往后说,我想把这个东西本地持久化一下。什么意思?就是我不希望每次打开应用以后,数据都没有了,我需要把东西存起来。AI 就会告诉你,什么叫本地存储,什么叫持久化,什么叫后端服务,什么叫数据库。你学了半天以后说,哦,我又学会一点东西,又把这个问题解决了,又一波奖励到手了。

再往后说,不光我自己想用,我还想给我朋友用,这事怎么办?你问 AI,AI 告诉你,你需要把它部署到云服务器上去。搁在自己电脑上,别人用不了。部署到云服务器以后,你还要给它申请个域名。你不希望别人乱用,可能还要登录;登录以后可能还有权限,因为现在不是你一个人用了。后台可能只有你一个人能看到,其他人能用前台的服务就可以了。等于你又学了一堆知识,又一波奖励到手。

它是这样的一个打怪升级过程。每一次你遇到的问题,正好是你现在知识上缺的这点。它不会给你做这种系统化教育。像我们原来学编程都是系统化教育,先学变量,再学计算机架构,然后再学什么,就是这样的一个系统化。现在没有了。我先有个需求,然后根据这个需求,一步一步把这个程序越做越复杂。在这个过程中,我学会编程了。

所以这就是 Vibe Coding 最厉害的地方。它不是把知识库做成课程,系统化教给你,而是让知识藏在问题里头。你自己发现问题,你自己想去解决问题,你自己去问,问完以后它就耐心地给你解释。在这个过程中,它就慢慢让你上瘾了,让你在这个过程中还学习了。

而且它永远知道你的能力边界是什么。你的能力边界就是你问的问题,你问了什么问题,你的能力边界就在这了。所以 Vibe Coding 会让孩子在解决问题中自然学习现实的知识。

Vibe Coding 的教育价值:从愿望走向现实

这部分很关键。很多人以为 Vibe Coding 是让 AI 写代码,如果只理解到这里就太浅了。Vibe Coding 真正的教育价值在哪?不是 AI 帮你写了多少代码,而是它会把你从一个愿望一步一步带到现实世界。

你就在这样的过程中,从一开始只想做一个简单的东西,不断往前推进,就会自然碰到现实世界的边界:网络延迟怎么办?服务器为什么要钱?用户数据怎么乱的?

这些问题比单纯上一门信息技术课要更有力量,因为这是从他自己的需求出发的,不是老师布置的。这是孩子自己碰上的。一个人只有在自己撞上墙、自己想去解决问题的时候,才有动力继续学习下去。Vibe Coding 就是一个不断制造这种温和撞墙的机器。这就是润物细无声的学习。它不需要说教,不需要像家长那样在旁边喊:“你应该学点有用的。”所以 Vibe Coding 让人上瘾,而且让人努力学习。

Vibe Coding 比游戏更没有边界

Vibe Coding 跟游戏还有一个很大的区别,就是游戏是有边界的,Vibe Coding 是没有边界的。在这点上,Vibe Coding 其实比游戏的成瘾性还强一些。

纳瓦尔在他的播客里有一个点让我觉得非常有意思。他讲,游戏这东西不可能让你无限地玩下去。就算是再大的开放世界游戏,它也是有边界的。原因其实很简单,游戏公司是靠卖游戏挣钱的。你如果买了一个游戏玩一辈子,再也不买第二套了,那人家不饿死了吗?

但是 Vibe Coding 不一样,它底下连接的是现实的计算机世界和计算机网络。所以理论上说,你可以让它做任何软件,你可以把软件向任何方向去升级。你可以让它做背单词工具、健身记录、家庭记账、小型游戏,也可以给同学们做社群工具。它没有一个特别固定的地图,后边无穷无尽,你可以一直让它玩下去。

所以它也没有固定任务。它不像传统游戏似的,还要设计说你应该先玩什么、后玩什么,都没有。想做什么做什么,一切都是从自己的意愿出发。Boss 无限多,你只要说我愿意打下一个 Boss,没问题,来了。它是这样的一个系统。而且每一个 Boss 打过去的过程都不是特别费劲,因为真正生成代码的是 AI,不是你自己。

纳瓦尔自己也说,他现在开始用 Vibe Coding 以后,立马上瘾,这一点都不夸张,而且是越用越上瘾。

AI 为什么会让孩子更敢表达

刚才我们讲到,小孩子有网瘾,有一个很重要的原因是他害怕被拒绝。他在现实世界中有挫折感,所以愿意逃避,愿意到网络世界里去寻找新的认同。那 AI 是一个什么东西?它不会嘲笑,不会翻脸,你让它干啥它都干。

咱们就说写程序。我今天说:“你给我加一个按钮。”看完以后,按钮不太好看,“你给我把这个颜色换成红的。”红的不好看,“给我换回去吧。”我需要一个新的功能,要做什么什么东西,它就做去了。那个 AI 可能吭哧吭哧做了俩小时,写了几万行代码进去,还没有上一版好用呢,你说“给我退回去”。如果后边是个人会怎么样?后边是个人早给你疯了。但是 AI 不会干这个,你说什么它就给你干什么。

而且 AI 还有一点,AI 大部分是讨好型人格。因为 AI 自己经常容易出现幻觉,它也知道自己说的东西不是特别靠谱,所以只要人不是错得特别过分,它都会说:“没问题,你是对的,我接着给你做。”所以 AI 在孩子面前会让孩子有一个非常安全的表达环境。

像我儿子有时候在我面前也是不太敢说话,因为怕我挑他错。我原来是有给人挑毛病的习惯,这确实要承认。说点什么事,我说:“你这样说对吗?你的逻辑清楚吗?”然后他就会觉得压力很大。AI 不会跟你说这个。

Vibe Coding 不是万能药,但它能改变方向

一个分流漏斗场景,上方是同一个孩子和同一块屏幕,左下流向游戏和短视频的消费池,右下流向 AI 工具、作品发布和现实反馈的创造池,旁边标注“不是万能药,是方向改变”,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

讲到这,很多家长就晕菜了,说老范你这不对,你找了一个更上瘾的东西回来。孩子原来就沉迷游戏,你现在让他沉迷 Vibe Coding。

所以我要把话说完整:Vibe Coding 不是万能药,不能自动解决孩子不社交的问题,也不能解决焦虑、抑郁、注意力缺陷、家庭冲突这些更深层次问题。如果孩子已经出现了严重的心理或者行为问题,您该去看医生还是要去看医生。

但是 Vibe Coding 能够解决另外一个非常关键的问题:它能够把一部分沉迷数字反馈的孩子,转换向能够用数字工具创造东西的孩子。向这个方向转换,这件事的价值还是非常巨大的。

纳瓦尔在这个播客里也说了,Vibe Coding 可能会把能够构建应用的人,从人口总数的 0.1%,提高到 1%、2%,甚至是 3%。注意,这里并不是说所有人都会变成程序员。他说可能未来人口里的 3% 会成为程序员。对于大多数人来说,电脑仍然是一个黑箱。但是对于那些有创造力、有自驱力、有表达能力、有清晰愿景的人来说,门槛就降低了。

所以我们也希望自己的孩子未必能够成为一个各方面都强的人,但是在 AI 时代,他一定要成为一个有创造力、有自驱力、有表达能力、有清晰愿景的人。这个非常重要。这就是我们今天的关键。

一个网瘾少年,如果只是沉迷游戏,他的数字能力可能就被锁在游戏的虚拟世界和游戏规则里。但如果他沉迷的是 Vibe Coding,他至少有机会进入 3% 的应用构建人才里去。他不一定会成为职业程序员,但是可能会成为一个会用 AI 做工具的人。我们是要让孩子从被软件控制的人,变成能够指挥软件的人。这才是 Vibe Coding 替代网瘾的真正意义。

家长应该怎么引导孩子接触 Vibe Coding

所以,如果您觉得家里的孩子稍微有点网瘾,可以让他接触 Vibe Coding。但是你不要说:“人家 Vibe Coding 都去做什么什么东西,你也要去做同样的东西。”这个就没必要了。一定要让他自己找到他自己的兴趣。

比如说:

  • 你不是喜欢打游戏吗?你让 AI 给你做个小游戏行不行?
  • 你不是喜欢动漫吗?你让 AI 给你做一个角色的成长历程库、资料库行不行?
  • 喜欢二次元设定,也可以做个小网站,把这些东西整理整理、比较一下。

重点不是这个项目有多大。大家注意,一开始如果项目大了,他可能就没兴趣了。重点是要让他得到正向反馈,让他体会到一次:“原来我不只是能玩别人的东西,我自己也能做出东西来。”这个转换很小,但是方向完全不同。

如果一个孩子连续几天都愿意花时间改自己的小项目,哪怕还是坐在电脑面前,这已经是从无意识地刷短视频、刷游戏,到自己去创作了。因为他开始有目标了,有目标就要有计划,他就会开始有一定的自控力。

当然,家长也要注意,不要把 Vibe Coding 又当成新型的鸡娃。一上来说:“你看别人家怎么怎么样了,你去参加个比赛,咱们去创个业吧。”这事就废了,你又把兴趣毁了。所以最好的方式是什么?让孩子玩起来,只是这次玩的东西是创造工具。

纳瓦尔是谁,为什么他的观点值得重视

纳瓦尔是个印度人,移民到美国以后,自己先去创业,然后开始做投资人。他创业的时候,跟他的投资人发生过一些诉讼,他觉得里头有一些条款有问题。所以他后来去做投资人的时候,做了一个项目叫 AngelList,叫天使列表,专门帮助创业者跟投资人建立联系的平台。

他投中的项目包括 Twitter、Uber、Yammer。Yammer 后来被微软收购了。然后是 Stack Overflow,已经上市了;Notion 也是他投的。所以这是一个非常成功的传奇投资人。投资人怎么叫成功?就是你看他投的项目到底都是什么。为什么老范自己老说,我吹牛说我投过 Musical.ly,现在是 TikTok。这种成功退出的,或者说能让大家知道的案例,就是一个投资人身上的标签。他身上有 Twitter,有 Uber,有 Notion,这些公司有的上市了,有的被收购了。

纳瓦尔关于苹果、软件和未来投资的判断

一个商业判断对照图,左侧是像 Costco 货架一样整齐但有限的 App Store,右侧是像淘宝集市一样密集多样的个人定制应用摊位,中间有苹果手机变成基础硬件的示意,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

苹果可能走到高峰

他还讲了些什么?第一个,他讲苹果完了。这个特别有意思。为什么?你想,他现在想着谁都可以写自己的程序。那写完程序以后会发生什么事?大家知道吗?你要上架,你要让 iOS 能够认你这个 App。但是 iOS 上 App 这个事要求是非常严格的。

在这点上,苹果有点像 Costco,叫开市客。大家想想开市客有什么特点?它的 SKU,或者说商品的品类特别少,但是所有商品都是精挑细选、经过选择的。那么大家为什么愿意上 Costco 去交会员费?因为人家替你选过了,你不需要再去挑了,这都是最好的。

苹果实际上一直走这样的策略。它的硬件确实设计得很好,它整体的软件体验也非常好,要比安卓好很多。但是现在好了,大家每一个人都可以写应用了。你要还按这样的方式去做就不行了。我们每个人都有应用,每个人都需要上架,每个人可能都需要在小范围内进行分发。这个时候我们就不需要 Costco 了,我们这时候需要什么?我们需要淘宝。

淘宝是什么?叫只有你想不到的,没有它不卖的。即使它真的不卖,你还可以找商家定制。你现在还可以让 AI 给你定制。所以以后苹果就没有任何意义了。他说苹果这种靠维持 App Store 垄断的生意肯定做不下去了。以后的手机是什么?就是显示器、电池、处理器、存储、摄像头、各种传感器、麦克风,再加上网络连接,其他就都不需要了。我不需要你去替我做这种筛选。我自己做了一个 App,我自己用就行了。你不要上来说“我要为了你的安全”,我不需要,我自己就足够安全了。所以他觉得苹果已经完事了,现在已经到高峰了,再往前涨涨不动了。

纯软件项目可能不再值得投资

他在这个播客里还有一个比较有意思的观点,就是纯软件项目以后就不值得投资了。这个观点也是非常刺激的。原因也很简单,做软件的门槛实在太低了。任何一个人,包括原来这个行业里的产品经理,或者一些文科生,也可以做出软件来了。

他说他以后要去投硬件,投网络效应。就是说你做了一个事情以后,可以进行这种裂变,一传十、十传百,这种事情他要投。数据优势,这个数据只有你有,其他人没有,这个事是值得投的。分发渠道,你可以触达用户,这事可以投。AI 模型能力、品牌、社区、现实世界资源,以及难以复制的系统能力,这些东西是值得投的。纯软件就不投了。

Vibe Coding 能不能替代大型软件公司

那么 Vibe Coding 到底能不能替代大型软件公司?我只能说,至少到目前为止还不行。现在 Vibe Coding 还是只能做个人工具、小团队工具、原型、内部的一些小系统、学习项目、兴趣项目或小范围应用。

但你说我想做一个为几百万用户服务的,涉及支付、安全、隐私、稳定性、合规、性能、灾备等等一大堆系统的完整项目,也用 Vibe Coding?现在苹果不是也 Vibe Coding 了吗?但是你还是需要有职业程序员,要组队去进行 Vibe Coding。完全不懂计算机的人去搞这个事,是搞不起来的。

但是这也只是当前状态。大家要想想,3 年前我们可能连 AI 到底能不能代码补全还心存疑虑;两年前我们知道 AI 可以做代码补全了,但是应对完整项目到底行不行,我们不知道;去年开始有 AI agent 了,你可以稍微处理一点完整项目了,但是我们还是要在浏览器里看代码的;到今年,已经发展到 Claude Code,发展到 Codex,我们可以不用看代码了。

去年我还不太敢去用自己不熟悉、不会的编程语言写程序。我现在已经可以完完全全使用我从来没有学过、也不看代码、也没见过代码的编程语言去写程序了。所以每一天都在发生变化。现在这种特别复杂的项目,依然需要职业程序员,甚至是成建制的职业程序员使用 Vibe Coding 工具去写。是不是再过一年,普通人也可以一拍脑袋把这事情搞定?这个事我不知道,可能行,但是也可能不行。

AI 时代,编程会不会像驾照一样普及

一个“编程像驾照”的社会普及图,左边是驾校方向盘和驾驶证,右边是 AI 编程证书、个人工具面板和普通人排队学习的场景,中间用百分比路牌连接 3% 到 50% 的不同预测,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

AI 时代,个性化软件一定会大爆发,手机可能就会变成一个基础硬件。有一点,我跟纳瓦尔的观点是不一致的。编程人口,他认为会达到 3%,这对于他来说已经是很夸张的一个数字了。但是我个人认为,编程人口有可能会像汽车驾照一样,达到社会人口的一半甚至以上。

中国到现在为止,18 岁以上的人有驾照的是 49%;日本大概是 70% 多;美国 18 岁以上有驾照的人是 85%。如果纳瓦尔的判断是对的,就是非常低的比例会成为程序员,那么你现在去学习 Vibe Coding,这个价值就会上升,因为你可以有敲门砖,可以赢在起跑线上。

如果我判断是对的,以后可能有 50% 以上的人都是程序员,那你就更要去学 Vibe Coding 了。因为你不会 Vibe Coding,不会编程,就相当于现在不会开车似的,你缺乏了一个基本的生活技能。不管是谁对,学 Vibe Coding 都是一个正确的事情。

结论:用更高阶的数字成瘾,替代低阶的数字成瘾

最后的结论是什么?以毒攻毒,用 Vibe Coding 治网瘾,也许就是 AI 时代的一个新选择。这就是咱们今天节目的核心观点。不是 Vibe Coding 要替代程序员了,也不是说孩子学了 Vibe Coding 就一定会发财,更不是说 Vibe Coding 是医学意义上的网瘾治疗方案。

我真正想说的是,在 AI 时代,我们也许可以用一种更高阶、更有现实生产力的数字成瘾,去替代一种低阶的、纯消费的、被算法控制的数字成瘾。

区别就在于,游戏的奖励大多是留在游戏的虚拟世界里了,而短视频的刺激更是什么都没剩下。Vibe Coding 的奖励是一个真实的作品、一个页面、一个小工具、一个 App 原型。这些才是真正有价值的东西,也是让孩子快速进入 AI 时代、快速进入程序时代的一个敲门砖。咱们不说什么赢在起跑线上这些比较垃圾的话,这就是咱们今天讲的故事。

Anthropic Pre-IPO 估值 1.2 万亿美金,超过 OpenAI 成为估值最高的 AI 企业,三层误解,一个风险

2026-05-11 09:12:19

Anthropic 与 OpenAI 两座橡皮泥公司大楼并排,前景是放大镜查看“1.2 万亿美金”标题,旁边有小型代币和股票证书形成对比,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

关注 AI 领域的朋友们,最近应该经常被一条新闻刷屏。这个新闻的标题叫做:Anthropic 的 Pre-IPO 估值已经冲到了 1.2 万亿美金,超越 OpenAI,成为全球估值最高的 AI 公司。

这个标题确实非常抓人,因为里面有 Anthropic、OpenAI、Pre-IPO、1.2 万亿美金这些关键词。全球市值第一的 AI 公司上市前暴涨,普通人要提前买入。如果只看标题,你会以为 AI 界已经变天了:OpenAI 已经不是老大,Anthropic 现在是老大了。

1.2 万亿美金这个数字本身很容易引起误导。所以今天不着急喊 Anthropic 好厉害,也不是出来喊哪里有泡沫,而是把它拆开以后,把这里面的三个误导和一个风险说清楚。

第一个误导:这不是通常意义上的 Pre-IPO

一条分叉路标分别写着“传统 Pre-IPO”和“链上 Pre-IPO”,投资人小人站在路口拿着地图困惑对比,两条路分别通向证券交易所和区块链节点,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

很多中国人对 Pre-IPO 这件事特别有执念。什么叫 Pre-IPO?就是 IPO 之前融的最后一轮钱。

为什么中国人对这件事特别有执念?因为中国 IPO 长期是审批制,不是注册制,所以 IPO 的机会很少。最后一轮上车的这帮人,也就是 Pre-IPO 这一轮的人,通常会代表一些官二代、红二代、富二代,他们上车以后会给你保驾护航,能够让你上市成功;上市以后,他们也能挣到超额回报。因为上市机会少,谁上去了以后就属于“奉旨割韭菜”。

所以 Pre-IPO 在中国有一个很特殊的意义。但是这里要讲的第一层误导就是:此 Pre-IPO 非彼 Pre-IPO

正常应该是上市之前最后一轮融资叫 Pre-IPO,但是 Anthropic 这个 Pre-IPO 叫做链上 Pre-IPO,是一种跟区块链相关的特殊股票计价方式。

第二个误导:tokenized Pre-IPO 不等于真正买到股票

有人把这种 tokenized 的 Pre-IPO 当成了真正买到了 Anthropic 股票。这个还不行。你买到的这种 token 化股票,实际上是一个价格敞口,跟最后你真正买到股票不能直接画等号。

一枚写着“Token”的橡皮泥圆币与一张写着“真实股票”的证书隔着透明玻璃相望,中间标注“价格敞口≠股权”,投资人伸手却只能碰到代币,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

第三个误导:小盘交易价格不等于上市市值

很多人会把这种二级市场上的小盘交易价格,当成 Anthropic 上市时一定能够兑现的市值。这是有区别的。

现在 tokenized Pre-IPO 这个盘子非常小,可能只占到千分之几的份额。这个数据的涨跌,跟 Anthropic 自己的估值或者最后上市的市值,其实并没有什么直接关系。而且这种从 tokenized Pre-IPO 的价格反向传导回它的估值、它的市值,这个链路并不通畅。

这就是三重误解。

一个重大风险:Anthropic 可能不承认这些交易

那么风险是什么?这些 SPV,也就是以特殊目的建立的基金或者公司,一般什么时候会玩这个东西?比如说想买 Anthropic 股票,但现在它没上市,买不着。那怎么办?有些人说,我们替你买。我们专门建一家公司,去买 Anthropic 股票。Stockx 每过一段时间也会卖一些老股。

如果你是个人,手里只有 20 块钱买菜钱,也想买这个东西,你买不着,人家不跟你谈。现在就有人说,我成立一个基金,我去投资,我去买它的老股,然后你再给我 20 块钱,我把这个东西拆开以后分你一部分。这个就叫 SPV。

有些人把 SPV 的东西代币化,到链上去交易,这就是今天讲的 tokenized Pre-IPO。

一个写着“SPV”的橡皮泥盒子把大股票切成许多小代币,链条另一端的散户小人排队购买,远处 Anthropic 大楼门口竖着“需审批”标牌,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

但这些东西 Anthropic 得承认才行。也就是说,Anthropic 承认他们买走的这些股票,到上市的时候都认,最后愿意给你兑现,这才可以。但是现在 Anthropic 有可能不承认。

它已经发公告说,我们现在是私营公司,我们没上市,所有对我们公司股票的转卖,必须要经过我们同意;没有经过我们同意的,我们通通不承认。

那你说,人家愿意买你股票,你凭什么不承认,凭什么不同意?这个其实很好理解。Anthropic 也有竞争对手,也有一些人是 Anthropic 不希望把股票卖给他的。比如背后是中国国资的一些基金,也想冲上去买 Anthropic 股票,那 Anthropic 会说,我必须审核一下。你卖给谁之前,必须告诉我;如果我不知道你就把股票卖了,这件事我有可能不承认。

如果它已经上市了,比如哪天 Anthropic 在纳斯达克上市,有国资基金冲上去说我们要买股票,它是不能反对的。但没上市之前,它是可以反对的。所以这里面有一个重大风险。

1.2 万亿美金到底从哪来

先把事情讲清楚:这 1.2 万亿到底是从哪来的?我们先不要被 1.2 万亿美金这个数吓着。这个数字不是 Anthropic 官方宣布的,也不是 Anthropic 最新融资爆出的估值。

像这种没上市的公司,它的估值一般有几种方式对外暴露。

  1. 融资。融了一轮新的钱,大家去报道一下,这轮新的融资以后,投后估值是多少。投后估值就是原来的估值加上这次新融进来的钱,最后一共多少钱,这是一个暴露方式。
  2. 卖老股。公司有一批老股要卖出去,想给创始团队和员工稍微改善一下生活,这个时候会有一个窗口:我们在什么样的估值上卖。卖掉以后,创始团队和有老股的人可以在里面变现一些,这也可以暴露一定的价格。
  3. 并购。比如 SpaceX 跟 xAI 之间的并购,也可以暴露一个估值出来。

上市以后才有市值,没上市之前通常只有这三种方式暴露估值。

这一次暴露的叫链上 Pre-IPO 市场的隐含估值。简单来讲,就是有人通过 SPV 的方式得到了一部分 Anthropic 的股票,而且这个股票的数量其实很少,还存在巨大风险:Anthropic 有可能不承认。他们把这一部分 Anthropic 股票上链交易去了,完整的名字应该叫 Anthropic tokenized stock。

一小撮写着“少量 Anthropic 股份”的橡皮泥筹码被放到区块链轨道上,投影屏把它放大成“隐含估值 1.2 万亿”,旁边有警示三角提示风险,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

交易 Pre-IPO 的这个公司叫 PreStocks,是 2025 年才创建的。现在在这个平台上交易的有 Anthropic、OpenAI、Neuralink、SpaceX,这些公司都没上市。但是比如通过投资、购买、买老股的方式,他们得到了一点点股份,然后放在这里,谁愿意买谁去买。

这里面就不再管你是谁了,只要你拿着比特币,或者 USDT、USDC,就可以来买,直接跟你交易。既然有交易,它就会有一个市值出来。所以这一次的价格就是这么来的。

要注意,它叫隐含估值。所谓隐含,就是它不是一个官方估值,也不是公司董事会批准的融资价格,不是审计以后的市场价值,也不是 IPO 定价,跟这些通通都没关系。而且这个价值想要传导回去,说“我这边已经 1.2 万亿了,我要影响 Anthropic 本身的定价”,基本上没有什么路径。

Anthropic 的官方估值是多少

Anthropic 的官方估值到底是多少?要注意,它已经 close 的融资是在 2026 年 2 月份,300 亿美金到手。那一轮已经关闭了。只有已经关闭的交易,才可以算它的估值是多少。你说现在还谈着,还有一些交易没做完,协议没签,钱没到手,这个是不能算的。

按照 2026 年 2 月份这一次 300 亿美金的融资,它的估值是 3,800 亿美金 post-money,也就是投后估值。

你说这跟 1.2 万亿差远了,差三点几倍,快 4 倍了,这数对吗?对,这就是官方确认的 3,800 亿美金。

再往后还有没有在谈的融资?有。现在还有一个 500 亿美金的融资还在谈,也就是说这一轮要进 500 亿美金现金。它这一轮的投后估值,现在大家猜测是 1 万亿美金。但是在没有签字、没有对外公示之前,这都是无效的。

所有谈融资,都要签 term sheet,也就是投资意向书。投资意向书里有一个很关键的点:保密。所以在正式投资文件签署之前、对外公开之前,没有任何一个严肃的投资人会来跟你讲说,我准备投多少钱,这个估值是多少。这个都不对。一旦说了这个数,就违反了投资意向书的保密义务,就会被踢出局。这个事是不能说的。

所以它到底是不是到 1 万亿美金了,我们要等。等它这个 500 亿美金这一轮融资完成,大家签了字,正规媒体出来报道了,我们才能说它的价值在往上涨。

所以 Anthropic 目前正常的估值是 3,800 亿美金。这里面有三个数:

  • 3,800 亿美金:2026 年 2 月份已经完成的那一轮投资的 post-money。
  • 1 万亿美金:现在正在进行的 500 亿美金融资外面传说的 post-money,注意是传说的,并没有最后签字确认。
  • 1.2 万亿美金:PreStocks 这样一家创业公司拿一部分在外面流通的、Anthropic 自己还不承认的股票去做 tokenized 交易,然后形成的一个预估价格。
三个橡皮泥价签从左到右排列,分别写着“3,800 亿已完成”“1 万亿传说中”“1.2 万亿链上隐含”,每个价签下方连接不同来源图标,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

这三个价格,大家要理解清楚。

OpenAI 到底有没有被超过

那讲到这里,OpenAI 值多少钱?到底有没有被超过?

OpenAI 在 2026 年 3 月份也完成了一轮巨额融资。这一轮融资以后,它的估值达到了 8,520 亿美金 post-money,也就是投后估值 8,520 亿美金。所以从可以确认的估值上来说,OpenAI 还是 Anthropic 的两倍多:OpenAI 是 8,520 亿,Anthropic 是 3,800 亿。

那 OpenAI 有没有 tokenized Pre-IPO 的估值?也有。PreStocks 这个创业企业也拿了一部分 OpenAI 的股票上链,让大家去交易。在那个上面,现在 OpenAI 的价格大概是 1.3 万亿美金,比 Anthropic 还要稍微贵一点点,但是已经非常接近了。

这种价格代表的是一种心理预期。虽然它很难反向影响到实际公司的价值,但是它还是代表着能够参与这种交易的人对这两家公司的价值认可。

那 SpaceX 现在在 PreStocks 的 Pre-IPO 上价格是多少?大概是 1.8 万亿。这三家公司都号称今年要上市,但是现在真正向 SEC 递表、交了 S-1 上市申请书的只有 SpaceX。

Anthropic、OpenAI、SpaceX 三辆橡皮泥赛车在不同赛道前进,赛道旁分别竖着“官方估值”“链上价格”“SEC 递表”三块计分牌,SpaceX 车前方有已提交文件图标,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

SpaceX 说我们准备按 1.75 万亿去招股,这是一个确定的数字,不是大家随便拍脑袋出来的数字,这是 SpaceX 已经交上去的数字。

剩下两家,OpenAI 和 Anthropic 到底什么时候交表,现在不知道,并没有确定消息说它们已经把表交到 SEC 了。所以对它们来说,正规的 Pre-IPO 压根还没开始做。最后 IPO 之前的那轮融资才叫 Pre-IPO。

而且在美股上,Pre-IPO 并不像在 A 股上这么神秘,大家都可以上去搞。而且 Pre-IPO 的投资还会受到一些限制,比如锁定期。不是说上市之前冲进去,上市以后就可以马上割韭菜。正常 Pre-IPO 投资在上市以后并不能马上卖掉,还要锁定一段时间才可以卖。

为什么 Anthropic 会被炒到这么高

那为什么 Anthropic 会炒到这么高?大家是不是真的觉得 Anthropic 已经接近甚至要超过 OpenAI 的价值?

Anthropic 最近一段时间确实很猛。一方面,它的编程模型 Opus 4.6、Opus 4.7 确实很强。虽然 OpenAI 的 Codex 以及 GPT-5.5 能力提升很快,而且 OpenAI 的 Codex 和 GPT 其实要比 Anthropic 便宜很多,解决同样的问题,这边花的钱要比那边少很多。即使在这样的情况下,大家依然认为现在最好的编程模型,最好的真正能够干活而不仅仅聊天的模型,还是 Anthropic 的。

而且 Anthropic 背后是谷歌和亚马逊。它可以证明谷歌云很强,亚马逊云也很强,谷歌的 TPU 很厉害,亚马逊自己做的芯片,包括上面买的英伟达芯片都很强。它这块的通用性很好。谷歌和亚马逊又是它的大股东,也非常愿意顶着它继续往前走。

对于云计算厂商来说,支撑一个这种顶级大模型公司前进是有巨大好处的。为什么?不是说我们买了 token,Anthropic 上谷歌云、亚马逊云交钱就完事了,而是比如我今天想买一个云服务,因为我后面要使用 Anthropic 的 AI 服务,所以我愿意把它部署在谷歌或者亚马逊云上。因为离服务器近,不用出机房就可以找到 Anthropic 的 AI 服务,成本会急剧下降,效率会急剧上升。这对于它们自己卖云计算服务是有巨大好处的。

Anthropic 模型核心连接谷歌云和亚马逊云两座橡皮泥数据中心,企业客户小人把应用部署到云端,箭头标出“低成本”和“高效率”循环,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

Anthropic 与 Harness agent

还有一点,Anthropic 现在真正比较强的地方在于,它算是引领了时代。在这个行业里,现在到底谁挣了多少钱,谁有多少用户,重要吗?重要,但并没有那么重要。真正重要的是谁代表了先进生产力,谁代表了未来的方向。

现在大家玩的这一波叫做 Harness agent,也就是驾驭系统。这一波是从哪里来的?就是从 Anthropic 的 Claude Code 这里来的。现在大家都在围绕这一套东西往前走,包括 OpenAI 的 Codex,还有国内很多类似产品,都属于 Harness agent,也就是驾驭系统,都是从 Anthropic 这边来的。

而且现在大家去看 GitHub,每周最抢眼、star 涨得最多的开源仓库,通通都是围绕 Claude Code 和 Harness agent 的。这就说明这就是今年的方向了,所以这一块确实很猛。

三家公司上市进度与市场情绪

现在还有一个问题是,Anthropic 号称要上市。现在要上市的这三家,SpaceX、Anthropic 和 OpenAI,SpaceX 这事基本上确定了,已经交表了,等就好了。

而 OpenAI 麻烦缠身,一边还跟马斯克打着官司,山姆·奥特曼又是一个财务纪律非常涣散的人。IPO 不光是说可以上市割韭菜,IPO 必须要守一大堆规矩。因为一旦 IPO 以后,大家就再也没有优先股了。

什么叫优先股?就是除了有股票的标准价格和权利之外,还有一些优先权,这个东西叫优先股。因为一旦上市,所有优先股通通变成普通股。不能说谁的股票比谁的股票权利更多一些,这个事是有问题的。当然投票权可能会有差异,但是别的权利都是一致的。你说我这个股票给你的分红权比别人的股票多一些,这不行,这样外面买你股票的人就亏了。

所以一定要一致。当所有人都拿着普通股时,就需要靠一套很完善的规则来管理公司。股市会保证这些公司都符合一个基本规则去运转:我买了它的股票,它就不能骗我,不能做假账,挣了钱得跟我分。这些规则是要保证的。

而山姆·奥特曼本身不是一个特别守规矩的人。他自己的 CFO 也认为,他经常有一些大嘴巴,或者有一些财务上不是那么守规矩的地方。所以 OpenAI 到底什么时候能上市,不知道。

Anthropic 一直相对来说还是比较规范的,而且挣钱也是老老实实在挣。它说我要上市了,大家就相信它真的能上市,而且上市以后还能涨很多。现在也就是 3,800 亿,如果这个时候能冲进去,等它上市的时候一定能挣很多。所以大家会有很强的 FOMO 情绪。

什么叫 FOMO?就是 fear of missing out,害怕错过的感觉。大家会想,我们能不能提前上车?等上市以后股票开始涨了我再去买,这不就亏了吗?能不能在它没上市之前就冲进去?于是大家就会研究怎么冲上去,怎么上这个车。现在 PreStocks 这个公司就拿出了这样的产品,叫做 tokenized Pre-IPO,很多人就会冲上来买它,把这个价值冲得很高。

一群散户橡皮泥小人举着“FOMO”牌子追赶一辆写着“未上市上车”的巴士,巴士入口是 PreStocks 代币闸机,远处 IPO 钟声尚未敲响,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

如果买了这些代币,IPO 以后怎么办

三个误导和一个风险已经讲过了,再补充一点知识:如果你今天买了这些代币,上市以后怎么办?

它叫 tokenized Pre-IPO,那 IPO 以后怎么办?首先要说一点,PreStocks 这个创业项目非常年轻,2025 年才创建,所以到目前为止,它没有成功退出过任何一个项目。没有哪个项目说,我把 Pre-IPO 的 tokenized 卖掉以后,它成功上市了。这个事并没有发生过,所以这里面还有很大的不确定性。

理论上说,它应该是在 Pre-IPO 这个点上,把原来寄存在它这里的这些 SPV 权益首先送到股市上去。

比如这里有一个叫张三的 Anthropic 员工,手里分到了一部分 Anthropic 股份,然后他偷偷把这个股份卖给了一个 SPV。这个 SPV 把这一部分股份 token 化,送到链上交易。等到 Anthropic 上市了,张三自己把这个股票登记到自己身上,因为他是员工,然后再跟这个 SPV 做交割,说我把这部分再交割给你。它已经上市了,你可以到那边去买,或者做相应处理。他是可以做这样的操作的。

SPV 要在满足所有限制条件以后,把这些股票卖掉变成现金,然后再把这些钱还给原来买 token 的人。它大概是这样的一个流程。

一条从员工股票到 SPV 盒子、再到链上代币、最后到 IPO 现金回款的流程线,中间每个节点都有锁头和问号标记,投资人小人等待结算,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

有人问,交割的时候,也就是 SPV 买这个股票的时候,直接登记不就完了吗?问题就在这儿:Anthropic 不承认。你去登记,也要有人承认才行。所以大家实际上签的是个白条,或者不是一个特别正规、可以被认可的协议。

所以这个钱你现在交了以后,怎么把它变回来,这个过程可能会有一定不确定性。

说一个比较小概率的事件。比如在临上市之前,张三被开除了,他所有授予的股票都直接被没收了。那你在这交易了半天,这个东西就是一张废纸。这个可能性也是存在的,所以这就是一个重大风险。

最后总结:三个误导和一个风险

最后重新数一下三个误导。

  1. 第一个误导,是把链上 Pre-IPO 的隐含估值,当成了公司真实的融资估值。
  2. 第二个误导,是把 tokenized Pre-IPO 当成了真正买到了 Anthropic 股票。
  3. 第三个误导,是把二级市场的小盘交易价格,当成了 Anthropic 上市时一定能够兑现的市值。

最后要注意的风险是,这些 SPV 和代币化的敞口,是 Anthropic 官方不承认的。以前我们投资项目的时候,最后要签协议,所有相关股东都要签协议。有一个股东不签字,整份协议就失效。

今天这个故事,其实就是第一个误导的重要性。你说 1.2 万亿美金估值这件事完全是空穴来风、完全是假的吗?也不是。只是这里面有很多信息被隐藏掉了,没有跟大家对齐。所以今天把这个事情稍微对齐一下,希望大家能够对 OpenAI、Anthropic 有一个更理性的看待。


背景图片

最新编程跑分 ProgramBench,大模型全军覆没,AI编程真正可怕在哪?

2026-05-10 08:51:38

九个大模型角色站在写着 ProgramBench 的巨大计分牌前,计分牌显示全员 0%,旁边有黑箱可执行文件和代码碎片,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

最新编程跑分:大模型全军覆灭,但真正可怕的不是 0%

大家好,欢迎收听老范讲故事的 YouTube 频道。

这两天,AI 编程圈出了一个新的跑分,叫做 ProgramBench。这个测试非常狠:它不是让 AI 去改一个 bug,也不是让 AI 补一个函数,也不是让 AI 在现有项目里加一个小功能。

它直接把题目做成这样:给你一个已经编译好的可执行文件,再给你一份使用文档。你根据文档和可执行文件去测试:应该输入什么、输错以后该怎么报错。源码什么都不给,然后让 AI 自己规划,写出完整的程序。

这已经是一个完整的软件工程了。以前很多人都说,AI 可以写一部分代码,可以补个 bug,但你给它一个完整项目,它写不出来。老范自己做直播的时候,很多程序员也会说:

你看看,你让它做一个这个,你让它做一个那个,它做得出来吗?

原来确实做不出来,这一次测试也说明它做不出来。但是事情并没有大家想象得那么简单。

ProgramBench 的结果:9 个模型,全员 0%

九个模型头像围坐在测试长桌旁,每个面前都有红色未通过印章,中央是一摞写着 248853 tests 的测试清单,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

这一次一共用了 9 个模型做测试,全员通过是 0

测试大概选了 200 多个软件,都是大家比较熟悉的各种底层开源软件,而且给到模型的是已经编译好的版本。每一个软件都有很多测试项,比如输入这个参数应该怎样,输入那个参数应该怎样,错误信息应该怎么处理。整体加起来有几千个测试项,论文中给出的总测试项是 248,853 个。

9 个模型测完以后,没有任何一个软件的所有功能可以全部通过。所以这一次就是全军覆没。

参与测试的模型包括 Claude、GPT、Gemini 系列,其中有 Claude Opus、Claude Sonnet,GPT 有 GPT 5.4、GPT 5.4 Mini,Gemini 有 Gemini 3.1、3.0 Flash Pro 等,合计 9 个。

很多人看完以后的第一反应可能是:程序员这饭碗保住了,AI 吹了半天牛,最后还是没法完成完整的软件工程吧?

这句话在测试结果公布的这个点上是对的,但也只对了一半。因为我看完以后,真正让我冷汗直流的不是那个 0%,而是另外一件事:这个 Benchmark 已经把下一代 AI Coding Agent 要攻克的目标定义得非常清楚了——AI 要完成完整的软件

真正可怕的是:目标已经被定义出来了

你不要给它选型,不要告诉它要用 C、JavaScript 还是 Python。你就说:我有一个应用,这头输入什么,那头输出什么,你给我再做一个。

这有点像修车。原来是某个部件坏了,我要等原厂配件,非原厂配件不好。以后可能变成:我缺一个配件,你给我重做一个。这个配件长这样,输入是这些,输出是那些,你给我做出来就完了。

一个 AI 工程师根据旧零件的输入输出标注重新捏出新零件,旁边是从修车工具箱变成软件工具箱的对照构图,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

一旦目标被定义出来,接下来就不是会不会的问题,而是什么时候的问题。甭管是美国人做 AI,还是中国人做 AI,大家都喜欢干一件事:刷题。

原来没有一套题来规定未来要向哪个方向发展,大家就不知道该刷谁。当一套题已经明确未来方向,剩下的事不就是刷吗?所以 ProgramBench 出来以后,所有做 AI Agent、做软件的厂商,方向就已经明确了:奔着这个方向刷就完了。

从 SWE-Bench 到 ProgramBench

ProgramBench 是由 SWE-Bench 这个团队做的。SWE-Bench 其实已经是 AI 编程领域里比较难的测试了。

在 AI 编程领域,最早的测试方式是:我给你出题,让你做一个排序、一个算法,做完以后验证对不对。到 SWE-Bench 的时候,他们做了一件更狠的事:给你一个 GitHub 仓库,上面有一些 bug,也有人提 issue,说这里有问题、那里有问题。AI 要自己把代码拉下来,读清楚问题,提交补丁,把问题解决掉,再看通过情况。

这已经开始解决现实问题了。

现在的大模型跑 SWE-Bench,很多已经可以跑到 70 多分,也就是 70% 多的问题都可以自动搞定。而且这些大模型在 SWE-Bench 上已经有点拉不开差距了。即使是国内的大模型,比如 DeepSeek、千问、Kimi,在这块都已经跑得非常靠前。甚至有些模型还可以跟 Claude Opus 4.7 稍微掰掰手腕。

因为在大模型领域里,最容易提升的就是编程。编程比较确定:要求是什么,输入是什么,输出是什么,中间可能出现什么问题,应该怎么解决,这些都相对明确。大模型可以一遍遍刷,不对就再刷一次。而且它不光知道哪个是对、哪个是错,还知道什么样更好。所以大模型在编程能力上提升得非常快。

当一个 Benchmark 已经没法再区分大模型能力的时候,怎么办?那就出更难的题。就像考试时所有人都考 100 分了,老师就再出一套更难的题。ProgramBench 就是在这个背景下出现的。

三段阶梯式考试路线从算法小题走向 GitHub 修 bug 再走向完整软件重建,AI 小人背着工具包逐级攀登,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

ProgramBench 到底怎么考

这一次不是修 bug。修 bug 仍然是在一个已经完成的项目里工作:项目用什么软件、什么技术栈、什么编程语言、什么目录结构、什么架构,人家都写好了,只是里面有一些 bug,你进去修就行。

ProgramBench 没有这些,只有一个黑箱子。

什么叫黑箱子?就是我知道输入什么、输出什么,但不知道里面怎么处理。等于我给你一个黑箱子,剩下的你要把箱子里的东西做出来。

ProgramBench 的论文名字叫“大语言模型能不能从零开始重建一个软件”。它设计得非常干净,也非常狠。

研究团队给模型的东西只有两类:

  • 第一类:已经编译好的可执行文件。
  • 第二类:这个程序的使用文档。

模型可以运行这个可执行文件,比如加一个 -a、加一个 -b,输入一个文件名,再输入其他参数,观察应该出现什么结果。文档里会写这个软件是什么,有哪些参数。

这里测试的都不是有图形界面的东西,而是 text in, text out,基本属于 Unix 平台的规范:输入是文本,输出也是文本,跟图形界面关系不大。

研究团队不会给:

  • 源代码;
  • 测试用例 test case;
  • 项目结构;
  • 技术栈;
  • 应用内部使用了什么函数。

模型要自己运行程序,观察输入输出行为,然后推理它有哪些命令行参数、如何处理边界情况、出错以后怎么办。

一个封闭黑箱左侧接收命令行参数和文本文件,右侧吐出结果与错误信息,AI 用放大镜记录边界情况,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

比如应该输入三个参数,结果只输入了两个,程序应该怎么处理?应该输入大于 0 的数,结果输入了小于 0 的数,应该怎么办?出异常时应该输出什么错误信息?这些都属于边界情况。

程序内部大概有什么样的数据结构,也可以通过行为观察。比如一个执行文件收到一些数据后,会在目录里创建数据文件,把输入信息存进去。模型可以观察这些行为,再自己决定用 Python、C、Rust 还是 Go 来重写,整个项目应该如何组织。

所以 ProgramBench 跟 SWE-Bench 已经不是同一个层次了。SWE-Bench 相当于修车:车还在,坏了一个零部件,我把它修好。ProgramBench 则是:我想要一辆车,它要具备某些特性,比如看到红灯会停、看到行人会按喇叭,剩下什么都没有,你去造吧。

任务规模:真实软件,不是玩具项目

这次是 200 个任务,每个任务有一堆测试,总共 248,853 个测试项。任务不是玩具项目,而是真实软件项目。

比如:

  • 压缩工具:Zstd、LZ4、Brotli;
  • 语言编译器或解释器:PHP、Lua、TinyCC;
  • 数据库:SQLite、DuckDB;
  • 媒体处理工具:FFmpeg。

其中最大的项目是 FFmpeg,很多人做视频编解码都会用到。这个项目有 270 万行代码,也被放进测试里,让模型去重建。

压缩工具数据库编译器和 FFmpeg 四类真实软件像城市地基模块排列,AI 站在 270 万行代码高楼前准备重建,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

当然,这些软件并不全都像 FFmpeg 这样大。很多项目比较小,平均代码中位数是 8,635 行,能够到 270 万行的只有 FFmpeg 一个。

这次测试考验的是:AI 有没有能力做软件架构、系统推理和长期工程设计。

成绩细节:Claude 稍微领先,但也只是“接近完成”

成绩是全员 0%,真的是全军覆没。即使是最简单的应用,上最好的模型 Claude Opus 4.7,也没有通过全部测试项。

当然,在这批模型里,Claude 还是稍微强一些。

测试里有一个指标叫“接近完成”:如果所有测试项里大概有 95% 都通过了,就算接近完成。按这个指标计算:

  • Claude Opus 4.7:3%;
  • Claude Opus 4.6:2.5%;
  • Claude Sonnet 4.6:1%;
  • GPT 5.4:0;
  • Gemini 3.1 Pro:0。

也就是说,用 Claude 还有可能做出一个差不太多的版本,但用 GPT 和 Gemini,连 95% 都达不到。从这一点看,Claude Opus 4.7 还是稍微领先一些。

如果有人好奇:它到底是把最简单的项目完成了 95%,还是把 FFmpeg 这样最难的项目完成了 95%?答案和大家想象差不多:越难、越大的项目越难完成,完成度越低。能够完成 95% 以上的,一定是相对简单的项目。

这次测的是模型能力,不是最强 Coding Agent 能力

还有一个重要细节:这次测试并没有使用 Claude Code,也没有使用 Codex,而是使用了一个比较轻量级的开发 AI Agent,叫 mini-SWE-agent。所有大模型都是在统一的 Agent 上跑出来的。

如果现在让 Claude Code 或者 Codex 去跑这些测试,完成度可能会提高一些。所以今天讲的是测试中的大模型能力,还不是最强 Coding Agent 的能力。

现在想让 AI 完成完整项目,很多时候提升可能不在大模型本身,而是在 Coding Agent 上。

所以 ProgramBench 真正测出来的是:今天的模型加上一个很轻量级的 Agent,还没法完成完整软件的重建。这并不等于未来上 Claude Code、Codex 这种更强的 Coding Agent 以后就一定做不出来。

一个有趣细节:AI 也在千方百计“作弊”

在这个测试里,有一点很有意思:测试时命令这些 AI 不允许作弊,也就是不允许抄源代码。否则如果能拿到源代码再去做,就失去了考核目的。

但是 AI 都在千方百计地作弊。

它们的第一种处理方式,是先上 GitHub 找源代码,然后去改。发现这事不行,不能这么干。

第二种方式,是使用包管理,想办法把包含源代码的包拉回来,再研究怎么做。这个也不允许。

第三种方式,是去电脑里的包缓存目录翻。Unix、Linux 或 macOS 会有很多软件包,拉下来以后会缓存在某个目录里,以便后续更新和维护。模型就去这些目录里找源代码。

后来没办法,研究团队说:断网吧。

AI 戴着小侦探帽先翻 GitHub 路牌再翻包管理箱和缓存抽屉,最后被一把断网剪刀切断搜索线,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

所以这一次测试是在断网环境下进行的。这里的断网不是说不能连接 OpenAI、Anthropic 的服务器,而是说没有联网工具,不能使用搜索工具和 Web 工具,只能连接模型自己的服务器。这样才得到了一个相对公允的测试结果。

如果允许这些大模型联网,它们应该可以更好地复刻这些软件。

为什么 0% 反而让人冷汗直流

讲到这里,为什么老范看了这个测试结果以后会冷汗直流?这不是标题党。

因为这个 0% 并不是证明 AI 很弱,而是说明一个新的方向已经找到了。ProgramBench 表面上的结论是:今天的大模型还无法完成完整的软件工程项目。但更深一层的结论是:完整软件工程第一次被 Benchmark 化了

也就是说,这件事已经被做成题了。以后大家只管刷题就完了。这个才是真正让人紧张的地方。

在 AI 发展里,一个任务一旦被明确地定义下来,可以稳定评测、稳定排名,就会进入工业化刷题流程。所有 AI 厂商、AI Agent 厂商、开发工具厂商,都会拼命刷这个题。如果谁刷的名次很高,就可能拿到融资,这背后有经济利益刺激。

最早大家说 AI 到底会不会写代码,于是有了 HumanEval。很快这个测试就被刷漏了,所有模型都能得到很高分,拉不开档次。

再往后 SWE-Bench 出来了,说不要只做写死的题,去解决现实问题,到 GitHub 上改 bug。结果现在这个也快搞定了,又拉不开档次。

那干脆做完整的软件吧,ProgramBench 就出来了。

这意味着下一个阶段,所有模型公司、Agent 公司、开发者工具,都知道应该向哪里使劲了。要攻克 ProgramBench,至少需要这些能力:

  • 长期规划;
  • 行为探索;
  • 系统抽象;
  • 自动测试;
  • 多轮纠错;
  • 记忆管理;
  • 工具链协作。

你会发现,这正好是现在 AI Coding Agent 行业正在卷的方向。所有这些关键词最后都会汇聚到一个目标上:让 AI 从写代码片段,进化到维护、重建完整的软件系统。

七个能力齿轮标注长期规划行为探索自动测试多轮纠错等,共同驱动一条从代码片段通向完整软件系统的传送带,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

所以,0% 只能说明今天这些模型还做不到从头开始写软件。真正让人紧张的是:路线图已经清楚了,测试也已经放好了,大家上吧。

更可怕的事:AI 写的软件,可能根本不是给人读的

当然,这还不是最可怕的。最可怕的是:AI 写出来的软件,可能根本就没有考虑过需要让人读。

ProgramBench 里有一个很奇特的发现,比 0% 更值得软件工程师认真思考。论文提到,模型倾向于生成单个文件,写特别长的函数。公开材料里的对比很有冲击力:模型生成的代码文件很少,目录层级很浅,函数数量更少,但单个函数特别长,代码总量比原项目少很多。

左侧是人类工程师整理的多层文件夹和短函数积木,右侧是 AI 生成的一卷超长单文件代码卷轴,二者形成强烈对比,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

从人类软件工程的角度看,这一定是个很烂的项目。如果哪个程序员把程序写成这样,肯定会被劈头盖脸骂一顿。因为这种代码别人没法维护,他自己以后也没法维护,属于软件工程上完全不合格的代码。

但 AI 就给你写出来了。

很多程序员听到这个结论以后可能会觉得开心:AI 只能写这种代码,它不懂软件工程。千万别这么想。我们为什么要做复杂的软件工程?主要有两个目的。

第一,代码复用

代码写完以后,下次还要接着用。原因有两个:

  • 代码写起来很贵,复用以后可以降低软件生产成本;
  • 一个代码被复用后,只要改这个代码,所有相关地方都可以一起改,不需要每个地方单独改一遍。

第二,团队协作

一个项目通常需要很多人一起协作,因为一个人写不下来。而且人的记忆力是有限的。

我们经常批评 AI 的上下文很短,但 AI 有 100 万 token 的上下文,人却没有办法记住 100 万字的东西,并且精准告诉你第几行第几列写了什么。人没有这个能力,所以我们必须把函数写短,把项目规划好,把不同东西放到不同目录里。

把每个文件写短还有一个好处:修改其中一部分时,其他代码在其他文件里,跟它没关系,可以进行错误隔离。版本升级时,也只需要考虑修改过的文件,其他文件不需要重新考虑。它们的编译结果可以继续用,甚至测试结果都不用改。

这些都是人类维护软件工程时的考虑。

但 AI 可能不需要这些软件工程规范

现在对 AI 来说,很多问题可能不存在。

AI 不需要像人类一样代码重用,也不一定需要知道每个代码里有什么,到时候搜索就完了。需要修改时,它可以把所有相关东西都改掉。下次再烧点 token,重写一遍。它没有那么强的软件重用需求。

从团队协作角度看,它也不一定需要跟人协作。它可以跟 AI 协作。它有 100 万 token 的上下文,也可以有一套矢量数据库进行代码检索,把大量代码一把塞进去,然后精准快速定位哪一段在干什么。

所以我们认为在软件工程上完全不合格的代码,对于它来说反而很方便。

举一个最简单的例子。人写代码时,经常要求变量名、函数名要起得特别小心,稍微长一点,把函数具体干什么写清楚。为什么?因为下一个人要读。你不能写一个函数名叫 a,别人完全不知道它是干什么的。

但是对 AI 来说,函数名写长和写短有什么区别?只有一个区别:写长了多烧几个 token。除此之外没有本质区别。

如果代码根本不需要人看,它就不需要按照人类规范写函数名。它可以写短一点,省几个 token。AI 可以写出代码来,效率很高,执行得也很好,而且不需要进行人类理解上的区隔。它可以把整个东西都改掉,然后把所有测试跑一遍就完事。

最让人害怕的是,以后 AI 写代码,人类可能插不上手了。

最早 AI 叫副驾驶,叫 Copilot。我写完代码,它帮我改。后来 AI 在我写好的 GitHub 仓库里改 bug,它改完的 bug,我还是可以看明白,还可以接着弄。

但是 ProgramBench 之后,它写的代码我可能看不明白了。虽然语法还是编程语言,我还能一行一行读,但如果你给我一个 5 万行的代码,我从上到下看就会看傻。

人类需要对代码进行抽象、继承、架构设计。AI 可能不需要,只要代码能跑就完了。

机器真正执行代码的时候,本来就不关心变量名起得多好。人写的源代码里有复杂的软件工程设计,但很多东西在编译和优化时都会被扔掉。机器只需要知道变量里的数据存在哪个地址,不需要知道它叫什么长长的名字。

所以 AI 虽然现在还没有开始直接用二进制机器码写程序,但它现在写出来的程序,人已经很难再看了。我记得马斯克前面好像说过,以后 AI 写代码可能就直接写机器代码,直接写编译过的结果,不需要写那种由人参与、由人维护的代码。可能马斯克在这件事上更高瞻远瞩一些。

人类程序员站在可读源代码门外皱眉,AI 则把短变量名代码直接输送到机器码流水线,远处服务器顺利运行,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

巨型脚本可能不是屎山,而是一种新生产方式

ProgramBench 里最让我害怕的一点,还不是 AI 找到了正确方向、要开始做完整软件了,而是:今天 AI 写出来的巨大一坨脚本,可能不是屎山。

这种巨型脚本可能代表一种新的软件生产方式:

  • 它不优雅,但是便宜;
  • 它不适合人类阅读,但是适合 AI 重写;
  • 它不服务于团队协作,但是服务于自动化迭代。

还有一个很重要的点:这次作为题目的 200 个项目,都是 Linux、macOS、Unix 里很底层的模块,比如压缩、开发、媒体处理。程序员不可能每个人都从头从零做这些东西。

但现在 AI 开始测试:怎么把最底层的地基重建一遍。一旦 AI 可以快速重建整个地基,人类可能就逐渐不会写程序了。甚至它重写以后发现,不需要遵守原来的协议,自己内部调用就行;自己写一个很小的模块放进去就完事。那人类可能会离现实编程越来越远。

AI 用一整块巨型脚本砖快速铺设操作系统底层地基,人类程序员站在安全栏外看着压缩数据库媒体处理模块被重建,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

这对程序员、创业者和投资人意味着什么

对程序员:饭碗暂时保住了,但工作内容会继续上移

今天的大模型还做不到完整软件系统的重建,这说明软件工程仍然很难。特别是架构设计、需求澄清、长期维护、系统安全、团队协作、业务理解,这些能力仍然是人类的优势。

但是不要把 0% 理解成完全安全。因为 AI 最擅长的就是沿着 Benchmark 快速迭代。

程序员真正要做的,不是证明 AI 不行。很多人特别喜欢干这个事,但这对你没有任何好处。

程序员真正要做的,是把自己从代码执行者升级成:

  • 需求定义者;
  • 系统验收者;
  • 工具链组织者;
  • 质量负责人;
  • 业务和技术之间的翻译者。

未来最危险的程序员,不是不会写代码的人,而是只会写代码,却不会定义问题、验证结果、控制风险的人。这些人可能就要失业了。

对 AI 创业者和投资人:新的 Benchmark 已经来了

对于 AI 创业者来说,Benchmark 已经来了,卷吧,上去刷。

对于投资人来说,谁刷得好就投谁,这就是未来的方向,而且非常明确。

旧的榜单依然有效,SWE-Bench 还是有效的。它现在并没有被刷到 100%,大概是 70% 多,还可以继续往上刷,只是已经没有特别大的区隔度。大家都刷到 70% 多以后,再往上刷一点就很难拉开差距。

后面就可以盯着 ProgramBench 了。

总结:0% 不是终点,而是新战争的起点

0% 不是终点,而是新战争的起点。对于程序员来说,这当然是一个短期安慰:又活过了一天。但它也是一个更危险的信号。

第一,AI 正在向着直接从零开始完成完整项目的方向发展,而且 Benchmark 出来以后,大家会快速向这个方向迭代。

第二,AI 写的程序以后人可能读不懂,人也没有办法再到 AI 程序里修修补补。到那个时候,大家就不要再去卷“我比 AI 更懂编码规范”这件事了。

我记得在猎豹的时候,傅盛有一次抱怨过一个事情。他女儿写小学作业时倒插笔,也就是写中文笔画顺序是错的,被他老婆狠狠批评了一顿。他回来跟我们抱怨:

到现在了,大家以后都使电脑了,你管他写什么笔画呢?只要能认出来不就完了吗?你让她费这么半天劲去笔画正确,这有什么意义呢?

我们现在如果继续坚持软件工程规范,可能就像当时要求孩子写字不能倒插笔一样。

未来可能是:我们的软件可以执行,功能跟原来的软件一致,甚至比原来的软件更好、更快。因为 AI 的写法没有那么多抽象、没有那么多架构,用巨大的单体函数写出来,可能会跑得更快。每一次代码抽象,对计算机来说本质上都是一次地址跳转;少跳转几次,速度就可能更快。

所以未来方向已经确定了:AI 不再只是代码助手,而是完整软件工程师。程序员要做的事情不再只是写代码,甚至连看代码都未必需要你看,而是如何定义需求、如何验收结果、如何进行安全把控。

大家一定要把这个事情搞清楚,这就是未来的方向。

好,这个故事今天就讲到这里。感谢大家收听,请帮忙点赞,点小铃铛,参加 Discord 讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

背景图片

三星家电为何卖不动:高端不尖低端不狠?

2026-05-08 08:54:14

封面构图中左侧是逐渐变空的三星家电卖场展台,右侧是发光的存储芯片、显示面板和全球供应链线路图相互连接,表现从终端消费市场转向上游供应链的战场切换,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

三星并不仅仅是撤退,而是转换了战场。消费品退出中国市场背后的全球供应链转向,到底是什么样的?

这两天有一个很有时代感的消息:三星电子宣布,在中国大陆市场停止销售所有家电产品。停售范围包括电视、显示器、大型商用显示器、空调、冰箱、洗衣机、干衣机、音响、投影仪、吸尘器、空气净化器等。不过,三星手机在中国仍然正常销售,售后也继续按照中国消费者权益保护法和国家三包规定提供。

表面上看,这是一个外资品牌退出中国市场的故事。当年三星手机就在中国市场上几乎消失,彻底败退。现在虽然还有得卖,但是销量已经非常少了。今天轮到了三星家电和电视。中国家电、中国手机把日韩品牌和欧美品牌打得节节败退。

但我想把这个故事反过来讲。我的核心判断是:三星不是简单地离开了中国,而是在中国市场里换了个位置。它从面向普通消费者的终端品牌,转向了更上游、更底层、更全球化的供应链位置。

也就是说,三星虽然不在中国卖电视了,但是它依然会在中国生产芯片。全球 AI 服务器、手机、PC、汽车电子,依然离不开三星的存储芯片、显示面板和关键零部件。而这些东西很多依然是三星中国工厂在生产,甚至三星还在中国继续扩大相应产能。

所以今天真正值得聊的不只是三星为什么卖不动了,而是为什么中国市场会把外资终端品牌挤出去;为什么他们一边从中国终端消费市场撤退,一边还在中国布局其他核心产能。这背后是不是全球供应链格局正在发生的一个转变?

三星到底停了什么:不是所有业务都退出中国

画面中央是一张中国大陆市场业务调整清单,电视、冰箱、洗衣机等家电图标被移出货架,旁边手机、芯片和售后服务窗口仍然亮着,表现停售范围和保留业务的边界,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

首先,这次三星到底停了什么?别把家电停售说成所有业务都退出了。

2026 年 5 月 6 日,三星中国发布业务调整通知:

为应对急剧变化的市场环境,经审慎研究,三星电子决定在中国大陆市场停止销售含电视、显示器在内的所有家电产品。

停售范围主要有三大类:

  • 视听影音类:电视、显示器、大型商用显示器、音响、投影仪。大型商用显示器,就是我们在很多商场或者火车站里看到的那种巨大的、拼在一起的显示设备。
  • 白电类:空调、冰箱、洗衣机、干衣机。
  • 生活电器类:吸尘器、空气净化器。

这三类里,真正我比较遗憾的是显示器。大家要知道,三星的电竞显示器和电脑显示器还是相当棒的。

但是这里有几个边界必须讲清楚。

  • 第一,三星手机产品仍然在正常销售。三星手机在中国败退之后,并没有彻底退出中国市场,只是不再参与大范围手机品牌竞争了,一些高端机依然还在销售,虽然量并不是很大。它把中国所有三星手机相关的研究所都关了,把三星在中国的手机工厂也都关了,通通搬到越南去了。
  • 第二,三星并没有说中国大陆市场所有业务都退出了。人家还有新的业务在开展,甚至还在增加投资。
  • 第三,对于已经购买的用户,售后维修、客户商谈渠道、授权服务中心、400 热线、微信小程序、在线咨询等渠道,按照三星官方说法,仍然会继续提供服务。

所以,如果标题写“三星彻底退出中国”,很容易过度渲染。更准确的说法是:三星停止在中国大陆销售家电、电视、显示器等消费电子和家电产品了。手机业务还在,存储芯片、显示等上游业务还在,售后服务还在依法继续。

这就是第一个反转:看起来是退出中国,实际上是退出中国终端家电消费市场。

三星为什么在中国变得高不成低不就

第二层,在中国市场里,三星为什么变得高不成低不就了?这是它退出中国的一个最核心原因。

接下来讲最直接的问题:三星家电为什么卖不动了?

中国市场非常奇怪。我们并不是不认外国品牌,我们也认,但是通常只认最好、最贵的那一个。剩下其他的,我们会觉得中国人自己也能造。对于三星来说,它就比较痛苦了:高端不够尖。

在中国高端家电和高端电视市场,消费者愿意付溢价,但是溢价的理由必须非常清楚。比如说我们愿意买索尼的电视,但是你说三星的电视,我为什么不去买个小米、华为或者海信就完事了?你比他们真的强到哪去了?

特别是现在消费降级,大家都需要比价、比性价比,三星在这块肯定是打不过的。这也像手机一样。三星说我是高端手机,你有苹果高端吗?我去买 iPhone 不就完了吗?你说我是中端,那跟华为比,人家还有爱国情怀,你又比不过人家。低端你更打不过了,中国有这么多低端品牌。

在中国的高端用户买电视、冰箱、洗衣机,可能会选择日本品牌。他们会觉得日本品牌更加精细,而且电视有一个很重要的东西,就是颜色是不是准。索尼电视在这方面确实很强。三星这样的韩国品牌,在中国天然不被认为是一个特别贵的品牌。所以它去卖一个很贵、很高端的商品时,打不过这些欧美品牌。

国内现在这些电器品牌,比如华为、小米、海尔、美的,也在向高端冲。在这样的情况下,三星怎么跟人竞争?

在中国市场,它的问题就是:它不像苹果、索尼那样形成不可替代的高端心智,也不像部分日本品牌那样在一些很细分的领域里被认为特别专业。索尼就属于特别专业,包括游戏机、相机,很多人就是要买索尼。三星也不像华为、小米那样,还可以讲爱国情怀。

所以在高端上,不是说价格贵就可以叫高端。真正的高端,是用户愿意为品牌故事、技术壁垒、服务体验、审美符号长期付费。三星的问题就是,在中国家电市场里,它的品牌溢价越来越难讲明白了。

画面是一台三星电视被夹在上方发光的高端品牌王冠和下方密集的低价国产品牌价格标签之间,两侧消费者分别看向索尼、苹果和小米、海尔货架,表现高端心智不足与低价竞争挤压,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

低端就更不用说了,中国一堆卷王,你跟谁比低端?中国家电行业肯定比它卷得多。海尔、美的、格力在白电领域里真的是深耕,三星跟他们完全没法比。TCL、海信、小米在电视显示终端上也打得非常凶。

卖显示器打不过,卖面板反而更划算

但是要注意一点,什么样的显示器卖得最好?我打游戏用显示器,很多人会选三星面板。因为你如果直接买三星的显示器很贵,买带三星面板的其他显示器,相对来说就比较便宜,而且质量很好。显示器最核心的就是那块面板。

所以三星依然在中国生产面板,但是它不在中国卖显示器了。因为卖显示器这件事,它跟中国品牌打不过。这个点正好说明了三星这一次决策的核心动力:我跟你们卷显示器卷不过,那我干脆造面板,然后你们挨个来买我的面板去出显示器,你们去拼个你死我活,我保证我的利润就完事了。

画面左侧是三星面板工厂输出一块块发光屏幕面板,右侧多家中国显示器品牌把面板装进不同外壳并在电商价格牌前竞争,表现从卖整机转向卖核心部件更划算,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

在以旧换新、国补、平台券、直播间价格上,三星整个销售环节并没有中国这些品牌灵活。三星如果跟着降价,利润就会被打穿。对于一个国际品牌来说,他们会要求每一个国家的市场都要单独盈利,不能说我在全世界挣了钱,来补你这一块市场,这事不行。在中国市场,你要想盈利,就跟其他这些品牌没得打了。

这就是中国消费电子市场最残酷的一面。高端需要信仰,每一个高端品类里,我们可以允许一到两个现在难以超越的海外品牌存在下去,比如日本品牌、美国品牌、欧洲品牌。但是你一个韩国品牌,电视上打不过索尼,冰箱、洗衣机上飞利浦、博世也打不过。中端要性价比,这事你肯定搞不定。低端三星又不愿意亏钱。

所以三星卡在一个高不成低不就的位置上:品牌不够神,价格不够狠,那只能选择退出

国补为什么没有把三星留下

第三层,大家可能会想,国补发了这么多以旧换新补贴,是不是没给三星发?是不是歧视人家?真没有。你买三星电视,也是可以用以旧换新补贴的。

那为什么国补救了这么多中国电器厂商,没有把三星留下?原因很简单。什么人会去使用国补?去买索尼的人,去买最贵冰箱的人,他们会在意国补吗?在意国补的人一定是消费降级的人。我现在要数着钱包里的钱过日子了,因为有国补,我才要去消费一下。

对于这些用国补的人来说,我会去买三星吗?凭什么?我去买个便宜的不成吗?我实在想用三星的显示器,也可以买三星面板的其他显示器,人家还更便宜一些。所以一定是最在意性价比的人,才会去用国补,而这些人是不会去买三星的。国补这件事情,对于三星基本上没有什么帮助。

画面中消费者拿着以旧换新补贴券走向标着高性价比的国产电视和冰箱货架,远处三星高价展台人流稀少,补贴券箭头主要流向低价商品,表现国补与三星目标客群错位,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

广告也很难形成正向循环

那你说三星好好打广告行不行?在中国打广告是有用的,但是广告投放有一个正向循环的规律。如果无法达到正向循环,就会越投越亏。

什么叫正向循环?就是你先投广告,卖好东西,然后有一定转化率。转化以后,用户体验还不错,买了你的产品感觉挺好,口碑积累下来,品牌价值上升。这个时候再打广告,就可以事半功倍,少花点钱得到很多转化,这叫正向飞轮。

但是三星在中国消费电子市场,广告很难形成正循环。对于中国人来说,我为什么要买一个韩国产品?我为什么不去买日本产品?我为什么不去买美国产品?如果我实在穷的话,我爱国去买个中国产品不行吗?

当一个品牌在用户心智里已经不是首选的时候,它再怎么打广告都不划算。如果广告只是购买短期流量,不能沉淀长期品牌资产,那广告就会变成费用,而不是投资。对于三星这种全球公司来说,这个账算得很明白:我做这事不划算。

三星手机是前车之鉴:在中国输掉,不等于全球失败

那么,三星退出中国消费市场,是不是中国人就赢了?手机就是前车之鉴。

三星基本上是退出了中国手机市场,把中国的研发中心、中国的工厂全关了。虽然还在卖,但是要注意,卖手机比卖电视的成本低很多。它不需要巨大的卖场,也不需要去跟线上卷。

三星退出中国市场之后,在全球还是老大。很多人看到三星家电停售,就联想到了三星手机。这个联想是对的,但也容易误解。

三星手机在中国市场的故事大概分几步。2013 年前后,三星曾经在中国智能手机市场里独步天下。当时我印象里,北京长安街上所有公交车站牌,广告都非常贵。三星每次发新手机,不管是 S 系列还是 Note 系列,都会把北京市长安街、十里长街上所有公交车站牌全刷满。

后来华为、小米、OPPO、vivo 这些本土品牌崛起,实际上也很难撼动三星的位置。一直到三星 Note7 电池事件之后,三星在中国的品牌受损巨大,品牌就彻底废掉了。

2018 年、2019 年,三星觉得这事玩不转了,陆续关闭天津、惠州等地的中国手机工厂,也关闭了三星中国实验室。我以前有很多同事是从三星中国实验室出来的。到 2019 年,三星结束了在中国的手机生产,包括研发,但是仍然保留销售。虽然卖得不多,但还是在卖。而且在那以后,三星就再也不去刷广告牌了。

画面是一条时间线从北京公交站牌上密集的三星手机广告,过渡到关闭的中国手机工厂,再延伸到全球地图上仍然明亮的三星手机销量柱状图,表现中国边缘化与全球领先并存,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

这里要注意的是,三星手机不是全球失败,它只是在中国市场被边缘化了。在全球市场,三星手机长期仍然是最重要的安卓手机品牌,没有之一。从手机销量来说,它一直都是全球第一,这么多年从来没有掉下来过。从销售额、利润来说,可能苹果会更高一些,因为那玩意儿贵。

这说明,一个外资品牌在中国输掉终端市场,不等于它在全球也输掉了产业地位。三星手机已经证明了这一点。今天三星家电和电视,也可能重复这个逻辑:中国市场不划算,我不做了,我退了;全球市场还有利润,我们就接着卷、接着做;中国制造供应链和上游产能有价值,我接着布局、接着投资。

为什么同样的打法在中国不灵了

中国市场跟全球市场的差异在于,为什么同样的打法在中国就不灵了?三星的很多策略和中国企业其实没有本质差异。它也是做性价比,也在砸广告,也上新品,也想着在不亏损的情况下尽可能抢占市场份额。那为什么在中国市场,它就搞不定这件事情?

中国企业更能够接受短期亏损和极低利润。我愿意赔钱,我熬死你。我死不死不重要,我要你死。中国企业在本土市场有几个优势:

  • 第一,供应链响应极快;
  • 第二,渠道反馈很快;
  • 第三,组织决策快;
  • 第四,对于低毛利、高周转、直播间大促、平台补贴更加适应。

说白了,就是中国企业比它更卷。

中国企业对于先抢份额、再找利润的容忍度极高,就是我亏得起,哪怕我也死了,我也得熬死你。所以很多中国企业的打法是,先把市场打下来,先把渠道占住,先把竞争对手挤死,利润以后再说。

三星当然也会打价格战,但是它毕竟是一家全球化公司,不能只看中国一个市场。它还要看全球品牌定位、全球利润率、投资者预期、供应链资源配置。

但是中国这些品牌也不要高兴得太早。中国品牌在中国是胜出了,但并不等于可以在全球轻松赢下三星。就像手机一样,我们卷来卷去,在全球三星依然是老大。

电视市场:出货量和收入份额不是一回事

以电视为例,三星官方在 2026 年仍然强调,根据 Omdia 的数据,三星 2025 年全球电视市场收入份额占 29.1%,连续 20 年全球第一。大家一定要注意,连续 20 年的全球第一。在 2,500 美元以上的高端电视市场,三星也强调自己仍有很高份额。2,500 美元就是 1 万块钱以上。

同时,Counterpoint 等机构数据也显示,TCL、海信等中国电视品牌在出货量维度上,对三星形成了非常强的挑战,甚至在 2025 年 12 月的月度出货量上短暂超越过三星。

但出货量跟最后卖了多少钱是两个概念。我卖好多特别便宜的电视,是可以在出货量上短暂超越你,但是从整体销售额上来说,三星人家就是连续 20 年的第一。

画面是两组并排天平,左边堆满大量低价电视纸箱代表出货量,右边少量高端电视旁叠着更高金额钞票代表收入份额,中央标注全球电视竞争分层,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

这说明,全球竞争已经进入更复杂的阶段。中国品牌在出货量、价格段、供应链效率上,追得确实很快。三星在收入份额、高端市场、品牌、渠道、操作系统和服务业务上,仍然有很重的积累。所以不能简单地说中国品牌就已经胜出了,这还很困难。

更准确的说法是,中国品牌在中国本土终端市场上确实占据了明显优势,而且让三星觉得在中国继续卖下去不划算。在全球中低端和部分高端市场上,中国品牌正在快速推进。但是三星、LG、索尼、博世、西门子等外资品牌,在全球不同区域、不同品类、不同价位上,仍然有坚固防线。我们想战胜他们非常非常难。

三星退出中国,不是中国品牌终局胜利,而是全球战场的一个分层。

这里还有一个很重要的点:原来三星可能很多家电是在中国生产的,现在因为美国的关税政策,它连在中国生产家电再往外卖这件事都不划算了,所以干脆不跟你费劲了。

不只是三星:外资消费品牌在中国普遍换赛道

其实这些年,从中国消费市场上撤退的不只是三星。如果只看到三星,我们会觉得这是个个案。但是如果把时间线拉长一点,会发现很多日韩和欧美消费品牌都在中国经历了类似过程。

  • 三星手机生产撤出中国;
  • 索尼手机在中国的存在量基本上等于零了;
  • 夏普、东芝等日系家电品牌在中国的存在感已经大幅下降;
  • 松下、日立等企业在中国其实更多强调工业零部件、汽车电子和 B2B 方向了;
  • 很多欧美消费品牌在中国大众终端市场上也越来越难以直接竞争了。

这里不是说这些企业全都离开中国了。恰恰相反,很多企业在中国换了赛道,甚至还在加大投入。它们把终端消费市场让给中国本土品牌,自己去做更上游、更专业、更稳定、更高利润的环节,而且还是在中国做。

画面是一条分叉赛道,前方大众消费货架由中国品牌接管,另一条通向工业零部件、汽车电子和 B2B 设备车间,日韩欧美品牌小旗沿着上游赛道移动,表现外资消费品牌换赛道,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

这就进入真正重要的主线:全球供应链不是简单的中国替代外资,它更像是中国本土品牌拿下了本土终端市场,外资品牌退出了低效内卷的中国终端市场;外资企业保留核心技术、核心零部件、工业设备、关键材料和全球高端渠道;他们换赛道了;中国制造继续嵌入全球供应链。

三星在中国押注的是更底层的东西

以三星为例,三星并没有真的走掉,它在中国押注了更底层的东西。

现在讲第二大反转:三星不卖冰箱电视了,但是三星并没有离开中国。三星在中国更重要的资产是什么?

大家看看韩国股市,不断创历史新高,三星、SK 海力士都做了巨大贡献。三星为什么能够在股市上屡创新高?他们做存储芯片,做 SSD。大家知道他们做 SSD 的工厂在哪吗?在西安。

三星在中国更重要的资产,不是电视卖场里的展台,而是半导体存储、显示供应链和制造网络。

公开报道显示,三星西安 NAND 闪存工厂仍是其全球存储供应链重要组成部分。NAND 是做什么的?就是做 SSD、SD 卡,包括手机上的这种存储。

现在我们使用的存储大概有三种:

  • 第一种叫高速显存 HBM,这个东西三星在中国国内是没有的。
  • 第二种是内存,也就是 DDR、DRAM,这块三星的产能也不在国内,SK 海力士比较强,他们的产能是在无锡。
  • 第三种就是做 SSD 硬盘的这块,也就是 NAND,三星有一块重要产能就在西安。

2024 年 4 月,韩国媒体 ChosunBiz 报道称,三星正在对西安 NAND 工厂进行设备更换和产线升级,目标是从相对老的 NAND 制程向更高层数、更先进的产品过渡。

同时,三星 2026 年一季度财报显示,公司合并收入 133.9 万亿韩元,营业利润 57.2 万亿韩元;半导体业务收入 81.7 万亿韩元,营业利润 53.7 万亿韩元。这个背后主要就是在生产各种各样的存储设备,这里头肯定很大一块是在西安造的。

所以对比一下,电视、家电、显示器这些终端产品,在中国市场继续卷是不划算了。在 AI 时代,就要去卷存储芯片。这就是三星最理性的选择:不和中国品牌在中国卖场里拼每一台冰箱,而是在全球 AI 供应链里卖更上游、更高价值、更高利润、更难以替代的东西。

画面中央是西安 NAND 闪存工厂的洁净车间,芯片沿着传送带流向 AI 服务器、手机和 PC 图标,旁边关闭的家电展台形成对比,表现三星把资源投向更底层的存储芯片供应链,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

所以三星不是被中国市场打没了,而是把低回报的战场砍掉,把资源投向高回报的战场。

德国企业也在做类似的事情

只有三星这么干吗?其他人也这么干。德国企业也在做类似事情。

比如卖汽车这件事,原来大众、宝马、奔驰,包括保时捷,在中国都是可以卖很多车的。但是现在,中国电动车产业上来了,比亚迪、理想、问界、小米、蔚来、小鹏、极氪等品牌不断挤压这些合资和外资品牌。智能座舱、辅助驾驶、补能生态、价格战,都让这些传统外资车企非常难受。

德国企业并没有离开中国。他们反而在做另外几件事情:

  • 在中国设立研发中心;
  • 和中国的智能驾驶、电池、电机、电控企业合作;
  • 把中国市场变成全球新能源车技术的学习场;
  • 让博世、大陆等零部件和工业企业继续深度参与中国供应链。

这和三星的动作其实很像:终端品牌在中国承压,上游产业链和工业能力继续加码。中国不再只是消费市场,而是全球技术迭代和制造网络的一部分。

真正的变化:终端消费市场本土化,上游核心供应链全球化

画面是一张两层结构图,下层中国本土商场里家电、手机、汽车终端品牌高度本土化,上层芯片、材料、设备、软件和全球渠道节点跨国连接,箭头显示终端本土化与上游全球化同时发生,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

这就是全球供应链格局的一个转变。真正的产业变化,是终端消费市场本土化,上游核心供应链全球化。这才是真正发生的事情。

过去几十年,全球化有一个典型模型:欧美日韩掌控品牌、设计、技术和渠道,中国负责生产,中国消费者购买这些外资品牌的商品。

但是现在,这个模型正在发生变化。新的模型更像是:中国企业掌握本土终端品牌、渠道、产品定义、性价比和消费者运营;外资企业保留部分高端品牌、核心零部件、材料、设备、芯片、软件平台和全球渠道;中国市场本土化,全球供应链重新分层。

在这个模型里,三星这样的公司会做三件事情:

  1. 退出中国低回报、强内卷的终端消费市场。
  2. 继续在全球高端市场和非中国市场销售电视、家电和手机。
  3. 在中国和全球继续布局半导体、存储、显示等核心产业链。

这不是情绪化的撤退,而是利润驱动的战略收缩。商业公司最诚实的地方不是喊口号,而是资源配置。它把人、钱、产能、渠道、广告预算投到哪里,哪里才是它真正相信的未来。

中国企业赢了本土市场,但下半场更难

对于中国企业来说,这是胜利,也是压力。至少我们赢得了中国国内市场。三星退出中国家电市场,当然是一个胜利信号。这说明中国品牌在本土终端市场的确建立了压倒性优势。中国供应链的效率、价格能力、渠道密度、服务网络,已经强到让全球巨头觉得不值得继续打。

但是这也带来了一个新问题:中国企业接下来要面对的,不是如何在中国打败三星,而是如何在全球供应链高价值环节上继续前进。

中国企业赢下终端市场之后,能不能赢下高端利润?能不能赢下核心零部件?能不能赢下全球品牌溢价?能不能赢下操作系统、服务收入和长期用户关系?能不能在不靠低价、不靠补贴、不靠内卷的情况下继续赚钱?这才是真正的下半场。

所以我不建议简单地把今天的事情理解为“三星被中国品牌打跑了”。三星不是简单地走了,它只是从中国商场的电视展台上退下来了,走进了全球供应链更深、更上游、更挣钱的位置。

而中国企业真正的挑战,不是把三星从卖场里赶走。真正的挑战是,当三星不再跟你抢冰箱、电视、洗衣机,而是在 AI 存储芯片、显示、材料、设备这些上游环节继续赚钱的时候,中国企业能不能继续向上打。这才是这条新闻背后最值得关注的变化。


背景图片

豆包68到500元:5层认知差看懂AI收费!

2026-05-07 08:48:50

巨大的豆包聊天气泡站在价格标签、GPU 芯片和电力塔之间,普通用户在前景抬头观察,画面用分层台阶表现免费入口与付费智能的距离,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

从豆包收费争议,看普通人的 AI 认知差

从豆包要开始收费、大家开骂这件事,我们来看看普通人的认知差到底能有多大。

这两天很多人都在骂豆包:不是说永久免费吗?怎么突然就一个月 68、200、500 了呢?以后免费版是不是就没得玩了?是不是就变笨了?字节是不是没钱了?玩不起别玩啊。

但这些问题都太表面了。真正值得聊的,不是你要不要给豆包交 68 块钱,而是:中国 AI 的免费时代可能正在结束

普通人第一次发现,智能可能会像专家号一样。专家号是什么?就是在医院里,你要花更多的钱去看特需门诊。智能以后可能真的是:普通人用比较笨的,付得起钱的人用最好的。你以为自己还在免费用 AI,其实已经被放进了一个新的算力等级制度里。

这一期的核心判断很简单:

  • 豆包不是因为没钱才收费的,后面会简单算一下这笔账;
  • 免费用户也不可能完全不受影响;
  • 字节真正想做的,是趁着豆包用户量遥遥领先,把 AI 竞争从“谁免费谁用户多”,强行切换到“谁敢收费、谁占领用户心智高地、谁能够跑通商业闭环”的下一个阶段。

这就是普通人的认知差。你以为 AI 是一个免费 App,其实它背后是一座云计算工厂、一座电力工厂、一套 GPU 军备竞赛,外加一场用户心理战。

手机里的免费 AI App 图标背后连着云计算机房、电力线路和成排 GPU 服务器,前景用户只看到简洁按钮,背景工厂正在高速运转,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

当然,中国用户跟国外用户还不太一样。国外的 AI 从诞生第一天开始就在收费,AI 收费是一件比较天经地义的事情。虽然 ChatGPT 有免费版本可以用,但它会处处告诉你:你要充会员,你要升级,它会不停提醒你这件事。

豆包收费事件的时间线

一条横向时间轴从五一假期延伸到 App Store 订阅页面,三个价格牌 68、200、500 依次出现,旁边媒体放大镜和官方声明纸张形成事件链,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

先把这件事的时间线简单捋一下。

2026 年 5 月 4 日前后,大家注意,当时还在五一假期里,豆包 App Store 页面出现了付费订阅、付费版服务声明。多家媒体转述了 App Store 页面和界面上的信息。

目前看到的收费分三档:

  • 标准版:68 元一个月;
  • 加强版:200 元一个月;
  • 专业版:500 元一个月。

官方也出来解释了。豆包官方对外核心口径大概是:

豆包始终提供免费服务,在免费服务基础上,探索更多的增值服务,相关方案仍在测试,正式上线会通过官方渠道发布完整信息。

接近豆包的人士透露,付费功能主要集中在复杂任务和生产力场景上,比如 PPT 生成、数据分析、视频制作。大家注意这 3 点,就是哪些地方可能会收费,因为这些任务更消耗算力和推理时间。

第一层结论是:这不是豆包明天就要开始全体收费,也不是免费聊天马上就要消失。更准确的说法是,豆包正在把原来混在一起的免费功能,拆成免费入口、增值能力、高端生产力服务几个不同层次。

第一层认知差:AI 不是普通 App

普通人的第一重认知差是,他们会认为:AI 不就是个软件吗?你让我用不就完了吗?

特别是在国内,很多软件都是免费的。抖音是免费的,微信是免费的,百度搜索是免费的,B 站、微博、小红书的基本功能也都是免费的,那 AI 有什么不能免费的呢?甚至有人说,字节这么有钱,抖音这么赚钱,豆包多几个用户也是给你拉用户来了,你就大方点,有什么问题吗?

但 AI 和传统互联网产品真的不太一样。

传统软件和内容平台的成本逻辑

拿 Netflix、长视频平台、软件平台来比较。传统软件包括这些视频平台,剧拍一次就完事了,或者软件做一次就完事了。虽然后期软件可能还需要维护,但剧真的是拍一次就完事了,成本已经锁死。

再往后多一个人看,边际成本就下降一点点;看的人越多,边际成本越低。而且看的人多了以后,没准还能多挣点广告费回来。前面拍视频的钱花过一份就完事了,不会因为多了 100 个人看,就需要多出一些视频成本。

写软件也是一样。软件写好了,一个人买,是一个人摊成本;十个人买,是十个人摊制作成本。

所以以前这些互联网软件为什么大多是免费的?因为把用户拉进来,多一个用户,成本不上升,但收入可能上升。

AI 的成本逻辑完全不同

AI 稍微有一点差距:每个用户的每次请求,都需要重新去算。

用户越多、越喜欢用,平台就要烧越多 Token。重度用户不是优质用户,可能是成本炸弹。

你问它:“今天天气怎么样?”它回答一下。另一个人上来就说:“你去给我做 10 个视频出来。”这两种请求消耗的 Token 肯定天差地别。

普通人认为豆包是在卖会员,真实情况是:豆包是在尝试把不可控的算力成本变成可预测的收入结构

它还是分开的:如果你就是每天问个天气、问个好,这些事依然可以免费用;但你上来就要做视频、要干活、要让 AI 做生产力任务,那就应该老老实实交钱。

这是 AI 商业模式的第一道坎:不是有没有用户,而是用户越多,到底是越赚钱还是越烧钱。

左侧传统 App 用户越多成本曲线越平缓,右侧 AI 请求像一枚枚 Token 硬币掉进 GPU 计算漏斗,重度用户旁边亮起成本炸弹图标,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

比如你进去问一句“今天天气怎么样”,问完以后就一头扎到抖音里直播购物去了,对字节跳动来说,你就是个好用户。你没烧多少 Token,然后又到抖音里拼命买东西。

但如果像我这种,抖音那边不怎么买,拎着豆包就开始狂问,让它写报告、分析数据、写 PPT、做视频,那就属于字节跳动不太欢迎的用户了,所以才需要分层。

第二层认知差:免费版不可能完全不受影响

普通人的第二层认知差是,他们会相信豆包官方的话,认为免费版不会受影响。

这几乎是不可能的。只要开始收费,免费版必然受影响。

官方讲基础服务继续免费,大概率是真的。但问题在于,免费继续存在,并不等于免费体验不变。

两条并行通道通向同一个 AI 机房,付费用户走快速明亮通道,免费用户在较窄队列中等待,墙上标着算力优先级和体验分层,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

免费用户的算力优先级会下降

高峰算力不足的时候,系统一定会排队。

这些 AI 公司背后其实是云计算公司。云计算公司有一个非常重要的指标,就是开机率。比如在高峰时间还能服务所有人,大家都觉得好快,那说明什么?说明机房建多了,这对云计算公司来说是不对的。

高峰时间的访问量,可能是低谷时间的几百倍,这个差距非常大,绝不可能按照高峰期满足所有人来建机房。

作为云计算公司,字节跳动该建多少机房?一定是在高峰时间让付费用户还可以用,免费用户稍微等一等,要么降个质,要么慢一点。否则一定是亏钱的。

模型等级会发生变化

现在豆包分 Pro 版本、Lite 版本,以后普通用户可能会更多地使用 Lite 版本。

我们现在用豆包 App 时,下方会有一个选项,叫“快速思考”和“专家”。如果选“专家”,就是 Pro 模式;如果选“快速”,就是 Lite 模式。

Lite 模式提供的结果要稍微差一些,幻觉会多一些。而且打开豆包,它默认会给你切到“快速”。

以后免费用户可能没有办法选 Pro 模式,或者选了 Pro,也就是选了专家模式以后,额度会有一定限制。

功能入口会发生变化

普通聊天肯定是免费的,但更复杂的功能大概率会被限制或收费:

  • 长文解析估计会限额;
  • AI 绘画应该会限额;
  • 深度分析大概就要付费;
  • PPT 大概要付费;
  • 视频生成大概率也要付费。

用户心理感受也会变化

即使两边没有任何变化,只要你看到那边有付费版本,你一定会觉得自己这个版本已经降质了。

原因很简单。哪怕我得个感冒去医院,我也总是会相信那些花了更多钱、看了特需门诊、看了专家的人,会得到更好的服务。所以人的心理上也会有落差,这个事避免不了。

收费团队一定会有 KPI

收费团队一定会有 KPI。它的 KPI 是什么?就是付费转化率。

现在有这么多免费用户,到底有多少人付费了?到底付了多少钱?留存率怎么样?续费率怎么样?你今年付了,明年还付不付?这些都会变成指标。

未来这些免费用户烧掉的 Token,大概率会计入豆包软件的获客成本。也就是说,我免费给你烧 Token,目标是为了获得这个用户,所以它算获客成本。

在这个逻辑里,它就会思考:怎么降低成本?怎么多收到钱?是不是再多恶心你一下,让你来付钱?它会做这样的事情。

这些指标上来,一定会改变产品形态:怎么让免费用户用得不那么痛快,怎么尽可能刺激你付费,怎么在你快要续费的时候给你一些小优惠。中国互联网公司在这块“绣花”还是很有水平的。

所以普通人认为:豆包说了免费可以继续,我没事。

真实情况可能是:免费确实继续了,但那是为了留住入口;付费分层,是为了重构体验,而且它会不断吸引你去付费。

未来免费 AI 的状态,很可能不是不能用,而是能用,但你总觉得旁边有人出了钱,得到更好的智能,让你心里不太平衡。

第三层认知差:字节是不是没钱了?

下一层普通人的认知差是:字节是不是没钱了?

这里面还有一个叙事,就是字节利润大跌,豆包烧不起了。很多文章和自媒体说,豆包收费是因为字节利润下降,同比下滑了 70%。这是一个非常大的数字。

据这些说法,字节 2024 年利润是 330 亿美元,2025 年利润大概只剩下 90 亿美元,一大块利润就没了。

但字节并不是上市公司,所以不会披露特别准确的财报。现在这些数据都是路透社等媒体报出来的。字节也没有否认这件事情,只是解释说,这个钱并不是真的没了,而是去做了几件事情。

那么,是不是字节已经不挣钱了,豆包已经把钱都烧掉了?不是这么回事。

这件事要分两块讲:

  1. 豆包一年到底烧多少钱?
  2. 字节的利润到底去哪了?从 330 亿美元到 90 亿美元,中间的 240 亿美元是不是被豆包烧掉了?
一张企业账本被分成 Token 成本和利润去向两栏,计算器旁边放着豆包图标、机房折旧卡片和股权期权筹码,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

估算豆包到底烧了多少钱

先讲数据来源。

火山引擎 2026 年 4 月 2 日在武汉 AI 创新巡展上披露:2026 年 3 月份,豆包大模型日均 Token 使用量突破 120 万亿,也就是每天 120 万亿 Token,而且在过去一年里涨了 1,000 倍。

这个数涨得非常猛。

按照火山引擎官方文档上的豆包 Seed 2.0 Pro 单价来算:

  • Pro 版本输入:3.2 元每百万 Token;
  • Pro 版本输出:16 元每百万 Token;
  • Lite 版本输入:0.6 元每百万 Token;
  • Lite 版本输出:3.6 元每百万 Token。

如果被缓存命中,输入价格还可以在这个基础上大概下降 60% 到 70%。它下降得比较少,不像 DeepSeek 下降那么多。

这 120 万亿 Token 到底有多少是输入、多少是输出、多少被缓存命中、多少没命中?这个我们不知道。

我就跑到 DeepSeek 里,用自己的一些使用记录估算。按照 DeepSeek 给我的使用状态,把这个比例套过来:

  • 输出大概只占所有 Token 的 0.7%;
  • 未命中的输入占所有 Token 的 3.3%;
  • 缓存命中的 Token 大概占所有 Token 的 96%。

有人可能会说,我进去问一句“今天天气怎么样”,我说了十来个字,它给我输出一大堆,这个比例合理吗?

其实没问题。第一,问这种问题的人大概率使用的是 Lite 模型。第二,这些人不会长期跟豆包聊来聊去,不会消耗特别多 Token。如果你是把豆包套到各种 Agent 里,然后进行很复杂的沟通,那么刚才这个比例是合理的。

如果按照这个估算,120 万亿 Token 接近 6,000 万人民币,也就是一天 6,000 万人民币。一年费用大概是 109 亿人民币。

字节跳动一年烧 100 多亿人民币在豆包上,确实挺不容易,也确实很花钱,很多人会觉得该收钱。

但是不要看到一个大数字就觉得这个钱特别多,还是要比较着看。

字节跳动一年的营收有多少钱?1.4 万亿。利润有多少?就算下降了 70%,利润还有四五百亿人民币。

很多人说,四五百亿人民币利润里烧了 100 亿人民币的豆包 Token,这也很大。其实这 100 多亿人民币对于字节来说就是九牛一毛。即使只计算资本支出,只计算建机房的钱,在这里头也不算特别大的钱。

字节利润下降 70%,钱去哪了?

有些人说,字节 70% 的利润下降是实打实的,原来从 330 亿美元降到 90 亿美元,这钱去哪了?

字节跳动是一个大集团,分两大块:国内叫抖音,国外叫 TikTok。

抖音的一位副总裁出来解释过这件事。他说,钱并不是凭空消失了,整个收入还在上升,利润基本持平,可能稍微有一点下降,但绝不可能下降 70%。

大家看到账面上少了 70% 的利润,主要去了三个地方。

第一,做新兴业务的资本投入

字节确实在做新兴业务的资本投入,也就是盖机房。

但要注意,盖机房并不是说这钱都直接花掉了。钱确实花出去了,但它要算折旧,今年可能摊销 25% 或 20%,也就是分 4 到 5 年摊销掉。

所以这一块有影响,但不会有那么多。假设去年是 1,500 亿,摊 1/5,也就是 300 亿人民币,是从这里摊掉的。

第二,优先股公允价值变化

剩下两块就特别有意思了。一块叫“优先股公允价值变化”。

这是什么意思?字节跳动发展到现在没有上市,前面有很多投资人,这些投资人得到的股票叫优先股。相对于普通股来说,它有一些优先权利,比如以后还有权利用一个较低价格再买一些其他股票。

这个权利是值钱的。未来某一个时间点可以按以前的价格买你的股票,如果整个公司的价值上升了,股价上升了,那这个权利的价值也上升了。这一块就要记到账上去,相当于利润减少。

举个例子:假设我原来投了你 100 万,我还有权利按照你现在的估值再投 100 万。如果你现在估值是 1 亿,那我这 100 万可以得到 1%。当你的估值达到 10 亿时,我按照前面的权利来履行,又拿 100 万得到了 1%。但现在这个 1% 已经值 1,000 万,因为你现在估值是 10 亿。差出来的 900 万,就要记成损失。

第三,期权股权激励计划

还有一大块损失叫期权股权激励计划。

字节里很多人是拿期权的,一部分是工资,一部分是期权。特别是最近在疯狂挖人,包括从 DeepSeek 挖人。前面还说 DeepSeek 有人被年薪上亿挖回来,那这上亿年薪里,有多少是期权?不可能上亿都给现金。

这个期权其实跟刚才讲的优先股问题类似。当公司整体估值上涨时,期权价值也会上涨,这一部分也需要从利润里刨掉。

所以所谓净利降低 70%,最主要降的是这两块。字节这么多人,这些年从中国甚至国外 AI 公司挖了这么多人回来,一旦字节跳动估值上升,这些东西都需要从利润里扣掉。

所以这里有个小知识:不用可怜它。虽然利润降低了 70%,但很多都是账面上的东西。

这是一个关键反转。普通人认为豆包收费等于字节没钱了,更合理的判断是:字节不是烧不起,而是不想继续用免费大锅饭掩盖真实的成本结构

字节真的烧得起这个钱。在它那个体量里,100 多亿一年的豆包成本,不算特别过分的数字。

字节到底想干什么?

那字节到底想干什么?整了这么一个事情,被大家骂成狗头,到底想干嘛?

第一,建立收费心智

字节现在最大的优势是什么?其实豆包的模型在国内各个模型里不算强,算是比较中间偏后。

但是豆包 App 做得非常好。豆包 App 里的各种系统提示词、各种 Agent 做得很好,所以豆包 App 的体验非常好,用户量极大。

现在豆包 App 的月活,大概是中国各种 AI 助手前十名里剩下 9 名的总和。它比那 9 个加起来还大,属于绝对遥遥领先、一骑绝尘的水平。

截至 2026 年 3 月:

  • 豆包月活用户:3.45 亿;
  • 第二名千问:1.66 亿;
  • 第三名 DeepSeek:1.27 亿;
  • 再往后的产品基本上可能是几千万甚至几百万,存在感很弱。
豆包 App 图标站在高高的月活柱状图顶端,千问和 DeepSeek 的柱子在旁边较低位置,远处竞争者举着免费旗帜追赶,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

千问的 1.66 亿怎么来的?春节拼命烧钱,各种送奶茶,搞这些活动才有的。如果没有这一步,千问 App 也不会有什么量。

豆包现在领先了,字节跳动就要做一件事:趁着用户还在,趁着心智领先,也就是大家觉得它好用;趁着竞争对手还在免费追赶,先把“AI 值得付费”这件事打进用户脑子里。

高价有心理锚定作用。有点像皇帝的新衣:我付了钱以后,哪怕没有得到更好的服务,我也会在心里把这个过程合理化。我不能告诉自己说,我付钱是个傻子;我一定会认为自己享受了更好的服务。

豆包现在要做的就是:先把高价锚点立起来,再用权益包、限时优惠去承接用户。

比如我去买剪映的年费会员,很贵,但它不停给你打折,不停做各种团购,可以用很便宜的价格买下来。

第二,把难题甩给竞争对手

字节下一件事,是把难题甩给竞争对手:我开始收费了,你们看着办。

阿里、腾讯,还有 DeepSeek 这些公司,就要思考这个问题:我到底收不收?

如果不跟着收费,继续说我要免费、我要抢用户,用户会怎么想?你为什么不收费?是不是能力不行?是不是商业化没做好?是不是不敢让用户为你付费?

如果跟着收费,本来你就落后,再收费基本上相当于自杀,后边再想增长用户基本上增长不上来了。

所以这个两难问题就直接被扔给竞争对手了。

第三,理顺内部 AI 资源战争

字节跳动可能还想理顺内部的 AI 资源战争。

字节内部不只有豆包。它还有豆包 App、豆包模型、火山引擎、扣子、即梦、剪映、飞书、Trae,还有 Seedance 这样的视频模型、Seedream 这样的图像模型、Coding Plan,以及各种企业服务和 API。

每个团队都有自己的 KPI:我要把我的东西卖给谁,卖到多少钱,怎么有自己的业绩,以便在内部争取更多资源。内部打架打得很厉害。

举一个例子。前面 Seedance 2.0 出来的时候,大家都要去生成视频,内部就掐起来了。

  • 你可以在豆包 App 上每天免费生成几个视频;
  • 你可以在即梦 App 上每天生成 4 个免费视频;
  • 你也可以到即梦网页上去生成视频;
  • 但如果你要在即梦网页上生成视频,就要花钱。

如果买基本 10 美金一个月的套餐,一个月大概能生成十几二十条 15 秒视频。这个划算吗?而且还要排队。

现在它变相涨价了,有一个 VIP 模型,涨两倍价格。你用这个模型,才能做出视频来。要是不上 VIP,我前面做了一个实验,把一个视频提示词扔上去,到现在已经一个礼拜了还没画出来。每天都说你前面等 10 个小时,但已经一个礼拜没画出来。

再加上剪映 App 里也允许你生成视频。火山引擎里,如果直接买 API,用 Seedance 2.0 的 API 直接生成视频,也可以,一块钱一秒。不同口径都在卖套餐,而且相互抢资源。

现在字节跳动下面各种模型里,Seedance 2.0 算是做得最好的一个,而且 Seedance 2.0 是真正的全球领先。

做自助餐厅最怕什么?最怕有一道菜特别贵,还大家都喜欢。如果出现这种情况,自助餐厅就可能亏钱。像以前去自助餐厅,有人就要吃三文鱼、北极贝,自助餐厅会希望你换着吃。你只吃这一种,它的生意就没法做了。

现在字节跳动也出现了这样的情况。豆包模型、画图模型、语音模型都一般,唯一最好用的是视频模型。就这一个模型,导致内部已经打起来了。

一个昂贵的视频模型像自助餐厅中央最受欢迎的大菜,豆包、即梦、剪映和火山引擎四个团队从不同方向拉扯同一盘资源,队列用户举着生成视频提示词等待,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

字节可能会向 OpenAI 学什么?

字节跳动有可能通过豆包收费这件事,直接把内部资源问题解决掉。

怎么解决?跟 OpenAI 学。

也就是直接交豆包订阅费,订阅完以后就可以使用 Coding Plan。像我们现在在 OpenAI 上每个月交 20 美金,交完以后,自然而然得到一个 Codex 上的额度,就可以拿这个额度去用。没有那么多乱七八糟的“这个也要付钱、那个也要付钱”,不同地方都要付钱,不同部门都向你推广告。

一个统一订阅账户像中央控制台,向 Coding Plan、视频生成、剪映、即梦和 API 五个功能模块发放额度卡片,用户只刷一次会员卡进入全套工具区,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

现在我在字节跳动里花了哪些钱?

  • 剪映 App 订了会员,一年会员,而且是最贵的一档;
  • 即梦订了比较便宜的一档,基本上是 10 美金一个月;
  • 火山引擎里的 Coding Plan 也买了,40 块钱一个月;
  • 里面还充了一点 API。

说到即梦我还生气。它里面有一些功能我想用,不让我用。对方说,只有订更高档才给你用这个功能,这一档不让用。

火山引擎里的 Coding Plan 也一样,里面有很多东西不让用。比如我想用豆包搜索,想用豆包里的 TTS、STT,这些功能都不让我用,因为那边火山引擎还要单独卖。各自有各自的 KPI,不能把人家套餐挂进去,于是就变成这种状态。

如果以后只要订阅豆包,就让我用所有这些功能,那我可能真的会订,而且有可能订比较贵的版本,比如一个月 200,或者一个月 500。

订下来以后,统一得到相应的 Token,统一得到所有功能,包括视频生成相应额度,这不是挺好吗?最好把剪映、即梦这些会员也合并进去,那我就去订最贵的。

这样做的好处是,内部所有部门利益就统一了。不会各自定价、各自抢资源、每个人都想办法转换成自己的用户和 KPI。也不需要每个部门都做一堆定价和打折策略,统一打折策略就完了。

比如以后一个月 500,一年 5,088,这可能是一个相对有意思的玩法。

国外的 OpenAI、Anthropic 都是走这条路:先让你订会员,订完会员以后,用会员给你一堆额度,下面所有产品都可以去用。

如果比较小家子气,比如 Anthropic,它让你 Claude Code 能用,但你把它挂在其他地方,就不定期封几个账号。OpenAI 就是鼓励你用,没问题,拿去用。

所以我希望字节跳动能够真正往前迈一大步,直接向 OpenAI 学习,把内部所有套餐一次性打通。当然,这只是我的愿望,可能像字节这样的大公司,最后还是各自为战。

如果各自为战,我应该不会去订这个套餐,因为没有任何意义。

所以这里又有反转。普通人会认为豆包收钱是为了赚这 68 块钱,但更深层次的可能是:字节在建立 AI 时代的统一计费权、算力分配权,以及用户心智高地。

豆包收费到底该不该骂?

开头我们问,豆包说 68、200、500,普通人到底该不该骂?

现在可以回答:你可以骂它贵,可以骂权益不清晰,可以担心免费版降权降级,可以等正式上线以后再决定充不充。

但如果你只骂“割韭菜”,这个事就太浅了。

这里面有 5 层认知差:

  1. 很多人把 AI 当成普通 App 来用,这是不对的,因为 AI 每次使用都要烧成本。
  2. 以为收费以后免费版不会有变化。免费入口会存在,但免费使用一定会让你觉得各种痛苦和不方便,这个事跑不掉。
  3. 以为字节收费是没钱了。字节不是烧不起,而是必须从增长转向经营,开始算单位经济模型了。
  4. 以为收费只是赚用户的钱。收费同时是在建立心智、测试价格、逼竞争对手、理顺内部资源。
  5. 以为 AI 普惠是永远免费的。这个想多了。真正普惠不是所有高级智能无限免费,而可能是基础能力免费,高级能力按需付费,成本不断下降后再逐步下放。
五个认知差像五层阶梯从免费 App、免费体验、没钱误解、收费目的到 AI 普惠,用户沿阶梯向上看到底层算力成本和商业闭环全景,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

我的判断

我个人对豆包收费并不感到意外。我真正关心的其实只有一件事:字节能不能做成统一账户和统一额度。

如果 68、200、500 能够打通豆包、即梦、火山和剪映,那我应该会冲上去充钱,而且有可能会充最高档的。

如果打不通,那么我觉得字节的大公司病就已经病入膏肓了。

最后一句话:豆包收费不是 AI 免费时代的终点,而是字节跳动趁着自己在中国这个封闭市场处于领先位置的时机,强行将竞争拉入下一个阶段。

好,这个故事就讲到这里。感谢大家收听,请帮忙点赞、点小铃铛,参加 Discord 讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。


背景图片