MoreRSS

site iconQianHei | 浅黑科技修改

一家关注科技前沿的媒体,由一群有爱的科技媒体人2017年创办于北京。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

QianHei | 浅黑科技的 RSS 预览

绝密档案:一台“纯血国产笔记本”身后的历史洪流

2026-01-22 08:56:00

原创 史中 浅黑科技 2026-01-22 08:56 中国香港

其实地上本没有路,走的人多了,也便成了路。

浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。

绝密档案:

一台“纯血国产笔记本”身后的历史洪流

文|史中

(一)少废话,先看“神兽” 

如果我冷不丁掏出这样一台电脑放在你面前,你会如何评价?

我猜,大多数浅友可能有点困惑:这好像。。。就是一台正常的笔记本电脑吧?

诶,我要的就是你这个反应!

当你说出“正常”二字,就意味着你觉得这台笔记本是一个长在主流审美点上的,可以出现在商场货架C位的,上班族日常选用的办公电脑。对吧?

揭晓答案:这台笔记本,从 CPU 到 GPU 到 NPU,从屏幕到键盘到触控板,所有的核心硬件,加上操作系统和软件,都是符合“信创标准”的自主可控产品!

换句话说,这就是很多人“听说过,没见过”的神兽——信创笔记本电脑

而且你还来着了!这家伙的性能是此时此刻信创笔记本中最强的,不用加“之一”。

正式介绍一下,它就是:联想开天 X7

如果你只想花一分钟对“纯血国产笔记本电脑已经做到啥程度”有深刻的理解,我觉得认识联想开天 X7 就够了:

它的 CPU 是“海光4号”的移动版,可以稳定工作在 4GHz,妥妥列席高端 CPU 队伍,同时开几十个办公软件都不会卡。

你能想到的接口它都有,独显可以同时挂载最多 3 个外接屏幕,处理剪辑、渲染,甚至还有本地 AI 功能,涵盖了一台笔记本的所有重载场景。

而这一切汹涌,都严丝合缝镶嵌在一体成型的铝合金外壳中,厚度不到 17mm,重量不过 1.5 Kg。

一句话概括:

它不仅外观看上去是一台主流旗舰笔记本,性能参数也不折不扣地是一台主流旗舰笔记本,用上去的感觉也是一台主流旗舰笔记本,因为它就是一台主流旗舰笔记本!

只不过,这一切并非基于大洋彼岸的 Wintel,而是用年轻的国产芯片和国产系统锻造的。

轻描淡写的结局之前,必有无数沸腾的章回。

为了了解联想开天 X7 背后的故事,我跑去和团队详聊了一个下午,像剪影一样记下了他们和海光团队一起打磨 CPU 的昼夜,记下了让笔记本厚度降低哪怕半毫米所付出的卓绝,也记下了整个产业链托起一款国产旗舰的奋力。

但把这些剪影叠在一起,所有细节都晕染开去。

从中浮现的,只是一颗颗赤子之心。

(二)我们值不值得更好的东西?

“中国人究竟需不需要信创笔记本电脑?”

2020 年冬天,夏晔走在北京的夜幕里,脑子里旋转着这个奇怪的问题。

“你说中国人需不需要笔记本电脑?”为了便携办公,当然需要。“你说中国人需不需要信创电脑?”为了自主可控,当然也需要。但把这俩句话捏在一起,答案还真不好说。。。

之所以会胡思乱想,是因为领导刚让他们团队接手“信创笔记本”的业务。

当时的情况是:夏晔所在的团队主要在做“信创台式机”的研发,趁着国产替代的浪潮,卖得还不错。可是隔壁“信创笔记本”却一言难尽,总销量才有 1000 台。

销量惨淡,必有原因。

业内有这么个解释:

台式机解决的是从无到有的问题,笔记本解决的是从有到优的问题。国产替代属于“底线思维”。做出台式机,底线就有了,那笔记本。。。没准是个伪需求?

话要这么说,把那 1000 台已经卖出的笔记本后续维保做完,也就可以弃疗了。

但夏晔越想越不对。

刚才那个解释隐含了一个前提假设,就是:“信创笔记本”在性能和体验上永远做不过 Mac 或 Wintel 这类所谓“主流笔记本”。

既然怎么做都做不过,那肯定有了就行,不用追求更好嘛!

但这个假设。。。对吗?

夏晔

如果有朝一日能让创笔记本的体验追平 Wintel,甚至超越它们,那此刻不仅不应该放弃,反而应该猛猛干啊!

问题就在于,你相信不相信。

凛冽的北风中,夏晔做了一个决定:相信。

他把这个思考分享给同事,才知道原来大伙儿同样怀揣做出“最好的笔记本”的梦想,只是现实骨感,不好意思把这么凶的梦想挂在嘴边。

那还等什么?这群师傅决定“摸黑”上路!

会议室里,几个人围着那台只卖出 1000 台的笔记本端详,一种“穿越感”袭来:它不像是 2020 年应该有的产物,反而像十年前的东西。。。

因为,制作它的过程是“搭积木”。

把 CPU 和主要芯片拿来,装在主板上,然后按照它们的功率配备电源,按照发热配置风扇,然后比照这些东西的大小,用一个机壳把它们罩起来。

这种看菜做饭的方法导致的结果就是:它只是一个看上去像笔记本的台式机。

那电脑很厚重,拿来拿去是个体力活。打字的话必须外接键盘,因为手搭在机器上面烫得受不了,还总会误碰触控板。不带电源的话,续航只能撑一个小时。

夏晔苦笑着回忆。

于是,老师傅的首要目标是:先把“积木”整合成一个有主张的“产品”

为了做成“产品”,他们必须把关键部件的参数先设计出来,再去找供应商合作研发,然后推着工厂生产出来,然后买回来用。。。

看到这儿,你也许隐隐觉得常识被挑战:

整机厂不就应该安静地做整合吗?作为产业链下游玩家,跑到上游去“掺合”元器件的设计研发,这靠谱吗?

如果是一条成熟的产业链,这么玩儿多半不经济。

但别忘了,当时的现实是:“信创笔记本这条产业链”几乎不存在!

如果不“逆流而上”主动整合产业链,那么联想开天拿到的就一直是上游飘来的又笨又丑的积木块,信创笔记本国际领先就永远是个梦。。。

事实证明,老师傅们这次勇敢没有换来一生内向,而是得到了历史的N次奖赏!

他们的第一个作品是“联想开天 N7”。

客观说这是一个定位均衡的性价比产品,但却是团队的主张第一次“具象化”:

续航能达到三四个小时,风扇不会“喋喋不休”。所有人拿到它,没有“穿越”的羞耻感,反而会因为它漂亮、得体、完善而愿意使用。

联想开天 N7,使用的是兆芯处理器。

产品的“一小步”,是这群师傅信心的“一大步”。

为了庆祝这次新生,也为了标记眼前的漫漫征程,“联想开天”的品牌在 N7 上首次使用。果然,2022 年上市以来,N7 销量节节高攀,笔记本产品线彻底起死回生!

老师傅信心生长,开始定义更多开天系列的笔记本,值得一提的就是 X1 Carbon。

联想开天 X1 Carbon

联想开天 X1 Carbon的定位是极致轻薄,整机重量只有 980g。夏晔告诉我,当时他们为了实现轻薄,不仅定制了 CPU、散热等等,就连 USB 接口都要比标准的薄一丢丢,最后为了冲击极致轻量,螺丝都是定制的轻型螺丝。

有了这次从里到外定制的经历,老师傅自然和供应链上的各个角色都处成了兄弟。

而这些兄弟,才是继续挑战更骚操作的底气!

当“均衡”、“轻薄”都搞定之后,所有人的目光自然落在了笔记本大类版图上最后一块缺失的拼图——性能

老师傅还真不是“为做而做”。

我们回到 2022 年,站在当时典型的信创用户金融从业者身边,就会明白他们对高性能笔记本的渴求有多强烈。

首先,金融安全事关国家稳定,需要“信创电脑”提供整套自主可控的计算环境;

其次,金融场景瞬息万变,需要时刻在线移动办公,所以天然倾向于用“笔记本形态”。

最后,金融业务又非常复杂,一台电脑上同时存在上百个专业软件,网页同时开几十个,妥妥是基操。

所以他们对于信创笔记本的要求极为苛刻,绝不是“能用就行”,而是“极致性能”:Wintel、Mac 旗舰能做的事情,信创必须*无差别*做到!

而且金融是个“先导指标”。就在夏晔他们忙着思考金融客户提出的需求时,其他更多行业,例如电信、能源的央国企也追过来索要高性能本。

历史大潮浩浩汤汤,人在江湖,刻不容缓呀!

高性能笔记本自然需要一个极为能打的 CPU,那么。。。信创 CPU 哪家强?

夏晔坐在了海光信息的办公室里。

(三)海光同学,敢不敢上点儿强度?

CPU 干的活儿乍一看是脑力劳动,但要我说,它更像是搬砖撸铁这样的“体力活儿”。

因为,拳击比赛的“重量级”概念在 CPU 界也适用。同样制程和架构下,CPU 的个头越大,意味着肌肉(晶体管)越多,力气也就越大。

海光 CPU 就是信创界的“肌肉男”:

它吃的多(耗电多),干活猛(算力强),出汗也多(发热大)。

这样的猛男,最好给他个宽敞的“大武馆”,让他尽情挥洒嘛!

事实也正是如此,在之前几年,海光 CPU 干活的地方都是工作站,也就是那种专业台式机。

您不是吃的多么?来人,给公子伙食加一倍!

您不是爱出汗么?来人,给公子换大号风扇!

在台式机里,加电源和风扇都不是大问题,反正有的是地方。可笔记本,尤其是联想开天定义的那种轻薄又美观的笔记本,问题就大了。。。

你想想看,把一个壮汉塞进一个小房间里,活儿不许少干,热气却散不出,那汉子越壮,死的越快啊!

真是让人头秃。

“咱们合作的台式机不是也卖得挺好么?为啥一定要把我们的 CPU 搭载到笔记本上呢?”一位海光同事弱弱地提出了灵魂拷问。

“你想不想有朝一日,更多人甚至普通人都认识海光 CPU,就像认识 Intel CPU 那样?”夏晔说。“那就一定要进笔记本!”

这话直击要害。

此刻全球每卖出 4 台笔记本, 才会卖出 1 台台式机——笔记本早已是商务办公的主流形态。

不进入笔记本,就等于拱手让出了主流用户群,进而让出了在浩荡的信创历史上扛起大旗的可能性。这种剧本是任何一个有野心的 CPU 都无法接受的。

海光同事们默默点头,这也正是深藏他们内心的思虑。

于是,就在这第一次见面,海光已经决定和联想开天联合研发可装载在笔记本电脑上的下一代 CPU——海光4号

很快,海光同事把“海光4号移动版”的初步设计参数传来了。

联想开天的同事们看到,心猛地一沉。经验告诉他们,这块 CPU 是决计放不进“开天级”的笔记本中的。

耗电和散热暂且不论,光是个头,就已经超标了。。。

先说长宽,第一版 CPU 定义的是 40mm×40mm。

四厘米见方,咱们外行放在手里感觉挺小巧的;但在夏晔他们眼里,那可不仅是一块 CPU,而是与之相关的一串东西,散热模组、GPU、内存、主板排布,牵一发动全身。。。

说到这,就不得不插入解释一个信创电脑的小特点。

咱们熟悉的 Intel 或 AMD 笔记本,经过几十年演化,芯片集成度已经非常高。比如 CPU 一般都配有“集成显卡”,比如内存颗粒都是直接镶嵌在主板上的。

可是我们的信创生态没有经过那么长时间的发展,海光 CPU 还没有集成显卡,也不支持嵌在主板上的内存颗粒,必须用那种插在主板上的内存条。

这就好比:人家的汉子可以身兼数职,搞定工作只需要三个人;但咱家的汉子还没办法兼职,搞定同样的工作需要“五条人”。

那必然会占用更多物理空间嘛。。。

总之,算了半天,联想开天的同事给出了结论:CPU 长宽不得大于 33mm×33mm。

别看一边只缩小了 7mm,但仔细算一下,总面积却小了 32% 之多!

说完长宽,还有厚度呢。。。

海光同事给出的第一版 CPU 封装厚度是 2mm。

所谓封装厚度,简单理解就是 CPU 除去引脚的主体部分厚度。你可以比划一下,2mm 已经很薄了。

就这,夏晔他们也斩钉截铁地说:不行。

原因是这样的:

从侧面看,CPU 装载在主板上,顶着散热模组,散热模组之上就是机壳。

一旦 CPU 过厚,很容易就顶到机壳上。这对于“防冲击能力”来说是致命的。

夏晔告诉我,每台笔记本设计时,都要经过很多严苛的实验,其中有一个就是“落球实验”——让一个铁球落到机身的各个位置。

一旦 CPU 顶着散热片和机壳形成“硬连接”,那不用想,肯定极容易撞坏。

为此,设计笔记本的标准原则就是:在 CPU 和机壳之间留出缓冲空间。缓冲空间越大,防冲击能力越强。

既然机身已然不能再厚,那只有委屈 CPU 再薄些了。。。

联想开天给出的建议是:把封装厚度从 2mm 改为 1.4mm,薄了三分之一。

看到这你可能要为海光师傅鸣不平:凭啥联想开天动动嘴,他们就跑断腿呢?改小这么多,能做出来吗?

这正是问题的关键,这些参数并不是随便乱说的。

开天师傅们,很多之前都做过“主流笔记本”,就是信创本这几年也做了 N7、X1 Carbon 等等好几款,各种方案都试烂了。

他们虽然不亲手做 CPU,但是对芯片的理解已是庖丁解牛级别的。这些精算数据,几乎就贴着目前国产供应链能力的极限。绝不容易做到,但一定有办法做到!

这些都得到了海光同事的认可。

换句话说,联想开天的经验不仅不会坑海光,反而会大大提升海光造芯的效率和质量。

后来的故事证明,这种产业链上下游罕见的信任协作,果然让中国信创迸发出强大的生命力,成为了弯道超车最大的底气!

回到故事的现场:两家定了个“娃娃亲”,作为全球第一款搭载海光4号的笔记本,联想开天 X7 需要在 2025 年秋天和芯片同时官宣。倒推一下,时间并不充裕。

敲定一整套目标参数,海光同事们马上潜入深海,开始了 CPU 设计。

等待“海光4号”降生,开天的师傅可以喘口气了吧?

怎么可能。

紧张的大戏才刚拉开序幕。

(四)没有代差!

之前说过,联想开天 X7 要达到的终极目标就是:用起来和“主流”旗舰笔记本没有区别。

如果续航比人家短,就是区别;如果发热比人家大,就是区别;如果屏幕比人家差,也是区别;如果同样打开 50个网页人家不卡但你卡,也是区别。

每一项体验都不是靠嘴说的,必须有相应的软硬件支持。

至少,主流版笔记本上有的模块,信创版都要有与之对应的模块,你不能缺零件啊!

可现实骨感。2023年,信创体系中很多对标的零件根本没有。。。

多了不说,咱们就说一个:CPU 的“CTDP 系统”。

这是啥呢?

CTDP(Configurable Thermal Design Power)的学名是“可配置热设计功耗”。

如果把 CPU 比作汽车的发动机,CTDP 就有点儿像“驾驶模式”,经济档、标准档、运动档,等等。

如果沿用之前的比喻,把 CPU 看作壮汉,那么 CTDP 就是他的“干活模式”:

比如突然来了大活儿,那您肯定要全速猛猛干;

如果活儿不太多,那您就要稍微悠着点儿,少制造噪音,少出点汗;

如果没活儿,那您就坐那歇着,别乱动。

话说,早在 2011 和 2012 年,AMD 和 Intel 的 CPU 就开始搭载 CTDP 技术,至今已经十几年了。后来那些不用风扇主动散热的笔记本,基本都是靠 CTDP 来管理 工作效能,把 CPU 压到 10w 左右才实现的!

可是即便到了 2023年,信创 CPU 还是“糙汉”,并没有 CTDP 设计:要么 0w 不干,要么 50w 猛干。。。

之前海光 CPU 都是在宽敞的台式机里干活,没有也就罢了;但在优雅的笔记本里,一味蛮干导致 CPU 过热,反而会让性能下降。这 CTDP 是非上不可!

CTDP 的实现原理大概如下:

先要在 CPU 上埋设一些“操纵杆”。不同的操纵杆调到不同档位,就能组合出一种整体能效模式;

由于操纵杆很多,每个操纵杆还有很多档位,所以最终组合出的能效模式的可能性有成千上万种;

根据电脑此刻工作负载不同,最匹配的能效模式也不同,所以需要一个“贴身教练”站在 CPU 身边,根据它的实时指标实时调整这些操纵杆。

看清这个原理,你就会明白,CTDP 不是一个团队的事儿,海光师傅要负责把壮汉身上的操纵杆做出来,而联想开天师傅要负责把这个“贴身教练”给做出来。

制造教练,本质上就是在求解一个变量极多的方程——这个方程并很变态,并不存在“最优算法”。你不断思考,变换姿势,总有可能找到更好的解。

话说,联想开天的师傅身经百战,做过很多 Intel、AMD 这类 x86 芯片的 CTDP 调教,各个都是“调参圣手”。而且,海光 CPU 的 C86 也是兼容 x86 指令集的,按说不难吧?

夏晔他们最开始也是这么想的。。。

其实,指令集只定义了 CPU “细胞级”的样貌,类似细胞生长出来的 CPU 不能说有所差异,简直是完全不同。老师傅用之前积累的 CTDP 参数实验了一下,海光 CPU 发挥出的性能只有预期值的一半。。。

简单测试,老师傅已经明白,要想“投机取巧”是没戏了:

美国 CPU 踩过的每一个坑,中国 CPU 都得老老实实踩一遍。

老师傅的经验虽然不能避免踩坑,但可以帮他们以十倍速“快进踩坑”。别人走了十年的路,我们一年走完,也很棒棒!

他们使用了迭代进化的方法:就像在虚空中点燃经验的火炬,敏锐地捕捉到关键参数,然后一跃踩在现有数值上,继续寻找更好的数值,再向前跳跃。

就这样不断向前跳跃了二十几轮,方程变得越来越精美、优雅,CPU 的功耗也被控制在 35w!

这位“中国教练”,气象初成。

话说,教练最终栖身的位置,是大名鼎鼎的 BIOS。

BIOS 不仅对 CPU 的体能负责,还对电脑各个硬件的底层运作负责。实际上 BIOS 系统固件的复杂度极高,堪比小型的操作系统。

所谓的“代差”,很大一部分就体现在 BIOS 固件中。

举个小例子:开机时间。

在硬件正式启动之前,BIOS 承担了最主要的引导作用,固件的效率直接决定了开机时间。

在很长一段时间里,Intel 笔记本的开机速度已经进入 10 秒以内,可信创电脑的开机时间还停在 40 秒。差距不要命,要命的是很多人都熟视无睹,坦然接受。。。

但夏晔他们觉得,凭啥要接受?

在之前的联想开天 X1 Carbon 上,老师傅们就解了这个问题——他们编写了优化模块,实现了 9 秒开机,2 秒唤醒,直接追平了主流笔记本的体验。

事实上,每一代信创笔记本的开发,BIOS 都在沉淀更多的先进特性,一点点补齐信创生态的短板。到了 X7 这一代,随着 CTDP 等核心模块的补齐,已经不存在“人有我无”的情况了。

这就是——没有代差!

2024 年下半年,底层代码已经开发到七七八八,海光4号也进入了流片阶段。

这个时候,开天师傅决定再来一波骚操作:

既然海光4号还没出来,咱先把已经开发好的模块配合上一代“海光3号”验证一下嘛!积累点儿一手经验也是好的!

这一上手测试,直呼好家伙:

3 号身上的很多结构设计果然不匹配笔记本。硬放进去,调高一点儿就两小时就把电池耗光;调低一点儿就性能衰减卡得要命。哪怕是调参圣手也回天乏术。。。

老师傅庆幸:要不是在海光4号设计之初就划定了那些重要的参数边界,那么流片回来肯定无法装载到开天笔记本中,所有的努力都会付之东流。

就在一错神的功夫,还发生了个有趣的小事儿:

有一家友商打听到联想开天在测试海光3号,误以为开天要正式推出基于海光3号的笔记本电脑。为了占得先机,他们抢先发布了搭载海光3号的信创笔记本,还大力卖出了 1 万台。

结果可想而知,这 1 万台成了行走的反向广告。。。

你看,“信创”的征程凶险,就像穿越暗夜的丛林,走对路重要,不走错路更重要。而判断哪条路是“对的”,考验的是手上的技术与心中的定力。

联想开天师傅没时间吃瓜,因为他们朝思夜盼的海光4号就要呱呱坠地了!

(五)众人拾柴 

2024 年底,海光 4 号流片回来。

两边的师傅们围着芯片样品,像是父母望着初生的婴儿。

夏晔他们赶紧把新生的芯片、新升级的 BIOS、新定制的其他元器件和最新的国产操作系统组装进工程机,擦擦手心里的汗,点亮!

测试程序一条一条加载,老师傅的笑容逐渐“变态”。这表现,和预期中几乎一致!

但是别急,除了标准的测试程序,联想开天老师傅还有一套祖传的《葵花宝典》,是这些年攒下来的专门用来测试小概率 Bug 的用例。

随着《葵花宝典》测试深入,阴云开始笼罩。。。

一些随机错误出现,这意味着系统中一定存在不稳定因素。可问题是:从 CPU 到 BIOS,从系统到应用的很多代码都是新的,任何一层的 Bug 都可能导致错误。

紧张的气味弥漫,如果真是芯片本身存在缺陷,可能就要重新设计,重新流片,这样一来,2025 年量产的计划就都泡汤了呀!

当务之急,是赶紧定位这错误的位置。

大海捞针,最考验直觉。开天师傅们开动毕生经验,把可能的问题类别根据概率大小列出来。然后针对每一类问题设计 AB Test,逐一排查。

确定问题大类之后,再继续设计更精巧的试验“缩小毒圈”。

不到一周的时间,问题被揪了出来。

坏消息是:CPU 内部的一个控制器设计果然有瑕疵。

好消息是:不需要重新流片,直接在量产时修复这个瑕疵就可以了!

看到“瑕疵”二字,你可能会皱眉。这里允许我多介绍两句背景知识:

CPU 是最为复杂的人造物,流片回来的第一版包含瑕疵是极为正常的。哪怕是 Intel、AMD 这种老炮儿也一样。

只不过,对于整机厂商来说,一般没有机会参与“第一版”的打磨,也就根本没机会看到这些瑕疵。

以 Intel 为例,他们设计一款 CPU,流片回来的第一版,只有自己的工程师可以看;改完之后的第二版,只有自己和主板厂商的工程师可以看;直到第三版,整机厂商才有机会介入,一起调试。

但“信创”不同。它是整个中国产业链共同托举的孩子。这里没有严格的上下游壁垒和利益精算,反而是能者多劳、不计回报的“背靠背”合作。

我愿称之为“中国模式”。

正是在“中国模式”加持下,我们才有机会见证联想开天这种下游的整机厂的工程师一杆子直接介入芯片第一版的打磨。

这就像是来自长江出海口的上海工程师,跋涉到了青藏高原,帮助一艘船堵住了一个破洞,从而一举避免了顺流而下不断修补所要耗费的巨大成本。

这是人类工业历史上一个罕见又壮阔的景观。

实际上,海光师傅的造芯水平是极牛的。经过第一版调试之后,海光4号 CPU 的总体表现极为闪耀。

在没有 CTDP 深度调试的情况下,用业界权威的测试套件 SPEC CPU 测试,这款 CPU 已经拿到了 300 分。

放到信创赛道上比较,这是断崖式领先的水平。

但老师傅来不及庆祝,此时距离 X7 笔记本的预定发布时间只剩半年左右,他们必须火速完成“硬件+系统+软件+整机”的联调工作。

联调工作很繁复。为了让你感受其中精髓,我们还是回到那个“武馆”:

CPU 这个壮汉不会自己主动找活儿干,主要看二楼的领队给他下达什么指令。

这个“领队”就是操作系统。

人类下达指令时,领队就把指令翻译成壮汉能听懂的语言,下达给他。

人类没有下达指令的时候,领队最好让壮汉休息,这样最省电。

但事实并非这么理想化。

在人类没有指令的时候,领队还是会给壮汉们安排一些基础工作,例如检查各种器械是否正常(守护进程),收拾房间(内存回收),写写日记(系统日志)等等。。。

如果这些工作排布得不合适,就会导致芯片们处在“瞎忙”的状态,一会儿到这干一下,一会儿到那干一下,最终活儿没干多少,却累得够呛。

宏观上,就是电脑摆在那,啥也没操作,感觉一会儿就掉了好多电!

领队怎么才能做好,没有一招制胜的银弹。操作系统只有细致了解 CPU 的“脾气”,才能巧妙给它安排工作。

于是一个有趣的场景出现了,联想开天的师傅不由分说,把海光团队和麒麟、统信操作系统团队都拉在了自己的会议室里,让产业链上的“巨头”面对面商量改进方案。

这一下,漫长的拉扯直接变成了极速进化。

除此之外,还有更复杂的事情:

“武馆”除了二楼的操作系统,还有三层,那就是“应用程序”,应用程序可以看作是人类放在电脑里的“代理人”。

一条命令完整的传达路径是:人类--应用程序--操作系统--芯片。

实际上在最底层,不只有一个 CPU 一个汉子,还有 GPU 负责图形计算,还有 NPU 负责 AI 推理,他们仨要分头工作,才能实现最高效率。

问题来了,到底哪些命令需要 CPU 来做,哪些命令需要 GPU、NPU 来做呢?

简单来说,应用程序这个“代理人”会把人类的指令分门别类,告诉楼下的“领队”应该由谁来执行,领队再把任务分别翻译给具体的“汉子”去执行。

你看,这其实需要应用程序、操作系统、芯片、整机厂商四方磋商。。。

总而言之,在联调最密集的 2025 年春天,这样从顶层到底层的“多方会谈”几乎天天都搞。

夏晔回忆,当时他们白天要完成自己份内的开发任务,经常是晚上10点左右才有时间线上开会,一讨论就是一两个小时,确定联动方向,明早继续埋头开发。

那段冲刺的日子虽然辛苦,但并不痛苦。因为他们无比确信,自己的每一步都在创造信创的新历史。

没什么比“创造历史”更上头了。

随着各层代码定型,联想开天自己的任务“供电散热架构”、“CTDP 调教”、“硬件驱动调试”、“整机工业设计”等等也陆续完成。

最终,核心参数确定:

联想开天 X7 的平衡模式被定义在 2.8GHz,高性能模式被定格在了 4GHz。国产屏幕 + 信创 GPU、AI 功能 + 信创 NPU 一应俱全,在此基础上,标准续航达到 7 小时,而整机重量只有 1.5Kg。

2025 年 7 月,海光如期举办发布会,联想开天 X7 作为全球首款搭载“海光4号”的笔记本(移动工作站)款款走进聚光灯,接受人们热切的目光。

(六)Create in China 

随着笔记本发售,各种评测数据也开始披露:

在倾向于整机性能的 UnixBench 测评中,开天 X7 的领先幅度就更大了,它拿到了 18000分,而与开天 X7 同样定位的信创笔记本,没有一台跑分过万。

在之前提到的 SPEC CPU 评测中,开天 X7 量产版稳定在 400 分上下,比使用同一颗 CPU 的其他品牌笔记本的分数高出 40%,与 Intel 的高端芯片 Ultra 5 125U 大致齐平!

没错,即便 CPU 一模一样,跑在不同的机型中,性能差异仍然有这么大。

这个结果对于开天师傅来说并不意外,反而印证了他们一直以来的判断:好的性能表现离不开一个凶悍的 CPU,但只靠凶悍的 CPU 是远远不够的。芯片、系统、应用、整机架构的综合调教,是差异的重要来源。

而调教的方法论背后,是对应用场景周全的理解,对计算的本质深刻的洞悉,是漫长岁月里的秋酿冬藏。

“你看看触控板,有什么不同?”

夏晔把一台开天 X7 真机递到我手里。

我按了一下,一个九宫格的数字键盘浮现在触控板上。

毕竟金融行业是这台电脑的主战场之一,对于每天和数字打交道的行业来说,小键盘是刚需。

于是开天团队专门设计了这个彩蛋,平常看起来就是整洁的触控板,需要输入数字时,这些线条才会浮现。

话说,在其他笔记本上也有类似的“触控板小键盘”设计,但那个小键盘是印在上面的,不会消失,平常看上去就显得杂乱。

但夏晔一直相信,用户的嗅觉是很灵敏的。“明明能做好但不去做”,人家一打眼就能识破。

他们找了触控板的供应商,合作设计了这样的显隐效果,还专门申请了专利。

外观设计当然是最容易发现的巧思,但上手使用,还有更多深层的惊喜。

夏晔告诉我,电脑里藏着一个 150 TOPS 的国产 NPU,这个 AI 算力足以支持断网的情况下生成会议纪要、翻译专业文档、生成文稿和图表。

就像这样↓↓↓

普通人未必对“断网使用”有多大感觉,但对于很多政府、关基行业来说,大量资料都不能触网,离线 AI 就变得非常刚需。

之所以举着两个例子,是因为创新有大有小,却没有高低贵贱。

你看,中国人搞出自己的强悍 CPU,这是创新;整合出轻薄长续航的笔记本整机,也是创新;为用户特定的场景研发优雅的解决方案,同样是创新。

无数层次的创新集合在一起,才能离“最好的笔记本”的终局越来越近。

虽然联想开天 X7 是在具备一定量产能力后才开的发布会,但他们还是低估了市场的热情。

各大企业先买了几台回家尝尝,不做过多解释,发下去让同事们试用,说说感受。

拿到同事们反馈,企业们好像突然意识到什么,一股脑杀回来大批采购。备货一扫而光,产能直接进入紧张状态,手慢一点儿的企业只好排队了。。。

遥想五年前开天笔记本起步时,惨淡的千台销售,对比今天的“一机难求”,夏晔心绪难平:

不可否认,国家对各个行业“信创替换”有一些时间表的指导,但是目前看来,电信,移动,金融,能源这些领域的企业都在大幅超越这个时间表。

原因很简单,他们真的急需一个流畅高效又自主可控的笔记本去干活。

这是一个深刻的历史拐点:信创替换的*第一动力*已不再是政策的推力,而是市场上优秀信创产品的拉力

谁先提供这样的产品,谁就先在广阔的蓝海里纵情“捕鲸”。

(七)历史并无秘密 

从 N7 到 X7,联想开天笔记本已经累计销售了 50 万台。

相比最早的 1000 台,这确实是一个值得纪念的里程碑。

但相比“主流笔记本”在中国每年上千万台的销量,这又仅仅是长征的第一步。

在很多人看来,信创追上 Wintel 仍是一个海市蜃楼般的梦想,但在开天师傅心里,这是一个只争来早与来迟的定数。如果不是为了这一天,他们根本就不会出发。

夏晔告诉我,技术根本不是壁垒。最大的坎儿在于“成本”。

由于芯片工艺制程、电路集成度、供应链成熟度的限制,信创笔记本的成本仍然高于“主流笔记本”。

成本终归是销量的刚性约束。

但这里没有任何秘密:只要信创体量不断增大, 供应链就会成熟,成本就会降低,两个生态之间的差距就会坚定地缩小。

直到某一天,哪个生态是“主流”变得并不那么判然。

“也许只需要十年,我们的国产 PC 生态会变得非常强大。”夏晔说。

“为什么这么乐观?”我问。

“就像我们的电动车,从补贴到退补,到能够出海竞争,这样的故事历史上不止一次上演。中国技术人的速度从没让大家失望。我不得不乐观。”

他的回答一如既往地从容。

退到历史的河岸观看,联想开天 X7 究竟卖出多少台,贡献多少利润,并不那么重要。

重要的是,它矗立在这里,让所有人都看到国产笔记本可以被做成什么样子,进而让大家有理由*相信*那个遥远的未来。

联想开天 X7,终究不是一个人的故事,也不是一个产品的故事,甚至不是一家公司的故事,而是一条产业链上无数人的故事。

在一个猜忌熊熊燃烧的世界,他们固执地做着一道有关团结和相信的证明题。

在成熟的产业链上,会有一个企业承担“链主”职责,负责整合整条产业链的协作。

而联想开天这群人,用五年时间从无到有连缀出一条“信创笔记本”的产业链,并且事实上承担了“链主”的职责——这恐怕是这群师傅上路之初未曾设想的荣光。

真正重要的是,在被历史选中的一刻,他们并未躲闪,而是全力以赴给于回应。

最初启用开天这个名字的时候,大伙儿其实并没有想太多。但有趣的是,他们脚下的故事却沿着这个名字绽放,成为一场“开天辟地”的自证。

开天辟地之时,往往寂静无声;但循着来路回望,能体会最初一刻的壮美。

开天笔记本团队成立五年,一路上招贤纳士,吸引了很多新同学。

让夏晔感慨的是:并不是所有人在加入之前就怀抱多大的情怀,但当同学们亲身参与了大大小小的“战役”后,反而有更多人坚定地看好信创的未来。

这种看好更加坚实,因为它并不全然来自理想感召,也来自理性思索。

告别开天师傅,我走在北京冬天的氤氲雾气中,恰好和一些工程师模样的人擦肩而过。

我突然想,五年前的冬夜,那群人不也是这样走着走着,安静地做出了沉甸甸的决定吗?

深爱脚下土地的人,并不一定时刻眼含泪水。他们也许样貌朴素,就匆匆走在我们身边,站在地铁站台上,汇入灯火闪烁的尘世洪流。

他们,也是我们。

往期推荐:

👉联想超算的三张面孔

👉2025:一代人冲出战壕

👉14亿人的战争:中国人用了30年望见计算力的珠峰

在猜忌燃烧的世界

做一道相信的证明题

再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax

哦对了,如果喜欢文章,请别吝惜你的“在看”“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。

Thx with  in  Beijing

阅读原文

跳转微信打开

2025:一代人冲出战壕

2025-12-29 09:04:00

原创 史中 浅黑科技 2025-12-29 09:04 北京

人和 AI 都在船上,但只有人心里有远方。

浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。

2025:一代人冲出战壕

文|史中

2025 年 11 月,我看到马斯克和黄仁勋搞了一次对谈。

他俩做出了四个预测:

1、人形机器人会成为有史以来最大的产业。

2、人类正经历一场“计算范式迁移”:GPU 不仅会替代 CPU 的“事务性工作”,还会进入 CPU 一直难以胜任的“开创性研究工作”。

3、人类作为一个文明,正(幸运地)处在上升期,对太阳能的利用比率还有大幅上升空间。未来“太阳能 AI 卫星”会让智能的成本大幅下降。

4、随着“AI+机器人”让生产力飞跃,金钱的重要性会逐步下降,工作将成为一种选择,人类彻底消除贫困。

这堪称恢弘的狂想。

不得不说,人类(中的梦想家)已经很久没有这么昂扬了。好像往日阿波罗登月的辉煌,都只配作脚下时代的序章。

放下手机,我突然想起了王兴那个著名预言:2019 年是过去十年中最差的一年,却可能是未来十年中最好的一年。

2025 走到最后,这句话所涵盖的 19 年浩荡,已经被(了不起的)我们挺过了 16 年。。。

必须承认,一场始于世纪之初的浓墨重彩的互联网大戏已近尾声,演员再奋力做派,也只能震下楼板的丝丝灰尘。

锣鼓喧闹,恍若隔世。

但作为普通观众,着实无需入戏太深。转回身,一个百倍宏大的新舞台正在布景。

我们为什么不先去占个前排?

站在 2025 和 2026 的分界点,我有一些关于未来的体验,它们未必是精雕细琢的理论,有些甚至是长久肃立身边的常识,却让我受益良多。

我想勇敢地分享给你。

(一)大航海时代重演 

如果你我能穿越。

重回艾萨克·牛顿爵士的英国,咱们有好多事儿可干。

你可以进入热火朝天的纺织厂,亲手改良纺纱机和蒸汽机;

你可以驾船一路向西,在新大陆买下一大片种植园和几百个奴隶;

你可以钻研一种叫“股票”的东西,抢先布局南海公司,狠狠割一把牛爵爷的韭菜。

大航海时代和紧随其后的工业革命时代,人类文明狂奔向上再没回头,源于两个因素:

劳动力数量暴涨

 + 

与之配合的工具进步

这里有一个值得玩味的历史细节:先有人口增加释放大量*廉价*劳动力,后有一众工程师改良纺纱机、蒸汽机。

1750 年到 1850 年,英国人口从 600 万到达 1800 万,大陆另一端的大清国人口从乾隆年间 1.8 亿激增到道光的 4.3 亿。

换句话说:“廉价劳动力数量”本身,是人类文明水位的先导指标。

然后呢?

我们在工业革命时代标注这个刻度,再把时间轴叠加到当下“刻舟求剑”一下,可以大致推测我们今天所处的位置。

我们就在新一轮“创生大量劳动力”的时刻!

你可能说:不对啊,生育率这不在下降么?

但谁说劳动力一定要是人呢?(劳动力又什么时候被当成过人呢?)

显然:AI 就是新世界的奴隶。

Agentic AI 是新世界的白领奴隶,

机器人是新世界的蓝领奴隶。

依赖生物学过程制造的劳动力,重要性从未像今天这么低。

从这个角度出发,一切新世界的角色都逐渐明晰:

特斯拉、英伟达之类的公司,就是新世界的“西印度公司、南海公司”;

马斯克、黄仁勋这类企业家,就是新世界的“哥伦布”。(可以称他们为探险家,也可以称他们为殖民者。)

AI 和机器人所创造的一切,就是新世界的“种植园”和“纺织厂”。

由此观之,我们无疑身处“新大航海时代”的开端,新大陆就在那,“奴隶”已经装船,未来几乎锁死。

但时代并非简单重演:

三百年前,劳动力虽然爆发,但总数仍然有瓶颈,是一种需要争夺的资源。

最终只有 1% 最彪悍的人控制了新增劳动力,成为工厂老板、种植园主、资本家。

三百年后, AI 劳动力爆发几乎是无穷的,它的上限是人类对于太阳能的利用率。

这个空间足够让每一个普通人都拥有充足的劳动力。

你无需那么彪悍,也能成为“新世界的种植园主”。

换句话说,2025 年,每个人的人生*可能性敞口*开始迅速放大。如同一条船从河面来到了入海口。

你要做的几乎只是:向前!

可宽阔的海面是自由的诅咒。千帆竞发,我们该用什么策略来开船?

(二)凡事使用乐观之筛

2025 年,使我受益的第一个决策是:乐观。

没错,我花了很多功夫才意识到“乐观可以是一个决策”,而非无可更改的天性。

人住在自己的长期决策里。

我们不妨思考一个极简模型:

每个人都占据了星球上独特的一平米。在每个人的区域,地面高度不同,有的人是山,有的人是谷。

时代和科技进步的红利就像从天而降的雨水。

下雨的地点是随机的,但水落到地面以后的方向并不随机,它总会向低洼地带流淌。

这种“地形”就是极简版的社会结构。

物理定律决定了,在这个结构中高海拔的人会不断补贴低海拔的人。也就是K型分化中的“下位”补贴“上位”。

久而久之,两条线越分越远。

以此观之,想要更多的雨水,不能靠手伸得长。最好的办法就是抄起铲子,挖低自己的高度。

而你的每一次决策,冥冥中定义了你是把脚下的土地挖低一寸,还是垫高一分。

那么,如何确保自己每次决策都让自己的海拔降低了呢?

答案是没有办法保证“每次”。

但我们有办法提高决策正确的概率,这意味着只要决策数量多到一定程度,正确的决策会占据多数。我们就能确定性地“降低海拔”。

这里当然可以有很多复杂的策略,但我生性愚钝,倾向于使用最简单的办法:用“第一性原理”作为筛子,筛选所有备选决策。

有点抽象。我们不妨用投资来举例。

面对一个市场,你可以对做出两类决策:做多、做空。

单次来看,做多和做空都可能盈利。但是如果你身处一个长期上涨的市场里,做空亏损的概率更大。做多盈利的概率更大。

我们可以试着从第一性原理出发来判断经济的长期趋势:在 100 年(大概一个人一生)的长期跨度里,世界的经济是会更繁荣还是更萧条?

不妨用过去 500 年的历史数据回测一下:

假设身处 1492年、 1789 年、1900 年,你分别会做出怎样的判断?(真实结果又是如何?)

结论是:过去 500 年,任何100年的周期,终点全部高于起点,没有例外。哪怕是经历了小冰期、三十年战争、明清交替、全球人口停滞的 17 世纪,依然如此。

而且在工业革命以后,这个增长斜率就越来越快。

任何战争、瘟疫都没有打破这个斜率。

更幸运的是,站在 2026 年,我们身处“过去几年的谷底”+“新大航海时代的开端”,做出乐观判断几乎比任何时候都要容易。

*长期乐观*的结论作为筛子,你就可以剔除*所有的*做空决策。只在大概率正确的方向上下注,不仅让你的决策篮子变得更轻,还提高了你的预期收益。

不妨对照一下美国股市的历史,在经历 1929 年大萧条、 1941 年偷袭珍珠港、 1947 年美苏冷战、 1973 年石油危机、 2001 年 9·11、 2008 年次贷危机、 2020 年新冠疫情前后的表现,你很容易发现:

使用乐观的投资策略,可以穿越人类有史以来的所有经济危机。

而且!越是在深刻的危机中,乐观越能让你获利!

这是 1871 年到 2025 年标准普尔 500 指数的走势。

你可能笑了,敢说大 A 么?

敢。

你看下面↓

公认比较怂的上证指数,也符合这个规律。(1990-2025)

由此,乐观不仅仅是一种哲学,也很可能是当下最大的实用主义。

巴菲特曾说:“永远不要做空美国”。

这和乐观筛子所做出的结论恰恰吻合。

多说一句,巴菲特的第一支股票就是 1942 年 3 月 11 日买的,当时珍珠港刚沦陷,美国被日本爆锤,中途岛海战还没打。

也许有浅友说,我是 20 后,还年轻,也没啥资本积累,我的“乐观”就无法变现了吗?

其实无论对谁来说,金钱都只是狭义的投资。你的注意力、时间才是更广义投资。

越年轻,意味着你手里未使用的“资本”越多。

你可以在各种决策上使用乐观之筛,例如:把时间用来锻炼而非躺平,把精力用在积极建设而非愤世嫉俗。

我们这个时代的特点是:工具极为丰富

而“乐观之筛”,是一个简单又好用的万能扳手(和所有工具都能配合)。它像船上的帆,能给你源源不断地提供朝向同一个方向的力。这种力会逐步让你站在 K型分化的上位。

当然,上位并不应该是优越感,它所带来的稳定的资源流入(例如现金流、新工作机会),应被视作一切爱与自由的前提。

之后,我们回到主线:

如果人人都有“AI 奴隶”,我们到底该让它们干点儿啥呢?

当然,AI 可以帮人解决专业领域五花八门的问题,暂且不论。

这里我想聚焦“最大公约数”,作为一个普通人,应当如何利用“AI 奴隶”目前最普惠的形式——ChatBot——对世界建模?

(三)对世界建模:从搜商到 Chat 商 

在 2025 年剑桥大学的一次交流活动上,主持人问黄仁勋:你是如何在最艰难的阶段保持信心,坚持到底的?

面对如此宽阔的提问,老黄居然猛地使出了十成功力,给出了(在我看来的)标准答案:

我们用理性去推导我们对未来的判断。

你得一步步推回去,回到计算机科学最基本的第一性原理,或者物理学的基本原理……你能抓住什么原理,就抓住什么原理。一直推到最底层的逻辑原点。

一旦你完成了这个过程,用你所掌握的环境信息和一切已有认知,构建起了对未来的理解与信念,那接下来问题就变成了:你是个“说说而已”的人?还是一个会“真的去做点什么”的人?

他在描述的,就是一个“对世界建模”的过程。

没错,每个人的“世界模型”(有时也被称为“底层认知”“元认知”)都像一个核反应堆,会在一生的跨度内持续输出能量,那才是你是否会对某件事坚持到底的底层因素。

就像一个航海家脑海里的地图↓

老黄说的是“道”,那么在“术”的层面,究竟应该怎么建模呢?

核心是两个字:数据

和 AI 训练类似,在颅内对世界建模也需要大量数据。而数据的平均质量最终决定了这个“核反应堆”的输出功率。

在印刷术之前,人们对世界建模的高质量数据来自长辈们口耳相传的故事;

在前互联网时代,人们对世界建模的高质量数据大多来自“书籍”;

世纪之初,伴随互联网发展,人们对世界建模的高质量数据大多来自“搜索引擎”。(当然互联网上的数据良莠不齐,所以“搜商”这个词一度流行。)

在 ChatGPT 出现之后,人们对世界建模的高质量数据将主要来自“ChatBot”。

能深度激发“ChatBot”并且获得高质量信息的能力,应该就叫“Chat 商”

在细说“Chat 商”之前,我想先讨论一个重要问题:ChatBot 和搜索引擎到底有什么区别?

答案是:搜索引擎在“已知内容”里搜索,ChatBot 在“可能性空间”里搜索。

打个比方吧:

假设我们人类发现的真理就像一个个岛屿。我们已经发现了 1 万个岛屿,然后把它们画在地图上。

你给出任何条件,搜索引擎的答案必须最终落到某一个岛上;

而 ChatBot 可以在岛屿之间的合理位置帮你画上一个新的岛。

这样“乱画”,必然隐含着问题。

在 ChatBot 诞生初期,这个问题尤其明显:

1、AI 帮你画的这个岛,可能位置未必正确。(幻觉)

2、即便正确,也未必准确。也就是它的回答“分辨率”不够。(答案过于笼统,没有指导性)

这个问题,由 GPT-o1 和 DeepSeek R1 开创了解决方向。

你可以这样理解:

GPT-4(及以前模型)所做的事情只有一步:在地图上画岛屿。

但 DeepSeek R1 所做的事情却是两步:1)连续 N 次放大地图;2)画岛屿。

别看仅仅多了一个放大地图的过程,却带来了本质的升级。

原有的 ChatBot 像一个瞭望塔,理论上你可以看到世界的尽头,但实际上远处的细节无法分辨。

现在的 ChatBot 像一艘船,可以开到世界的尽头,在那里无比清晰地调查细节。

这也直接催生了 2025 年最让人兴奋的技术之一:Agentic AI。

给你看一张图:

在过去的大模型中,训练消耗了绝大多数的算力(训练侧的 Sacling Law);

而在 Agentic AI 上,训练消耗算力占比大幅缩减,越来越多的消耗由推理迭代所消耗。(推理侧的 Scaling Law)

而对推理迭代的形象理解,就是刚才所说的一次次放大地图的过程。

总结一下,刚才说这么多,其实就是三句话:

1)对世界正确建模是生活的基石;

2) 2025 年,我们手上的 ChatBot 能力已经及格;

3)我们应该赶紧用它帮助我们对世界建模。

我们继续回到主线任务:到底怎么建模呢?

深度学习之父理查德·萨顿在《苦涩的教训》中提出训练 AI 的两个关键技术:学习、搜索

学习是指:根据已有的数据,提取出内部蕴含的知识;

搜索是指:在可能性空间里寻找更优解(不是搜索引擎的搜索)。

Richard S. Sutton

这当然已经成为本轮 AI 爆炸的纲领,不用多聊。

但整个 2025 年,我都在思考万维钢就此给出的衍生方法论:每一个人都应该像 AI 一样去学习和搜索,并且应该在这两件事上花掉*无上限*的功夫。

核心在“无上限”三个字。

因为宇宙具有不可约化的复杂(《最 Deep 的 Seek),所以学习和搜索是不存在边际效益递减的。它能给你的“世界建模”带来线性的新增量。

在我看来,所谓“Chat 商”高,就是:

首先理解“对世界建模”值得花费无上限的功夫;

然后能和“AI 奴隶”之间形成了一种高效的合体范式,一起学习和搜索。

合体范式简单来说就是:

1、人负责处理“不可描述的部分”,例如动机、偏好;

2、ChatBot 负责处理“可描述的部分”,也就是具体向某个方向划行。

你和奴隶虽然都在船上,但奴隶心里只想着海浪,只有你心里怀着远方。

你需要的是“AI 领导力”,或者说“AI 奴役力”。

只要你萌发出一个念头,想让 AI 帮你改善某个行为、研究某类技术、推荐特定书籍都没有问题。

念头不用很明确,但一定要抓住它,开始和 ChatBot 讨论,在讨论过程中,你不断思考有没有值得继续探索的方向。

这种建模不分领域:

可以是功利的,为解决某个实际问题而进行的;

也可以是完全无功利的,纯粹因生活中某个兴趣点驱动。

宇宙的底层规则是通行的,所以任何一个构建于其上的领域都全息蕴含着底层真理。没有白走的路,每一步都算数。

比如。。。我用 Chatbot 自学了本地运行 Z-Image 模型,下面是我的作品↓

说回来,真正重要的是:

不要认为 AI 在帮你解决具体的问题。

它是在通过解决问题的方法,帮你对世界建模!你需要*刻意*和 ChatBot 共同学习搜索,让自己的世界模型随着时间推移不断进步。

马斯克认为,为了更深刻地探寻真理,一个把全世界人的意识连接起来的“广场”异常重要。(他指的是 X 平台)

在我看来,ChatBot 也有把人类意识连接起来的功能,只不过是通过“点对点”的模式:

ChatBot 能持续提供稳定、高水平的世界模型。

随着越来越多的人(自觉不自觉)把 ChatBot 作为大脑外挂,人类作为一个整体的世界模型质量将会不可逆地大幅提高。

高质量的世界模型是一切高玩的前提。

在此基础上,我们才可以试着做一些“大决策”!

(四)中庸:分配与置信度相匹配的资源 

“新大航海时代”的船需要人机共驾。对 AI 的考验很大,对人的考验也很大。

我们不妨继续听黄仁勋怎么说:

你可以选择成为那种“哦,我当时也想过这事”“我也说过类似的话”的人,但你并没有真的行动。

而我更倾向于那种人:我会非常认真地去推理和思考,并且一旦形成信念,我会深信不疑。

坦白说,只要我脑海中能清晰地“看见”它,我就几乎当它已经成真了。其余的,都只是细节问题。

这种行为模式一点儿都不稀奇,你可以在各路大佬身上找到。

我给你念叨两个段永平的例子。

1982 年,段永平从浙大毕业后,分配到北京电子管厂,他努力工作却成效甚微,不断往深层分析,发现一个底层桎梏:计划经济的低效。

这让他推导出结论:待在“计划经济的大本营”不会有太好的结果。

那么计划经济的反向大本营——市场经济最发达的地方——是哪呢?

广东。

这才有了南下广东之后“阿段”的传奇故事。(段永平说按照广东的风格应该叫阿平,但听上去像女的,所以改叫阿段。。。)

1980 年代末的东莞

在 2001 年去到美国后,阿段开始全职投资。

他发现了每股含现金 2 美元的网易股价居然跌到了 1 美元之下,于是仔细阅读财报、请律师分析潜在风险,还试玩了网易游戏和对手的游戏。

然后他决定把所有闲置资金归集 100 万美元,甚至又破例借了100万美元,用来买网易,最终获利 100 倍。

以上两个故事很多人都知道,在故事里段永平决策也用的都是常识。

我敢肯定, 80 年代北京电子管厂也有很多人和段永平有同样的感受,世纪之交也有很多人觉得网易便宜得不真实。

但是差异在于:段永平用极高的规格“款待了自己的判断。他用自己的职业生涯押注广东,用所有的闲钱押注了网易。

换句话说,他在自己高置信度的方向上下了重注。

简单打个比方:你的判断是 1,而你押注的筹码是后面的 0。

能判断出 1 的人很多,舍得在后面写 0 的人很少。

而真正改变人处境的,不是 1,而是 1 后面跟着的一串 0。

如果预期收益很高,却没有匹配相应的筹码,本质上等于你白白浪费了自己的“世界建模”。成为黄仁勋说的“哦,我当时也想过这事”的人。

这里我引入了一个“预期收益”指标。

我私下认为,一个人的智力很大程度体现为 Ta 是否理解概率, 并且在决策中(自觉或不自觉)应用概率。

预期收益就是一个与概率相关的指标。

简单举例:

如果你认为预期收益是 5,可以投入五个零的资源。如果你觉得预期收益是 8,就可以投入八个零的资源。

注意,这俩可不是线性关系,而是个曲线。

这个曲线参数是可以因人而异修改的。但基本精神就是如此:你必须在预期收益更高的判断上,下更更更大的注。(也被称为凯利准则,凸性配置)

这里有一个技术细节:

如果你发现,面对置信度更高的机会,手中却已经没有足够的资源下更大的注,那就意味着你在置信度更低的机会上分散了过多资源,需要动态调整。

当然,只有涉及时间、空间范围足够广的决策才是预期收益更大的决策,你中午吃盖饭还是炸鸡的小决策不可能有很大的预期收益。

正如巴菲特所说:“你应该有张一生决策卡,卡上只有 20 个孔位。”

我们不妨把这 20 个决策称为“大决策”

把大决策集合在一起,形成一个组合,然后按照权重为这个池子分配手里的资源额度。

如此,就形成了一个稳固的决策池。(你不用花很大的精力每天去维护它,除非当初用以做出某个判断的条件发生了变化)

由此观之,所谓的“All in”或者“All 不 in”,都是很明显的错误操作。(或者只是一种简化的表达方式。)

我一直认为,中国文化中的“中庸”这个词是对以上策略的最佳概括。

所谓中,就是不偏,不为某个机会匹配超过或少于它权重的资源。

所谓庸,就是在每一天的行动中践行这种匹配。

同一个道理,段永平喜欢用开车打比方:你开车的目标是到达目的地,不是要快,也不是炫技。所以你不应该开快车,更不应该崇拜开快车的人。

为了到达目的地,你的操作应该是:

1)待在车道中央行驶;

2)全程待在车道中央。(不能因为犯困,或者想炫技,或者任何理由而撞上两侧护栏。)

从这个意义上说,“庸”的难度要比“中”更大。

话说人的大脑设计,根本不是为了完成超长时间跨度的任务的。大脑最初只是一个保卫基因传承的生存工具,只要能瞬时帮助生命体摆脱危险,就大功告成了。(《AI 活成了你的样子》

可是随着社会发展,竞争加剧,生存策略逐渐复杂,大脑被迫在更长的时间里维持策略。

事情渐渐变得反人性。

所以,我们必须找到一些工具来帮助自己践行“庸”

(五)知行合一:摆脱痛苦的不二法门 

电视剧《西游记》里有一个耳熟能详的情节:

孙悟空去化斋前,给唐僧画了个圈儿,叫他不要出圈儿。但最后红孩儿装成受伤,利用同情心诱骗唐僧出了圈儿。(我也是和 ChatBot 聊过之后才知道“画圈儿”这个戏原著里没有,是电视剧独有桥段。)

套用之前的理论:唐僧去西天就是一个时间跨度很长的决策执行过程,这个过程中充满了未知,稍不留神就会做出与风险不匹配的行动。就像开车撞上护栏。

孙悟空给唐僧画的“圈儿”,就是车道线,也叫安全边界。

而保证不出圈,就是纪律。

为了达到目标,需要长期稳定执行策略,为了长期稳定执行策略,你需要纪律。

严格来说,纪律不是为了防止自己犯错,而是为了让自己在框架之内犯错。

所谓框架,其实就是人为设定的“变量合集”

在框架内犯错,为了两件事:

1、为了控制损失。

在已知变量下,你更容易估算出自己做一件事的最大收益和最大损失。

比如在无人区徒步爱好者中有一个“三人原则”,就是最少要有三人结伴同行。

这样如果有一个人受伤,可以有另一个人原地照护,第三人去求助。最大损失止于受伤。

如果单人徒步,一旦走入没有信号的地区,失足跌落无法行动,最大损失就是死亡。

同理,唐僧不出圈,最大的损失就是同情心遭受煎熬,但西天的未来仍在;唐僧出圈,最大的损失就是被妖怪吃,西天的未来就没了。

2、为了累积策略。

在已知变量下,你更容易判断出此次犯错受到哪个变量影响,从而可以有针对性地改进策略。

如果你在框架外犯错,本质上你都不知道到底有哪些变量,就更不知道哪些变量与自己此次错误相关。那么你不仅承受了错误带来的损失,这个损失还没换来任何“策略的积累”。

你就是最冤的冤大头。

这就是巴菲特所说:只投资自己能看懂的公司。计划你的交易,交易你的计划。

推而广之就是:只做自己能想明白的事情。计划你的生活,生活你的计划。

重复一下结论:

1)做自己想明白的事情,未必不会犯错。

2)但这个错误可以换来策略积累,让你朝着正确的目标迭代。

3)“行至西天”才是你的根本目标。为了其他任何“支线任务”而降低接近西天的概率,都是错误的选择。

但客观现实摆在这里,西天路上真是有很多“魔”。。。唐僧出门就上当,当当不一样,他也不想,但就是会打破纪律啊!

这是人之常情。

我们的思维就像一条河,随着支流不断汇入,逐渐失去的上游的清澈。随着时间推移,我们打破纪律的可能性在不断上升。

危险的是,很多情况下我们无法意识到自己的在打破纪律。

由此,你必须用一套*可操作的*行为准则来保证纪律得到实施。

丹尼尔·卡尼曼在《噪声》中提出了一个“决策卫生”的概念。简单说,他主张做重要的决策时一定要*走流程*。

Daniel Kahneman

这至少有俩好处:

1、走流程会增加你做出决策的成本,从而抑制住过剩想象力引导你做出“轻浮”决定。

2、一旦你真的走流程做出决策,它大概率也是一个高质量决策。

卡尼曼把决策中的噪声分为很多类,其中影响最大的是“稳定模式噪声”。这种噪声来源于你的成长经历所塑造的世界观、行为习惯以及思考偏好。

在我看来,这有点儿像佛教唯识宗里讲的“阿赖耶识”里“有漏种子”的概念。

由于生活经历的复杂性,以及多因素之间的纠缠,要描述自己的“稳定模式噪声”非常难,而且几乎不可能。

所以,最好的抑制噪声的方法就是放弃“端到端输出”,转而尊重“分段流程”。(在“端到端”备受推崇的今天,这是一个有益的提醒。)

一个简单的例子就是量表:

你做一个决策,不能拍脑袋。而是画一张表,它的利弊分别有哪些?列在表上,然后分别对这些利弊打分,然后加起来算总分。

具体到人生只有二十次的那个“大决策组合”。

每当你想做一个新决策时,首先要去判断和既有的“大决策组合”是否相冲突。如果冲突,就要重新评估一下大决策组合里相冲突的决策。

还是举个例子吧:

段永平离开北京,意味着要放弃“北京户口”。这在当时的朋友看来得不偿失。

如果为了户口而留下来,就会和之前的决策产生冲突。

段永平走了一个流程:他评估了一下北京户口的“价格”,当时值 1 万人民币左右。然后他计算了一下自己投入市场经济可能带来的收益,应该是远远大于 1 万人民币。

于是,他维持了原来的决策,否决了新的决策——最终还是去了广东。

这就是决策卫生。

在每一个新决策面前都走一遍“决策卫生”流程,就是在遵守纪律。

正是因为坚持“决策卫生”,巴菲特在很长的时间里一直不投资科技股,现在看来,这个机制让他为错失了非常好的机会,当然也保护他没有撞到护栏。

把自己的行为限定在一个圈子里,在很多时候是违背直觉的,这会带来纯纯的痛苦。

那么,我们就该强行忍受这种痛苦,闭眼待在既有的圈儿里吗?

当然不是。

如果你是唐僧,最好老老实实呆在圈儿里,如果你变成了孙悟空,就不用待在这个破圈儿里了(你的圈儿扩大到了如来佛的手掌那么大了。)

之所以每次都要不厌其烦地走“决策卫生”的流程,而不是简单固守之前的决策,就是因为你走完流程之后真的有可能改变之前的决策。

什么情况下你会改变之前的决策呢?

第一种:你得到了新的信息。

第二种:你的“世界模型”进化了。

实际上,每当你使用“新版世界模型”对之前的决策做校验的时候,无论是否改变策略,你的安全边界其实都是在扩张的。

于是,我们又回到了第三章的内容。你必须通过(和 AI 一起)学习来改进对世界的建模,由此才能扩展安全边界。

反过来说,当你感觉到痛苦的时候,并不是该“出圈”锻炼胆量的时候,而是该“扩圈”,也就是通过输入高质量数据来学习的时候!

巴菲特还有一句名言:我一生中最好的投资不是买了哪只股票,而是不断地投资自己。

这里的心法极为简单:

1)永远保证在安全边界内正确行事;

2)时刻精进自我,扩大安全边界。

只要你真正理解了底层原理,去践行也并不困难。

在中文里,有一个更加优雅的词汇形容这个状态——知行合一

(六)一代人冲出战壕 

最后,让我来实操一把“知行合一

我决定就以上几章的思考和 AI 进行一番探讨,看看我是否能在“AI 奴隶”的帮助下,真正对生活方式做点儿改进。

我选择的奴隶是 Grok。

我问它:对于个人来说,《苦涩的教训》中所揭示的 AI 训练方式在日常生活里有哪些实践方案?

他给我想了三个方法:

一、把生活变成“梯度下降游戏”。

具体来说是这样:

1)定义你的核心目标池,例如:金钱、健康、创作、关系。

2)用电子表格把所有的行为的时长记录下来——睡眠、运动、阅读、写作、社交,等等。

3)每 2-4 周让 AI 帮你做一次“损失函数评估”,哪些变量和你的核心目标相关性最高?然后减少低相关性的行为,增加高相关性的行为。

二、把劳动尽可能外包,自己只做“搜索空间设计”。

在日常工作中,你要越来越像一个“AI 训练师”。

你的核心能力变成:定义目标函数 + 提供高质量数据 + 设计奖励机制,而非亲自执行。

例如,把图片制作交给 Midjourney,你来精修;把代码交给 Claude,你来验收;把重复工作交给 Zapier,你只定义触发条件。

三、用“生成-筛选”替代精雕细琢。

让 AI 先做 100个垃圾出来,然后从中挑选 3 个可救的,精修这 3 个。

接受 97% 的产出是垃圾,但剩下 3% 会碾压所有“完美主义者”的 100%。

我把这三个方法也送给你。

作为普通人,进入新大航海时代的广阔洋面,大概都要对现有的生活和工作方式进行巨大改造。而且每个人的改造方式都是个性化的,这意味着巨大的投入、不确定性和不安全感

但别忘了我们的“中庸”和“知行合一”。

你需要为高置信度的未来匹配相应的资源。(这才是安全的终极来源。)

在我看来,过去 20 年的生活方式塑造了我们太多对“确定性”的执念,它已经无法适应未来的 20 年。

我曾经在《最 Deep 的 Seek》中介绍过计算机科学家沃尔夫勒姆的研究:

在复杂系统中,因果关系极为不清晰,甚至可以说不存在因果。

假设你重复在南美蝴蝶煽动翅膀之后观察到一个飓风,那么你不必搞清中间的传导过程(你也大概率搞不清),而是可以直接用模型标定二者的相关性,然后利用相关性达到你的目的。

抖音赖以成功的推荐系统的工作原理就是如此:

一个内容在小规模用户群里收到了大量点赞,就直接推给更大的用户群,如果仍然获得高赞,就推给更大的用户群。

从头到尾,抖音完全不用知道这个视频内容为什么被喜欢,甚至就不用知道视频的内容是什么。(只要它合规,爱是什么是什么。)

正应了“股票大作手”利弗莫尔那句话:看到信号立即采取行动,而不是搞清楚原因再动手。

在一个变幻莫测的大时代:你要训练自己搞不懂“因果”的前提下,可以依赖“相关”继续行事。

这次 AI 浪潮中,美国和中国的科技断崖式地领先于欧洲和日本,在我看来,与这两个国家承继了互联网时代的*工程师思维*密切相关,那就是:尽可能用“相关性”(How)而非“因果性”(Why)来制造系统。

先不预设立场,允许各种形态的创新生成,让子弹飞一会儿,最终再根据顶层意图进行筛选。(而非从一开始就把所有的发展路径都推导清晰。)

这种利用“不确定性”进行经济治理的方式,不和我们利用 AI 大量生成,然后再做筛选-精修的过程完全一致么?

作为地球 Online 的玩家,我们可以期待的最好结局也许是:

人类将会利用能源驱动 AI 和机器人对任何目标发动“饱和式攻击”——所有创意都可以被迅速验证、实施。

在这个结局里,想象力将会成为最后的瓶颈,能源将会成为唯一的限制。

在这种高效熵增机器的加持下,人类也许将要第一次正式冲击卡尔达肖夫尺度中的 Type1 级文明。

说实话,这个好结局未必百分百会被(不靠谱的)人类打出来。。。

但“乐观之筛”强迫我不得不认真思考这个未来。

更具确定性的,也许是未来十年内就会出现的一个 Check Point。

当 AI 顶着生产力拐头向 12 点钟方向行进,大量商品被廉价制造,增发的货币会被稠化,滞涨的天花板被捅破,人类有希望再次进入温和通胀的增长周期。

站在彼处回望,2025 年可能会极为特殊,它是旧剧最后的高潮,新戏锣鼓的初响。

那时,我们或许可以心安理得地追认 2025 为某种“拐点”。

历史可能正在转向,你我都有责任知道这一点。

战壕的存在,是让士兵作为掩体,但没有任何一场战争是靠躲在掩体里赢下的。

当时代凌厉的子弹扫射渐渐减弱,那就是一代人冲出战壕的时刻。

往期推荐:

👉最 Deep 的 Seek:AI 的“终极设计图”是什么样子?

👉当 AI 活成了你的样子,而你活成了狗

👉我们该不该怀念2021?

👉2022,我们在幽暗的谷底守护一朵花

👉2023:当我们都活成了“大模型”

👉2024:赛博羔羊,不投降

人和AI都在船上

但人心中有远方

再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax

哦对了,如果喜欢文章,请别吝惜你的“在看”“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。

Thx with  in  Beijing

阅读原文

跳转微信打开

夜里,我偷偷用“千问AI小剧场”演了十五部短剧。。。

2025-12-16 19:29:00

原创 史中 浅黑科技 2025-12-16 19:29 北京

一晚上,四大名著被我演完了。

浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。

事情是这样的,最近我摸鱼的时候,发现 OpenAI 的 Sora App 火了。

这玩意儿就像抖音。

区别在于:你不用真拍视频,而是用嘴撸一段话,它就能直接根据描述生成视频了。。。

更牛的是,你还能上传自己的脸,让自己出演小视频!给你看看中哥唱 Rap↓

我刷了一阵儿,随即忧愁袭来,这么厉害的东西,咱中国好像还没有吧。。。

于是我悄悄问了一下(我觉得最有希望的)阿里同学,没想到他们发了个神秘的表情,跟我说:你升级一下千问 App 试试!

千问 App 居然发布了一毛一样的功能,这就是——“千问AI小剧场”

我赶紧升级了千问,果然“AI小剧场”按钮就水嫩嫩地躺在对话框上边。

千问同学告诉我,他们的 AI 小剧场有俩地方很强:

一是可以自动切换分镜头;

二是人物可以说台词,声画都是一致的。

我想了想,这玩意儿贼岂不是适合做短剧,过一把飙戏的瘾?

那我就不客气了!赶紧上传了自己的头像,一切 ready!

幸福来得太突然,我竟有点儿茫然,该演个啥嘞?

咱第一次“触电”,可不能亏待自己,我决定演一个《水浒传》里的英雄好汉!

一百单八将里,我挑了——西门大官人。

给你看看我和潘金莲的对手戏↓

别看制作挺精良,其实我写的提示词很短:

@史中穿越到了电视剧《水浒传》里,成为了西门庆,打扮和西门庆一模一样。 @史中和潘金莲喝酒调情。

其中的动作啊,台词啊,都是 AI 自己给设计的。。。别说,正中老夫心意呀!

注意,这里的“@,就是点名出演的意思。

我只要上传了头像,就可以@我自己;你上传了你的头像,也可以@你自己。

当然系统还内置了好多形象,有梵高、关羽、甄嬛各种,你想@谁出镜都行!

既然大官人演得旗开得胜,接下来得演个更趁钱的啊!

比大官人还有钱的,那就是和大人了!

给你看看我的演技↓

这个视频我导演欲爆棚,用了更具体的提示词,连分镜都写清楚了:

@史中穿越到清朝,成为了和珅,正和家里的妻妾一起喝酒。说:“穿越成和珅和大人,也太爽了!”

门口走进来几个太监,手里托着长长的白绫,对@史中说:“皇上赐您升天!”

@史中大惊失色。

你对照我的提示词看一下视频就会发现,这细节跟的也太准了!

每一个我描述到的细节,它都呈现了。

每一句我写的台词,它都精准地说了,而且情绪非常对味儿。

每一处需要切换镜头的地方,它都给切换了。你甚至没感觉。

千问同学告诉我,这种精确的能力归功于阿里最新的视频生成模型“Wan 2.6”

你可以简单理解,Wan 2.6 就是一个专门面向影视制作的模型,在训练的时候,就针对“角色复刻”“声画同步”“多镜头叙事”这些能力调教了个够。

技术科普有机会咱再细嗦,现在我想接着玩儿。

《水浒传》演完了,索性来《三国演义》客串一个。这回你猜我准备演谁?

没错,我演的是华雄。。。

你看,这里我其实指定了两个角色,@史中 和 @关羽,模型把两个人的形象都驱动了。而且关羽这个红脸的汉子,脸是真红啊,颇有喜感。

虽说演反派考验演技,但总演反派阻碍中哥我事业发展啊。。。

我决定,演一个拯救世界的大英雄!

知道 1944 年盟军诺曼底登陆为啥能成功么?

还不是因为中国开着高达帮他们铲除了德军的滩头阵地!

知道比特币是怎么出现的么?

还不是因为十几年前中哥化名中本聪运行了创世区块!

知道米开朗琪罗为什么能画出《创世纪》么?

还不是因为中哥给他当枪手!

你生成的每一部作品,(只要不嫌丢人)都可以上传成为公开作品,这样别人就能刷到了!

刷到的人如果觉得创意不错,Ta 也想来个同款,其实都不用费劲再写提示词。

只要点视频下面的“AI 翻拍”,然后把其中人物替换成你自己(或者任何人)就可以直接二创。

就在红框的位置↓

比如这个丝瓜老奶的走秀视频我觉得不错,一键替换成我的脸,中哥走得比她专业。

当然,你想用卡通形象做“二创”也没问题,一句话的事儿。

比如下面这个,我直接打字让它换角儿:

成了:

玩到这儿,我的身体好像打开了。。。思路也打开了。。。

千问AI小剧场其实不仅可以拍电影,它还可以模拟各种拍摄场景。比如监控录像,比如手机随手拍。

那我就会玩儿了!

快过年了,没什么多余的钱可以给我老妈,就给她发一个我穿名牌开豪车的视频吧,证明一下我混得还不错!

但做出来之后发现,我这形象,怎么看都不像开豪车,纯像跑滴滴。。。

那就别怪我不客气了,搞一个彩票中奖的“现场视频”给我妈看吧。。。

你们感受一下,蒙老太太是不是足够了?

客串了十几种不同的人生,根本停不下来。猛然抬眼已经快半夜了。。。

如此沉迷可不好。

我决定最后刷刷大家在小剧场里的作品就睡觉。

刷着刷着,突然意识到,之前我那戏精玩法其实都在憋着挑战“千问 AI 小剧场”的极限。一般情况下,大家最喜欢玩的还是那种“薄皮大馅儿”的穷欢乐视频

于是我又不困了,把这些无厘头的视频也试了一下,千问 AI 小剧场可以说毫无鸭力。

比如,岳云鹏和马斯克一起说相声↓↓↓

我和刘欢一起唱《好汉歌》↓↓↓

我和马斯克一起跳肚皮舞↓↓↓

如果你和名人一起玩腻了,想和朋友一起玩,也没有问题。

我发现千问 AI 小剧场专门有个功能,叫“邀请好友”!

试了一下,流程是酱:

你只要点“邀请好友”,它会自动弹出一个剧本,让你和朋友一起演。

如果剧本不满意你也可以一键更换。

把这个邀请直接发给朋友,Ta 只要同意上传自己的形象,就能自动生成你俩的“合拍视频”了!

就像这样:

毕竟是免费玩儿,千问同学告诉我,这两天用户爆炸式增长,服务器也是压力山大。来晚了可能生成视频要排队。

我不允许浅友们比别人来得晚。。。

我把邀请口令放在评论区,你可以复制之后打开千问 App 试试,然后可以继续邀请你的朋友一起玩~

孟子云:独乐乐不如众乐乐嘛!

延伸阅读:

👉当年轻人在说“夸克真香”,他们在说什么?

👉十年了,世界欠我的那副 AI 眼镜,终于来了!

👉15 年前为双11“渡劫”的技术,却打通了AI的任督二脉

👉2024:赛博羔羊,不投降

AI 帮我实现演戏自由,

这是什么奇葩科技树?

再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax

哦对了,如果喜欢文章,请别吝惜你的“在看”“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。

Thx with  in  Beijing

阅读原文

跳转微信打开

15 年前为双11“渡劫”的技术,却打通了AI的任督二脉

2025-11-10 10:43:00

原创 史中 浅黑科技 2025-11-10 10:43 北京

计算是一场深刻的模拟。

浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。

15 年前为双11“渡劫”的技术,

却打通了AI的任督二脉

文 | 史中

快来吧奔腾电脑

就让它们代替我来思考

1999 年,朴树唱出了这句歌词。

而后,时光把你我绑在刀尖,猛地刺穿新世纪的四分之一。无数孩子眼中的遥远未知,眨眼已坍缩为大人的细碎回忆。

2025,我们短暂停靠在了 AI 站台,回望迷雾,一颗子弹正中眉心:当年歌者的无心呢喃,竟是呼啸而来的预言。

(一)困在船上的师傅 

“10、9、8、7。。。”

随着零点读秒,又一年双11开始冲刺,红包如瀑宣泄,直播间呐喊起伏,快递车连夜奔忙。

此刻谁也不会记起,15 年前,这群工程师曾经做过的另一次读秒——淘宝的“爆炸”倒计时。

那是 2010 年“双11”,眼看淘宝系统就要被 3 亿剁手党冲垮。在只剩 4 秒的时候,杀掉了一个数据库,才保护淘宝这艘巨轮没有被浪头吞没。

这就是很多人都听说过的“惊魂 4 秒”的故事。

之所以要提起这个往事,是因为它不止代表阿里,也不止代表中国师傅,而是代表了整个人类在 15 年前面临的技术困境

话说,人类发展有一个稳固的底层逻辑:犯懒——总想用能源驱动工具来替代自己的劳动。

具体到计算机这个工具,主要是用来替代人类的“脑力劳动”。比如最早在军事上替代人类弹道计算员,后来在能源勘探上替代人类地质计算员。

这是美国第一颗人造卫星“探险者 1 号”使用的计算员,是真正意义上的 Computer。根据图灵的定义,计算员是“遵循固定规则,无权在任何细节上偏离这些规则的人

那在当时的淘宝系统呢?主要替代两类人:

一类是前台“售货员”,剁手党点什么商品,就给 TA 看什么商品,再推个购物车跟着。

一类是后台“会计员”,负责把下单的价格、数量、型号都记录清楚,后续好给人家发货。

在 2010 那个时间点上,它俩代表了两种经典计算架构:

这“售货员”跑在小巧的 x86 服务器上。救它相对还容易,因为服务器有点儿像隔断船舱,这个船舱塞满了,可以找另一个稍空的船舱借点儿地方。

可即便如此,腾挪还得靠人。这边嘴上吼,那边手上敲,稍微手慢一点就会挂掉。

这“会计员”就更难救了,它跑在一整套*专用*的软硬件系统,由 IBM 小型机、 Oracle 数据库和 EMC 存储系统组成——这就是大名鼎鼎的“IOE”

IOE好比轮船的轮机室,总共就这么大的功率,商品库、交易库、用户库,所有库挤在里面一同施压,要想不爆炸,只能关掉一些系统。

直说吧:彼时这俩“赛博牛马”,都已经不太称职了,这对人类这个老板来说是灾难。

你也许没当过老板,但肯定打过游戏,用上一关的武器对付下一关的 BOSS,会极其吃力,甚至完全失效——BOSS 的毒打会逼迫你寻找新的武器。

就在历史的巨大缝隙面前,一支敢死队出发了,他们的任务就是:从虚空中悟出一种新武器,能够打败“双11”这个大 BOSS。

这个新武器,绝不能再像孤悬海上的船,有沉重的轮廓阻挡扩容;而是要飘在云端,像金箍棒一样收放自如。

它就是阿里云的基础技术——弹性计算

注意,这个弹,绝不能是“人肉弹”,而是要在赛博空间建立一套*工业流水线级*稳定可靠的系统,自动感知及反应微小的颤动,毫秒级就把计算力调度得纤毫不差的弹!

阿里云的第一行代码

敢死队手握一纸计算独立宣言

不仅要让计算从(美国定义的)传统软件时代的 IOE 体系里独立出来;还要从(中美共同定义的)互联网时代造就的“软件直怼硬件”的框架里独立出来!

“一次跨两代”,相当于从封建社会直接迈入社会主义。难度有多炸裂,简直不敢想。

你或许不知道,从起草计算独立宣言,到弹性计算的旗帜高高飘扬,中间已经历了漫长的 5000 多个日夜求索。

你或许不知道,“独立”并非终点,计算系统对智能的模拟越来越深刻,竟然创造出了智能本身——AI。

但阿里云这群疯子早就知道,从出发的那一刻就知道。

今天,中哥就借着弹性计算团队的故事,科普一下这段中国师傅的十五载硬核征程。

(二)弹性计算就像炒菜 

讲故事之前,咱们不妨先来点儿暴力——撬开机箱盖子看看里面。

都说治大国如烹小鲜,依我看,弹性计算也如厨师炒菜。

每一个机箱里,都有一个厨师,他就是厨房的灵魂,CPU;

厨师切墩、炒菜的过程,就是计算;

厨师炒菜用到的炉灶、锅盆、调料,就是软件;

不时有食材送进来,也有炒好的菜送出去,这些都是数据;

而传菜的窗口,就是网卡;

当然厨师还会把一些食材、半成品放进冰箱储存,这个冰箱就是硬盘;

这样几百万、几千万个厨房组织在一起,所形成的巨大的“炒菜能力”,就叫——计算力!

了解了如上的比喻,你自然会得出结论:

所谓宏观上的计算弹性,其实就是微观上厨师听话的程度。

想想看,如果你有办法在*短时间内*精准改变*每个厨师*的任务状态:

例如,让某几百万厨师从待命变成颠勺,让某几十万厨师从炒菜变成往冰箱储存,让某几万厨师从做鱼香肉丝改成做法式蜗牛,让某几个厨师从切丝变成切条,不就等于能让计算力瞬间变大变小,随意调度了吗?

这里有大难题!

厨师一直待命,但它不能凭空炒菜,需要很多“家伙事儿”,这些就是操作系统和软件。而且根据炒的菜系不同,家伙事儿也不同。

但给电脑装过系统的都知道,安装不仅慢,而且还得根据硬件不同选择版本,不可能在短时间内完成。

诶,那时业界老师傅已经想出一个方法——在厨房里再做一个厨房。

具体分三步:

1、根据任务不同,把需要的设施都打包装修在一个个“小样板间”里;

2、样板间是一个隔绝的小世界,可以随意挪动,也可以快速克隆;

3、炒菜任务来临时,只要提前一两分钟把一堆样板间 Ctrl+V+V+V... 放进无数厨房里,就可以开干了!

没错,这个样板间就是“虚拟机”

有了虚拟机,大厨们再也不能以“厨具没备好”为理由摸鱼了,来活儿就得乖乖接。

别急,大厨们的“好日子”才刚来。

由于虚拟厨房很小,一个厨房里可以塞进很多个虚拟厨房,这意味着一个厨师可以*同时*照顾很多道菜:在这边炒两下青菜,去那边翻一下烙饼,再去那边拍一拍黄瓜。

把不同的任务穿插起来,完美压榨厨师的时间,真是牛马看了会落泪啊!

正因有了虚拟化技术,计算这件事被成功推上了工业流水线:厨房(在调度层面上)被连在一起,组成*中央厨房*

这就是“弹性计算”最初的模样。

手握锤子,赶紧砸钉子:老师傅开始大规模使用弹性计算替代“前台的售货员”,果然效果拔群。

同样的硬件设备,因为“厨师”空闲更少了,相当于模拟出更多的售货员。(你品一下)

就像这样↓

然而!他们比划了半天,发现这“后台的会计员”还是没办法弹。。。

原因跟“工种”有关。会计员负责算数,哪怕算错了一分钱,记错了一笔订单,都是重大事故。

这个活儿相当于让厨师们做满汉全席给老佛爷吃,但凡有地方盐多了、醋少了,都是掉脑袋的罪过。

当时虚拟化加持的弹性计算系统,根本做不到这么稳定。(至于原因,我们在下一章详解。)

好不容易研发了弹性计算,却不能一把实现“计算独立”,未免有些沮丧。。。

不过罗马不是一天建成的,眼前至少还有个好消息:

就在这个阶段,互联网行业崛起了一个新的“工种”——数据研究员。数据研究员负责从海量的数据里提炼特征,为不同类型的用户和商品都打上标签,以备后续推荐。

没错,这就是:大数据系统

在 2015 年以前,很多国民应用的爆火,最大的功臣都是大数据加持的“猜你喜欢”系统。比如手机淘宝、今日头条、微博,不断推给你感兴趣的商品或内容,才牢牢抓住你。

多说一句,别看“大数据”和“数据库”都带“数据”,实际上大数据系统的只是做定性分析,偶尔算错一个数,或者算得慢一些,都无妨大局。

就以当时最主流的大数据系统 Hadoop 为例,你可以极简理解为:它就是用一套公式,把数据库里所有的数都算一遍。

而 Hadoop 的创新在于,它能把这种计算拆分成无数独立的小计算。小计算的结果捏合起来,就能得到最终结果。

这,不正适合新生的弹性计算系统么?

每一个小计算,都能放在一个(大厨房里的)虚拟厨房里。

每天人类下班以后,“赛博厨师们”就上班,把这一整天新增的数据都给“炒熟”。

就像酱↓

那几年,阿里巴巴内部的各个业务线,爱尝鲜的老师傅都用“中央厨房”搭建了各自的大数据系统,这些师傅,后来好多也成了阿里云的悍将。

之所以要说“后来”,是因为有个历史原因:最早阿里巴巴的底层技术团队和阿里云的技术团队分属两边,后来慢慢合并的。(详见《中国人用 30 年望见算力珠峰》《阿里云的疯子》

那么,当时的阿里云团队在忙啥呢?

他们忙着把弹性计算包装成产品(ECS),系上蝴蝶结,满世界寻找客户,准备大庇天下寒士!

最初一批“寒士”,就是阿里巴巴收购万网之后继承过来的中小网站们。

中小网站,和淘宝这种网站比起来,那简直是蚂蚁 VS 大象。

很多小网站全部代码只需要一个虚拟机就能跑起来,而且一天也没几个人访问,相当于厨师们都闲着,就算底层的弹性计算的架构“不结实”,也不至于出问题嘛。

阿里云的师傅们开始乐观了,小网站行的话,那大网站行不行?网游行不行?政企行不行?

现实的毒打马上就来了。

(三)烦恼的源头:“打扰税” 

话说,在轰轰烈烈的“计算独立运动”中,涌现了一批扫地僧,专门负责“搬家”,也就是协助各个业务搬到弹性计算上。

杨曦就是其中一员。

他有点像老中医,一个系统摆在面前,他把把脉,就知道目前的弹性计算的能力够不够支撑,从而决定是现在上还是等等上。

在他和同事的努力下,每一年“双 11”都有更多的淘宝模块被搬上弹性计算,不再忍受“人肉云计算”的煎熬。

阿里云弹性计算产品解决方案负责人 杨曦

2014年,组织上看中了他的医术,调他来阿里云帮一帮外部大客户上云。

杨曦一来,才发现这是个坑。。。

外部客户不像阿里同事那样,把自己的业务系统全都拆开摸索着上。人家手里的是售货员、观察员、各种员长在一起的“连体系统”,要上就一起上!

这样的系统在弹性计算上能跑明白吗?

两个字:看命。

杨曦记得,当时手游刚刚开始火爆,有很多游戏厂商面临和“双11”类似的难题,一做推广促销,服务器扩容就跟不上,结果浪费金钱、浪费大好机会。

他们听说阿里云这个老中医专治“双11”,满怀期待用了弹性计算。结果计算力倒是有弹性,可负载一重,系统就*随缘*出 Bug。。。

Bug 不怕,怕的是随缘——老师傅就像原始人看见雷公电母那样无助。

所有故障都指向一个地方:虚拟化系统。

上一章我答应你,要讲讲不稳定的具体原因。现在咱们开始:

一个厨师,面对眼前的五个虚拟厨房里,最难的是啥?当然是掌握每一个厨房的进度,在各个任务里精准地*切换*。

为了切换,他得有个日程表,而日程要靠“规矩”来定。

我随便编几个规矩你感受下:1)某个灶上的水开了,就要赶紧中断其他任务,跑过来下饺子;2)某个炉灶里的菜冒烟了,就要赶紧中断其他任务,过来翻炒。

像这样的规矩有好多条,它们编成了一个厚厚的“操作手册”,这个手册就是“虚拟化架构”,它放在一个桌子上,也就是“宿主操作系统”。

厨师每炒几下菜,都得坐回到桌子前面,对照手册算一下,确定接下来该操作哪个炉灶。

这种情况,其实无法保证菜不糊,因为“确定下一步”这个动作本身,就会占用厨师的时间和精力。

假设:同时五个厨房都在进行步骤很复杂的菜,厨师为了搞清楚下一步该给哪个厨房做,要在桌前算很长时间,这边刚搞清楚,那边的菜已经糊了。。。

这下你知道,为啥负载一重,虚拟化系统就爱崩,而且还随缘崩了吧?

阿里云赶紧满世界贴告示“重金求子”,如今的阿里云弹性计算通用虚拟化负责人,大神沈益斌就是这个当口加入团队的。

沈益斌还记得,当时他们几个师傅使出毕生绝学,把各种能想到的情况都做成精巧的补丁,打在系统里,给虚拟化架构续命。

到后来补丁摞补丁,也摞不动了,他们只好采取“惹不起,躲得起”的六字方针:主动帮客户定时释放内存,或者监测到哪个地方负载高了,赶紧把一部分“虚拟厨房”迁到提前准备的“备用服务器”上。

就这样,云计算又硬生生退回到了“人计算”。

人是最不靠谱的动物了。

即便用人来填,到后来也不好使了:移动互联网方兴未艾,不到半年,客户负载密度又提高了十倍。这时你要保证不出事儿,就得准备十倍的服务器放在那准备腾挪。这么多服务器,用裸机都能支撑业务峰值了,还“弹”个毛线啊。

老师傅被逼到了悬崖边。

2015年,团队下定决心,玩命跳向对岸,重构所有的虚拟化代码,从 Xen 架构到 KVM 架构。

他们跳过去了:KVM 这个新的操作手册轻巧多了,厨师不用每次都跑回桌子前面,而是可以带在身上,随时拿出来算一算下一步该干啥。

这一下,一般的重负载,弹性计算都能绷住,绝对不抽了。

眼看阿里云上外部客户骂声能歇一歇,淘宝也能再挑出一部分负载较重的系统上云了。

老师傅擦着汗,给自己偷偷点了个赞。

之所以偷偷,是因为他们心里都清楚,更换虚拟化引擎,最多能顶个三年五载,但绝不会是终点。

因为搬家师傅杨曦已经帮他们试过了,即便最新的 KVM 引擎能承担很多重载,却仍旧没办法支撑“双11”状态下满负荷工作的会计员(数据库)。

这到底是为啥呢?因为数据库在满载时有个缺德的特点:“高 I/O”

还用厨房举例吧。数据库的基本功能可以抽象为两件事:存一个数(I),取一个数(O)。这就相当于让厨师把食物放冰箱,以及从冰箱里取食物。

在“双11”这种情况下,它存取的频率极高。

指令是发给五个虚拟厨房的,但实际只有一个厨师干活。。。

而且别忘了,这么多请求同时过来,他还得照手里的小本本算,先搞那个后搞那个。

每次“低头+算一算+抬头”的时间,就和它放一件东西在冰箱的耗时差不多长了。原本就紧张的时间,这下彻底不够了!

你看到了没,这里出现了一个死结:

要想实现弹性,就得有虚拟化;要想虚拟化,就会出现一个厨师对多个虚拟厨房的情况;只要厨师一对多,就涉及到日程切换;一旦编排日程,就得来回看本本;一旦看本本次数多,厨师的工作效率就直线下降。

这个死结有一个名字:虚拟化损耗。

而虚拟化损耗的本质,就是厨师“被打扰”产生的精力开销。虚拟化损耗的本质就是“打扰税”。

越是小而多的任务,打扰就越频繁,打扰税就越重。

别说沈益斌,就是天王老子来了,他也得交这个“税”。可只要有税,数据库就交不起!

“计算独立宣言言犹在耳,难道说,弹性计算永远无法一统山河,永远要在土地上给传统计算留一块扎眼的“租界”吗?

孔子曰:面对死结,最好的方法不是去解,而是找一把刀,把丫劈了!

(四)金箍棒铸成!

我问你:有谁规定,编排厨师日程这个活儿,必须得厨师自己干?

当时老师傅被逼急了,也问出了一毛一样的话。。。

你给厨师配个秘书,能死吗?

这个秘书,就是后来救了所有人一命的神龙 CIPU。

秘书守在窗户前面,举着小本本,每每从窗口传进来原料,他就直接帮厨师算好了日程。

厨师下一步要干啥,完全不用自己操心,可以两耳不闻窗外事,一心只顾颠大勺。

这样一来,打扰税直接降到了“0”!

你可能会说:不对吧?这个活儿还在,只是换了个牛马干啊。。。

诶,让驴拉磨和让狗拉磨,那效率可是天差地别。

CIPU 的总架构师杨航告诉我,CIPU 这个秘书生下来就是为了分配任务“定向培养”的芯片,它(在这个特定任务上)的计算密度是厨师的千倍万倍。

2017 年云栖大会上推出这个专用芯片的时候,杨航完全没想到一个月后世界云计算的公认领导者 AWS 也发布了同样的玩意儿,他更没想到,CIPU 的用处居然比他之前的设想更广泛,更激进。。。

激进到啥程度呢?

激进到连“虚拟厨房”都可以拆了!

回忆一下,当初之所以要设立虚拟厨房,是因为啥?因为锅碗瓢盆很难快速备齐对吧?

现在,老师傅掌握了另一套方案:

1)每个厨房都先安装好基础的炉灶、油烟机。(这不够对付所有菜系);

2)使用一种筐,把当前这道菜所需的专用工具和食材打包放在里面,从窗口biu~biu~biu~递进去;

3)厨师不用挪地方,只管站在操作台前,秘书把哪个筐递到他面前,他就干哪个活儿!

这个筐,就是大名鼎鼎的“容器”。

当然为了复制和移动方便,最好别一次性把一道大菜的所有工具都装一个筐里。你可以分在不同的筐里,相当于把一道菜的工序切碎,变成“微服务”。

就像生产线上打螺丝:每个厨师只做一小步,然后就传给下一个厨师。他甚至不用知道自己在做啥菜,让你切萝卜就切萝卜,让你给锅里放蒜就放蒜。

分布式炒菜,妥妥的。

既然厨师们在广大的网络中协作,秘书们就没办法自扫门前雪,而是要拉一个“秘书群”:任何一个秘书都要准确知道眼前这个筐里的食材从哪来,下一步要送到哪去。

换句话说,在云上协作体系中,秘书变成了和厨师一样重要的角色,它成了云计算的基础设施计算芯片,没错,CIPU 的全称 Cloud Infrastructure Processing Unit 就是这个意思。

云雾中,“金箍棒”雏形初现:

1)有了容器,中央厨房具备了收放自如的弹性,瞬间变大变小;

2)有了 CIPU,厨师们可以在收放自如的前提下摆脱“打扰税”,聚精会神在自己最擅长的炒菜上。此刻他们的效率,和在最早的“实体厨房”里是一样的。

看着以上这俩特点,你意识到了什么没?

没错,十年艰苦战役,打扰税降为 0,终于可以敲锣打鼓把“会计员”(数据库)请上弹性计算了。。。

更准确的说法是:终于可以把账目交给云上的会计员去管理了!

就在 2020 年前后,阿里巴巴集团核心数据库陆续搬上 PolarDB 等等自研云数据库。

征服“会计员”之后,弹性计算彻底杀疯了,已经没什么“员”不能被计算力替代了。

比如现场促销员,就是当时已经流行的“实时计算大数据系统”。它会把用户的每一次点按拿回去立刻计算,几毫秒之内就要调整推荐策略——弹性计算可以支持。

比如找货员,就是你熟悉的“搜索引擎”,这是一个和数据库类似的高 I/O 系统,还涉及全球范围内的信息传输——弹性计算也可以支持。

凑齐这一套“赛博牛马”盲盒后,阿里云上的“大迁徙”已经势不可挡。

容器服务负责人易立回忆,智联招聘前两年特别头疼的就是招聘季突然会有大量的毕业生涌入平台,算力需求暴增。为了服务不挂,他们只能按照峰值准备厨师(服务器)。

可一过旺季,很多厨师就闲着了,每天摸鱼,实在浪费。后来他们索性迁徙到了阿里云的容器计算上,每秒用几个厨师就付几个厨师的工资。

这样精细切分,综合成本比之前降低了恐怖的 40%。

同样搬迁上来的还有 OPPO、得物、小红书。。。数不胜数。

相当于阿里云准备了一套极其高效的中央厨房,你们这些大酒楼小饭店只管拉客,菜我给你炒!

看到这儿,估计你产生了另一个疑问:

别人用你几秒钟厨房就付几秒钟的钱,人家倒是没损失了,你阿里云的中央厨房不就承担了闲置的损失吗?

这个问题,恰恰是我最早有意略过的,也是弹性计算的最精彩一块拼图。

一切红利都来自宇宙的基础特性:时间!

小红书的峰值,和 OPPO 的峰值,和智联招聘的峰值,和阿里云上千行百业的峰值会同一分钟到来吗?会同一秒到来吗?会同一毫秒到来吗?

观察的时间颗粒度越小,越不会。

要知道,微观上的厨师根据“CPU 时钟”作息,本就比我们感知的颗粒小很多。

推到极端来说,只要这些客户的峰值不撞进同一个调度时间片之内,哪怕只差几微秒,就不算“同时”!厨师就可以先炒 A 客户的菜,后炒 B 客户的菜。

对“时间红利”运用越深刻,就需要“厨师调度系统”越敏锐:如果你的最小调动能力仅是分钟级,当然就没办法让客户们“秒级复用”你的厨师。

复用有一个前提:所有弹性计算的客户,必须在(逻辑上的)同一套中央厨房里!

而当时的阿里云上,有人已经在用筐(容器),有人还在用虚拟厨房(虚拟机)。

对于杨航来说,任务非常明确:秘书(CIPU)必须升级,所有形式的弹性计算,它全理解,全支持,全安排,才能把客户们容纳在同一个中央厨房里。

这件事儿,就叫“并池”。

但并池又加剧了一个副作用,那就是所有饭馆儿都在一个中央厨房里大锅炒,万一有人食材不干净,污染了其他家的菜品,或者干脆有人恶意下毒怎么办?

易立和沈益斌两支团队合作,把虚拟化上的一些关键隔离能力移植到容器上,虽然我炒的是百家饭,但是相互之间绝对不会渗漏。

同时,杨航团队又升级了 CIPU,让这个秘书经手的数据完全默认加密。

这些技术组合在一起,就做出了“安全容器”。

宜将剩勇追穷寇!搞完这些,技术大牛们蓦然回首,那面“技术独立”的旗帜已经高高飘扬。

他们恍然大悟,原来“独立”从来不是一个时间节点,而是分布在漫长的时光中一串无尽的脚印。

在这面旗帜下,所有的算力第一次团结为一朵云。

这朵云的每一处都是均匀的,没有任何特例,可以称之为“纯粹的算力”

它就像电,你用电的时候,绝对不会纠结它是水电还是火电,它就是电!你清楚地知道,每一度电,都是完完全全等价的。

而历史告诉我们:电力诞生的那一刻,并非结束,甚至并非结束的开始,而只是开始的结束。

1893 年芝加哥世博会是人类第一次大规模使用交流电照明,西屋电气公司让二十万只灯泡齐明,夜空亮如白昼。

(五)AI 奇点 

闪回到 2014 年夏天,淘宝低调地上线了一个功能:拍立淘。

从某个角度理解,这个功能对后来阿里云的意义,甚至大于它对淘宝的意义。

拍立淘的功能是通过对图片的理解从商品库里帮你找出对应商品,是一个“找货员”。

那我问你:同样是找货员,“拍立淘”和“搜索引擎”有啥不同?

表面上的感觉是:一个用图搜,一个用字搜。这没错。

深一点儿的认识是:一个用了 AI,一个没用 AI。这就更对了。

但我有一个有趣的角度:他们替代人脑的工作是不同的。

搜索引擎模拟的人脑工作是一个——规则执行;

拍立淘模拟的人脑工作是两个——规则建立+规则执行。

也就是说:拍立淘在搜索前,必须先建立一套规则,用以判断两个图片处于相似“模式”。这就是 AI 的经典能力:模式识别。

这厉害在哪?

阿里云加速计算的产品技术负责人王超一语道破天机:

规则执行,例如大数据,大规模计算一旦停止,价值输出就随之停止。

规则建立,例如大模型,即便大规模计算停止了,它仍能继续喷涌价值。

你上班干的具体工作,手停嘴就停;但你从工作中学习的技能,却受用终生。

拍立淘后,历史陡然加速。

越来越多的业务开始附加 AI 功能,边干边学。

旺盛的需求催生了达摩院老师傅的热情,他们开始训练能建立更深层模式的模型,比如(通义大模型的前身)M6 大模型。

底层的硬件,也从拍立淘的 384 张 V100 计算卡变成了 512 张 A100。

训练大模型的计算强度,如舞会的音乐逐渐推高,烈焰一般炙烤着底层的算力平台。

幸亏,阿里云的师傅们已经把弹性计算炼成了金箍棒,能接住 AI 时代的第一波“泼天富贵”。

2022年,王超他们拜访客户小鹏汽车,无意中听到了他们的“绝密计划”。

阿里云加速计算产品技术负责人 王超

当时,特斯拉已经开始用计算力模拟“人类驾驶员”——把 10000 张计算卡连在一起,端到端地训练自己的“自动驾驶 AI”。

小鹏也看好这个方向,只是自己尝试了半天,很难建起这么庞大又稳定的计算集群。

王超乐了:您说的这玩意儿,洒家恰好能干!你来我阿里云上用如何?

说干就干,王超申请了天价预算,准备启动万卡集群建设。

当时采购同学看到这个单子都慌了:“超哥,你可别冲动啊,一个客户你敢买这么多卡?万一将来没有别的客户续上,可就废了。。。”

但王超心里笃定,AI 浪潮将会席卷,这次不是演习,无数企业很快会来阿里云上训练他们的 AI!

一万张卡可能都买少了。

“弹性计算 AI 版”,就这样摸黑上路了。

这就是——灵骏集群

后来的故事证明,王超简直神预测。就在小鹏上灵骏之后几个月,ChatGPT 横空出世,大模型的潮水席卷而来,成千上万的团队涌上阿里云来训练他们的 AI。

之前的一万张卡,果然买少了。。。

和泼天富贵一起来的,是凶猛的技术挑战:

随着训练模型的规模扩大到千亿-万亿参数,底层的算力平台又开始颤抖了。

这是为啥呢?

众所周知,AI 训练的核心负载从 CPU 转移到了 GPU,相当于原来的厨师还在,只是炒菜的主要任务交给了一位新厨师。

厨师变化其实问题不大,关键是这群厨师要做的菜完全变了。

打个比方:

过去 CPU 厨师们做菜,有点像婚宴。一个厨师做十个菜,每盘之间没有关系。你炒糊了一盘菜,是不会影响其他菜的。大不了我把这盘重做一下就是了。

现在 GPU 的厨师们做菜,一万个厨师只做一盘菜,任何一个厨师手抖一下,对不起,剩下九千九百九十九个厨师都白干了。。。

可人无完人,每个厨师都有一定概率出问题:

足够多的厨师×足够长的时间=必然出问题

王超回忆,当时被阿里全集团寄予厚望的通义千问大模型刚刚在灵骏上做训练时,在内部论坛直接吐槽:讲个笑话,灵骏集群能稳定运行八小时,哈哈哈哈。。。

可在那个烈火烹油的当口,全世界都在追赶 ChatGPT,老板们天天盯着灵骏团队,让他们搞快些,哪怕多给拨些人也行。

王超气得顶嘴:一个人生孩子要 10 个月,两个人 5 个月就能生出来吗??

逼到疯癫,他们只好使出了阿里云的传统艺能:人计算。

一群 P8、P9 的老师傅夜里轮流值班,手动救火;白天再把昨天救火的经验总结成GPU巡检、网络优化的代码组件,固定到系统里。

就这样连轴转了三个月,每个 GPU 身背的出错概率终于缓缓下降,系统总体的稳定性稳步爬升。

说到这里,有个普遍误区。

很多人觉得 AI 计算是 GPU 的天下, CPU 在这里打酱油。

其实,GPU 厨师主要负责炒菜,但是炒菜的同时,大量洗菜(数据清洗)、放冰箱(数据存储)之类的任务,还是得交给 CPU 来“帮厨”。

帮厨师傅一点儿不比主厨闲,具体来说,它需要多核心来并行任务,超高主频来思考,还要大内存带宽来保证同时处理大量数据。

找来找去,阿里云找到了 AMD,他们的 EPYC 系列 CPU 就是专门为 AI 计算设计的。

这个 CPU 的技能简单说就是:无论是数据预处理,还是调度任务,都比 GPU 需要得节奏更快。

这样,帮厨师傅永远等着主厨,主厨不用等帮厨,就能全速炒菜了。

用户的脚是投票器:最疯狂的时候,全国一半左右的大模型都在灵骏集群上全速训练,一个个“赛博大脑”自流水线喷涌而出。

可叹十几年前,阿里师傅还在“双11”惊恐地大口呛水;如今,隐天蔽日的“云上厨房”,已成智能的肥沃土壤。

向前追溯,至 1946 年第一台电子计算机 ENIAC,甚至 1642年第一台机械计算机“帕斯卡加法器”,人类在漫长的征程中,用计算一点点替代大脑的规则执行部分;

而今,我们终于模拟出了大脑的规则生成部分,从而凑成了大脑的“完全体”。

脚下,是万年不遇的 AI 奇点。

我们该期待些什么呢?

ENIAC

(六)计算的银河 

阿里云创始人王坚曾给出绝佳的开示:如果说云计算是电,那么大模型就是电动机。

实际上,在电发明后,人类仍忍受了漫长的毫无想象力的生活;

而横空出世的电动机,才真正搅动万物,让电动机床、卷扬机、电钻、风扇、洗衣机、冰箱、缝纫机、电车、电梯依次诞生,历史从此澎湃前行。

如此说来,此刻 90% 的人对 AI 的期待都可能是被局限的。

比如,受第一波浪潮 ChatGPT 的影响,很多人天然认为 AI 的形态就该是聊天机器人。

但王超告诉我:AI 真正的想象力,其实根植在具体的行业中。

千行百业都存在领域知识。而这些领域知识,过去都由具体的从业者体会、发现、传承——这个匠人精神成本极高,而且产出不稳定。

而之前说过,AI 的本质功能就是“规则生成”,恰可以在细分的领域里替代那些匠人。

它会进入千行百业,成为比人类更资深的客服、卡车司机、机器精调师、医生、翻译、老师、编辑、裁缝。。。

更深刻的改变也许是——当 AI 脚踩弹性计算,它可以零成本实现“协作模式”的切换。

100年前,福特发明了流水线,让生产效率飞跃;而弹性计算可以让流水线根据需要每时每刻重组。

王超开脑洞举了个例子:

将来也许会出现一种“服装电话亭”,你站在里面,就有 AI 自动操纵扫描仪给你 3D建模,然后帮你设计衣服,做裁剪,最后产出一套成衣让你拿走。

在你看来,自始至终都是在和一个 AI 对话,而它背后,是一套可以随意组合、对接、改造,无远弗届的计算力。

如果这一天真的到来,意味着在最底层,燃烧着万倍、亿倍于今天的弹性计算。如今让阿里云师傅们骄傲的技术,仍然需要N次迭代和升级。

“那时的计算底座会是什么样?”我问。

“我不知道,人的想象力是有限的。就像让你现在想象 iPhone 20,你也许只会想到更好的摄像头,更大的屏幕。但最有可能的是,到那时,原来的思考框架已经被颠覆。”他回答。

王超很喜欢弹性计算同事们常说的话——为了永不停机的计算服务。

永不停机的计算,并不意味着我们的灯永远亮着,而是我能永远满足人类旺盛的计算需求——当世界有需要,我们就在那里。

他说。

做算力基础设施的人,很难站在聚光灯下接受奖杯。他们像是时代大厦的支柱,深埋在泥土中。

正如这些年手机芯片提升了百倍,但电池工程师的苦,似乎无人过问。

做算力基础设施,就像是做电池,每年你都要逼迫自己把性能增加 15-20%。看上去只是日积跬步,没有奇迹时刻,但当你走过十几年回头望,身后就是工程奇迹。

正如爱迪生点亮灯泡的一瞬间,只有他自己知道过去的 1000 次实验意味着怎样的艰难跋涉。

回望来路,一个真理不言而喻:世界从来不是某个截面,而是时光中错综的连线:

2010年,如果没有弹性计算师傅趁黎明出发,用十五年锻造出“大规模计算的组织能力”,如今像灵骏这样的 AI 算力集群就不会成立;

2020年,如果没有全世界 AI 研究者的反复试错,就不会有 ChatGPT 的横空出世;

2025年,如果没有无数行业对大模型的热烈拥抱,未来那个无远弗届的 AI 也只能是赛博传说。

如此,我们并不活在一个确定的当下,我们活在无数可能性组成的根系中。

在任何一个时间截面上,你无法看到根系之间的联系,他们散落在天穹,恰似辽阔的银河。

而梦想家知道:在这条银河中,终将有一颗新星闪耀。

往期推荐:

👉阿里云的这群疯子

👉云栖:他们的伍德斯托克

👉阿里造“神龙”

👉14亿人的战争:中国人用了30年望见计算力的珠峰

👉阿里巴巴的十三载计算力大突围

👉我们该不该怀念2021?

👉2022,我们在幽暗的谷底守护一朵花

👉2023:当我们都活成了“大模型”

👉2024:赛博羔羊,不投降

计算是一场

深刻的模拟

再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax

哦对了,如果喜欢文章,请别吝惜你的“在看”“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。

Thx with  in  Beijing

阅读原文

跳转微信打开

做手机的 OPPO,悄悄改写了中国精密制造

2025-10-09 11:01:00

原创 史中 浅黑科技 2025-10-09 11:01 广东

一个精致野心,一群手机犟人。

浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。

做手机的 OPPO,悄悄改写了中国精密制造

文|史中

(一)光刻战争身侧的“点胶战争” 

2020 年,深圳一座游泳池。

平静的水面泛起涟漪,一个男人浮出来,手里捏着手机。

他刚刚给潜水俱乐部的伙伴们在水下拍了几张照片,兴奋地游过去给队友展示。指尖刚划两下,屏幕突然漆黑。

“卧槽,应该防水的呀!”男人猛压电源键,仿佛在掐手机的人中。

空气静了,只有水波暗涌。

黑屏中折射出五米外一个路人的身影。

此人名叫陆研

不用走到近前,陆研已经看出来,那哥们用的是某著名的国际大牌手机,标志性的曲面屏,价格不菲。他回忆了一下,以这款手机宣传的防水性能,至少得在 1 米深度挺 15 分钟。显然,它失败了。。。

泳池里的男人非常扫兴,跟队友吐槽再也不买这个牌子的手机了。

陆研心里一沉,奇怪的思绪升腾:“如果这家手机的工程师就站在此地,有没有办法据此推动产品工艺改进?需要多长时间才能影响下一代的设计?”

不知道。

但他确信的是:眼前这一幕肯定会推动 OPPO 手机的工艺进步。

不仅因为他是 OPPO 的老师傅,研究了N年的“点胶”工艺恰与防水性能息息相关;

还因为,在 OPPO,像他这样只爱钻研不善 Social 的一线工程师,也能毫无鸭力地推开副总裁的门,直接提改进意见。

隔天上班,陆研径直走到测试生产线,拉过熟悉的显微镜,摆上一个手机中框。

头发丝一样粗细的“胶线”浮现在眼前↓↓↓

在“手机宇宙”中,这些几乎无法被肉眼察觉的细丝妥妥是“超级英雄”,它们扛着与体型极不相称的巨大职责。

它对手机的体魄负责:

中框与屏幕之间的这圈胶水,不仅把最主要的两个部件固定牢靠,支撑了结构强度,还是一座抵御液体、粉尘入侵的堤坝。

它还对手机的颜值负责:

中框胶线的宽度、精度和角度,直接影响手机屏幕黑边的宽度。

这些胶线,本质上是由“点胶机”喷出的一颗颗直径在 0.5 毫米的胶点连缀而成的。每一次喷射都需要点胶头在三维空间里“微米”级(0.000001m)的精准腾挪,对胶水量进行“皮升”级(0.000000000001L)的控制。

但凡点胶过程出现任何颤动,都可能导致胶点异形,胶水外溢、胶线无法闭合,进而冲垮整机的抗震性能、防水性能,最终在一次偶然跌落或者泡水时,让手机用户说出“再也不买”的狠话。

一颗马掌钉覆灭一个王国,大抵如此。

如果说光刻是人类技术的巅峰之战,那么点胶技术就是隔壁山头的另一场战役。

二者的本质都是在空间里谋求精准的定位与控制,在小数点后永无止尽地加上一个又一个零,是“人类精密控制技术”与“物理定律”的终极搏杀。

你可能猜到的是,在这场堪称为人间盗火的“点胶战争”中,中国师傅已经站挑起大旗,代表人类扩展着自己的疆界。

你可能没猜到的是,在最前线的战壕里,竟然站着如此众多的 OPPO 将士。

他们用了十几年时间,靠血肉和子弹推进至此,脚下的每寸土地,皆有代价。

(二)角落里的点胶机 

时光之风逆流,我们一起坐在 2014 年深圳某工厂大门外的马路牙子上。

抬眼望,人人手里都捏着一台“大下巴”手机。两厘米宽的底边上,点缀着时髦的“指纹解锁按键”。

那个时空里,怎么看这都是手机的理想模样。

如果咱拉住路人诚恳地说:十年后,主流手机会消灭这个下巴,正面全是屏幕,而且最牛的工艺可以让屏幕距离四边框都只有 0.1 毫米,恐怕会得到一个关爱的眼神。

就在这时,一个背着黑包的路人匆匆走过,脸上挂着汗珠。

他包里塞着几张 A4 纸一样的“软电路板”,上面密密麻麻地排列着上百个相同的小器件。

估计你猜不出,我直接公布答案:

这是手机侧边按键的电路板。

就是这些指甲盖大小的玩意儿,已经让老哥三个月没睡好觉了。

他叫高原,是 OPPO 手机的 SMT 工程师。

SMT(Surface Mount Technology)的中文叫做表面贴装技术,你可以简单理解:这个活儿就是把器件(芯片、电容之类)各就其位地固定在主板上,其中当然也包括侧边按键。

“贴”容易,难的在于要“一直贴着”——正如爱情是短暂的,相扶到老是艰难的。

其实手机主板出事儿主要就俩原因:碰撞、进水。

刚好这俩事儿都能用一样东西解决——胶。

过去几年,智能机像泥石流一样在人群中普及,工艺也迅速进化。高原他们已经在各种元器件的焊点上密密麻麻加了很多点胶工序,从 USB、耳机口一直点到了主板、CPU。

给你看一下封胶的实图,截取自微机分 WekiHome 对 OPPO Find X8 的拆机视频,链接附后。

但防护就像木桶,长板再长也白搭,用户骂不骂娘要看短板。

没错,手机侧按键,就是当时最短的板。。。

假设一部手机用三年,它的侧按键大约会被按 10 万次,每一次都会粘上汗液。经年日久,会浸入按键底部,腐蚀焊点,导致失灵。

你可能会说:这么小的东西,点一点胶不就把焊点封住了?

哎,问题就出在这里:太小!

要用胶封住的焊点位置。

你可能都忘了,当时的手机甚至比现在的薄!2014 年底推出的 OPPO R5,厚度只有 4.85 mm(最近推出的 iPhone Air 是 5.6 mm),可想而知,侧边按键有多窄。

说到这,就不得不回忆一下点胶机江湖:彼时公认最好的,也是 OPPO 在用的 SMT 点胶机,是美国的“诺信”。

它是咋点的呢?

这么大一个整板,铺平之后,会有一个相机对它进行拍照,识别出两头的两个“定位孔”,然后通过计算得出中间所有元器件的位置。点胶头根据这个结果去相应位置点胶。

看出问题了吧?

这个板子可是软的,很难保证没有一丝拉扯形变。

你点胶机只用两个点的坐标就草率推算出几百个点胶位置,实际点的时候很可能是偏的呀!

这咋办?

很明显,只要修改点胶机的算法,让它别只盯着定位孔,辛苦一下拍板子的全貌,识别每个具体的点胶位置,不就行了吗?

就这个小要求,高原提给了诺信的香港代理商(他们在中国大陆没人)。代理商说:“冇問題,偶幫你轉達去美國總部。”

然后。。。就没有然后了。

我去,这边手机等着上新技术呢,您没信了?

高原有点慌,赶紧给其他点胶机代理商打电话。日本的武藏、韩国的 PROTEC,可这些海外大牌都没啥兴趣。

他们倒不明说,可话里话外的意思很明显:哦,定制开发?全世界都没提过这种要求。怕是你们没用对吧?

不给我定制,理解,我拿你的机器试试总可以吧?要是能点准,我就买!

人家回复:“没地儿试哦,想买就直接下单哦亲。”

高原差点晕厥过去,只好托朋友找关系继续问,三个月把可能的工厂都跑了个遍。

这一折腾,眼看快过年了。那天领导开会突然提起:“你不是说要提升按键防护,怎么样了?”高原一激灵:“在找厂家验证了,有机会,有机会。。。”

隔天,高原眉苦脸出现在工厂,拉了把椅子坐下,继续翻通讯录。

不远处桌子上,正摆着一台点胶机。

这是之前散热部门的同事买来做实验用的国产设备,很小,还是半自动的,需要人手工把物料搬上去,点完胶再手工拿下来,看着比诺信那种用传送带上下料的大设备 Low 不少。

就这个小玩意,居然还有个厂商的技术小哥在现场忙前忙后给调试。

“要是外国厂商也有这么好的服务就好了。”他自言自语。

鬼使神差,他径直走过去问了技术小哥一句:“你们有没有那种全自动点胶机?”

小哥笑:“巧了,我们刚研发了全自动在线点胶机,目前只有一些贴牌厂家感兴趣。你们这种手机原厂总觉得国外的机器好,都不肯睬我们。”

高原眼前一亮,把“精确定位”的开发需求说给他。小哥皱皱眉:“这个嘛,等我跟研发工程师转达一下。”


高原眼神又暗了,哎,又是这套说辞。

第二天下班前,对方的销售经理罗威突然打来电话:“昨天说的事情我们研究了,有戏!正调集硬件、算法的工程师专门给 OPPO 服务,还准备了一台最新点胶机用于测试,什么时候方便拉到你们产线?”

高原缓缓转头第一次正视着这个角落里的点胶机的品牌:深圳市轴心自控

(三)藤条 

顺着街巷,镜头来到十几公里外,轴心自控总部。

会议室的桌上,摆着那块软板样品,轴心最精锐的工程师聚在周围,有视觉总监、研发总监、工艺测试、算法博士,噼里啪啦地敲键盘。

早些时候,一台崭新的点胶机已经装车,由技术员“押运”前往 OPPO。

高原个老饕一样就坐在点胶机旁,看它“现场炒菜”,哪个地方点不准,技术员就打电话回去轴心,让“大厨”修改菜谱(算法)。几个小时后,新算法传回来,用 U 盘升级,再继续点。

看着每一版的点胶位置都在细微变化,高原有些出神:这个轴心自控。。。是什么来头?

话说,轴心自控的野心,谜底都写在了谜面上。

所谓“轴心”,并非轴承的中心,而是苏格拉底、孔子、释迦摩尼这些先贤们所开创的“轴心时代”的轴心。

轴心这群人最早归属于工业电商震坤行,卖一些点胶阀、胶水之类的进口物料,卖着卖着就想:这玩意儿这么贵,我们为啥不能做?

于是,2008 年轴心自控成立,开始自研点胶阀。

接着又想:点胶机比点胶阀贵多了,我们为啥不做?

接着又想:全自动在线点胶机更贵,我们为啥不做?

接着又想:既然卖给了二线厂商,为啥不卖给原厂?

刚想到这儿,就和四处找寻供应商的 OPPO 撞了满怀。

估计你也看出来了,其实轴心和 OPPO 一样,是千万大湾区创业者中的“典型角色”,相比大树,他们更像藤条,随时调整角度,但凡嗅到一个砖缝,马上拼命往里钻。

如此,两根藤条缠绕,只是时间问题。

回到当下,轴心自控的工程师们并没清晰地意识到,自己正在冲击一个世界级难题。

点胶机的每一行算法,目的都是定位到旁边两个 1 毫米宽的焊条。

如果偏里一点,按键弹片非常娇气,胶水沾到马上死给你看;如果偏外一点,电路板余量又非常窄,很容易漏胶到背面,也是完蛋。

更凶残的是,无论两侧的焊条还是中心的按键弹片,都是强反光材质,镜头极难定位准确;只能退而求其次,靠电路板的上下边缘或侧面缺口去定位,这就会有误差。

最初两周,算法还在逼近目标,之后突然遇到瓶颈,无论怎么调总有一些点位死活不准。

高原里五味杂陈:“这国产技术。。。你说不行吧。。。你说行吧。。。要不我还是出去找找备胎?”

十几公里外,轴心团队都快疯了,好几个专家都在办公室住了几天了,眼看 OPPO 给出了一道缝隙,这一把钻不进去的话,鬼知道后面还有没有机会了。。。

一筹莫展时,突然有一位算法工程师自言自语:倒也。。。不用非得一次定位吧?把电路板边缘定位和缺口定位叠加在一起呢?

一句话,猛地撕开了迷雾。

接下来一周,靠着“叠加定位法”,良率迅速冲上了99.92%。这意味着:10000 个按键,点胶不良的低于 8 个。

这达到了 OPPO 的最低要求!

话说,如今全世界几乎所有高端点胶机都在使用双重定位甚至三重定位技术。但鲜有人知,追溯到根源,它就诞生在 OPPO 试产线上的轴心点胶机中。

当着 OPPO 的老哥们,罗威还保持一副“基操勿6”的神态,回家的路上,他血都冲脑门了:“这把有了!有了!”

后面几天,他坐在办公室翘着腿,就等着 OPPO 订货。

果然,电话来了,OPPO 说:给我们来。。。两台!

罗威差点儿趴桌子底下。

这个账好像不难算:调集最精锐的工程师干了一个月,开发了独创算法,然后您只买两台,每台 30 多万,这单生意赔了个底儿掉啊。。。

但真这么算,你就输了。

作为“藤条”,轴心这帮老哥一直强迫自己用另一套逻辑算账:

1、人家不多买,肯定是技术有不合适的地方。

2、既然我们已经比同行身位靠前了,面对这么好的锻炼机会,为啥不陪 OPPO 玩到底?

3、真要是把技术搞到炉火纯青,就算 OPPO 不买,vivo 还不买么?华为还不买么?

想清楚以上这些,罗威只花了 0.5 秒。

他调整呼吸,轻快的语气上线:“两台~没问题!”

果然,这两台机器送进去以后,OPPO 隔三差五就提好多“龟毛”的意见:

拍照时相机总停下来,能不能搞快些,一边移动一边拍?

点胶时点胶头也总停下来,能不能边走边点?

能不能搞异步控制,这边点胶头点胶的同时,那边相机就给下一个件拍照?

你看,这些意见全与效率相关。

OPPO 索性也不见外了,把轴心算法工程师请到生产线。

站在产线边,轴心工程师恍然大悟:原来,OPPO 之所以还不敢在量产机型大规模采用侧按键点胶,主要是因为点胶机的效率不够,会成为整个生产流程的瓶颈!

“行,你们等着!”轴心工程师迈着大步回去了。

接下来一年,他们陆续拿出了“飞行拍照技术”,“投弹点胶技术”,“双XY轴异步技术”。

几项新技术的叠加,让点胶速度翻倍又翻倍。可轴心这边如小伙儿吹拉弹唱,OPPO 那边却如女神矜持稳坐,隔几个月买两台,隔几个月买四台。。。

2016年夏天,罗威又接到 OPPO 电话:“我们订货!”

“还是两台?”

“不,每条生产线两台!”

OPPO 在当年推出新机上,全量使用了侧按键点胶技术。现在回看,谜底早已揭晓,那正是狂销 2000 万台的 R9,2016 年中国单机型的销量冠军。

造化弄人,当时 OPPO 自己也根本没梦到 R9 能一战封神,面对缺货,只好玩儿命扩产。

不久罗威又接到电话:“你们点胶机的产能上限是多少?我们包圆了,每个月底点数,拉来多少就结多少账!”

轴心这帮人也懵了,赶紧给配件供应商打电话:“你们手里的货全拉来,我们包圆了!”

仅在 2016 一年,OPPO 就狂炫了 200 多台轴心点胶机,最多的时候,单月就买了 70 台。最后一算,当年轴心产能的三分之一都卖给了 OPPO 一家。。。

此时再算账,过去两年下的“赌注”简直不要太值。

手握这种水平的点胶机,配上外国品牌四分之一的价格,配上 R9 的金字背书,轴心很快打入 vivo、华为等其他手机的 SMT 生产线,兵不血刃地拉高了一个时代的手机工艺水准。

但借用丘吉尔的名言:这不是结束,也不是结束的开始。

这仅仅是“空间战争”开始的结束。

(四)欲望 

就在 R9 大卖的时候顾泽梧已经看到了下一代 R11 的设计方案。

作为 OPPO 装配工艺的设备专家,他感到一种幻痛,像是诺曼底滩头被狂轰滥炸的那种疼。

在手机边框普遍是 4mm 的年代,OPPO ID 设计组欲望爆棚,愣是把边框设计成了 3.16mm。

而装配的主要任务就是在这个边框上走一圈胶,然后把屏幕粘上去。

显然边框越窄,越难粘!

坦率说,比友商薄了不到 1mm ,对点胶机来说还不至于要命。但问题不这么简单:边框的一圈儿不是同样宽窄,在屏幕上沿“距离传感器”旁的一小段,点胶宽度只剩下 0.5mm。

那么胶线本身有多宽呢?0.45mm。

这就像人从狭窄的走廊跑过,缝隙只比身体宽一个拳头,左右墙壁都是滚烫的铜墙。蹭一下就熟了。

地狱的是,ID 组的创作欲还没释放完,他们发挥传统艺能搞了五颜六色:金色、玫瑰色、限量版红色、巴萨队服定制色,还自带渐变和 Bling 特效。。。

你还记得吧?点胶机是靠拍照来定位物体轮廓的,本质是识别颜色。可“渐变色”本身是艺术,喷涂不追求极端精确。如果依然使用颜色来定位,就难以和手机本身的几何结构精确吻合。

我手上恰好有一台红色 R11,给你看看实图↓↓↓

奇怪的难度又增加了:奔跑在滚烫的狭窄缝隙,周遭还是眼花缭乱的渐变色,你感受一下点胶组师傅头顶的黑线。

“绝境”在前,顾泽梧脸上突然浮现出诡异的笑容:你 ID 组创作欲爆棚,这不是逼着我们工艺组也创造欲爆棚吗?!

他脑海里浮现出一种邪门的技术:“3D 线激光”

你看过阿汤哥的《碟中谍》吧?

特工要通过那种满是激光束的屋子,触碰激光就会被 Boss 感知。把这些激光减弱一些,然后密集地平行排列,恭喜你,发明了 3D 线激光定位技术。

之所以说邪门,是因为在当时,激光定位最主流的用途是测量铁轨的间距、木材的直径,和精密制造八竿子打不着。

但理论上说:如果把激光线进一步加密,密集到每 0.1 毫米就有 3 条线,它不就足够识别手机框的空间细节,从而引导点胶了吗?!

就像这样↓↓↓

这是手机中框边缘的横截面,为了让你看清楚,我把纵向画夸张了些。

那么这种点胶机真的存在吗?

还真让他找到了。当时一家加拿大品牌剑走偏锋,押注了 3D 线激光点胶机,顾泽梧他们如获至宝买回来。

什么?你问轴心自控?

这里插播一个行业小知识:

SMT 点胶主要就是在电路板上进行,上世纪就有,一般就是直线或者画圆,被称为“标准点胶”,也叫“前装点胶”;

而装配点胶是本世纪兴起的技术,动作更自由,被称为“非标点胶”,也叫“后装点胶”。

这俩一个像卡车一个像轿车,虽然都是车,但定位有区别,你买轿车大概不会去卡车店里问。。。

当时的轴心主打的标签是 SMT 点胶机,况且 3D 激光比较偏门,轴心当时也真没有,所以遗憾没被翻牌子。但也正因这个小挫折,他们会在下一章更凶猛地杀回舞台中心。

视线回到 OPPO,只有这样一个机器躯壳根本不够,它考验的是里面的灵魂——算法。

话说,一个小小的手机框,激光全扫一遍,大概会取几千个定位点,但这些定位只是原始数据,必须从中选出100个点作为点胶路径。

选哪 100 个点,是哲学。

看下图:

假设这是手机框左侧横截面扫描之后得到的点云。你认为手机框的真实形状是啥样?

是这样吗?

不是。

我之前特意提到了,这里的激光非常密集,所以不能像阿汤哥电影里那么强,实际上它是非常弱的。

而且激光也是光,弱激光成像也会像暗光照片一样存在大量噪点。

恐怖的来了:每个点位只有一束激光提供信息,你无法分辨哪些点是真实的反射,哪些点是鬼魅的噪点。

这意味着,上图的点云,对应的真实边框物理边缘可能是这样,可能是这样,可能是这样。

一般师傅到这一步就要掀桌子了。

顾泽梧他们不慌,我辈半生功力,不用在此,更待何时?!

团队师傅款动厨刀,算法如土豆丝般流淌:

首先设计一套公式,根据偏离值,排除掉最不可信的噪点;

然后找出范围内的高点和低点;

再利用公式算出一个理想高度,根据理想高度寻找参考点;根据参考点推移,找到点胶定位点。

以上还只是理想情况。

实际操作中因为批次和公差,斜坡的斜率也不同,不一定存在实际的参考点,所以也许还需要一套算法对斜率进行拟合,虚拟出参考点。

这一切精密的推演,都发生在 0.5 毫米的范围之内,最终点胶位置的正负调整也不过是 0.1 毫米的样子。

但就是为了这 0.1 毫米,砸进去昂贵的点胶机,最牛的工程师,半年的研发时间,千万级别的研发费用。

你可能都快忘了,这一切最初的缘起,无非是 R11 外观设计师傅的小小欲念,把边框比友商做窄了一丢丢,把颜色做多了一两种。

OPPO 的企业价值观是“本分”。

本分地想想:这事儿到底值不值?

回答这个问题,只需要搞清一个前置问题:手机对用户来说是什么?

它是一个通讯设备么?它是一个办公用品么?他是一个装饰品么?

都不是。

手机是人的外接器官。

如果你把手机当成通讯设备,你就会把性能作为考量手机的唯一指标;如果你把手机看做办公用品,那么边框厚薄无足轻重;如果你把手机看成装饰,那么耐用性就没那么重要。

如果你把做手机看成给用户做器官,按照“生物级”的标准来要求,“好用”、“好看”、“可靠”,三样就均不能妥协。

什么是不本分?

你的用户掏出手机摆在桌上,完全无法吸引同桌人的目光,这不本分;在东北旅游,所有人都拍照,你家手机突然关机,这不本分;几个人一起游泳,就你家用户不敢水下拍照,这不本分;有人问为啥套手机壳,用户羞赧地说怕摔,这不本分;同样一个群里抢红包,你家手机总是慢半拍,这也不本分。

如此就可以解释,为啥 OPPO 这群师傅,无论是工业设计、工艺设计还是软件优化,都展现出一种自发的,似乎超越必要的欲望

因为让你的用户在任何工况、任何场合使用手机都不觉得低人一等,才是最大的本分。

多说一句,OPPO 使用 3D 线激光点胶技术整整三年后,苹果 iPhone 才开始使用这个技术,其他品牌还要更久。这个事儿,大多数 OPPO 用户是不知道的,OPPO 也没有让他们刻意知道。

把欲望控制在事情本身,而非外溢煽情,也是本分。

说远了,你是不是快忘掉隔壁那个错失 3D 线激光点胶设备的轴心自控了?

和 OPPO 一样,他们的欲火也从未熄灭。那两年,他们煎熬地觊觎,默默地练功,藤条像捕食者一样蓄力,等待着下一个一闪而过的裂缝。

(五)神兽 

2018,也许是手机行业最“弯”的一年。

三星开创了曲面屏时代。现在回望,那么夸张的曲面也许并无必要。但这个时代对于所有手机厂商和精密制造设备厂商来说,却是一场无法绕过的“成人礼”。

OPPO 的首款曲面屏,就是 Find X。

对于屏幕装配来说,一个显而易见的变化就是:左右两侧的粘合面发生了倾斜。

这一倾斜不要紧,直接把平面几何升级成了立体几何,把二次元升级成了三次元。

对于点胶工艺来说,这简直是“底层世界观的崩塌”。

打个比方吧,很多浅友都开过车。你开过城区、山路、高速、上坡、下破,但我敢肯定,所有的路面的左右方向都是水平的。

如果你正在山路上开车,面前的道路突然向右倾斜30度角,还敢开吗?

顾泽梧就是那个司机师傅。

当时 OPPO 生产线上的点胶机,虽然点胶头的高度可调,但都只能垂直点,没办法歪头点。

这就导致点胶头和点胶面存在倾角。

就这么斜着愣点不行吗?

可以,但要保证极窄的边框,不行。

因为边框一旦侧过来,就比胶线更窄了,没有操作空间,怎么点都会点到外面↓↓↓

斜着点不一定非要点胶头动,实际上中框动就行了。

当时业内流行一个有点儿“抖机灵”的方案:

先把上下两侧点完,再找个托架把手机框斜着垫起来继续点。

这样虽然能做,但过度部分非常难处理,怎么弄都会在四条胶水接缝处形成微小的断点。

就像骨折之后再接上,是未来碎裂或进水的隐患。

这极有可能解释了我们最开始讲的故事,为什么游泳池里那哥们手机黑屏了。

这也解释了为啥当时大家都做曲面屏,却只有 OPPO 矫情,煞有介事地满世界寻找新方案。

虽然每家厂商的一线工程师其实都明白这里有坑,但 OPPO 一线工程师的意见可以无损传到决策层。

顾泽梧脑海里又出现了一种邪门的东西:五轴联动 3D 线激光点胶机

五轴的意思是,除了控制点胶头上下(Z轴)、左右(X轴)、前后(Y轴)移动的线性三轴外,再加上Y轴的倾斜与垂Y轴方向的旋转。

怎么形容“五轴+3D”点胶机呢?它颇有点像蛇身鹰爪鹿角的“龙”,能想象出来,但没人见过。

果然这次 OPPO 师傅没那么幸运了,去海外品牌里找了一圈,如此激进的“神兽”尚不存于人间。

问对方想不想现在开发,人家说不想谢谢。。。

一次开会,有同事提起,轴心自控是出了名的喜欢玩“自虐”,这几年无论提啥非分要求,就没听他们说过一个不字。要不问问他们?

话说当时,OPPO 已经成为轴心自控的 VIP 中 P 客户,由大客户经理李林负责对接。

李林像会师一样跟顾泽梧紧紧握手:“我等你们等得好苦啊!”

这几年,轴心心心念念要打入 OPPO 的后装产线,每天面壁苦练,已经搞出了五轴点胶机。

现在,只要把拍照定位器换成 3D 线激光定位器,这躯体就齐了;再把 OPPO 这边成熟的线激光定位算法灌进去,灵魂也有了!

这就是“神兽”本体。

直到“神兽”的样机做出来,顾泽梧才注意到,从头到尾,轴心这帮人压根没问过:“能不能用我家已有的点胶机型号凑合一下?”

顾泽梧于是确信:“这帮人是真喜欢自虐。”

接下来,两拨工程师携手进入人类工程的顶尖战场,开始了炼狱般的“综合校准”

究竟是什么决定了点胶的终极精准度?

三件事儿:视觉引导、运动控制、流体控制

视觉引导,考验的是激光算法,必须根据目标物体的轮廓绘制出精准的导航地图。

运动控制,考验的是几台伺服电机的精确协调,必须让点胶阀和托盘走到目标位置,并且每次重复走位都要完全一致。

流体控制,考验的是阀体本身,把一个细小的水珠弹出去,必须珠圆玉润、百步穿杨、命中靶心。

最终误差是三者叠加。

这难度,这就像是杂技演员踩着高跷站在球上,手里还在扔着五个球,任何一个环节失误,都会导致整体扑街。

几个月过去,神兽终于被点上了眼睛,最终轨迹空间精度误差定格在了 0.075 毫米(75微米)以内。

想象一下,我们缩小一万倍,站在这只神兽体内:

一片漆黑的世界,无数条激光像罗马柱一样直通天地,描摹出金属造物的轮廓。电机在耳侧尖啸,巨物在三维空间里丝滑运动,时而旋转,时而俯仰,每一时刻的运动都恰好与弹射过来的胶水球精准碰撞,在凹槽里缀成不偏不倚的胶线,一刻不停,绵延向远。

这种精致的壮观,微小的广袤,是人在混乱的世界里支撑起精确秩序的野心。

五轴 3D 点胶机开发异常成功,很快开始全线列装,OPPO 和轴心自控完成了一次凶狠的相互成全,两根藤条的命运开始大面积缠绕。

以那一刻为起点,历史笔直地通往今天:

Find X 系列作为 OPPO 的顶级产品线绵延至今;

而轴心自控不仅就此成为 OPPO 的“御用”设备供应商,也在其他 3C 领域,乃至汽车行业攻城拔寨,一跃坐上国产点胶机头把交椅。

回望当前,无数点胶机企业千帆竞发,或许都梦想过成为领域第一,但有多少人用一句 NO 轻松堵死了自己通往遥远奖赏的路呢?

(六)代价 

2019 年冬天,工程规划负责人沈集在思考一个天大的问题:OPPO 究竟有何不同?

这并非务虚的白日梦,而是他现实又迫切的职责所在。

话说沈集在 OPPO 的经历就像一块硬砖,哪里需要哪里拍:13年他做旋转摄像头,16 年又忙活全机型切换指纹解锁,19年全行业材质升级,他又被派去做玻璃和陶瓷的采购。

别看这些事儿东一榔头西一棒槌,但有个共性,那就是:“一米外可见”。

镜头加一颗,Home 键加上指纹解锁,材质变成陶瓷,屏幕做出曲面,路人一打眼儿就能发现了啊!

但事情从 2019 年开始起了变化。

所有手机都是四颗摄像头,所有手机都是正面大屏幕,除了 LOGO,你 OPPO 和其他手机到底有啥区别?没区别为啥要买你?

OPPO 师傅讨论后达成共识:“有无”这种横向比较已经无法拉开差距,能定义 OPPO 的只有四个字:“整合深度”

就像开饭馆儿:一条街能买到的食材都一样,你再多做一家杀猪菜有啥意思?要做就做“米其林三星”!

工程团队的职责就是:想象出 3-5 年后的手机形态,并且从此刻起就为之储备技术,再把这些散点技术拧成麻花,最终定义出 OPPO 本 O。

2020 年初,他们定下了很多具体目标,包括主板元器件密度、电池容量、背壳玻璃、防水防震性能。。。

其中对屏幕的要求尤其苛刻:

上下左右四个黑边,全要小于某个极低数值。(他们特别叮嘱我这个目标不能泄露,但总之很低就是了。)

这个宽度,意味着什么?

意味着过去的屏幕点胶,甚至屏幕装配工艺,全都要推倒重来。

之前我们所讲的点胶技术,都是把屏幕的玻璃盖板与中框相连。但正如前述,为了保证结构强度和柔韧度,胶线本身不能窄于0.45mm,再加上结构余量,边框几乎不能低于 2mm。(这也是 Find X7 边框的宽度)

故事讲到这,点胶工艺大牛陆研终于出场了。

为了进一步降低黑边,他和同事们引入了一种方法,把点胶位置从玻璃盖板下方挪到屏幕模组下方:

注:按照行业惯例,发光模组边缘的一部分也算作黑边。

可这样一来,又有新问题,屏幕模组不仅直接暴露在了空气中,还距离边框更近了,撞击时可能有风险。

于是,又需要在其边缘另包一圈胶水,以抵御腐蚀和冲击。

实际上,2024 年发布的 OPPO Find X8 就是采用这种方法装配的。

这种工艺,上、左、右三边都没问题,只在下边留了一个小遗憾:

由于屏幕排线会从下方引出,所以这里需要额外增加胶水的厚度,以保护屏幕模组。这样一来,下边框的极限只能到达 1.45mm 左右。(为了整体四边等宽,其他三边被迫做宽了一丢丢。)

为了解决这个遗憾,陆研和伙伴们构想了一种奇特的方案:

在手机中框下缘内里抠出一道极小的凹槽,让屏幕模组的封装胶水突出的部分扣在里面,这样既能保证屏幕模安全,又能保证边框极窄!

可是,这样一来,装配时屏幕就没办法垂直落下,必须斜插进去。。。

然而,能执行这种斜插装配的设备并不存在。

十年来卡过这么多 Bug,OPPO 师傅内心早已毫无波澜,这次一秒都没犹豫,直接找到他们的哆啦A梦——轴心自控。

李林也根本不含糊:要啥样的点胶机?什么?不点胶,这次玩贴装?没问题!

有了过去五轴技术打底,运动控制的难关已经过了,只要把点胶头变成屏幕吸盘,再加上亿点点适配,就做成了!

实话说,升级打怪到这个阶段,创造某个新设备已经不太让 OPPO 的师傅头疼,他们面前横亘的,是一道更危险的悬崖。

由于生产过程中穿插了太多自研工艺和专用设备,已经越来越没有代工厂愿意接 OPPO 的活儿。。。

这是某种意义上的“咎由自取”:

手机从设计到生产,可以理解为一个巨长的公式,这其中涉及无数变量。

代工生产线不可能只服务一家,这决定了他们虽然可以为原厂要求做改动,但也仅限于某些变量,并且在有限范围内改动。

当你的工艺与同类产品差别过于巨大,以至于代工厂添置设备和专业工人的成本超过阈值,相当于单独为你开一条线,这个生意就不成立了。

实际上,早在沈集接手团队,同时往诸多方向做技术预研时,他们就猜到了结局:

总有一天,OPPO 必须自建生产线。

这并非“意向图”,而是 OPPO 自建生产线的实景。

想做米其林餐厅,就要忘掉预制菜。

独特的代价是孤单。

从 2020 年开始,团队开始了孤独的跋涉,把生产环节一点点儿接回来。

可叹生产是个极为复杂的整体,涉及到对整个供应链和产业工人的把握,这个过程缓慢而痛苦,跨越了 X2、X3、X5、X6、X7 整整五代机型。

2024 年,OPPO 自建生产线终于火力全开,一年后,OPPO Find X9 系列发布。

在 X9 的无数参数中,有一个非常凶猛:屏幕四边等宽,只有 1.15mm

给你看一张 X9 Pro 的实图,感受下↓↓↓


沈集距离四年前的承诺仅剩咫尺之遥,这并不圆满,却也不是终点。

为了这 1.15mm,师傅们开发了一整套点胶技术,并为之配合了斜插装配工艺;

为了实现这些工艺,轴心自控顶上了几个崭新型号的点胶机、贴片机和质检设备;

为了这些工艺和设备可以完美配合,OPPO 把整套生产线拉回自家厂房。

一个真理不言而喻:任何当下都是历史的总和。

但历史从来不是轻飘飘的,它是脚下埋藏着白骨的大地。

成为 OPPO,也许最初只是一群人赤裸的欲望。而过去十几年在设计和工艺上的推演和试错,在点胶战争和与之平行的材料战争、芯片战争以及软件工程战争中的一次次硝烟中穿行,是为之付出的层层堆垒的代价。

欲望与代价,总因时间淘洗而精确地配平。

正如尼采所说:“如果你知道为什么而活,就能够忍受任何一种生活。”

(七)手与机械 

2025年,轴心自控凑齐了两顶皇冠,分别是“深圳市制造业单项冠军”和“广东省制造业单项冠军”。

在李林看来,这是一场漫长的奖赏。

作为世纪之初就进入制造业的一代人,李林和所有人一样,串演过诸多角色。

他们曾经串演效仿者,拆开国外的设备,小心翼翼地研究,复现。

他们曾经串演追求者,一点点说服厂商给本土技术一点机会。

他们曾经串演开拓者,把想象中的工业神兽亲手制造出来。

十几年轰然而过,他们目睹了中国企业对进口产品的痴迷到对国产产品的接纳,见证了外国设备在中国从强势到弱势,从弱势到消失。

十几年间,他们眼见那些代理海外设备的中间商平地高楼,大宴宾客,最后一个个关门走人。

十几年间,草木枯荣,大河奔涌,他们庆幸自己从来站在此岸,一切繁花似锦,皆与自己有关。

十几年间,从代理胶水到代理点胶阀,从做阀体到做整机,从前装到后装,从寂寂无名到点胶机一哥,直到今天产品线扩展,点胶机只占轴心自控销售额的一半,并且持续下降。

李林告诉我,轴心自控很长时间的目标都是“做最棒的点胶设备供应商”。现在他们意识到不太合适,应该把“点胶”俩字划掉,“做最棒的设备供应商”。

说到这,他哈哈大笑。像是漫长的征途中歇脚时开个小玩笑。

十几年穿行在各个企业的生产线,李林早已得出一个坚硬的结论:

在工业生产中,精密设备正在不可逆地替代人工,不仅因为机器成本更低,更因越来越多的环节已经*无法*被人类完成。

对于 3C 来说,即便再训练有素的工人,微观上还是存在微小的颤抖。而且这种偏差还会随心情、疲劳程度而变化。与之对比,最近几代手机对装配精度的要求却呈倍数级提高,已经突破人类对肌肉控制的极限。

对于汽车来说,现在一个主控板就要15公斤,只有壮小伙才能搬动。目之所及的未来,主控板可能进一步变重,大力士都够呛。

旧日产线上的“黄金手”、“肌霸男”,正在成为希腊传说一般的存在。

正如标枪抛得再远,也不可能及导弹的分毫。

正如 AlphaGo 击败柯洁,与柯洁有多努力无关。

陆研提到一件小事。

每一代产品量产前,为了确保新工艺稳定,他都会到自家生产线上“打工”。

在曲面屏手机上,有一道工艺,叫“擦胶”,为了装配时严丝合缝,需要用无尘布蘸酒精把屏幕边缘的胶水打磨平整。搞定一个屏幕,需要用手指大力擦动几十下。

在擦了3000个屏幕之后,他发现自己的指头脱皮了,一碰生疼。

他赶紧去看其他工友的手,果然全都是破的。

虽然大家出来打工都是为了赚钱养家,但家人不会同意自己的亲人用健康换钱。

回到办公室,他马不停蹄打报告,不久和轴心自控一起开发了遮光胶精擦机,用机械臂接管了擦胶工序,工人被分配到更安全的岗位。

不论是出于怜悯、尊重、贪婪或者欲望,机械对人的替代进程都像洪流一样不可阻挡。时光中散落的故事,无非是中国制造漫长征途中的小小注脚。

临别前,OPPO 伙伴们特别嘱咐我不要用工程师的真名,防止猎头骚扰。

“为什么一直留在 OPPO?”我问陆研

“可能 OPPO 给我的,别人给不了。”

“那是什么?”

“对技术的企图心。”

是啊,人在荒凉的世间行走,没有企图,又如何度过漫长的日夜呢?

对于 OPPO,对于轴心自控,对于千万曾经、正在和将要义无反顾地投身于“中国制造”这个迷人词汇的工程师来说,又何尝不是如此?

参考链接:

OPPO Find X8 拆解:极窄边框背后的秘密

https://www.bilibili.com/video/BV1Jj15YtEru/?share_source=copy_web&vd_source=4d0235835b28c23833d33b2e29476bdb

往期推荐:

👉卖手机的 OPPO,偷偷干了件让全世界付费的事

精致野心

手机犟人

再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax

哦对了,如果喜欢文章,请别吝惜你的“在看”“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。

阅读原文

跳转微信打开

纳米 AI:红衣大叔的新战刀

2025-09-15 11:02:00

原创 史中 浅黑科技 2025-09-15 11:02 北京

人们想念的,是每一次站出来与高耸的技术壁垒对峙,抽出 40 米大刀的那个人。

浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。

纳米 AI:红衣大叔的新战刀

文|史中

(零)红衣大叔又抽出了 40 米大刀 

最近半年,我听到“AI”这个词,感觉越来越愤怒。

点开头条公众号:某 28 岁 AI 大神被挖走,年薪上亿;某厂搞出最新模型,股票长虹。

点开抖音小红书:各路天才选手用 AI 生成的视频段子像泥石流一样往脸上呼。

点开得到小宇宙:一众大佬说不会 Vibe Coding 就等于文盲+残废。

点开微信钉钉:发现我自己的活儿竟不会用 AI 干一点儿。。。

关掉手机屏幕,映出一张不知所措的脸。

AI 已来,只是分布不均。 这种不均,是我和马斯克的总资产有 3000 亿美元的那种不均。

我猜你和我一样,心里隐隐觉得不公平,但转念一想又天经地义:毕竟 AI 这么难,人家玩得转,活该赚大钱。

但这,正是房间里的大象!

如果一个时代的门槛比《只狼》还高一百倍,高到只有极少数天才垄断创新,并且心安理得地拿走绝大多数时代红利,这叫什么伟大的时代?

面对高耸的门槛,产品创业者眼前只剩两条路:

第一,抽身观望,泡沫破裂时别血溅了我爱马仕的长衫;

第二,躬身入局,抽出 40 米大刀,冲到 AI 的门槛前面一顿狂砍,解救被时代围困的普通人。

周鸿祎选择后者,一点儿都不意外。

遥想红衣大叔第一次抽出 40 米大刀,还是在十几年前。当时普通人买不起杀毒软件,也看不懂专业界面,360 就是用“免费+傻瓜”的大刀砍掉了网络安全的门槛,结束了人人(被迫)与毒共舞的时代。

而这一次,他的大刀叫:纳米 AI

最近,红衣大叔几乎每周都做一场直播,就是在给你我这样的普通人手残党安利纳米 AI。

你也许看过直播,但没注意在画面另一端还有个“蓝衣大叔”,他不是来给直播间配色的,而是纳米 AI 的产品负责人,也是我们今天故事的主讲人:梁志辉。

“人不能开引擎,人只能开汽车!”梁志辉的吐槽开门见山。

在他看来,各种大模型就像引擎:

引擎性能再好、再便宜,你也不会买回家自己攒汽车吧?

专业人士在发动机周围做一整套传动系统,做好底盘车架,再包一层帅气的铁皮,经过 10086 个步骤做成量产车,才能真正让这个技术走进千家万户,定义一个时代。

纳米 AI 的目标就是:做出一辆开起来最简单的车。

简单到啥地步呢?

“你会在微信群里口喷吗?将来只要一个人会用微信,就能调动一群 AI 帮你完成复杂任务!”梁志辉说。

我怀疑他在内涵某些老板。但讲真,如果有朝一日每个牛马都能翻身当老板,对“赛博牛马”呼来喝去就把班儿给上了,这画面还真挺诱人呢!

要理解纳米 AI 具体如何实现“口喷即干活”,咱得先科普一下当今 AI 的“最强组织模式”

“大模型”,就像一个眼神清澈的赛博毕业生;

教会它特定的技能,再塞给它一些工具,它的眼神就没那么清澈了,成了一只赛博蜜蜂,也叫“智能体”

面对复杂任务,需要好多个智能体协作,它们组成的业务部门就叫“蜂群”

话说,纳米 AI 的师傅们,最近半年做了很多智能体和蜂群,例如:说一句话就有一群 AI 帮你生成大电影;说一句话就有一群 AI 给你生成专业的调研报告。

但在我看来,纳米 AI 提供的最锋利的想象力,不在某个智能体或蜂群,而是“想要啥智能体就能有啥智能体的能力”

没错,它们还做了一个“360 智能体工厂”。你口喷就能创造智能体,还能口喷把一堆智能体变成蜂群!

说到这里,图穷匕见:纳米 AI 正在挥舞的大刀,不只是在砍 AI 使用的门槛,同时也在砍 AI 生产的门槛

梁志辉算了下,这半年来,官方团队拼死拼活才做出了 200 多个智能体,而在智能体工厂里,普通用户做出的智能体/蜂群已经超过了恐怖的 10 万个。

理解了这些,你或许能体会我的激动:一个*普通人*可以玩懂 AI,并且享受 AI 红利的恢宏时代正在缓缓降临。

而如今的一切,都源自一颗小小的种子。

梁志辉

(一)搜索:蜂群里的一只蜜蜂 

2023 年春天,ChatGPT 爆火,那是本轮人工智能开始邪门的起点。

评论家首先为之疯狂,他们高呼:“模型即产品”的时代到了!

但曾经手造了几个亿级 DAU 的梁志辉和同事们一起试过 ChatGPT 后,有种“有句话不知当讲不当讲”的感觉。

先不说激发模型的能力需要极其精准而冗长的提示词,就单说一个问题,靠模型自己就无法解决,那就是——幻觉。

深度学习之父辛顿认为:幻觉是智能的副产品。注意,是智能的副产品,而非仅仅是“人工智能”的副产品。(参考《辛顿的冬与春》

模型的本质是对世界的“有损压缩”(《当 AI 活成了你的样子》),它在还原世界的时候,就必然会经历反向“生成”的步骤,所以它们本质上全是幻觉。

大众意义上的“幻觉”,只是恰好生成内容和现实中的强证据存在逻辑矛盾而已。

那么,怎么让模型生成的内容和现实世界尽量不矛盾呢?

AI 您动动发财的小手,自己搜一下再说不就行啦?!

看到了吗?搜索,是大模型进化成智能体的路上擎起的第一个工具,它无异于原始人的火炬。

实际上,英雄所见略同。 就在老师傅技术验证的过程中,主打搜索的 AI 产品 Perplexity 窜红,梁志辉他们直拍大腿,决定火速研发!

你可能觉得,“让模型查搜索引擎”应该三五个人七八条枪就能搞定。

错!作为智能体家族老大哥,搜索智能体的难度在于“开模”——定义出模型使用工具的*基本范式*。

一个模型使用工具好不好,效率如何,标定了智能体的能力基线,直接影响后来“蜂群”的工作效果!

回到当下,老师傅其实没想这么深远,他们无畏地上路了。。。

刚出发就直接进坑了。

当时的 360 搜索引擎,是给人用的,不是给 AI 用的。

啥区别呢?很多,这里我挑一个最本质的说下:

人在查看网页时,大脑会根据排版、字号、颜色等等多个模态进行“权重判断”,也就是哪些话要重点看,重点想,哪些话要略过。

所以,给人用的搜索引擎只要把网页合理排序展示出来就行,信息冗余点儿不碍事。

AI 在查看网页时,只能依靠文字本身的内容来判断权重。

所以搜索引擎给到 AI 的内容,必须尽量去掉无关的文字,最好再对网页的内容进行一次总结抽象。信息越精炼越好。

这么说吧,一个 AI 搜索功能,直接把搜索引擎团队的师傅给拉下水了。。。

2023 年冬天,梁志辉写了一个规划书,建议把搜索团队和 AI 团队进行架构合并,老周全力支持,眼神殷切,搜索引擎团队瑟瑟发抖。

而后几个月,搜索引擎团队把底层索引机制全部拆开,挨个升级。新的引擎能够对每一个网页的语义都进行向量计算,它给出的信息,不仅和用户的真实意图更对应,还更简短。

2024 年 1 月,360 AI 搜索,也就是纳米 AI 的前身正式上线。

在 2024 年 10 月的榜单上,360 AI 搜索全球排名超过了 Perplexity。

如果说如今的纳米 AI 是一个蜂群,那么“AI 搜索”就是其中的一只蜜蜂,而且是只相当能打的蜜蜂。

多说一句,现在 AI 界的师傅已有共识:AI 产品要想好,三大支柱少不了——搜索、浏览器、编码能力

在当时“搜索到底重不重要”还没定论的情况下,这群人就已经冲着一根支柱跌跌撞撞走去了。这可以说是一种幸运,但更是一种嗅觉。

正因做搜索,老师傅无意间走上了一条超长的雪坡。

故事是这样的:

随着纳米 AI 逐渐火爆,很多用户开始上强度,拿各种偏门、专业的题目来“刁难”它。

难题一多,老师傅很快注意到一个问题:大模型使用搜索引擎查询到的东西,有时会相互矛盾。

于是,“搜索小蜜蜂”就不能傻傻地直出答案,而要在生成答案之前多加一道工序:选边站。

选过边的小伙伴都知道,站队是个很耗费脑力的工作,它必须得做很多判断,例如:哪个信源更权威?哪个说法更自圆其说?哪个说法和上下文能印证?

而在选边站之前,起码还得有一道工序:感知查询到的资料里是不是存在矛盾。

是不是感觉事情变复杂了?

敲黑板!这里我们要引入一个重要的概念:任务复杂度

任务越复杂,“搜索小蜜蜂”查到矛盾信息的可能性就会增加,也就更需要更多*工序*去做感知、验证、深入调查,保证最终结果质量。

于是,一个水灵灵的问题摆在老师傅面前:

怎么才能正确地计划所有工序,稳定地执行多道工序呢?

这句云淡风轻的追问,召唤着一场汹涌的技术突破。。。

(二)脑海里的“小窗地图” 

一个任务复杂不复杂,咱们基本能靠直觉判断。

你问:周鸿祎是男是女?这是个简单的任务。

你问:根据 2025 年美国各个行业对中国稀土的依赖程度,判断一下它对于中国芯片卡脖子的政策未来会有什么变化。这就是个复杂的任务。

但做工程不能靠直觉,必须追问到底:究竟是什么因素决定了任务的复杂度?

跟我一起想象:

一个像血管支脉一样的迷宫,大模型从原点出发,每一步都要在诸多岔路中选择一条,最终的目标就是找到出口。

每一步面对的支脉越多,就越难选对正确的岔路,这对应着横坐标:“任务的开放性”。

从起点到出口经历的步数越多,走出迷宫就越难,这对应着纵坐标:“任务的步骤数”。

横纵坐标一乘,面积越大,任务的复杂度就越高。

但是!以上只是站在“全知视角”的示意图。

大模型在执行某个具体工序的过程中,是不知道任务总体有多复杂的。

玩游戏的同学很容易理解这个比喻:

大模型周围存在一个“战争迷雾”,它只能处理眼前的岔路,不知道自己出发了多久,也不知道出口在多远的未来。(其实人生也是如此。)

这会导致一个严重的问题——迷路。(用文艺的话说就是:走得太远,AI 会忘记自己为什么出发。)

所以,为了让复杂的工序得以一步步正确推进,大模型必须在视野角落建立一个“小窗地图”,每时每刻都提醒自己从哪来到哪去,总体任务是什么,现在进行到第几步。

这个“小窗地图”,就叫“规划”

正所谓:“凡事预则立,不预则废”嘛!

说回 2024 年,纳米 AI 老师傅评估了一下市面上大模型的规划能力,结论是:不太行。

问题很棘手:一边是广大人民群众让纳米 AI 解决复杂问题的殷切希望,一边是 AI 无法自主规划复杂任务的废柴现状。

老师傅冥思苦想,找到一条“妥协路线”:谁说规划必须自己做?也可以遵循套路嘛!

你大概做过旅游计划。

如果你擅长,就根据实际情况亲自定计划,肯定玩得又尽兴,花钱又少;

如果你不擅长,就报一个旅行团,跟着别人规划的标准路线走,也可以嘛!

梁志辉他们绞尽脑汁,把需求分门别类,手搓了好多“工作流”,例如:有帮你做研究报告的,有帮你写小红书文案的,有帮你做旅游攻略的。。。

工作流的每一个步骤上,都挂载具体的思考方式,再配好相应的工具。

本质上,相当于这个任务的全貌(也就是复杂度)已经被人为规定了,大模型只负责在流水线上一步一步执行下去就行了。

就像酱↓↓↓

然而,这样做代价是巨大的:

梁志辉回忆,当时遇到复杂一点的工作流,整个团队要写两三个月的代码。

在赛博空间里,筑起一堆极其复杂的“脚手架”

每个脚手架都被螺丝拧死,大模型在通道里面按部就班地推理,跟八股文一样没有自由发挥的空间,用户稍微提出非分要求,AI 就选择狗带。

现在回望,2024 年冬天,是纳米 AI 最幽暗的一段时光。

老师傅每天都在寻找各种新的细分需求,然后从头到尾一遍遍焊接工作流的脚手架,到最后真是焊不动了呀。。。

就在最痛苦的时候,他们看到了援军的烟尘。

(三)“四自递递”与“三只小猪” 

2025 年春天,DeepSeek 横空出世。

普通用户只是看到它回答问题前会自己“穷嘟囔”,可梁志辉他们看到的是:模型的自主规划能力终于上了一个大台阶。

没过几天,Manus 又刷屏了。看到这里你会明白,Manus 正是利用了模型刚进化出的自主规划能力,再配上各种工具而形成的一个智能体。

今天看来,以 DeepSeek 和 Manus 为代表的产品奠定了一个 AI 蜜蜂的“工作范式”。

我愿称之为“四自递递”

1、干活之前先自主制定规划;

2、干的过程中自主决定使用什么工具;

3、自主发现工作中的矛盾和瑕疵;

4、自主判断什么时候该结束思考。

5、从原始信息开始,把每一次思考的结果不断填入模型的上下文迭代思考,传递再传递,最终得出答案。

卸掉脚手架,真是一身轻松↓↓↓

虽然蜜蜂在“战争迷雾”里行进,但因为有清晰的规划,每一步有清晰的反思,还是能找到比较好的答案。

不过,梁志辉他们尝试之后发现个问题:当时主流的国产模型在迭代次数方面是短板,最多思考 20 步。超过之后 AI 的“思想负担”就迅速变重。

换句话说:那个“小窗”太小,装不下大地图。。。

于是纳米师傅决定:博采众长,成一家之言。

他们找来几个在迭代任务上表现出色的国际模型,对自家的智脑模型进行强化蒸馏。

效果拔群!做出的模型竟然能迭代 99 步左右仍然不犯迷糊。

不知你发现了没,一开始我还在讲“搜索”,后来我悄悄把这个词换成了“任务”。

没错,你如果能让一个智能体“如如不动”迭代 99 步,它就不只能做搜索,而是能完成更丰富的创作任务了。

你可以如此理解:搜索只是任务的一种,搜索智能体也只是任务智能体的一个子集。

纳米 AI 不知不觉从“搜索智能体”进化成了“创作引擎”。

意识到这一点,老师傅仿佛中了一道闪电,这幸福的闪电告诉他们的,他们也准备告诉每一个人。

他们决定,让纳米 AI 秀一下肌肉,完成一个复杂任务。

“咱们就用一句话做一个电影,讲《三只小猪》的故事,如何?”团队有人提议。

这个任务很有深意,咱们简单拆解一下,从一句指令到最终成片大概需要五步:

1、从关键词出发,查询《三只小猪》的故事梗概;

2、写出《三只小猪》的脚本;

3、根据脚本画分镜;

4、根据分镜图片输出各段动态视频;

5、把镜头拼接在一起,加上包装做出成片。

以下就是纳米 AI 完成任务全部流程↓↓↓

这个任务的起点极低:甚至不需要完成九年义务教育的人都能给出完整指令:

这个任务的终点极高:要知道一个人类团队从编写剧本、画分镜,到草稿到绘制完成至少需要 10 人天的劳动。

这么大的高度差,其实都是这只“赛博蜜蜂”靠自己规划,又靠自己一步步徒手攀岩上去的。

“四自递递”的范式,就是这么凶猛。

纳米 AI 发布会上,红衣大叔展示《三只小猪》作品,是我路转粉的时刻。现在回顾,很多新用户注意到纳米 AI,也都是从《三只小猪》开始。

下面就是成片,你感受一下↓↓↓

AI 怕出名猪怕壮,舞台之上纳米 AI 爆火,舞台后面的梁志辉团队却被架在了烧烤架上。

他们发现,依靠现有的技术,无论换什么姿势,都没办法让一个“赛博蜜蜂”思考超过 100 步。但用户才不管这些,他们疯狂给纳米 AI 发来复杂度超越 100 步的任务,而且“变态需求”的比例还在迅速攀升。

老师傅像被霸总逼到墙角,这个变态的客,不接也得接。

他们胡思乱想:既然一只蜜蜂不够用,咱要不,养一群蜜蜂试试?

但很快又被自己的想法吓到了,要让一堆智能体组成“蜂群”,难度并不亚于管理一群真人,需要哪些工程框架?模型能不能支撑?一切都无法预料。

前面是漆黑一片的深渊,看看左右的友商,有人往下探探脚,有人对深渊喊一喊,就是没人敢纵身一跃。

梁志辉决定:你们不跳,我跳!

这是一些用户的问题和任务。

(四)蜂群之战 

人类的公司,其实是蜂群现成的仿生学教材。

老师傅从中学到的重要一课就是:层级

他们为蜂群设计了三层架构:

最高层,是“蜜蜂 CEO”,它负责把人类这个董事长布置的任务做规划,拆解成不同的子任务。

中层,是“蜜蜂经理”,它负责认领一个子任务,立下军令状,保证给 CEO 交付满意的结果。

下层,是“蜜蜂牛马”,也就是之前咱们说的智能体,宏观战略不用它思考,有意见保留,它只负责想办法把分配到手里的任务完成好!

这个班味儿十足的架构,怎么说呢,是真™有效率。。。

它的效率来自于两方面:合+分。

所谓,就像会议室。

有些任务没办法拆分,例如之前提到的《三只小猪》视频任务,先要查询故事,才能扩写故事,才能生成分镜,每一步都依赖前一步,没办法“跳步”。

老师傅索性搞了个“智能体协作空间”。它就像一个大会议室,任务就摆会议桌上,赛博经理指挥一圈蜜蜂你一下我一下进行操作,封闭开发,效率自然大大提升。

所谓,就像格子间。

有些任务是可以拆分的,例如《三只小猪》任务的分镜生成后,下面就是依据每一个分镜来生成视频。

但每一段视频之间其实是(相对)独立的。赛博经理把它分配给多只蜜蜂,拿回工位分头干,不就相当于并行处理了吗?

这样一来,整体任务完成的时间会大大缩短。

现在,所有的压力都给到这个 CEO。。。

面对一个具体的复杂任务,究竟要以怎样的方式对手下的蜜蜂排列组合呢?

这里,一个终极命题出现了:

由于蜂群总体的可能性是每个蜜蜂面对的可能性的乘积,算下来复杂度已经是天文数字,几乎没有 AI 能够短时间内找到最优路径。

就像“一个人应该如何过好一生”这种天问,本质上已经是一个偏好问题,不存在标准答案了。

面对极端复杂问题,如果放手交给 AI 自主规划,有时结果不遂用户的偏好;如果完全规定套路,又难以适配各种变化,

思来想去,他们来了个“两头堵”:

既可以通过“连线”的方式规范协作流程;也可以通过“拉群”的方式让 AI 自己决定协作流程。

比如,“一句话生成大片”是个很多人都用得到的功能,老师傅尝试了很多种套路之后掌握了一套“最佳实践”,索性就把这种组合方式用连线的方式固化下来,开放给用户直接去用↓↓↓

比如,你想让 AI 根据你自己具体的情况提供一些面试建议,就可以拉几个你信任的智能体进群,直接下命令,让它们现场研究现场写报告↓↓↓

梁志辉告诉我,把这么多智能体在一起,先不说连线还是拉群,首先面临的难题其实是:“成功率”

你可能玩过那个“传水”的团建游戏。人蒙眼站成一排,把自己桶里的水倒给下一个人。这中间,每个人都会撒出一些水,到最后就所剩无几。

而且但凡有一个猪队友,把水全撒到外面,整个 Mission 就 Failed 了。。。

简单的数学:如果一个任务需要 100 步,每一步的成功率是 90%,那么最后的成功率就是 0.9¹⁰⁰≈0.002656%。

反过来算,如果需要一个任务最终成功率是 98%,那么每一步的失败率就要低到万分之二(0.02%)。

这是极为变态的要求。

老师傅尝试了很多方法,连打带骂调教这些赛博蜜蜂,效果都不太好。最后他们发现,答案就在灯火阑珊处:“知人善任”

不同模型适合不同蜜蜂的体质,他们索性接入了全中国 16 家主流模型,给每个模型安排最合适的角色,如果失败率还是压达不到万分之二,就让模型厂商去改模型。。。

“其实模型厂商很愿意去改模型,一来我们是大客户,二来我们提供的都是真实用户需求,这对模型进化来说是非常珍贵的。”梁志辉说。

就这样折腾几个月,成功率真的稳定在了 98%,蜂群舞起来了!!

说到这,你心里可能会升起一个大疑问:光成功管啥用,干出来的活儿到底好不好啊?

这。。。是另一个神坑。

(五)创作非儿戏 

同样是你,给你一个铲子和给你一个挖掘机,干活儿的效果是不一样的。

每个蜜蜂干活的质量,也极为依赖于它手中的“工具”

幸亏,从最早做搜索智能体时对搜索引擎进行深度改造开始,老师傅一直在积累经验。

所以此时,他们的目标很明确:蜂群之中每一只蜜蜂都要能根据具体任务选择正确的工具,每一个工具都要像之前那个 AI 搜索引擎一样强大而稳定。

话说,都有啥工具呢?

比如,从分镜到视频要用到“图生视频工具”;

生成一个新闻播报员要用到“数字人工具”;

让人物说话要用“声音对口型工具”;

视频剪辑包装要用到“剪辑工具”;

还有更基础的搜索引擎工具、地图工具等等。。。

目前业界已经形成标准,这些工具都通过一个叫做 MCP 的协议被大模型使用,所以也叫 MCP 工具。

“今天市面上大概有 16000 个 MCP 工具,可是绝大部分都是玩具。”

梁志辉毫不客气。

举一个实际的例子:我有一款 A 相机,现在想拍人像,想知道哪款镜头比较好。这时,蜂群中有一只蜜蜂会去查询小红书上大家怎么说,它就必须用到——小红书内容抓取工具

这事儿如果让人来做,真的不难。

打开小红书,搜关键词,扫一眼屏幕,就能知道这个帖子的内容,有多少人点赞转发,评论区在讨论啥,信息就抓到了呀。

但这事儿给 AI 来做,可是要跨越千山万水。

AI 必须得有一个电脑用来跑浏览器吧?

AI 要想查询小红书,得有个账号登录吧?

AI 要想理解一段视频在说啥,得有图像理解能力吧?得会语音转文字吧?

AI 得理解页面布局,知道点赞、转发、评论都在哪吧?

以上每一步,但凡走不通就拿不回来信息。但凡没理解准,拿回来的信息就是错的。如此,其他小蜜蜂干得再勤奋,也是在浪费算力。

为了做好这个工具,他们专门开发了 AI 能方便使用的浏览器,又给浏览器准备了虚拟机沙箱环境,还针对小红书的页面布局做了专门的解析模块,甚至为了让工具能大规模稳定运行,连底层的 MCP 服务系统都几乎重写了一遍↓↓↓

“小红书”还只是一个工具,老师傅为各个蜜蜂量身定做或修改过的工具,算起来有上百个。

这些工作全都做在暗处,如果不说,一般用户肯定不知道。但梁志辉很有信心,他们一用纳米 AI,就能*感觉*出来。

时至今日,创作早已不是儿戏,而是很多人赖以吃饭的家伙,如果一个 AI 不能帮助创作者*稳定地达成目标*,最终是不会有人买账的。

但实话说,在现有的条件下,即便有最强模型+最强智能体组成的蜂群,也很难一次创作成型。

就拿“一句话生成视频”这个官方制作的蜂群举例。

一个 90 秒的影片,大概需要 20 个镜头,其中但凡有一个镜头出现人物一致性错误,或者出现三头六臂,或者出现解说混乱,都没办法用。

好的 AI 蜂群,需要具备“Redo”的能力。

梁志辉把这件事儿称为“反悔”,他们设计了两种反悔能力:即时反悔和延时反悔。

啥是即时反悔

就是在每一个子任务执行的过程中,经理都会进行质检,判断刚刚生成的视频里有没有“明显瑕疵”,例如出现敏感画面、人物畸形之类的肯定不行。

如果存在问题,那就不往下走了,直接返工重做。

啥是延时反悔

就是在全片生成之后,交给人类审看。人发现某个不满意的地方,还可以追溯回去,让负责这个任务的蜂群返工重做。

比如下面这张看上去像剪映的界面,就是一个“P视频”的系统,你如果对某个片段不满意,可以直接上手修改它的提示词,替换原有画面,直到满意为止。

同理,人物口播、旁白、配乐也都可以修改。

梁志辉的想法很实际,他确信在未来相当长的时间内,AI 都没办法 100% 独立完成任务,这也就要求人必须以某种(简单的)方式“在回路”。

由此看来,这个编辑界面是一个完美的隐喻,它是并不完美的人工智能和同样并不完美的人类智慧相互咬合的接触点。

藉由这种相互搀扶,人机才能各自成为左右脚,向那些宏大的、也许永远没有答案的命题里一步步迈进。

(六)当蜂群渗入人生 

“纳米 AI 的终极目标是什么样?”我问。

“我们想挑战 AI 应用的上限。具体到每一次的挑战方向不好提前预测,其实都是用户需求推动的。所以,我最怕的是用户不用。”梁志辉笑。

一瞬间,我意识到有趣的问题:很多人都在说“用户”,但当他们说“用户”时,心里想的其实并不是同一群人。

梁志辉所谓的用户,特指那些在 AI 上“没有经过特别训练”,也“没有特别天赋”的数量众多的普通人。

之所以要面对这样的普通人,是因为他们身上有“金矿”——他们不仅面对着巨量的“解决问题”的场景,甚至面对巨量的“定义问题”的场景。

中国是一个产业体系最完整的国家,此刻在看这篇文章的人,可能分布在极为广泛的垂直行业,做着彼此难以理解的工作内容,面对着复杂又具体的难题。

举一个小例子:

在医院里,医生问诊之后,需要把刚才问到的信息,结合医学常识写成一个标准格式的报告。

这会耗费医生大量的时间,降低问诊效率。

本质上它是一个可以被智能体蜂群解决的问题;

但真正困难的是,纳米 AI 的老师傅不一定知道这个问题的存在。即便知道,隔行隔山,也很难精确描绘解决问题的流程。

这也是他们开发“智能体工厂”的核心逻辑。

梁志辉告诉我,在智能体工厂里,用户不需要任何代码能力,用自然语言的方式就能给智能体描述它的职责,通过拖拽就能安排“赛博蜜蜂”的协作顺序。

然后,一个“特种蜂群”就诞生了。

如果你对它们的工作不满意,只需要调整协作顺序,调整岗位描述,就能改进他们的能力;如果还不满意,你就可以“人在回路”,在蜂群工作的基础上完善一下就好了。

这并非空想,实际上已经有医生用“智能体工厂”做出了辅助写诊断报告的蜂群,并且投入使用。

在 360 的老本行网络安全领域,也有很多同事用纳米 AI 做出了专业蜂群,使用各种安全产品做网络安全运维。

除此之外,还有各行业的老铁们做了发票报销蜂群、宣传片制作蜂群、竞品分析蜂群。。。

观其本质,“定义问题”这件事情终于从行业精英的垄断权力成为了普通职业人的日常。面对问题的同时,你可能已经离解决问题很近了。

正如前述,各行各业的用户已经在纳米智能体工厂上做出了超过 10 万个智能体和蜂群。

每个蜂群,至少对应一个“岗位职责”

坦白说,以目前的 AI 水平,无法覆盖所有岗位的所有职责,但梁志辉提出一个评价蜂群价值的客观的指标:相应人类岗位的月薪

随着技术演进,期待蜂群能替代的岗位月薪越来越高,意味着它的技术含金量越强,价值也就越大。

这个未来的降临,似乎还需要 AI 补齐一个能力,也就是三个支柱中的最后一根——编码

虽说现在大模型已经具备一定的编码能力,可以搭个网站之类。但梁志辉觉得这远远不够,AI 在工作中使用的工具,绝大多数还需要人类帮它们编写。

相比 AI 的燃烧算力,人类显然是拖后腿的猪队友。

他期待有一天,模型可以根据需要现场编码任何工具,触达任何系统。

只有这样,蜂群才有机会深入工业产线,进行实时调参,分析数据,优化排产;有机会深入游戏领域,实时 3D 建模、渲染出动画;有机会深入影视制作,自动分析画面内容,个性化剪辑。

未来,智能体之间的协作靠实时生成的上下文,模型工作靠实时编程的工具,人类编码越来越薄,人类介入越来越轻,AI 反而能像水一样渗入更多的场景。

这才是 AI 应用真正爆发的时刻。

梁志辉说。

弱小和无知不是生存的障碍,傲慢才是。

今天的 AI 并不完美,但未来不能靠一边说风凉话一边等待而降临。

大模型,正如钢铁。

人们很早就发明了冶铁技术,可这远非创新的终点。

随后几千年,人们锻出了铁犁与镰刀,铸造了铠甲和戈矛,发明了齿轮与钢筋,组装了轮船与火箭,唤醒了机器人,至今一切仍在蓬勃。。。

那是留给一代又一代梦想家的舞台与追光。

告别老师傅,我突然想起 8 年前,一篇名叫人民想念周鸿祎的文章在网络上流行。

我确信,人们想念的并不是某个具体的名字。人们想念的,是在历史的轮回里,每一次站出来与高耸的技术壁垒对峙,抽出 40 米大刀的那个人。

相关推荐:

👉辛顿的冬与春

👉当 AI 活成了你的样子,而你活成了狗

👉360想拯救与黑客作战的100000个“帕鲁”

👉360杀出一支“蓝色十字军”

👉360摄像机往事:一半芯片江湖,一半理想国度

👉最 Deep 的 Seek:AI 的“终极设计图”是什么样子?

👉“AI 蠕虫”和时代裂隙中的刺客

👉黑客的滑铁卢——美国大断网全纪实

但得蜜成功用足

不辞辛苦与君尝

再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax

哦对了,如果喜欢文章,请别吝惜你的“在看”“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。

Thx with  in  Beijing

阅读原文

跳转微信打开