MoreRSS

site iconQianHei | 浅黑科技修改

一家关注科技前沿的媒体,由一群有爱的科技媒体人2017年创办于北京。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

QianHei | 浅黑科技的 RSS 预览

2025:一代人冲出战壕

2025-12-29 09:04:00

原创 史中 浅黑科技 2025-12-29 09:04 北京

人和 AI 都在船上,但只有人心里有远方。

浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。

2025:一代人冲出战壕

文|史中

2025 年 11 月,我看到马斯克和黄仁勋搞了一次对谈。

他俩做出了四个预测:

1、人形机器人会成为有史以来最大的产业。

2、人类正经历一场“计算范式迁移”:GPU 不仅会替代 CPU 的“事务性工作”,还会进入 CPU 一直难以胜任的“开创性研究工作”。

3、人类作为一个文明,正(幸运地)处在上升期,对太阳能的利用比率还有大幅上升空间。未来“太阳能 AI 卫星”会让智能的成本大幅下降。

4、随着“AI+机器人”让生产力飞跃,金钱的重要性会逐步下降,工作将成为一种选择,人类彻底消除贫困。

这堪称恢弘的狂想。

不得不说,人类(中的梦想家)已经很久没有这么昂扬了。好像往日阿波罗登月的辉煌,都只配作脚下时代的序章。

放下手机,我突然想起了王兴那个著名预言:2019 年是过去十年中最差的一年,却可能是未来十年中最好的一年。

2025 走到最后,这句话所涵盖的 19 年浩荡,已经被(了不起的)我们挺过了 16 年。。。

必须承认,一场始于世纪之初的浓墨重彩的互联网大戏已近尾声,演员再奋力做派,也只能震下楼板的丝丝灰尘。

锣鼓喧闹,恍若隔世。

但作为普通观众,着实无需入戏太深。转回身,一个百倍宏大的新舞台正在布景。

我们为什么不先去占个前排?

站在 2025 和 2026 的分界点,我有一些关于未来的体验,它们未必是精雕细琢的理论,有些甚至是长久肃立身边的常识,却让我受益良多。

我想勇敢地分享给你。

(一)大航海时代重演 

如果你我能穿越。

重回艾萨克·牛顿爵士的英国,咱们有好多事儿可干。

你可以进入热火朝天的纺织厂,亲手改良纺纱机和蒸汽机;

你可以驾船一路向西,在新大陆买下一大片种植园和几百个奴隶;

你可以钻研一种叫“股票”的东西,抢先布局南海公司,狠狠割一把牛爵爷的韭菜。

大航海时代和紧随其后的工业革命时代,人类文明狂奔向上再没回头,源于两个因素:

劳动力数量暴涨

 + 

与之配合的工具进步

这里有一个值得玩味的历史细节:先有人口增加释放大量*廉价*劳动力,后有一众工程师改良纺纱机、蒸汽机。

1750 年到 1850 年,英国人口从 600 万到达 1800 万,大陆另一端的大清国人口从乾隆年间 1.8 亿激增到道光的 4.3 亿。

换句话说:“廉价劳动力数量”本身,是人类文明水位的先导指标。

然后呢?

我们在工业革命时代标注这个刻度,再把时间轴叠加到当下“刻舟求剑”一下,可以大致推测我们今天所处的位置。

我们就在新一轮“创生大量劳动力”的时刻!

你可能说:不对啊,生育率这不在下降么?

但谁说劳动力一定要是人呢?(劳动力又什么时候被当成过人呢?)

显然:AI 就是新世界的奴隶。

Agentic AI 是新世界的白领奴隶,

机器人是新世界的蓝领奴隶。

依赖生物学过程制造的劳动力,重要性从未像今天这么低。

从这个角度出发,一切新世界的角色都逐渐明晰:

特斯拉、英伟达之类的公司,就是新世界的“西印度公司、南海公司”;

马斯克、黄仁勋这类企业家,就是新世界的“哥伦布”。(可以称他们为探险家,也可以称他们为殖民者。)

AI 和机器人所创造的一切,就是新世界的“种植园”和“纺织厂”。

由此观之,我们无疑身处“新大航海时代”的开端,新大陆就在那,“奴隶”已经装船,未来几乎锁死。

但时代并非简单重演:

三百年前,劳动力虽然爆发,但总数仍然有瓶颈,是一种需要争夺的资源。

最终只有 1% 最彪悍的人控制了新增劳动力,成为工厂老板、种植园主、资本家。

三百年后, AI 劳动力爆发几乎是无穷的,它的上限是人类对于太阳能的利用率。

这个空间足够让每一个普通人都拥有充足的劳动力。

你无需那么彪悍,也能成为“新世界的种植园主”。

换句话说,2025 年,每个人的人生*可能性敞口*开始迅速放大。如同一条船从河面来到了入海口。

你要做的几乎只是:向前!

可宽阔的海面是自由的诅咒。千帆竞发,我们该用什么策略来开船?

(二)凡事使用乐观之筛

2025 年,使我受益的第一个决策是:乐观。

没错,我花了很多功夫才意识到“乐观可以是一个决策”,而非无可更改的天性。

人住在自己的长期决策里。

我们不妨思考一个极简模型:

每个人都占据了星球上独特的一平米。在每个人的区域,地面高度不同,有的人是山,有的人是谷。

时代和科技进步的红利就像从天而降的雨水。

下雨的地点是随机的,但水落到地面以后的方向并不随机,它总会向低洼地带流淌。

这种“地形”就是极简版的社会结构。

物理定律决定了,在这个结构中高海拔的人会不断补贴低海拔的人。也就是K型分化中的“下位”补贴“上位”。

久而久之,两条线越分越远。

以此观之,想要更多的雨水,不能靠手伸得长。最好的办法就是抄起铲子,挖低自己的高度。

而你的每一次决策,冥冥中定义了你是把脚下的土地挖低一寸,还是垫高一分。

那么,如何确保自己每次决策都让自己的海拔降低了呢?

答案是没有办法保证“每次”。

但我们有办法提高决策正确的概率,这意味着只要决策数量多到一定程度,正确的决策会占据多数。我们就能确定性地“降低海拔”。

这里当然可以有很多复杂的策略,但我生性愚钝,倾向于使用最简单的办法:用“第一性原理”作为筛子,筛选所有备选决策。

有点抽象。我们不妨用投资来举例。

面对一个市场,你可以对做出两类决策:做多、做空。

单次来看,做多和做空都可能盈利。但是如果你身处一个长期上涨的市场里,做空亏损的概率更大。做多盈利的概率更大。

我们可以试着从第一性原理出发来判断经济的长期趋势:在 100 年(大概一个人一生)的长期跨度里,世界的经济是会更繁荣还是更萧条?

不妨用过去 500 年的历史数据回测一下:

假设身处 1492年、 1789 年、1900 年,你分别会做出怎样的判断?(真实结果又是如何?)

结论是:过去 500 年,任何100年的周期,终点全部高于起点,没有例外。哪怕是经历了小冰期、三十年战争、明清交替、全球人口停滞的 17 世纪,依然如此。

而且在工业革命以后,这个增长斜率就越来越快。

任何战争、瘟疫都没有打破这个斜率。

更幸运的是,站在 2026 年,我们身处“过去几年的谷底”+“新大航海时代的开端”,做出乐观判断几乎比任何时候都要容易。

*长期乐观*的结论作为筛子,你就可以剔除*所有的*做空决策。只在大概率正确的方向上下注,不仅让你的决策篮子变得更轻,还提高了你的预期收益。

不妨对照一下美国股市的历史,在经历 1929 年大萧条、 1941 年偷袭珍珠港、 1947 年美苏冷战、 1973 年石油危机、 2001 年 9·11、 2008 年次贷危机、 2020 年新冠疫情前后的表现,你很容易发现:

使用乐观的投资策略,可以穿越人类有史以来的所有经济危机。

而且!越是在深刻的危机中,乐观越能让你获利!

这是 1871 年到 2025 年标准普尔 500 指数的走势。

你可能笑了,敢说大 A 么?

敢。

你看下面↓

公认比较怂的上证指数,也符合这个规律。(1990-2025)

由此,乐观不仅仅是一种哲学,也很可能是当下最大的实用主义。

巴菲特曾说:“永远不要做空美国”。

这和乐观筛子所做出的结论恰恰吻合。

多说一句,巴菲特的第一支股票就是 1942 年 3 月 11 日买的,当时珍珠港刚沦陷,美国被日本爆锤,中途岛海战还没打。

也许有浅友说,我是 20 后,还年轻,也没啥资本积累,我的“乐观”就无法变现了吗?

其实无论对谁来说,金钱都只是狭义的投资。你的注意力、时间才是更广义投资。

越年轻,意味着你手里未使用的“资本”越多。

你可以在各种决策上使用乐观之筛,例如:把时间用来锻炼而非躺平,把精力用在积极建设而非愤世嫉俗。

我们这个时代的特点是:工具极为丰富

而“乐观之筛”,是一个简单又好用的万能扳手(和所有工具都能配合)。它像船上的帆,能给你源源不断地提供朝向同一个方向的力。这种力会逐步让你站在 K型分化的上位。

当然,上位并不应该是优越感,它所带来的稳定的资源流入(例如现金流、新工作机会),应被视作一切爱与自由的前提。

之后,我们回到主线:

如果人人都有“AI 奴隶”,我们到底该让它们干点儿啥呢?

当然,AI 可以帮人解决专业领域五花八门的问题,暂且不论。

这里我想聚焦“最大公约数”,作为一个普通人,应当如何利用“AI 奴隶”目前最普惠的形式——ChatBot——对世界建模?

(三)对世界建模:从搜商到 Chat 商 

在 2025 年剑桥大学的一次交流活动上,主持人问黄仁勋:你是如何在最艰难的阶段保持信心,坚持到底的?

面对如此宽阔的提问,老黄居然猛地使出了十成功力,给出了(在我看来的)标准答案:

我们用理性去推导我们对未来的判断。

你得一步步推回去,回到计算机科学最基本的第一性原理,或者物理学的基本原理……你能抓住什么原理,就抓住什么原理。一直推到最底层的逻辑原点。

一旦你完成了这个过程,用你所掌握的环境信息和一切已有认知,构建起了对未来的理解与信念,那接下来问题就变成了:你是个“说说而已”的人?还是一个会“真的去做点什么”的人?

他在描述的,就是一个“对世界建模”的过程。

没错,每个人的“世界模型”(有时也被称为“底层认知”“元认知”)都像一个核反应堆,会在一生的跨度内持续输出能量,那才是你是否会对某件事坚持到底的底层因素。

就像一个航海家脑海里的地图↓

老黄说的是“道”,那么在“术”的层面,究竟应该怎么建模呢?

核心是两个字:数据

和 AI 训练类似,在颅内对世界建模也需要大量数据。而数据的平均质量最终决定了这个“核反应堆”的输出功率。

在印刷术之前,人们对世界建模的高质量数据来自长辈们口耳相传的故事;

在前互联网时代,人们对世界建模的高质量数据大多来自“书籍”;

世纪之初,伴随互联网发展,人们对世界建模的高质量数据大多来自“搜索引擎”。(当然互联网上的数据良莠不齐,所以“搜商”这个词一度流行。)

在 ChatGPT 出现之后,人们对世界建模的高质量数据将主要来自“ChatBot”。

能深度激发“ChatBot”并且获得高质量信息的能力,应该就叫“Chat 商”

在细说“Chat 商”之前,我想先讨论一个重要问题:ChatBot 和搜索引擎到底有什么区别?

答案是:搜索引擎在“已知内容”里搜索,ChatBot 在“可能性空间”里搜索。

打个比方吧:

假设我们人类发现的真理就像一个个岛屿。我们已经发现了 1 万个岛屿,然后把它们画在地图上。

你给出任何条件,搜索引擎的答案必须最终落到某一个岛上;

而 ChatBot 可以在岛屿之间的合理位置帮你画上一个新的岛。

这样“乱画”,必然隐含着问题。

在 ChatBot 诞生初期,这个问题尤其明显:

1、AI 帮你画的这个岛,可能位置未必正确。(幻觉)

2、即便正确,也未必准确。也就是它的回答“分辨率”不够。(答案过于笼统,没有指导性)

这个问题,由 GPT-o1 和 DeepSeek R1 开创了解决方向。

你可以这样理解:

GPT-4(及以前模型)所做的事情只有一步:在地图上画岛屿。

但 DeepSeek R1 所做的事情却是两步:1)连续 N 次放大地图;2)画岛屿。

别看仅仅多了一个放大地图的过程,却带来了本质的升级。

原有的 ChatBot 像一个瞭望塔,理论上你可以看到世界的尽头,但实际上远处的细节无法分辨。

现在的 ChatBot 像一艘船,可以开到世界的尽头,在那里无比清晰地调查细节。

这也直接催生了 2025 年最让人兴奋的技术之一:Agentic AI。

给你看一张图:

在过去的大模型中,训练消耗了绝大多数的算力(训练侧的 Sacling Law);

而在 Agentic AI 上,训练消耗算力占比大幅缩减,越来越多的消耗由推理迭代所消耗。(推理侧的 Scaling Law)

而对推理迭代的形象理解,就是刚才所说的一次次放大地图的过程。

总结一下,刚才说这么多,其实就是三句话:

1)对世界正确建模是生活的基石;

2) 2025 年,我们手上的 ChatBot 能力已经及格;

3)我们应该赶紧用它帮助我们对世界建模。

我们继续回到主线任务:到底怎么建模呢?

深度学习之父理查德·萨顿在《苦涩的教训》中提出训练 AI 的两个关键技术:学习、搜索

学习是指:根据已有的数据,提取出内部蕴含的知识;

搜索是指:在可能性空间里寻找更优解(不是搜索引擎的搜索)。

Richard S. Sutton

这当然已经成为本轮 AI 爆炸的纲领,不用多聊。

但整个 2025 年,我都在思考万维钢就此给出的衍生方法论:每一个人都应该像 AI 一样去学习和搜索,并且应该在这两件事上花掉*无上限*的功夫。

核心在“无上限”三个字。

因为宇宙具有不可约化的复杂(《最 Deep 的 Seek),所以学习和搜索是不存在边际效益递减的。它能给你的“世界建模”带来线性的新增量。

在我看来,所谓“Chat 商”高,就是:

首先理解“对世界建模”值得花费无上限的功夫;

然后能和“AI 奴隶”之间形成了一种高效的合体范式,一起学习和搜索。

合体范式简单来说就是:

1、人负责处理“不可描述的部分”,例如动机、偏好;

2、ChatBot 负责处理“可描述的部分”,也就是具体向某个方向划行。

你和奴隶虽然都在船上,但奴隶心里只想着海浪,只有你心里怀着远方。

你需要的是“AI 领导力”,或者说“AI 奴役力”。

只要你萌发出一个念头,想让 AI 帮你改善某个行为、研究某类技术、推荐特定书籍都没有问题。

念头不用很明确,但一定要抓住它,开始和 ChatBot 讨论,在讨论过程中,你不断思考有没有值得继续探索的方向。

这种建模不分领域:

可以是功利的,为解决某个实际问题而进行的;

也可以是完全无功利的,纯粹因生活中某个兴趣点驱动。

宇宙的底层规则是通行的,所以任何一个构建于其上的领域都全息蕴含着底层真理。没有白走的路,每一步都算数。

比如。。。我用 Chatbot 自学了本地运行 Z-Image 模型,下面是我的作品↓

说回来,真正重要的是:

不要认为 AI 在帮你解决具体的问题。

它是在通过解决问题的方法,帮你对世界建模!你需要*刻意*和 ChatBot 共同学习搜索,让自己的世界模型随着时间推移不断进步。

马斯克认为,为了更深刻地探寻真理,一个把全世界人的意识连接起来的“广场”异常重要。(他指的是 X 平台)

在我看来,ChatBot 也有把人类意识连接起来的功能,只不过是通过“点对点”的模式:

ChatBot 能持续提供稳定、高水平的世界模型。

随着越来越多的人(自觉不自觉)把 ChatBot 作为大脑外挂,人类作为一个整体的世界模型质量将会不可逆地大幅提高。

高质量的世界模型是一切高玩的前提。

在此基础上,我们才可以试着做一些“大决策”!

(四)中庸:分配与置信度相匹配的资源 

“新大航海时代”的船需要人机共驾。对 AI 的考验很大,对人的考验也很大。

我们不妨继续听黄仁勋怎么说:

你可以选择成为那种“哦,我当时也想过这事”“我也说过类似的话”的人,但你并没有真的行动。

而我更倾向于那种人:我会非常认真地去推理和思考,并且一旦形成信念,我会深信不疑。

坦白说,只要我脑海中能清晰地“看见”它,我就几乎当它已经成真了。其余的,都只是细节问题。

这种行为模式一点儿都不稀奇,你可以在各路大佬身上找到。

我给你念叨两个段永平的例子。

1982 年,段永平从浙大毕业后,分配到北京电子管厂,他努力工作却成效甚微,不断往深层分析,发现一个底层桎梏:计划经济的低效。

这让他推导出结论:待在“计划经济的大本营”不会有太好的结果。

那么计划经济的反向大本营——市场经济最发达的地方——是哪呢?

广东。

这才有了南下广东之后“阿段”的传奇故事。(段永平说按照广东的风格应该叫阿平,但听上去像女的,所以改叫阿段。。。)

1980 年代末的东莞

在 2001 年去到美国后,阿段开始全职投资。

他发现了每股含现金 2 美元的网易股价居然跌到了 1 美元之下,于是仔细阅读财报、请律师分析潜在风险,还试玩了网易游戏和对手的游戏。

然后他决定把所有闲置资金归集 100 万美元,甚至又破例借了100万美元,用来买网易,最终获利 100 倍。

以上两个故事很多人都知道,在故事里段永平决策也用的都是常识。

我敢肯定, 80 年代北京电子管厂也有很多人和段永平有同样的感受,世纪之交也有很多人觉得网易便宜得不真实。

但是差异在于:段永平用极高的规格“款待了自己的判断。他用自己的职业生涯押注广东,用所有的闲钱押注了网易。

换句话说,他在自己高置信度的方向上下了重注。

简单打个比方:你的判断是 1,而你押注的筹码是后面的 0。

能判断出 1 的人很多,舍得在后面写 0 的人很少。

而真正改变人处境的,不是 1,而是 1 后面跟着的一串 0。

如果预期收益很高,却没有匹配相应的筹码,本质上等于你白白浪费了自己的“世界建模”。成为黄仁勋说的“哦,我当时也想过这事”的人。

这里我引入了一个“预期收益”指标。

我私下认为,一个人的智力很大程度体现为 Ta 是否理解概率, 并且在决策中(自觉或不自觉)应用概率。

预期收益就是一个与概率相关的指标。

简单举例:

如果你认为预期收益是 5,可以投入五个零的资源。如果你觉得预期收益是 8,就可以投入八个零的资源。

注意,这俩可不是线性关系,而是个曲线。

这个曲线参数是可以因人而异修改的。但基本精神就是如此:你必须在预期收益更高的判断上,下更更更大的注。(也被称为凯利准则,凸性配置)

这里有一个技术细节:

如果你发现,面对置信度更高的机会,手中却已经没有足够的资源下更大的注,那就意味着你在置信度更低的机会上分散了过多资源,需要动态调整。

当然,只有涉及时间、空间范围足够广的决策才是预期收益更大的决策,你中午吃盖饭还是炸鸡的小决策不可能有很大的预期收益。

正如巴菲特所说:“你应该有张一生决策卡,卡上只有 20 个孔位。”

我们不妨把这 20 个决策称为“大决策”

把大决策集合在一起,形成一个组合,然后按照权重为这个池子分配手里的资源额度。

如此,就形成了一个稳固的决策池。(你不用花很大的精力每天去维护它,除非当初用以做出某个判断的条件发生了变化)

由此观之,所谓的“All in”或者“All 不 in”,都是很明显的错误操作。(或者只是一种简化的表达方式。)

我一直认为,中国文化中的“中庸”这个词是对以上策略的最佳概括。

所谓中,就是不偏,不为某个机会匹配超过或少于它权重的资源。

所谓庸,就是在每一天的行动中践行这种匹配。

同一个道理,段永平喜欢用开车打比方:你开车的目标是到达目的地,不是要快,也不是炫技。所以你不应该开快车,更不应该崇拜开快车的人。

为了到达目的地,你的操作应该是:

1)待在车道中央行驶;

2)全程待在车道中央。(不能因为犯困,或者想炫技,或者任何理由而撞上两侧护栏。)

从这个意义上说,“庸”的难度要比“中”更大。

话说人的大脑设计,根本不是为了完成超长时间跨度的任务的。大脑最初只是一个保卫基因传承的生存工具,只要能瞬时帮助生命体摆脱危险,就大功告成了。(《AI 活成了你的样子》

可是随着社会发展,竞争加剧,生存策略逐渐复杂,大脑被迫在更长的时间里维持策略。

事情渐渐变得反人性。

所以,我们必须找到一些工具来帮助自己践行“庸”

(五)知行合一:摆脱痛苦的不二法门 

电视剧《西游记》里有一个耳熟能详的情节:

孙悟空去化斋前,给唐僧画了个圈儿,叫他不要出圈儿。但最后红孩儿装成受伤,利用同情心诱骗唐僧出了圈儿。(我也是和 ChatBot 聊过之后才知道“画圈儿”这个戏原著里没有,是电视剧独有桥段。)

套用之前的理论:唐僧去西天就是一个时间跨度很长的决策执行过程,这个过程中充满了未知,稍不留神就会做出与风险不匹配的行动。就像开车撞上护栏。

孙悟空给唐僧画的“圈儿”,就是车道线,也叫安全边界。

而保证不出圈,就是纪律。

为了达到目标,需要长期稳定执行策略,为了长期稳定执行策略,你需要纪律。

严格来说,纪律不是为了防止自己犯错,而是为了让自己在框架之内犯错。

所谓框架,其实就是人为设定的“变量合集”

在框架内犯错,为了两件事:

1、为了控制损失。

在已知变量下,你更容易估算出自己做一件事的最大收益和最大损失。

比如在无人区徒步爱好者中有一个“三人原则”,就是最少要有三人结伴同行。

这样如果有一个人受伤,可以有另一个人原地照护,第三人去求助。最大损失止于受伤。

如果单人徒步,一旦走入没有信号的地区,失足跌落无法行动,最大损失就是死亡。

同理,唐僧不出圈,最大的损失就是同情心遭受煎熬,但西天的未来仍在;唐僧出圈,最大的损失就是被妖怪吃,西天的未来就没了。

2、为了累积策略。

在已知变量下,你更容易判断出此次犯错受到哪个变量影响,从而可以有针对性地改进策略。

如果你在框架外犯错,本质上你都不知道到底有哪些变量,就更不知道哪些变量与自己此次错误相关。那么你不仅承受了错误带来的损失,这个损失还没换来任何“策略的积累”。

你就是最冤的冤大头。

这就是巴菲特所说:只投资自己能看懂的公司。计划你的交易,交易你的计划。

推而广之就是:只做自己能想明白的事情。计划你的生活,生活你的计划。

重复一下结论:

1)做自己想明白的事情,未必不会犯错。

2)但这个错误可以换来策略积累,让你朝着正确的目标迭代。

3)“行至西天”才是你的根本目标。为了其他任何“支线任务”而降低接近西天的概率,都是错误的选择。

但客观现实摆在这里,西天路上真是有很多“魔”。。。唐僧出门就上当,当当不一样,他也不想,但就是会打破纪律啊!

这是人之常情。

我们的思维就像一条河,随着支流不断汇入,逐渐失去的上游的清澈。随着时间推移,我们打破纪律的可能性在不断上升。

危险的是,很多情况下我们无法意识到自己的在打破纪律。

由此,你必须用一套*可操作的*行为准则来保证纪律得到实施。

丹尼尔·卡尼曼在《噪声》中提出了一个“决策卫生”的概念。简单说,他主张做重要的决策时一定要*走流程*。

Daniel Kahneman

这至少有俩好处:

1、走流程会增加你做出决策的成本,从而抑制住过剩想象力引导你做出“轻浮”决定。

2、一旦你真的走流程做出决策,它大概率也是一个高质量决策。

卡尼曼把决策中的噪声分为很多类,其中影响最大的是“稳定模式噪声”。这种噪声来源于你的成长经历所塑造的世界观、行为习惯以及思考偏好。

在我看来,这有点儿像佛教唯识宗里讲的“阿赖耶识”里“有漏种子”的概念。

由于生活经历的复杂性,以及多因素之间的纠缠,要描述自己的“稳定模式噪声”非常难,而且几乎不可能。

所以,最好的抑制噪声的方法就是放弃“端到端输出”,转而尊重“分段流程”。(在“端到端”备受推崇的今天,这是一个有益的提醒。)

一个简单的例子就是量表:

你做一个决策,不能拍脑袋。而是画一张表,它的利弊分别有哪些?列在表上,然后分别对这些利弊打分,然后加起来算总分。

具体到人生只有二十次的那个“大决策组合”。

每当你想做一个新决策时,首先要去判断和既有的“大决策组合”是否相冲突。如果冲突,就要重新评估一下大决策组合里相冲突的决策。

还是举个例子吧:

段永平离开北京,意味着要放弃“北京户口”。这在当时的朋友看来得不偿失。

如果为了户口而留下来,就会和之前的决策产生冲突。

段永平走了一个流程:他评估了一下北京户口的“价格”,当时值 1 万人民币左右。然后他计算了一下自己投入市场经济可能带来的收益,应该是远远大于 1 万人民币。

于是,他维持了原来的决策,否决了新的决策——最终还是去了广东。

这就是决策卫生。

在每一个新决策面前都走一遍“决策卫生”流程,就是在遵守纪律。

正是因为坚持“决策卫生”,巴菲特在很长的时间里一直不投资科技股,现在看来,这个机制让他为错失了非常好的机会,当然也保护他没有撞到护栏。

把自己的行为限定在一个圈子里,在很多时候是违背直觉的,这会带来纯纯的痛苦。

那么,我们就该强行忍受这种痛苦,闭眼待在既有的圈儿里吗?

当然不是。

如果你是唐僧,最好老老实实呆在圈儿里,如果你变成了孙悟空,就不用待在这个破圈儿里了(你的圈儿扩大到了如来佛的手掌那么大了。)

之所以每次都要不厌其烦地走“决策卫生”的流程,而不是简单固守之前的决策,就是因为你走完流程之后真的有可能改变之前的决策。

什么情况下你会改变之前的决策呢?

第一种:你得到了新的信息。

第二种:你的“世界模型”进化了。

实际上,每当你使用“新版世界模型”对之前的决策做校验的时候,无论是否改变策略,你的安全边界其实都是在扩张的。

于是,我们又回到了第三章的内容。你必须通过(和 AI 一起)学习来改进对世界的建模,由此才能扩展安全边界。

反过来说,当你感觉到痛苦的时候,并不是该“出圈”锻炼胆量的时候,而是该“扩圈”,也就是通过输入高质量数据来学习的时候!

巴菲特还有一句名言:我一生中最好的投资不是买了哪只股票,而是不断地投资自己。

这里的心法极为简单:

1)永远保证在安全边界内正确行事;

2)时刻精进自我,扩大安全边界。

只要你真正理解了底层原理,去践行也并不困难。

在中文里,有一个更加优雅的词汇形容这个状态——知行合一

(六)一代人冲出战壕 

最后,让我来实操一把“知行合一

我决定就以上几章的思考和 AI 进行一番探讨,看看我是否能在“AI 奴隶”的帮助下,真正对生活方式做点儿改进。

我选择的奴隶是 Grok。

我问它:对于个人来说,《苦涩的教训》中所揭示的 AI 训练方式在日常生活里有哪些实践方案?

他给我想了三个方法:

一、把生活变成“梯度下降游戏”。

具体来说是这样:

1)定义你的核心目标池,例如:金钱、健康、创作、关系。

2)用电子表格把所有的行为的时长记录下来——睡眠、运动、阅读、写作、社交,等等。

3)每 2-4 周让 AI 帮你做一次“损失函数评估”,哪些变量和你的核心目标相关性最高?然后减少低相关性的行为,增加高相关性的行为。

二、把劳动尽可能外包,自己只做“搜索空间设计”。

在日常工作中,你要越来越像一个“AI 训练师”。

你的核心能力变成:定义目标函数 + 提供高质量数据 + 设计奖励机制,而非亲自执行。

例如,把图片制作交给 Midjourney,你来精修;把代码交给 Claude,你来验收;把重复工作交给 Zapier,你只定义触发条件。

三、用“生成-筛选”替代精雕细琢。

让 AI 先做 100个垃圾出来,然后从中挑选 3 个可救的,精修这 3 个。

接受 97% 的产出是垃圾,但剩下 3% 会碾压所有“完美主义者”的 100%。

我把这三个方法也送给你。

作为普通人,进入新大航海时代的广阔洋面,大概都要对现有的生活和工作方式进行巨大改造。而且每个人的改造方式都是个性化的,这意味着巨大的投入、不确定性和不安全感

但别忘了我们的“中庸”和“知行合一”。

你需要为高置信度的未来匹配相应的资源。(这才是安全的终极来源。)

在我看来,过去 20 年的生活方式塑造了我们太多对“确定性”的执念,它已经无法适应未来的 20 年。

我曾经在《最 Deep 的 Seek》中介绍过计算机科学家沃尔夫勒姆的研究:

在复杂系统中,因果关系极为不清晰,甚至可以说不存在因果。

假设你重复在南美蝴蝶煽动翅膀之后观察到一个飓风,那么你不必搞清中间的传导过程(你也大概率搞不清),而是可以直接用模型标定二者的相关性,然后利用相关性达到你的目的。

抖音赖以成功的推荐系统的工作原理就是如此:

一个内容在小规模用户群里收到了大量点赞,就直接推给更大的用户群,如果仍然获得高赞,就推给更大的用户群。

从头到尾,抖音完全不用知道这个视频内容为什么被喜欢,甚至就不用知道视频的内容是什么。(只要它合规,爱是什么是什么。)

正应了“股票大作手”利弗莫尔那句话:看到信号立即采取行动,而不是搞清楚原因再动手。

在一个变幻莫测的大时代:你要训练自己搞不懂“因果”的前提下,可以依赖“相关”继续行事。

这次 AI 浪潮中,美国和中国的科技断崖式地领先于欧洲和日本,在我看来,与这两个国家承继了互联网时代的*工程师思维*密切相关,那就是:尽可能用“相关性”(How)而非“因果性”(Why)来制造系统。

先不预设立场,允许各种形态的创新生成,让子弹飞一会儿,最终再根据顶层意图进行筛选。(而非从一开始就把所有的发展路径都推导清晰。)

这种利用“不确定性”进行经济治理的方式,不和我们利用 AI 大量生成,然后再做筛选-精修的过程完全一致么?

作为地球 Online 的玩家,我们可以期待的最好结局也许是:

人类将会利用能源驱动 AI 和机器人对任何目标发动“饱和式攻击”——所有创意都可以被迅速验证、实施。

在这个结局里,想象力将会成为最后的瓶颈,能源将会成为唯一的限制。

在这种高效熵增机器的加持下,人类也许将要第一次正式冲击卡尔达肖夫尺度中的 Type1 级文明。

说实话,这个好结局未必百分百会被(不靠谱的)人类打出来。。。

但“乐观之筛”强迫我不得不认真思考这个未来。

更具确定性的,也许是未来十年内就会出现的一个 Check Point。

当 AI 顶着生产力拐头向 12 点钟方向行进,大量商品被廉价制造,增发的货币会被稠化,滞涨的天花板被捅破,人类有希望再次进入温和通胀的增长周期。

站在彼处回望,2025 年可能会极为特殊,它是旧剧最后的高潮,新戏锣鼓的初响。

那时,我们或许可以心安理得地追认 2025 为某种“拐点”。

历史可能正在转向,你我都有责任知道这一点。

战壕的存在,是让士兵作为掩体,但没有任何一场战争是靠躲在掩体里赢下的。

当时代凌厉的子弹扫射渐渐减弱,那就是一代人冲出战壕的时刻。

往期推荐:

👉最 Deep 的 Seek:AI 的“终极设计图”是什么样子?

👉当 AI 活成了你的样子,而你活成了狗

👉我们该不该怀念2021?

👉2022,我们在幽暗的谷底守护一朵花

👉2023:当我们都活成了“大模型”

👉2024:赛博羔羊,不投降

人和AI都在船上

但人心中有远方

再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax

哦对了,如果喜欢文章,请别吝惜你的“在看”“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。

Thx with  in  Beijing

阅读原文

跳转微信打开

夜里,我偷偷用“千问AI小剧场”演了十五部短剧。。。

2025-12-16 19:29:00

原创 史中 浅黑科技 2025-12-16 19:29 北京

一晚上,四大名著被我演完了。

浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。

事情是这样的,最近我摸鱼的时候,发现 OpenAI 的 Sora App 火了。

这玩意儿就像抖音。

区别在于:你不用真拍视频,而是用嘴撸一段话,它就能直接根据描述生成视频了。。。

更牛的是,你还能上传自己的脸,让自己出演小视频!给你看看中哥唱 Rap↓

我刷了一阵儿,随即忧愁袭来,这么厉害的东西,咱中国好像还没有吧。。。

于是我悄悄问了一下(我觉得最有希望的)阿里同学,没想到他们发了个神秘的表情,跟我说:你升级一下千问 App 试试!

千问 App 居然发布了一毛一样的功能,这就是——“千问AI小剧场”

我赶紧升级了千问,果然“AI小剧场”按钮就水嫩嫩地躺在对话框上边。

千问同学告诉我,他们的 AI 小剧场有俩地方很强:

一是可以自动切换分镜头;

二是人物可以说台词,声画都是一致的。

我想了想,这玩意儿贼岂不是适合做短剧,过一把飙戏的瘾?

那我就不客气了!赶紧上传了自己的头像,一切 ready!

幸福来得太突然,我竟有点儿茫然,该演个啥嘞?

咱第一次“触电”,可不能亏待自己,我决定演一个《水浒传》里的英雄好汉!

一百单八将里,我挑了——西门大官人。

给你看看我和潘金莲的对手戏↓

别看制作挺精良,其实我写的提示词很短:

@史中穿越到了电视剧《水浒传》里,成为了西门庆,打扮和西门庆一模一样。 @史中和潘金莲喝酒调情。

其中的动作啊,台词啊,都是 AI 自己给设计的。。。别说,正中老夫心意呀!

注意,这里的“@,就是点名出演的意思。

我只要上传了头像,就可以@我自己;你上传了你的头像,也可以@你自己。

当然系统还内置了好多形象,有梵高、关羽、甄嬛各种,你想@谁出镜都行!

既然大官人演得旗开得胜,接下来得演个更趁钱的啊!

比大官人还有钱的,那就是和大人了!

给你看看我的演技↓

这个视频我导演欲爆棚,用了更具体的提示词,连分镜都写清楚了:

@史中穿越到清朝,成为了和珅,正和家里的妻妾一起喝酒。说:“穿越成和珅和大人,也太爽了!”

门口走进来几个太监,手里托着长长的白绫,对@史中说:“皇上赐您升天!”

@史中大惊失色。

你对照我的提示词看一下视频就会发现,这细节跟的也太准了!

每一个我描述到的细节,它都呈现了。

每一句我写的台词,它都精准地说了,而且情绪非常对味儿。

每一处需要切换镜头的地方,它都给切换了。你甚至没感觉。

千问同学告诉我,这种精确的能力归功于阿里最新的视频生成模型“Wan 2.6”

你可以简单理解,Wan 2.6 就是一个专门面向影视制作的模型,在训练的时候,就针对“角色复刻”“声画同步”“多镜头叙事”这些能力调教了个够。

技术科普有机会咱再细嗦,现在我想接着玩儿。

《水浒传》演完了,索性来《三国演义》客串一个。这回你猜我准备演谁?

没错,我演的是华雄。。。

你看,这里我其实指定了两个角色,@史中 和 @关羽,模型把两个人的形象都驱动了。而且关羽这个红脸的汉子,脸是真红啊,颇有喜感。

虽说演反派考验演技,但总演反派阻碍中哥我事业发展啊。。。

我决定,演一个拯救世界的大英雄!

知道 1944 年盟军诺曼底登陆为啥能成功么?

还不是因为中国开着高达帮他们铲除了德军的滩头阵地!

知道比特币是怎么出现的么?

还不是因为十几年前中哥化名中本聪运行了创世区块!

知道米开朗琪罗为什么能画出《创世纪》么?

还不是因为中哥给他当枪手!

你生成的每一部作品,(只要不嫌丢人)都可以上传成为公开作品,这样别人就能刷到了!

刷到的人如果觉得创意不错,Ta 也想来个同款,其实都不用费劲再写提示词。

只要点视频下面的“AI 翻拍”,然后把其中人物替换成你自己(或者任何人)就可以直接二创。

就在红框的位置↓

比如这个丝瓜老奶的走秀视频我觉得不错,一键替换成我的脸,中哥走得比她专业。

当然,你想用卡通形象做“二创”也没问题,一句话的事儿。

比如下面这个,我直接打字让它换角儿:

成了:

玩到这儿,我的身体好像打开了。。。思路也打开了。。。

千问AI小剧场其实不仅可以拍电影,它还可以模拟各种拍摄场景。比如监控录像,比如手机随手拍。

那我就会玩儿了!

快过年了,没什么多余的钱可以给我老妈,就给她发一个我穿名牌开豪车的视频吧,证明一下我混得还不错!

但做出来之后发现,我这形象,怎么看都不像开豪车,纯像跑滴滴。。。

那就别怪我不客气了,搞一个彩票中奖的“现场视频”给我妈看吧。。。

你们感受一下,蒙老太太是不是足够了?

客串了十几种不同的人生,根本停不下来。猛然抬眼已经快半夜了。。。

如此沉迷可不好。

我决定最后刷刷大家在小剧场里的作品就睡觉。

刷着刷着,突然意识到,之前我那戏精玩法其实都在憋着挑战“千问 AI 小剧场”的极限。一般情况下,大家最喜欢玩的还是那种“薄皮大馅儿”的穷欢乐视频

于是我又不困了,把这些无厘头的视频也试了一下,千问 AI 小剧场可以说毫无鸭力。

比如,岳云鹏和马斯克一起说相声↓↓↓

我和刘欢一起唱《好汉歌》↓↓↓

我和马斯克一起跳肚皮舞↓↓↓

如果你和名人一起玩腻了,想和朋友一起玩,也没有问题。

我发现千问 AI 小剧场专门有个功能,叫“邀请好友”!

试了一下,流程是酱:

你只要点“邀请好友”,它会自动弹出一个剧本,让你和朋友一起演。

如果剧本不满意你也可以一键更换。

把这个邀请直接发给朋友,Ta 只要同意上传自己的形象,就能自动生成你俩的“合拍视频”了!

就像这样:

毕竟是免费玩儿,千问同学告诉我,这两天用户爆炸式增长,服务器也是压力山大。来晚了可能生成视频要排队。

我不允许浅友们比别人来得晚。。。

我把邀请口令放在评论区,你可以复制之后打开千问 App 试试,然后可以继续邀请你的朋友一起玩~

孟子云:独乐乐不如众乐乐嘛!

延伸阅读:

👉当年轻人在说“夸克真香”,他们在说什么?

👉十年了,世界欠我的那副 AI 眼镜,终于来了!

👉15 年前为双11“渡劫”的技术,却打通了AI的任督二脉

👉2024:赛博羔羊,不投降

AI 帮我实现演戏自由,

这是什么奇葩科技树?

再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax

哦对了,如果喜欢文章,请别吝惜你的“在看”“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。

Thx with  in  Beijing

阅读原文

跳转微信打开

15 年前为双11“渡劫”的技术,却打通了AI的任督二脉

2025-11-10 10:43:00

原创 史中 浅黑科技 2025-11-10 10:43 北京

计算是一场深刻的模拟。

浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。

15 年前为双11“渡劫”的技术,

却打通了AI的任督二脉

文 | 史中

快来吧奔腾电脑

就让它们代替我来思考

1999 年,朴树唱出了这句歌词。

而后,时光把你我绑在刀尖,猛地刺穿新世纪的四分之一。无数孩子眼中的遥远未知,眨眼已坍缩为大人的细碎回忆。

2025,我们短暂停靠在了 AI 站台,回望迷雾,一颗子弹正中眉心:当年歌者的无心呢喃,竟是呼啸而来的预言。

(一)困在船上的师傅 

“10、9、8、7。。。”

随着零点读秒,又一年双11开始冲刺,红包如瀑宣泄,直播间呐喊起伏,快递车连夜奔忙。

此刻谁也不会记起,15 年前,这群工程师曾经做过的另一次读秒——淘宝的“爆炸”倒计时。

那是 2010 年“双11”,眼看淘宝系统就要被 3 亿剁手党冲垮。在只剩 4 秒的时候,杀掉了一个数据库,才保护淘宝这艘巨轮没有被浪头吞没。

这就是很多人都听说过的“惊魂 4 秒”的故事。

之所以要提起这个往事,是因为它不止代表阿里,也不止代表中国师傅,而是代表了整个人类在 15 年前面临的技术困境

话说,人类发展有一个稳固的底层逻辑:犯懒——总想用能源驱动工具来替代自己的劳动。

具体到计算机这个工具,主要是用来替代人类的“脑力劳动”。比如最早在军事上替代人类弹道计算员,后来在能源勘探上替代人类地质计算员。

这是美国第一颗人造卫星“探险者 1 号”使用的计算员,是真正意义上的 Computer。根据图灵的定义,计算员是“遵循固定规则,无权在任何细节上偏离这些规则的人

那在当时的淘宝系统呢?主要替代两类人:

一类是前台“售货员”,剁手党点什么商品,就给 TA 看什么商品,再推个购物车跟着。

一类是后台“会计员”,负责把下单的价格、数量、型号都记录清楚,后续好给人家发货。

在 2010 那个时间点上,它俩代表了两种经典计算架构:

这“售货员”跑在小巧的 x86 服务器上。救它相对还容易,因为服务器有点儿像隔断船舱,这个船舱塞满了,可以找另一个稍空的船舱借点儿地方。

可即便如此,腾挪还得靠人。这边嘴上吼,那边手上敲,稍微手慢一点就会挂掉。

这“会计员”就更难救了,它跑在一整套*专用*的软硬件系统,由 IBM 小型机、 Oracle 数据库和 EMC 存储系统组成——这就是大名鼎鼎的“IOE”

IOE好比轮船的轮机室,总共就这么大的功率,商品库、交易库、用户库,所有库挤在里面一同施压,要想不爆炸,只能关掉一些系统。

直说吧:彼时这俩“赛博牛马”,都已经不太称职了,这对人类这个老板来说是灾难。

你也许没当过老板,但肯定打过游戏,用上一关的武器对付下一关的 BOSS,会极其吃力,甚至完全失效——BOSS 的毒打会逼迫你寻找新的武器。

就在历史的巨大缝隙面前,一支敢死队出发了,他们的任务就是:从虚空中悟出一种新武器,能够打败“双11”这个大 BOSS。

这个新武器,绝不能再像孤悬海上的船,有沉重的轮廓阻挡扩容;而是要飘在云端,像金箍棒一样收放自如。

它就是阿里云的基础技术——弹性计算

注意,这个弹,绝不能是“人肉弹”,而是要在赛博空间建立一套*工业流水线级*稳定可靠的系统,自动感知及反应微小的颤动,毫秒级就把计算力调度得纤毫不差的弹!

阿里云的第一行代码

敢死队手握一纸计算独立宣言

不仅要让计算从(美国定义的)传统软件时代的 IOE 体系里独立出来;还要从(中美共同定义的)互联网时代造就的“软件直怼硬件”的框架里独立出来!

“一次跨两代”,相当于从封建社会直接迈入社会主义。难度有多炸裂,简直不敢想。

你或许不知道,从起草计算独立宣言,到弹性计算的旗帜高高飘扬,中间已经历了漫长的 5000 多个日夜求索。

你或许不知道,“独立”并非终点,计算系统对智能的模拟越来越深刻,竟然创造出了智能本身——AI。

但阿里云这群疯子早就知道,从出发的那一刻就知道。

今天,中哥就借着弹性计算团队的故事,科普一下这段中国师傅的十五载硬核征程。

(二)弹性计算就像炒菜 

讲故事之前,咱们不妨先来点儿暴力——撬开机箱盖子看看里面。

都说治大国如烹小鲜,依我看,弹性计算也如厨师炒菜。

每一个机箱里,都有一个厨师,他就是厨房的灵魂,CPU;

厨师切墩、炒菜的过程,就是计算;

厨师炒菜用到的炉灶、锅盆、调料,就是软件;

不时有食材送进来,也有炒好的菜送出去,这些都是数据;

而传菜的窗口,就是网卡;

当然厨师还会把一些食材、半成品放进冰箱储存,这个冰箱就是硬盘;

这样几百万、几千万个厨房组织在一起,所形成的巨大的“炒菜能力”,就叫——计算力!

了解了如上的比喻,你自然会得出结论:

所谓宏观上的计算弹性,其实就是微观上厨师听话的程度。

想想看,如果你有办法在*短时间内*精准改变*每个厨师*的任务状态:

例如,让某几百万厨师从待命变成颠勺,让某几十万厨师从炒菜变成往冰箱储存,让某几万厨师从做鱼香肉丝改成做法式蜗牛,让某几个厨师从切丝变成切条,不就等于能让计算力瞬间变大变小,随意调度了吗?

这里有大难题!

厨师一直待命,但它不能凭空炒菜,需要很多“家伙事儿”,这些就是操作系统和软件。而且根据炒的菜系不同,家伙事儿也不同。

但给电脑装过系统的都知道,安装不仅慢,而且还得根据硬件不同选择版本,不可能在短时间内完成。

诶,那时业界老师傅已经想出一个方法——在厨房里再做一个厨房。

具体分三步:

1、根据任务不同,把需要的设施都打包装修在一个个“小样板间”里;

2、样板间是一个隔绝的小世界,可以随意挪动,也可以快速克隆;

3、炒菜任务来临时,只要提前一两分钟把一堆样板间 Ctrl+V+V+V... 放进无数厨房里,就可以开干了!

没错,这个样板间就是“虚拟机”

有了虚拟机,大厨们再也不能以“厨具没备好”为理由摸鱼了,来活儿就得乖乖接。

别急,大厨们的“好日子”才刚来。

由于虚拟厨房很小,一个厨房里可以塞进很多个虚拟厨房,这意味着一个厨师可以*同时*照顾很多道菜:在这边炒两下青菜,去那边翻一下烙饼,再去那边拍一拍黄瓜。

把不同的任务穿插起来,完美压榨厨师的时间,真是牛马看了会落泪啊!

正因有了虚拟化技术,计算这件事被成功推上了工业流水线:厨房(在调度层面上)被连在一起,组成*中央厨房*

这就是“弹性计算”最初的模样。

手握锤子,赶紧砸钉子:老师傅开始大规模使用弹性计算替代“前台的售货员”,果然效果拔群。

同样的硬件设备,因为“厨师”空闲更少了,相当于模拟出更多的售货员。(你品一下)

就像这样↓

然而!他们比划了半天,发现这“后台的会计员”还是没办法弹。。。

原因跟“工种”有关。会计员负责算数,哪怕算错了一分钱,记错了一笔订单,都是重大事故。

这个活儿相当于让厨师们做满汉全席给老佛爷吃,但凡有地方盐多了、醋少了,都是掉脑袋的罪过。

当时虚拟化加持的弹性计算系统,根本做不到这么稳定。(至于原因,我们在下一章详解。)

好不容易研发了弹性计算,却不能一把实现“计算独立”,未免有些沮丧。。。

不过罗马不是一天建成的,眼前至少还有个好消息:

就在这个阶段,互联网行业崛起了一个新的“工种”——数据研究员。数据研究员负责从海量的数据里提炼特征,为不同类型的用户和商品都打上标签,以备后续推荐。

没错,这就是:大数据系统

在 2015 年以前,很多国民应用的爆火,最大的功臣都是大数据加持的“猜你喜欢”系统。比如手机淘宝、今日头条、微博,不断推给你感兴趣的商品或内容,才牢牢抓住你。

多说一句,别看“大数据”和“数据库”都带“数据”,实际上大数据系统的只是做定性分析,偶尔算错一个数,或者算得慢一些,都无妨大局。

就以当时最主流的大数据系统 Hadoop 为例,你可以极简理解为:它就是用一套公式,把数据库里所有的数都算一遍。

而 Hadoop 的创新在于,它能把这种计算拆分成无数独立的小计算。小计算的结果捏合起来,就能得到最终结果。

这,不正适合新生的弹性计算系统么?

每一个小计算,都能放在一个(大厨房里的)虚拟厨房里。

每天人类下班以后,“赛博厨师们”就上班,把这一整天新增的数据都给“炒熟”。

就像酱↓

那几年,阿里巴巴内部的各个业务线,爱尝鲜的老师傅都用“中央厨房”搭建了各自的大数据系统,这些师傅,后来好多也成了阿里云的悍将。

之所以要说“后来”,是因为有个历史原因:最早阿里巴巴的底层技术团队和阿里云的技术团队分属两边,后来慢慢合并的。(详见《中国人用 30 年望见算力珠峰》《阿里云的疯子》

那么,当时的阿里云团队在忙啥呢?

他们忙着把弹性计算包装成产品(ECS),系上蝴蝶结,满世界寻找客户,准备大庇天下寒士!

最初一批“寒士”,就是阿里巴巴收购万网之后继承过来的中小网站们。

中小网站,和淘宝这种网站比起来,那简直是蚂蚁 VS 大象。

很多小网站全部代码只需要一个虚拟机就能跑起来,而且一天也没几个人访问,相当于厨师们都闲着,就算底层的弹性计算的架构“不结实”,也不至于出问题嘛。

阿里云的师傅们开始乐观了,小网站行的话,那大网站行不行?网游行不行?政企行不行?

现实的毒打马上就来了。

(三)烦恼的源头:“打扰税” 

话说,在轰轰烈烈的“计算独立运动”中,涌现了一批扫地僧,专门负责“搬家”,也就是协助各个业务搬到弹性计算上。

杨曦就是其中一员。

他有点像老中医,一个系统摆在面前,他把把脉,就知道目前的弹性计算的能力够不够支撑,从而决定是现在上还是等等上。

在他和同事的努力下,每一年“双 11”都有更多的淘宝模块被搬上弹性计算,不再忍受“人肉云计算”的煎熬。

阿里云弹性计算产品解决方案负责人 杨曦

2014年,组织上看中了他的医术,调他来阿里云帮一帮外部大客户上云。

杨曦一来,才发现这是个坑。。。

外部客户不像阿里同事那样,把自己的业务系统全都拆开摸索着上。人家手里的是售货员、观察员、各种员长在一起的“连体系统”,要上就一起上!

这样的系统在弹性计算上能跑明白吗?

两个字:看命。

杨曦记得,当时手游刚刚开始火爆,有很多游戏厂商面临和“双11”类似的难题,一做推广促销,服务器扩容就跟不上,结果浪费金钱、浪费大好机会。

他们听说阿里云这个老中医专治“双11”,满怀期待用了弹性计算。结果计算力倒是有弹性,可负载一重,系统就*随缘*出 Bug。。。

Bug 不怕,怕的是随缘——老师傅就像原始人看见雷公电母那样无助。

所有故障都指向一个地方:虚拟化系统。

上一章我答应你,要讲讲不稳定的具体原因。现在咱们开始:

一个厨师,面对眼前的五个虚拟厨房里,最难的是啥?当然是掌握每一个厨房的进度,在各个任务里精准地*切换*。

为了切换,他得有个日程表,而日程要靠“规矩”来定。

我随便编几个规矩你感受下:1)某个灶上的水开了,就要赶紧中断其他任务,跑过来下饺子;2)某个炉灶里的菜冒烟了,就要赶紧中断其他任务,过来翻炒。

像这样的规矩有好多条,它们编成了一个厚厚的“操作手册”,这个手册就是“虚拟化架构”,它放在一个桌子上,也就是“宿主操作系统”。

厨师每炒几下菜,都得坐回到桌子前面,对照手册算一下,确定接下来该操作哪个炉灶。

这种情况,其实无法保证菜不糊,因为“确定下一步”这个动作本身,就会占用厨师的时间和精力。

假设:同时五个厨房都在进行步骤很复杂的菜,厨师为了搞清楚下一步该给哪个厨房做,要在桌前算很长时间,这边刚搞清楚,那边的菜已经糊了。。。

这下你知道,为啥负载一重,虚拟化系统就爱崩,而且还随缘崩了吧?

阿里云赶紧满世界贴告示“重金求子”,如今的阿里云弹性计算通用虚拟化负责人,大神沈益斌就是这个当口加入团队的。

沈益斌还记得,当时他们几个师傅使出毕生绝学,把各种能想到的情况都做成精巧的补丁,打在系统里,给虚拟化架构续命。

到后来补丁摞补丁,也摞不动了,他们只好采取“惹不起,躲得起”的六字方针:主动帮客户定时释放内存,或者监测到哪个地方负载高了,赶紧把一部分“虚拟厨房”迁到提前准备的“备用服务器”上。

就这样,云计算又硬生生退回到了“人计算”。

人是最不靠谱的动物了。

即便用人来填,到后来也不好使了:移动互联网方兴未艾,不到半年,客户负载密度又提高了十倍。这时你要保证不出事儿,就得准备十倍的服务器放在那准备腾挪。这么多服务器,用裸机都能支撑业务峰值了,还“弹”个毛线啊。

老师傅被逼到了悬崖边。

2015年,团队下定决心,玩命跳向对岸,重构所有的虚拟化代码,从 Xen 架构到 KVM 架构。

他们跳过去了:KVM 这个新的操作手册轻巧多了,厨师不用每次都跑回桌子前面,而是可以带在身上,随时拿出来算一算下一步该干啥。

这一下,一般的重负载,弹性计算都能绷住,绝对不抽了。

眼看阿里云上外部客户骂声能歇一歇,淘宝也能再挑出一部分负载较重的系统上云了。

老师傅擦着汗,给自己偷偷点了个赞。

之所以偷偷,是因为他们心里都清楚,更换虚拟化引擎,最多能顶个三年五载,但绝不会是终点。

因为搬家师傅杨曦已经帮他们试过了,即便最新的 KVM 引擎能承担很多重载,却仍旧没办法支撑“双11”状态下满负荷工作的会计员(数据库)。

这到底是为啥呢?因为数据库在满载时有个缺德的特点:“高 I/O”

还用厨房举例吧。数据库的基本功能可以抽象为两件事:存一个数(I),取一个数(O)。这就相当于让厨师把食物放冰箱,以及从冰箱里取食物。

在“双11”这种情况下,它存取的频率极高。

指令是发给五个虚拟厨房的,但实际只有一个厨师干活。。。

而且别忘了,这么多请求同时过来,他还得照手里的小本本算,先搞那个后搞那个。

每次“低头+算一算+抬头”的时间,就和它放一件东西在冰箱的耗时差不多长了。原本就紧张的时间,这下彻底不够了!

你看到了没,这里出现了一个死结:

要想实现弹性,就得有虚拟化;要想虚拟化,就会出现一个厨师对多个虚拟厨房的情况;只要厨师一对多,就涉及到日程切换;一旦编排日程,就得来回看本本;一旦看本本次数多,厨师的工作效率就直线下降。

这个死结有一个名字:虚拟化损耗。

而虚拟化损耗的本质,就是厨师“被打扰”产生的精力开销。虚拟化损耗的本质就是“打扰税”。

越是小而多的任务,打扰就越频繁,打扰税就越重。

别说沈益斌,就是天王老子来了,他也得交这个“税”。可只要有税,数据库就交不起!

“计算独立宣言言犹在耳,难道说,弹性计算永远无法一统山河,永远要在土地上给传统计算留一块扎眼的“租界”吗?

孔子曰:面对死结,最好的方法不是去解,而是找一把刀,把丫劈了!

(四)金箍棒铸成!

我问你:有谁规定,编排厨师日程这个活儿,必须得厨师自己干?

当时老师傅被逼急了,也问出了一毛一样的话。。。

你给厨师配个秘书,能死吗?

这个秘书,就是后来救了所有人一命的神龙 CIPU。

秘书守在窗户前面,举着小本本,每每从窗口传进来原料,他就直接帮厨师算好了日程。

厨师下一步要干啥,完全不用自己操心,可以两耳不闻窗外事,一心只顾颠大勺。

这样一来,打扰税直接降到了“0”!

你可能会说:不对吧?这个活儿还在,只是换了个牛马干啊。。。

诶,让驴拉磨和让狗拉磨,那效率可是天差地别。

CIPU 的总架构师杨航告诉我,CIPU 这个秘书生下来就是为了分配任务“定向培养”的芯片,它(在这个特定任务上)的计算密度是厨师的千倍万倍。

2017 年云栖大会上推出这个专用芯片的时候,杨航完全没想到一个月后世界云计算的公认领导者 AWS 也发布了同样的玩意儿,他更没想到,CIPU 的用处居然比他之前的设想更广泛,更激进。。。

激进到啥程度呢?

激进到连“虚拟厨房”都可以拆了!

回忆一下,当初之所以要设立虚拟厨房,是因为啥?因为锅碗瓢盆很难快速备齐对吧?

现在,老师傅掌握了另一套方案:

1)每个厨房都先安装好基础的炉灶、油烟机。(这不够对付所有菜系);

2)使用一种筐,把当前这道菜所需的专用工具和食材打包放在里面,从窗口biu~biu~biu~递进去;

3)厨师不用挪地方,只管站在操作台前,秘书把哪个筐递到他面前,他就干哪个活儿!

这个筐,就是大名鼎鼎的“容器”。

当然为了复制和移动方便,最好别一次性把一道大菜的所有工具都装一个筐里。你可以分在不同的筐里,相当于把一道菜的工序切碎,变成“微服务”。

就像生产线上打螺丝:每个厨师只做一小步,然后就传给下一个厨师。他甚至不用知道自己在做啥菜,让你切萝卜就切萝卜,让你给锅里放蒜就放蒜。

分布式炒菜,妥妥的。

既然厨师们在广大的网络中协作,秘书们就没办法自扫门前雪,而是要拉一个“秘书群”:任何一个秘书都要准确知道眼前这个筐里的食材从哪来,下一步要送到哪去。

换句话说,在云上协作体系中,秘书变成了和厨师一样重要的角色,它成了云计算的基础设施计算芯片,没错,CIPU 的全称 Cloud Infrastructure Processing Unit 就是这个意思。

云雾中,“金箍棒”雏形初现:

1)有了容器,中央厨房具备了收放自如的弹性,瞬间变大变小;

2)有了 CIPU,厨师们可以在收放自如的前提下摆脱“打扰税”,聚精会神在自己最擅长的炒菜上。此刻他们的效率,和在最早的“实体厨房”里是一样的。

看着以上这俩特点,你意识到了什么没?

没错,十年艰苦战役,打扰税降为 0,终于可以敲锣打鼓把“会计员”(数据库)请上弹性计算了。。。

更准确的说法是:终于可以把账目交给云上的会计员去管理了!

就在 2020 年前后,阿里巴巴集团核心数据库陆续搬上 PolarDB 等等自研云数据库。

征服“会计员”之后,弹性计算彻底杀疯了,已经没什么“员”不能被计算力替代了。

比如现场促销员,就是当时已经流行的“实时计算大数据系统”。它会把用户的每一次点按拿回去立刻计算,几毫秒之内就要调整推荐策略——弹性计算可以支持。

比如找货员,就是你熟悉的“搜索引擎”,这是一个和数据库类似的高 I/O 系统,还涉及全球范围内的信息传输——弹性计算也可以支持。

凑齐这一套“赛博牛马”盲盒后,阿里云上的“大迁徙”已经势不可挡。

容器服务负责人易立回忆,智联招聘前两年特别头疼的就是招聘季突然会有大量的毕业生涌入平台,算力需求暴增。为了服务不挂,他们只能按照峰值准备厨师(服务器)。

可一过旺季,很多厨师就闲着了,每天摸鱼,实在浪费。后来他们索性迁徙到了阿里云的容器计算上,每秒用几个厨师就付几个厨师的工资。

这样精细切分,综合成本比之前降低了恐怖的 40%。

同样搬迁上来的还有 OPPO、得物、小红书。。。数不胜数。

相当于阿里云准备了一套极其高效的中央厨房,你们这些大酒楼小饭店只管拉客,菜我给你炒!

看到这儿,估计你产生了另一个疑问:

别人用你几秒钟厨房就付几秒钟的钱,人家倒是没损失了,你阿里云的中央厨房不就承担了闲置的损失吗?

这个问题,恰恰是我最早有意略过的,也是弹性计算的最精彩一块拼图。

一切红利都来自宇宙的基础特性:时间!

小红书的峰值,和 OPPO 的峰值,和智联招聘的峰值,和阿里云上千行百业的峰值会同一分钟到来吗?会同一秒到来吗?会同一毫秒到来吗?

观察的时间颗粒度越小,越不会。

要知道,微观上的厨师根据“CPU 时钟”作息,本就比我们感知的颗粒小很多。

推到极端来说,只要这些客户的峰值不撞进同一个调度时间片之内,哪怕只差几微秒,就不算“同时”!厨师就可以先炒 A 客户的菜,后炒 B 客户的菜。

对“时间红利”运用越深刻,就需要“厨师调度系统”越敏锐:如果你的最小调动能力仅是分钟级,当然就没办法让客户们“秒级复用”你的厨师。

复用有一个前提:所有弹性计算的客户,必须在(逻辑上的)同一套中央厨房里!

而当时的阿里云上,有人已经在用筐(容器),有人还在用虚拟厨房(虚拟机)。

对于杨航来说,任务非常明确:秘书(CIPU)必须升级,所有形式的弹性计算,它全理解,全支持,全安排,才能把客户们容纳在同一个中央厨房里。

这件事儿,就叫“并池”。

但并池又加剧了一个副作用,那就是所有饭馆儿都在一个中央厨房里大锅炒,万一有人食材不干净,污染了其他家的菜品,或者干脆有人恶意下毒怎么办?

易立和沈益斌两支团队合作,把虚拟化上的一些关键隔离能力移植到容器上,虽然我炒的是百家饭,但是相互之间绝对不会渗漏。

同时,杨航团队又升级了 CIPU,让这个秘书经手的数据完全默认加密。

这些技术组合在一起,就做出了“安全容器”。

宜将剩勇追穷寇!搞完这些,技术大牛们蓦然回首,那面“技术独立”的旗帜已经高高飘扬。

他们恍然大悟,原来“独立”从来不是一个时间节点,而是分布在漫长的时光中一串无尽的脚印。

在这面旗帜下,所有的算力第一次团结为一朵云。

这朵云的每一处都是均匀的,没有任何特例,可以称之为“纯粹的算力”

它就像电,你用电的时候,绝对不会纠结它是水电还是火电,它就是电!你清楚地知道,每一度电,都是完完全全等价的。

而历史告诉我们:电力诞生的那一刻,并非结束,甚至并非结束的开始,而只是开始的结束。

1893 年芝加哥世博会是人类第一次大规模使用交流电照明,西屋电气公司让二十万只灯泡齐明,夜空亮如白昼。

(五)AI 奇点 

闪回到 2014 年夏天,淘宝低调地上线了一个功能:拍立淘。

从某个角度理解,这个功能对后来阿里云的意义,甚至大于它对淘宝的意义。

拍立淘的功能是通过对图片的理解从商品库里帮你找出对应商品,是一个“找货员”。

那我问你:同样是找货员,“拍立淘”和“搜索引擎”有啥不同?

表面上的感觉是:一个用图搜,一个用字搜。这没错。

深一点儿的认识是:一个用了 AI,一个没用 AI。这就更对了。

但我有一个有趣的角度:他们替代人脑的工作是不同的。

搜索引擎模拟的人脑工作是一个——规则执行;

拍立淘模拟的人脑工作是两个——规则建立+规则执行。

也就是说:拍立淘在搜索前,必须先建立一套规则,用以判断两个图片处于相似“模式”。这就是 AI 的经典能力:模式识别。

这厉害在哪?

阿里云加速计算的产品技术负责人王超一语道破天机:

规则执行,例如大数据,大规模计算一旦停止,价值输出就随之停止。

规则建立,例如大模型,即便大规模计算停止了,它仍能继续喷涌价值。

你上班干的具体工作,手停嘴就停;但你从工作中学习的技能,却受用终生。

拍立淘后,历史陡然加速。

越来越多的业务开始附加 AI 功能,边干边学。

旺盛的需求催生了达摩院老师傅的热情,他们开始训练能建立更深层模式的模型,比如(通义大模型的前身)M6 大模型。

底层的硬件,也从拍立淘的 384 张 V100 计算卡变成了 512 张 A100。

训练大模型的计算强度,如舞会的音乐逐渐推高,烈焰一般炙烤着底层的算力平台。

幸亏,阿里云的师傅们已经把弹性计算炼成了金箍棒,能接住 AI 时代的第一波“泼天富贵”。

2022年,王超他们拜访客户小鹏汽车,无意中听到了他们的“绝密计划”。

阿里云加速计算产品技术负责人 王超

当时,特斯拉已经开始用计算力模拟“人类驾驶员”——把 10000 张计算卡连在一起,端到端地训练自己的“自动驾驶 AI”。

小鹏也看好这个方向,只是自己尝试了半天,很难建起这么庞大又稳定的计算集群。

王超乐了:您说的这玩意儿,洒家恰好能干!你来我阿里云上用如何?

说干就干,王超申请了天价预算,准备启动万卡集群建设。

当时采购同学看到这个单子都慌了:“超哥,你可别冲动啊,一个客户你敢买这么多卡?万一将来没有别的客户续上,可就废了。。。”

但王超心里笃定,AI 浪潮将会席卷,这次不是演习,无数企业很快会来阿里云上训练他们的 AI!

一万张卡可能都买少了。

“弹性计算 AI 版”,就这样摸黑上路了。

这就是——灵骏集群

后来的故事证明,王超简直神预测。就在小鹏上灵骏之后几个月,ChatGPT 横空出世,大模型的潮水席卷而来,成千上万的团队涌上阿里云来训练他们的 AI。

之前的一万张卡,果然买少了。。。

和泼天富贵一起来的,是凶猛的技术挑战:

随着训练模型的规模扩大到千亿-万亿参数,底层的算力平台又开始颤抖了。

这是为啥呢?

众所周知,AI 训练的核心负载从 CPU 转移到了 GPU,相当于原来的厨师还在,只是炒菜的主要任务交给了一位新厨师。

厨师变化其实问题不大,关键是这群厨师要做的菜完全变了。

打个比方:

过去 CPU 厨师们做菜,有点像婚宴。一个厨师做十个菜,每盘之间没有关系。你炒糊了一盘菜,是不会影响其他菜的。大不了我把这盘重做一下就是了。

现在 GPU 的厨师们做菜,一万个厨师只做一盘菜,任何一个厨师手抖一下,对不起,剩下九千九百九十九个厨师都白干了。。。

可人无完人,每个厨师都有一定概率出问题:

足够多的厨师×足够长的时间=必然出问题

王超回忆,当时被阿里全集团寄予厚望的通义千问大模型刚刚在灵骏上做训练时,在内部论坛直接吐槽:讲个笑话,灵骏集群能稳定运行八小时,哈哈哈哈。。。

可在那个烈火烹油的当口,全世界都在追赶 ChatGPT,老板们天天盯着灵骏团队,让他们搞快些,哪怕多给拨些人也行。

王超气得顶嘴:一个人生孩子要 10 个月,两个人 5 个月就能生出来吗??

逼到疯癫,他们只好使出了阿里云的传统艺能:人计算。

一群 P8、P9 的老师傅夜里轮流值班,手动救火;白天再把昨天救火的经验总结成GPU巡检、网络优化的代码组件,固定到系统里。

就这样连轴转了三个月,每个 GPU 身背的出错概率终于缓缓下降,系统总体的稳定性稳步爬升。

说到这里,有个普遍误区。

很多人觉得 AI 计算是 GPU 的天下, CPU 在这里打酱油。

其实,GPU 厨师主要负责炒菜,但是炒菜的同时,大量洗菜(数据清洗)、放冰箱(数据存储)之类的任务,还是得交给 CPU 来“帮厨”。

帮厨师傅一点儿不比主厨闲,具体来说,它需要多核心来并行任务,超高主频来思考,还要大内存带宽来保证同时处理大量数据。

找来找去,阿里云找到了 AMD,他们的 EPYC 系列 CPU 就是专门为 AI 计算设计的。

这个 CPU 的技能简单说就是:无论是数据预处理,还是调度任务,都比 GPU 需要得节奏更快。

这样,帮厨师傅永远等着主厨,主厨不用等帮厨,就能全速炒菜了。

用户的脚是投票器:最疯狂的时候,全国一半左右的大模型都在灵骏集群上全速训练,一个个“赛博大脑”自流水线喷涌而出。

可叹十几年前,阿里师傅还在“双11”惊恐地大口呛水;如今,隐天蔽日的“云上厨房”,已成智能的肥沃土壤。

向前追溯,至 1946 年第一台电子计算机 ENIAC,甚至 1642年第一台机械计算机“帕斯卡加法器”,人类在漫长的征程中,用计算一点点替代大脑的规则执行部分;

而今,我们终于模拟出了大脑的规则生成部分,从而凑成了大脑的“完全体”。

脚下,是万年不遇的 AI 奇点。

我们该期待些什么呢?

ENIAC

(六)计算的银河 

阿里云创始人王坚曾给出绝佳的开示:如果说云计算是电,那么大模型就是电动机。

实际上,在电发明后,人类仍忍受了漫长的毫无想象力的生活;

而横空出世的电动机,才真正搅动万物,让电动机床、卷扬机、电钻、风扇、洗衣机、冰箱、缝纫机、电车、电梯依次诞生,历史从此澎湃前行。

如此说来,此刻 90% 的人对 AI 的期待都可能是被局限的。

比如,受第一波浪潮 ChatGPT 的影响,很多人天然认为 AI 的形态就该是聊天机器人。

但王超告诉我:AI 真正的想象力,其实根植在具体的行业中。

千行百业都存在领域知识。而这些领域知识,过去都由具体的从业者体会、发现、传承——这个匠人精神成本极高,而且产出不稳定。

而之前说过,AI 的本质功能就是“规则生成”,恰可以在细分的领域里替代那些匠人。

它会进入千行百业,成为比人类更资深的客服、卡车司机、机器精调师、医生、翻译、老师、编辑、裁缝。。。

更深刻的改变也许是——当 AI 脚踩弹性计算,它可以零成本实现“协作模式”的切换。

100年前,福特发明了流水线,让生产效率飞跃;而弹性计算可以让流水线根据需要每时每刻重组。

王超开脑洞举了个例子:

将来也许会出现一种“服装电话亭”,你站在里面,就有 AI 自动操纵扫描仪给你 3D建模,然后帮你设计衣服,做裁剪,最后产出一套成衣让你拿走。

在你看来,自始至终都是在和一个 AI 对话,而它背后,是一套可以随意组合、对接、改造,无远弗届的计算力。

如果这一天真的到来,意味着在最底层,燃烧着万倍、亿倍于今天的弹性计算。如今让阿里云师傅们骄傲的技术,仍然需要N次迭代和升级。

“那时的计算底座会是什么样?”我问。

“我不知道,人的想象力是有限的。就像让你现在想象 iPhone 20,你也许只会想到更好的摄像头,更大的屏幕。但最有可能的是,到那时,原来的思考框架已经被颠覆。”他回答。

王超很喜欢弹性计算同事们常说的话——为了永不停机的计算服务。

永不停机的计算,并不意味着我们的灯永远亮着,而是我能永远满足人类旺盛的计算需求——当世界有需要,我们就在那里。

他说。

做算力基础设施的人,很难站在聚光灯下接受奖杯。他们像是时代大厦的支柱,深埋在泥土中。

正如这些年手机芯片提升了百倍,但电池工程师的苦,似乎无人过问。

做算力基础设施,就像是做电池,每年你都要逼迫自己把性能增加 15-20%。看上去只是日积跬步,没有奇迹时刻,但当你走过十几年回头望,身后就是工程奇迹。

正如爱迪生点亮灯泡的一瞬间,只有他自己知道过去的 1000 次实验意味着怎样的艰难跋涉。

回望来路,一个真理不言而喻:世界从来不是某个截面,而是时光中错综的连线:

2010年,如果没有弹性计算师傅趁黎明出发,用十五年锻造出“大规模计算的组织能力”,如今像灵骏这样的 AI 算力集群就不会成立;

2020年,如果没有全世界 AI 研究者的反复试错,就不会有 ChatGPT 的横空出世;

2025年,如果没有无数行业对大模型的热烈拥抱,未来那个无远弗届的 AI 也只能是赛博传说。

如此,我们并不活在一个确定的当下,我们活在无数可能性组成的根系中。

在任何一个时间截面上,你无法看到根系之间的联系,他们散落在天穹,恰似辽阔的银河。

而梦想家知道:在这条银河中,终将有一颗新星闪耀。

往期推荐:

👉阿里云的这群疯子

👉云栖:他们的伍德斯托克

👉阿里造“神龙”

👉14亿人的战争:中国人用了30年望见计算力的珠峰

👉阿里巴巴的十三载计算力大突围

👉我们该不该怀念2021?

👉2022,我们在幽暗的谷底守护一朵花

👉2023:当我们都活成了“大模型”

👉2024:赛博羔羊,不投降

计算是一场

深刻的模拟

再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax

哦对了,如果喜欢文章,请别吝惜你的“在看”“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。

Thx with  in  Beijing

阅读原文

跳转微信打开

做手机的 OPPO,悄悄改写了中国精密制造

2025-10-09 11:01:00

原创 史中 浅黑科技 2025-10-09 11:01 广东

一个精致野心,一群手机犟人。

浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。

做手机的 OPPO,悄悄改写了中国精密制造

文|史中

(一)光刻战争身侧的“点胶战争” 

2020 年,深圳一座游泳池。

平静的水面泛起涟漪,一个男人浮出来,手里捏着手机。

他刚刚给潜水俱乐部的伙伴们在水下拍了几张照片,兴奋地游过去给队友展示。指尖刚划两下,屏幕突然漆黑。

“卧槽,应该防水的呀!”男人猛压电源键,仿佛在掐手机的人中。

空气静了,只有水波暗涌。

黑屏中折射出五米外一个路人的身影。

此人名叫陆研

不用走到近前,陆研已经看出来,那哥们用的是某著名的国际大牌手机,标志性的曲面屏,价格不菲。他回忆了一下,以这款手机宣传的防水性能,至少得在 1 米深度挺 15 分钟。显然,它失败了。。。

泳池里的男人非常扫兴,跟队友吐槽再也不买这个牌子的手机了。

陆研心里一沉,奇怪的思绪升腾:“如果这家手机的工程师就站在此地,有没有办法据此推动产品工艺改进?需要多长时间才能影响下一代的设计?”

不知道。

但他确信的是:眼前这一幕肯定会推动 OPPO 手机的工艺进步。

不仅因为他是 OPPO 的老师傅,研究了N年的“点胶”工艺恰与防水性能息息相关;

还因为,在 OPPO,像他这样只爱钻研不善 Social 的一线工程师,也能毫无鸭力地推开副总裁的门,直接提改进意见。

隔天上班,陆研径直走到测试生产线,拉过熟悉的显微镜,摆上一个手机中框。

头发丝一样粗细的“胶线”浮现在眼前↓↓↓

在“手机宇宙”中,这些几乎无法被肉眼察觉的细丝妥妥是“超级英雄”,它们扛着与体型极不相称的巨大职责。

它对手机的体魄负责:

中框与屏幕之间的这圈胶水,不仅把最主要的两个部件固定牢靠,支撑了结构强度,还是一座抵御液体、粉尘入侵的堤坝。

它还对手机的颜值负责:

中框胶线的宽度、精度和角度,直接影响手机屏幕黑边的宽度。

这些胶线,本质上是由“点胶机”喷出的一颗颗直径在 0.5 毫米的胶点连缀而成的。每一次喷射都需要点胶头在三维空间里“微米”级(0.000001m)的精准腾挪,对胶水量进行“皮升”级(0.000000000001L)的控制。

但凡点胶过程出现任何颤动,都可能导致胶点异形,胶水外溢、胶线无法闭合,进而冲垮整机的抗震性能、防水性能,最终在一次偶然跌落或者泡水时,让手机用户说出“再也不买”的狠话。

一颗马掌钉覆灭一个王国,大抵如此。

如果说光刻是人类技术的巅峰之战,那么点胶技术就是隔壁山头的另一场战役。

二者的本质都是在空间里谋求精准的定位与控制,在小数点后永无止尽地加上一个又一个零,是“人类精密控制技术”与“物理定律”的终极搏杀。

你可能猜到的是,在这场堪称为人间盗火的“点胶战争”中,中国师傅已经站挑起大旗,代表人类扩展着自己的疆界。

你可能没猜到的是,在最前线的战壕里,竟然站着如此众多的 OPPO 将士。

他们用了十几年时间,靠血肉和子弹推进至此,脚下的每寸土地,皆有代价。

(二)角落里的点胶机 

时光之风逆流,我们一起坐在 2014 年深圳某工厂大门外的马路牙子上。

抬眼望,人人手里都捏着一台“大下巴”手机。两厘米宽的底边上,点缀着时髦的“指纹解锁按键”。

那个时空里,怎么看这都是手机的理想模样。

如果咱拉住路人诚恳地说:十年后,主流手机会消灭这个下巴,正面全是屏幕,而且最牛的工艺可以让屏幕距离四边框都只有 0.1 毫米,恐怕会得到一个关爱的眼神。

就在这时,一个背着黑包的路人匆匆走过,脸上挂着汗珠。

他包里塞着几张 A4 纸一样的“软电路板”,上面密密麻麻地排列着上百个相同的小器件。

估计你猜不出,我直接公布答案:

这是手机侧边按键的电路板。

就是这些指甲盖大小的玩意儿,已经让老哥三个月没睡好觉了。

他叫高原,是 OPPO 手机的 SMT 工程师。

SMT(Surface Mount Technology)的中文叫做表面贴装技术,你可以简单理解:这个活儿就是把器件(芯片、电容之类)各就其位地固定在主板上,其中当然也包括侧边按键。

“贴”容易,难的在于要“一直贴着”——正如爱情是短暂的,相扶到老是艰难的。

其实手机主板出事儿主要就俩原因:碰撞、进水。

刚好这俩事儿都能用一样东西解决——胶。

过去几年,智能机像泥石流一样在人群中普及,工艺也迅速进化。高原他们已经在各种元器件的焊点上密密麻麻加了很多点胶工序,从 USB、耳机口一直点到了主板、CPU。

给你看一下封胶的实图,截取自微机分 WekiHome 对 OPPO Find X8 的拆机视频,链接附后。

但防护就像木桶,长板再长也白搭,用户骂不骂娘要看短板。

没错,手机侧按键,就是当时最短的板。。。

假设一部手机用三年,它的侧按键大约会被按 10 万次,每一次都会粘上汗液。经年日久,会浸入按键底部,腐蚀焊点,导致失灵。

你可能会说:这么小的东西,点一点胶不就把焊点封住了?

哎,问题就出在这里:太小!

要用胶封住的焊点位置。

你可能都忘了,当时的手机甚至比现在的薄!2014 年底推出的 OPPO R5,厚度只有 4.85 mm(最近推出的 iPhone Air 是 5.6 mm),可想而知,侧边按键有多窄。

说到这,就不得不回忆一下点胶机江湖:彼时公认最好的,也是 OPPO 在用的 SMT 点胶机,是美国的“诺信”。

它是咋点的呢?

这么大一个整板,铺平之后,会有一个相机对它进行拍照,识别出两头的两个“定位孔”,然后通过计算得出中间所有元器件的位置。点胶头根据这个结果去相应位置点胶。

看出问题了吧?

这个板子可是软的,很难保证没有一丝拉扯形变。

你点胶机只用两个点的坐标就草率推算出几百个点胶位置,实际点的时候很可能是偏的呀!

这咋办?

很明显,只要修改点胶机的算法,让它别只盯着定位孔,辛苦一下拍板子的全貌,识别每个具体的点胶位置,不就行了吗?

就这个小要求,高原提给了诺信的香港代理商(他们在中国大陆没人)。代理商说:“冇問題,偶幫你轉達去美國總部。”

然后。。。就没有然后了。

我去,这边手机等着上新技术呢,您没信了?

高原有点慌,赶紧给其他点胶机代理商打电话。日本的武藏、韩国的 PROTEC,可这些海外大牌都没啥兴趣。

他们倒不明说,可话里话外的意思很明显:哦,定制开发?全世界都没提过这种要求。怕是你们没用对吧?

不给我定制,理解,我拿你的机器试试总可以吧?要是能点准,我就买!

人家回复:“没地儿试哦,想买就直接下单哦亲。”

高原差点晕厥过去,只好托朋友找关系继续问,三个月把可能的工厂都跑了个遍。

这一折腾,眼看快过年了。那天领导开会突然提起:“你不是说要提升按键防护,怎么样了?”高原一激灵:“在找厂家验证了,有机会,有机会。。。”

隔天,高原眉苦脸出现在工厂,拉了把椅子坐下,继续翻通讯录。

不远处桌子上,正摆着一台点胶机。

这是之前散热部门的同事买来做实验用的国产设备,很小,还是半自动的,需要人手工把物料搬上去,点完胶再手工拿下来,看着比诺信那种用传送带上下料的大设备 Low 不少。

就这个小玩意,居然还有个厂商的技术小哥在现场忙前忙后给调试。

“要是外国厂商也有这么好的服务就好了。”他自言自语。

鬼使神差,他径直走过去问了技术小哥一句:“你们有没有那种全自动点胶机?”

小哥笑:“巧了,我们刚研发了全自动在线点胶机,目前只有一些贴牌厂家感兴趣。你们这种手机原厂总觉得国外的机器好,都不肯睬我们。”

高原眼前一亮,把“精确定位”的开发需求说给他。小哥皱皱眉:“这个嘛,等我跟研发工程师转达一下。”


高原眼神又暗了,哎,又是这套说辞。

第二天下班前,对方的销售经理罗威突然打来电话:“昨天说的事情我们研究了,有戏!正调集硬件、算法的工程师专门给 OPPO 服务,还准备了一台最新点胶机用于测试,什么时候方便拉到你们产线?”

高原缓缓转头第一次正视着这个角落里的点胶机的品牌:深圳市轴心自控

(三)藤条 

顺着街巷,镜头来到十几公里外,轴心自控总部。

会议室的桌上,摆着那块软板样品,轴心最精锐的工程师聚在周围,有视觉总监、研发总监、工艺测试、算法博士,噼里啪啦地敲键盘。

早些时候,一台崭新的点胶机已经装车,由技术员“押运”前往 OPPO。

高原个老饕一样就坐在点胶机旁,看它“现场炒菜”,哪个地方点不准,技术员就打电话回去轴心,让“大厨”修改菜谱(算法)。几个小时后,新算法传回来,用 U 盘升级,再继续点。

看着每一版的点胶位置都在细微变化,高原有些出神:这个轴心自控。。。是什么来头?

话说,轴心自控的野心,谜底都写在了谜面上。

所谓“轴心”,并非轴承的中心,而是苏格拉底、孔子、释迦摩尼这些先贤们所开创的“轴心时代”的轴心。

轴心这群人最早归属于工业电商震坤行,卖一些点胶阀、胶水之类的进口物料,卖着卖着就想:这玩意儿这么贵,我们为啥不能做?

于是,2008 年轴心自控成立,开始自研点胶阀。

接着又想:点胶机比点胶阀贵多了,我们为啥不做?

接着又想:全自动在线点胶机更贵,我们为啥不做?

接着又想:既然卖给了二线厂商,为啥不卖给原厂?

刚想到这儿,就和四处找寻供应商的 OPPO 撞了满怀。

估计你也看出来了,其实轴心和 OPPO 一样,是千万大湾区创业者中的“典型角色”,相比大树,他们更像藤条,随时调整角度,但凡嗅到一个砖缝,马上拼命往里钻。

如此,两根藤条缠绕,只是时间问题。

回到当下,轴心自控的工程师们并没清晰地意识到,自己正在冲击一个世界级难题。

点胶机的每一行算法,目的都是定位到旁边两个 1 毫米宽的焊条。

如果偏里一点,按键弹片非常娇气,胶水沾到马上死给你看;如果偏外一点,电路板余量又非常窄,很容易漏胶到背面,也是完蛋。

更凶残的是,无论两侧的焊条还是中心的按键弹片,都是强反光材质,镜头极难定位准确;只能退而求其次,靠电路板的上下边缘或侧面缺口去定位,这就会有误差。

最初两周,算法还在逼近目标,之后突然遇到瓶颈,无论怎么调总有一些点位死活不准。

高原里五味杂陈:“这国产技术。。。你说不行吧。。。你说行吧。。。要不我还是出去找找备胎?”

十几公里外,轴心团队都快疯了,好几个专家都在办公室住了几天了,眼看 OPPO 给出了一道缝隙,这一把钻不进去的话,鬼知道后面还有没有机会了。。。

一筹莫展时,突然有一位算法工程师自言自语:倒也。。。不用非得一次定位吧?把电路板边缘定位和缺口定位叠加在一起呢?

一句话,猛地撕开了迷雾。

接下来一周,靠着“叠加定位法”,良率迅速冲上了99.92%。这意味着:10000 个按键,点胶不良的低于 8 个。

这达到了 OPPO 的最低要求!

话说,如今全世界几乎所有高端点胶机都在使用双重定位甚至三重定位技术。但鲜有人知,追溯到根源,它就诞生在 OPPO 试产线上的轴心点胶机中。

当着 OPPO 的老哥们,罗威还保持一副“基操勿6”的神态,回家的路上,他血都冲脑门了:“这把有了!有了!”

后面几天,他坐在办公室翘着腿,就等着 OPPO 订货。

果然,电话来了,OPPO 说:给我们来。。。两台!

罗威差点儿趴桌子底下。

这个账好像不难算:调集最精锐的工程师干了一个月,开发了独创算法,然后您只买两台,每台 30 多万,这单生意赔了个底儿掉啊。。。

但真这么算,你就输了。

作为“藤条”,轴心这帮老哥一直强迫自己用另一套逻辑算账:

1、人家不多买,肯定是技术有不合适的地方。

2、既然我们已经比同行身位靠前了,面对这么好的锻炼机会,为啥不陪 OPPO 玩到底?

3、真要是把技术搞到炉火纯青,就算 OPPO 不买,vivo 还不买么?华为还不买么?

想清楚以上这些,罗威只花了 0.5 秒。

他调整呼吸,轻快的语气上线:“两台~没问题!”

果然,这两台机器送进去以后,OPPO 隔三差五就提好多“龟毛”的意见:

拍照时相机总停下来,能不能搞快些,一边移动一边拍?

点胶时点胶头也总停下来,能不能边走边点?

能不能搞异步控制,这边点胶头点胶的同时,那边相机就给下一个件拍照?

你看,这些意见全与效率相关。

OPPO 索性也不见外了,把轴心算法工程师请到生产线。

站在产线边,轴心工程师恍然大悟:原来,OPPO 之所以还不敢在量产机型大规模采用侧按键点胶,主要是因为点胶机的效率不够,会成为整个生产流程的瓶颈!

“行,你们等着!”轴心工程师迈着大步回去了。

接下来一年,他们陆续拿出了“飞行拍照技术”,“投弹点胶技术”,“双XY轴异步技术”。

几项新技术的叠加,让点胶速度翻倍又翻倍。可轴心这边如小伙儿吹拉弹唱,OPPO 那边却如女神矜持稳坐,隔几个月买两台,隔几个月买四台。。。

2016年夏天,罗威又接到 OPPO 电话:“我们订货!”

“还是两台?”

“不,每条生产线两台!”

OPPO 在当年推出新机上,全量使用了侧按键点胶技术。现在回看,谜底早已揭晓,那正是狂销 2000 万台的 R9,2016 年中国单机型的销量冠军。

造化弄人,当时 OPPO 自己也根本没梦到 R9 能一战封神,面对缺货,只好玩儿命扩产。

不久罗威又接到电话:“你们点胶机的产能上限是多少?我们包圆了,每个月底点数,拉来多少就结多少账!”

轴心这帮人也懵了,赶紧给配件供应商打电话:“你们手里的货全拉来,我们包圆了!”

仅在 2016 一年,OPPO 就狂炫了 200 多台轴心点胶机,最多的时候,单月就买了 70 台。最后一算,当年轴心产能的三分之一都卖给了 OPPO 一家。。。

此时再算账,过去两年下的“赌注”简直不要太值。

手握这种水平的点胶机,配上外国品牌四分之一的价格,配上 R9 的金字背书,轴心很快打入 vivo、华为等其他手机的 SMT 生产线,兵不血刃地拉高了一个时代的手机工艺水准。

但借用丘吉尔的名言:这不是结束,也不是结束的开始。

这仅仅是“空间战争”开始的结束。

(四)欲望 

就在 R9 大卖的时候顾泽梧已经看到了下一代 R11 的设计方案。

作为 OPPO 装配工艺的设备专家,他感到一种幻痛,像是诺曼底滩头被狂轰滥炸的那种疼。

在手机边框普遍是 4mm 的年代,OPPO ID 设计组欲望爆棚,愣是把边框设计成了 3.16mm。

而装配的主要任务就是在这个边框上走一圈胶,然后把屏幕粘上去。

显然边框越窄,越难粘!

坦率说,比友商薄了不到 1mm ,对点胶机来说还不至于要命。但问题不这么简单:边框的一圈儿不是同样宽窄,在屏幕上沿“距离传感器”旁的一小段,点胶宽度只剩下 0.5mm。

那么胶线本身有多宽呢?0.45mm。

这就像人从狭窄的走廊跑过,缝隙只比身体宽一个拳头,左右墙壁都是滚烫的铜墙。蹭一下就熟了。

地狱的是,ID 组的创作欲还没释放完,他们发挥传统艺能搞了五颜六色:金色、玫瑰色、限量版红色、巴萨队服定制色,还自带渐变和 Bling 特效。。。

你还记得吧?点胶机是靠拍照来定位物体轮廓的,本质是识别颜色。可“渐变色”本身是艺术,喷涂不追求极端精确。如果依然使用颜色来定位,就难以和手机本身的几何结构精确吻合。

我手上恰好有一台红色 R11,给你看看实图↓↓↓

奇怪的难度又增加了:奔跑在滚烫的狭窄缝隙,周遭还是眼花缭乱的渐变色,你感受一下点胶组师傅头顶的黑线。

“绝境”在前,顾泽梧脸上突然浮现出诡异的笑容:你 ID 组创作欲爆棚,这不是逼着我们工艺组也创造欲爆棚吗?!

他脑海里浮现出一种邪门的技术:“3D 线激光”

你看过阿汤哥的《碟中谍》吧?

特工要通过那种满是激光束的屋子,触碰激光就会被 Boss 感知。把这些激光减弱一些,然后密集地平行排列,恭喜你,发明了 3D 线激光定位技术。

之所以说邪门,是因为在当时,激光定位最主流的用途是测量铁轨的间距、木材的直径,和精密制造八竿子打不着。

但理论上说:如果把激光线进一步加密,密集到每 0.1 毫米就有 3 条线,它不就足够识别手机框的空间细节,从而引导点胶了吗?!

就像这样↓↓↓

这是手机中框边缘的横截面,为了让你看清楚,我把纵向画夸张了些。

那么这种点胶机真的存在吗?

还真让他找到了。当时一家加拿大品牌剑走偏锋,押注了 3D 线激光点胶机,顾泽梧他们如获至宝买回来。

什么?你问轴心自控?

这里插播一个行业小知识:

SMT 点胶主要就是在电路板上进行,上世纪就有,一般就是直线或者画圆,被称为“标准点胶”,也叫“前装点胶”;

而装配点胶是本世纪兴起的技术,动作更自由,被称为“非标点胶”,也叫“后装点胶”。

这俩一个像卡车一个像轿车,虽然都是车,但定位有区别,你买轿车大概不会去卡车店里问。。。

当时的轴心主打的标签是 SMT 点胶机,况且 3D 激光比较偏门,轴心当时也真没有,所以遗憾没被翻牌子。但也正因这个小挫折,他们会在下一章更凶猛地杀回舞台中心。

视线回到 OPPO,只有这样一个机器躯壳根本不够,它考验的是里面的灵魂——算法。

话说,一个小小的手机框,激光全扫一遍,大概会取几千个定位点,但这些定位只是原始数据,必须从中选出100个点作为点胶路径。

选哪 100 个点,是哲学。

看下图:

假设这是手机框左侧横截面扫描之后得到的点云。你认为手机框的真实形状是啥样?

是这样吗?

不是。

我之前特意提到了,这里的激光非常密集,所以不能像阿汤哥电影里那么强,实际上它是非常弱的。

而且激光也是光,弱激光成像也会像暗光照片一样存在大量噪点。

恐怖的来了:每个点位只有一束激光提供信息,你无法分辨哪些点是真实的反射,哪些点是鬼魅的噪点。

这意味着,上图的点云,对应的真实边框物理边缘可能是这样,可能是这样,可能是这样。

一般师傅到这一步就要掀桌子了。

顾泽梧他们不慌,我辈半生功力,不用在此,更待何时?!

团队师傅款动厨刀,算法如土豆丝般流淌:

首先设计一套公式,根据偏离值,排除掉最不可信的噪点;

然后找出范围内的高点和低点;

再利用公式算出一个理想高度,根据理想高度寻找参考点;根据参考点推移,找到点胶定位点。

以上还只是理想情况。

实际操作中因为批次和公差,斜坡的斜率也不同,不一定存在实际的参考点,所以也许还需要一套算法对斜率进行拟合,虚拟出参考点。

这一切精密的推演,都发生在 0.5 毫米的范围之内,最终点胶位置的正负调整也不过是 0.1 毫米的样子。

但就是为了这 0.1 毫米,砸进去昂贵的点胶机,最牛的工程师,半年的研发时间,千万级别的研发费用。

你可能都快忘了,这一切最初的缘起,无非是 R11 外观设计师傅的小小欲念,把边框比友商做窄了一丢丢,把颜色做多了一两种。

OPPO 的企业价值观是“本分”。

本分地想想:这事儿到底值不值?

回答这个问题,只需要搞清一个前置问题:手机对用户来说是什么?

它是一个通讯设备么?它是一个办公用品么?他是一个装饰品么?

都不是。

手机是人的外接器官。

如果你把手机当成通讯设备,你就会把性能作为考量手机的唯一指标;如果你把手机看做办公用品,那么边框厚薄无足轻重;如果你把手机看成装饰,那么耐用性就没那么重要。

如果你把做手机看成给用户做器官,按照“生物级”的标准来要求,“好用”、“好看”、“可靠”,三样就均不能妥协。

什么是不本分?

你的用户掏出手机摆在桌上,完全无法吸引同桌人的目光,这不本分;在东北旅游,所有人都拍照,你家手机突然关机,这不本分;几个人一起游泳,就你家用户不敢水下拍照,这不本分;有人问为啥套手机壳,用户羞赧地说怕摔,这不本分;同样一个群里抢红包,你家手机总是慢半拍,这也不本分。

如此就可以解释,为啥 OPPO 这群师傅,无论是工业设计、工艺设计还是软件优化,都展现出一种自发的,似乎超越必要的欲望

因为让你的用户在任何工况、任何场合使用手机都不觉得低人一等,才是最大的本分。

多说一句,OPPO 使用 3D 线激光点胶技术整整三年后,苹果 iPhone 才开始使用这个技术,其他品牌还要更久。这个事儿,大多数 OPPO 用户是不知道的,OPPO 也没有让他们刻意知道。

把欲望控制在事情本身,而非外溢煽情,也是本分。

说远了,你是不是快忘掉隔壁那个错失 3D 线激光点胶设备的轴心自控了?

和 OPPO 一样,他们的欲火也从未熄灭。那两年,他们煎熬地觊觎,默默地练功,藤条像捕食者一样蓄力,等待着下一个一闪而过的裂缝。

(五)神兽 

2018,也许是手机行业最“弯”的一年。

三星开创了曲面屏时代。现在回望,那么夸张的曲面也许并无必要。但这个时代对于所有手机厂商和精密制造设备厂商来说,却是一场无法绕过的“成人礼”。

OPPO 的首款曲面屏,就是 Find X。

对于屏幕装配来说,一个显而易见的变化就是:左右两侧的粘合面发生了倾斜。

这一倾斜不要紧,直接把平面几何升级成了立体几何,把二次元升级成了三次元。

对于点胶工艺来说,这简直是“底层世界观的崩塌”。

打个比方吧,很多浅友都开过车。你开过城区、山路、高速、上坡、下破,但我敢肯定,所有的路面的左右方向都是水平的。

如果你正在山路上开车,面前的道路突然向右倾斜30度角,还敢开吗?

顾泽梧就是那个司机师傅。

当时 OPPO 生产线上的点胶机,虽然点胶头的高度可调,但都只能垂直点,没办法歪头点。

这就导致点胶头和点胶面存在倾角。

就这么斜着愣点不行吗?

可以,但要保证极窄的边框,不行。

因为边框一旦侧过来,就比胶线更窄了,没有操作空间,怎么点都会点到外面↓↓↓

斜着点不一定非要点胶头动,实际上中框动就行了。

当时业内流行一个有点儿“抖机灵”的方案:

先把上下两侧点完,再找个托架把手机框斜着垫起来继续点。

这样虽然能做,但过度部分非常难处理,怎么弄都会在四条胶水接缝处形成微小的断点。

就像骨折之后再接上,是未来碎裂或进水的隐患。

这极有可能解释了我们最开始讲的故事,为什么游泳池里那哥们手机黑屏了。

这也解释了为啥当时大家都做曲面屏,却只有 OPPO 矫情,煞有介事地满世界寻找新方案。

虽然每家厂商的一线工程师其实都明白这里有坑,但 OPPO 一线工程师的意见可以无损传到决策层。

顾泽梧脑海里又出现了一种邪门的东西:五轴联动 3D 线激光点胶机

五轴的意思是,除了控制点胶头上下(Z轴)、左右(X轴)、前后(Y轴)移动的线性三轴外,再加上Y轴的倾斜与垂Y轴方向的旋转。

怎么形容“五轴+3D”点胶机呢?它颇有点像蛇身鹰爪鹿角的“龙”,能想象出来,但没人见过。

果然这次 OPPO 师傅没那么幸运了,去海外品牌里找了一圈,如此激进的“神兽”尚不存于人间。

问对方想不想现在开发,人家说不想谢谢。。。

一次开会,有同事提起,轴心自控是出了名的喜欢玩“自虐”,这几年无论提啥非分要求,就没听他们说过一个不字。要不问问他们?

话说当时,OPPO 已经成为轴心自控的 VIP 中 P 客户,由大客户经理李林负责对接。

李林像会师一样跟顾泽梧紧紧握手:“我等你们等得好苦啊!”

这几年,轴心心心念念要打入 OPPO 的后装产线,每天面壁苦练,已经搞出了五轴点胶机。

现在,只要把拍照定位器换成 3D 线激光定位器,这躯体就齐了;再把 OPPO 这边成熟的线激光定位算法灌进去,灵魂也有了!

这就是“神兽”本体。

直到“神兽”的样机做出来,顾泽梧才注意到,从头到尾,轴心这帮人压根没问过:“能不能用我家已有的点胶机型号凑合一下?”

顾泽梧于是确信:“这帮人是真喜欢自虐。”

接下来,两拨工程师携手进入人类工程的顶尖战场,开始了炼狱般的“综合校准”

究竟是什么决定了点胶的终极精准度?

三件事儿:视觉引导、运动控制、流体控制

视觉引导,考验的是激光算法,必须根据目标物体的轮廓绘制出精准的导航地图。

运动控制,考验的是几台伺服电机的精确协调,必须让点胶阀和托盘走到目标位置,并且每次重复走位都要完全一致。

流体控制,考验的是阀体本身,把一个细小的水珠弹出去,必须珠圆玉润、百步穿杨、命中靶心。

最终误差是三者叠加。

这难度,这就像是杂技演员踩着高跷站在球上,手里还在扔着五个球,任何一个环节失误,都会导致整体扑街。

几个月过去,神兽终于被点上了眼睛,最终轨迹空间精度误差定格在了 0.075 毫米(75微米)以内。

想象一下,我们缩小一万倍,站在这只神兽体内:

一片漆黑的世界,无数条激光像罗马柱一样直通天地,描摹出金属造物的轮廓。电机在耳侧尖啸,巨物在三维空间里丝滑运动,时而旋转,时而俯仰,每一时刻的运动都恰好与弹射过来的胶水球精准碰撞,在凹槽里缀成不偏不倚的胶线,一刻不停,绵延向远。

这种精致的壮观,微小的广袤,是人在混乱的世界里支撑起精确秩序的野心。

五轴 3D 点胶机开发异常成功,很快开始全线列装,OPPO 和轴心自控完成了一次凶狠的相互成全,两根藤条的命运开始大面积缠绕。

以那一刻为起点,历史笔直地通往今天:

Find X 系列作为 OPPO 的顶级产品线绵延至今;

而轴心自控不仅就此成为 OPPO 的“御用”设备供应商,也在其他 3C 领域,乃至汽车行业攻城拔寨,一跃坐上国产点胶机头把交椅。

回望当前,无数点胶机企业千帆竞发,或许都梦想过成为领域第一,但有多少人用一句 NO 轻松堵死了自己通往遥远奖赏的路呢?

(六)代价 

2019 年冬天,工程规划负责人沈集在思考一个天大的问题:OPPO 究竟有何不同?

这并非务虚的白日梦,而是他现实又迫切的职责所在。

话说沈集在 OPPO 的经历就像一块硬砖,哪里需要哪里拍:13年他做旋转摄像头,16 年又忙活全机型切换指纹解锁,19年全行业材质升级,他又被派去做玻璃和陶瓷的采购。

别看这些事儿东一榔头西一棒槌,但有个共性,那就是:“一米外可见”。

镜头加一颗,Home 键加上指纹解锁,材质变成陶瓷,屏幕做出曲面,路人一打眼儿就能发现了啊!

但事情从 2019 年开始起了变化。

所有手机都是四颗摄像头,所有手机都是正面大屏幕,除了 LOGO,你 OPPO 和其他手机到底有啥区别?没区别为啥要买你?

OPPO 师傅讨论后达成共识:“有无”这种横向比较已经无法拉开差距,能定义 OPPO 的只有四个字:“整合深度”

就像开饭馆儿:一条街能买到的食材都一样,你再多做一家杀猪菜有啥意思?要做就做“米其林三星”!

工程团队的职责就是:想象出 3-5 年后的手机形态,并且从此刻起就为之储备技术,再把这些散点技术拧成麻花,最终定义出 OPPO 本 O。

2020 年初,他们定下了很多具体目标,包括主板元器件密度、电池容量、背壳玻璃、防水防震性能。。。

其中对屏幕的要求尤其苛刻:

上下左右四个黑边,全要小于某个极低数值。(他们特别叮嘱我这个目标不能泄露,但总之很低就是了。)

这个宽度,意味着什么?

意味着过去的屏幕点胶,甚至屏幕装配工艺,全都要推倒重来。

之前我们所讲的点胶技术,都是把屏幕的玻璃盖板与中框相连。但正如前述,为了保证结构强度和柔韧度,胶线本身不能窄于0.45mm,再加上结构余量,边框几乎不能低于 2mm。(这也是 Find X7 边框的宽度)

故事讲到这,点胶工艺大牛陆研终于出场了。

为了进一步降低黑边,他和同事们引入了一种方法,把点胶位置从玻璃盖板下方挪到屏幕模组下方:

注:按照行业惯例,发光模组边缘的一部分也算作黑边。

可这样一来,又有新问题,屏幕模组不仅直接暴露在了空气中,还距离边框更近了,撞击时可能有风险。

于是,又需要在其边缘另包一圈胶水,以抵御腐蚀和冲击。

实际上,2024 年发布的 OPPO Find X8 就是采用这种方法装配的。

这种工艺,上、左、右三边都没问题,只在下边留了一个小遗憾:

由于屏幕排线会从下方引出,所以这里需要额外增加胶水的厚度,以保护屏幕模组。这样一来,下边框的极限只能到达 1.45mm 左右。(为了整体四边等宽,其他三边被迫做宽了一丢丢。)

为了解决这个遗憾,陆研和伙伴们构想了一种奇特的方案:

在手机中框下缘内里抠出一道极小的凹槽,让屏幕模组的封装胶水突出的部分扣在里面,这样既能保证屏幕模安全,又能保证边框极窄!

可是,这样一来,装配时屏幕就没办法垂直落下,必须斜插进去。。。

然而,能执行这种斜插装配的设备并不存在。

十年来卡过这么多 Bug,OPPO 师傅内心早已毫无波澜,这次一秒都没犹豫,直接找到他们的哆啦A梦——轴心自控。

李林也根本不含糊:要啥样的点胶机?什么?不点胶,这次玩贴装?没问题!

有了过去五轴技术打底,运动控制的难关已经过了,只要把点胶头变成屏幕吸盘,再加上亿点点适配,就做成了!

实话说,升级打怪到这个阶段,创造某个新设备已经不太让 OPPO 的师傅头疼,他们面前横亘的,是一道更危险的悬崖。

由于生产过程中穿插了太多自研工艺和专用设备,已经越来越没有代工厂愿意接 OPPO 的活儿。。。

这是某种意义上的“咎由自取”:

手机从设计到生产,可以理解为一个巨长的公式,这其中涉及无数变量。

代工生产线不可能只服务一家,这决定了他们虽然可以为原厂要求做改动,但也仅限于某些变量,并且在有限范围内改动。

当你的工艺与同类产品差别过于巨大,以至于代工厂添置设备和专业工人的成本超过阈值,相当于单独为你开一条线,这个生意就不成立了。

实际上,早在沈集接手团队,同时往诸多方向做技术预研时,他们就猜到了结局:

总有一天,OPPO 必须自建生产线。

这并非“意向图”,而是 OPPO 自建生产线的实景。

想做米其林餐厅,就要忘掉预制菜。

独特的代价是孤单。

从 2020 年开始,团队开始了孤独的跋涉,把生产环节一点点儿接回来。

可叹生产是个极为复杂的整体,涉及到对整个供应链和产业工人的把握,这个过程缓慢而痛苦,跨越了 X2、X3、X5、X6、X7 整整五代机型。

2024 年,OPPO 自建生产线终于火力全开,一年后,OPPO Find X9 系列发布。

在 X9 的无数参数中,有一个非常凶猛:屏幕四边等宽,只有 1.15mm

给你看一张 X9 Pro 的实图,感受下↓↓↓


沈集距离四年前的承诺仅剩咫尺之遥,这并不圆满,却也不是终点。

为了这 1.15mm,师傅们开发了一整套点胶技术,并为之配合了斜插装配工艺;

为了实现这些工艺,轴心自控顶上了几个崭新型号的点胶机、贴片机和质检设备;

为了这些工艺和设备可以完美配合,OPPO 把整套生产线拉回自家厂房。

一个真理不言而喻:任何当下都是历史的总和。

但历史从来不是轻飘飘的,它是脚下埋藏着白骨的大地。

成为 OPPO,也许最初只是一群人赤裸的欲望。而过去十几年在设计和工艺上的推演和试错,在点胶战争和与之平行的材料战争、芯片战争以及软件工程战争中的一次次硝烟中穿行,是为之付出的层层堆垒的代价。

欲望与代价,总因时间淘洗而精确地配平。

正如尼采所说:“如果你知道为什么而活,就能够忍受任何一种生活。”

(七)手与机械 

2025年,轴心自控凑齐了两顶皇冠,分别是“深圳市制造业单项冠军”和“广东省制造业单项冠军”。

在李林看来,这是一场漫长的奖赏。

作为世纪之初就进入制造业的一代人,李林和所有人一样,串演过诸多角色。

他们曾经串演效仿者,拆开国外的设备,小心翼翼地研究,复现。

他们曾经串演追求者,一点点说服厂商给本土技术一点机会。

他们曾经串演开拓者,把想象中的工业神兽亲手制造出来。

十几年轰然而过,他们目睹了中国企业对进口产品的痴迷到对国产产品的接纳,见证了外国设备在中国从强势到弱势,从弱势到消失。

十几年间,他们眼见那些代理海外设备的中间商平地高楼,大宴宾客,最后一个个关门走人。

十几年间,草木枯荣,大河奔涌,他们庆幸自己从来站在此岸,一切繁花似锦,皆与自己有关。

十几年间,从代理胶水到代理点胶阀,从做阀体到做整机,从前装到后装,从寂寂无名到点胶机一哥,直到今天产品线扩展,点胶机只占轴心自控销售额的一半,并且持续下降。

李林告诉我,轴心自控很长时间的目标都是“做最棒的点胶设备供应商”。现在他们意识到不太合适,应该把“点胶”俩字划掉,“做最棒的设备供应商”。

说到这,他哈哈大笑。像是漫长的征途中歇脚时开个小玩笑。

十几年穿行在各个企业的生产线,李林早已得出一个坚硬的结论:

在工业生产中,精密设备正在不可逆地替代人工,不仅因为机器成本更低,更因越来越多的环节已经*无法*被人类完成。

对于 3C 来说,即便再训练有素的工人,微观上还是存在微小的颤抖。而且这种偏差还会随心情、疲劳程度而变化。与之对比,最近几代手机对装配精度的要求却呈倍数级提高,已经突破人类对肌肉控制的极限。

对于汽车来说,现在一个主控板就要15公斤,只有壮小伙才能搬动。目之所及的未来,主控板可能进一步变重,大力士都够呛。

旧日产线上的“黄金手”、“肌霸男”,正在成为希腊传说一般的存在。

正如标枪抛得再远,也不可能及导弹的分毫。

正如 AlphaGo 击败柯洁,与柯洁有多努力无关。

陆研提到一件小事。

每一代产品量产前,为了确保新工艺稳定,他都会到自家生产线上“打工”。

在曲面屏手机上,有一道工艺,叫“擦胶”,为了装配时严丝合缝,需要用无尘布蘸酒精把屏幕边缘的胶水打磨平整。搞定一个屏幕,需要用手指大力擦动几十下。

在擦了3000个屏幕之后,他发现自己的指头脱皮了,一碰生疼。

他赶紧去看其他工友的手,果然全都是破的。

虽然大家出来打工都是为了赚钱养家,但家人不会同意自己的亲人用健康换钱。

回到办公室,他马不停蹄打报告,不久和轴心自控一起开发了遮光胶精擦机,用机械臂接管了擦胶工序,工人被分配到更安全的岗位。

不论是出于怜悯、尊重、贪婪或者欲望,机械对人的替代进程都像洪流一样不可阻挡。时光中散落的故事,无非是中国制造漫长征途中的小小注脚。

临别前,OPPO 伙伴们特别嘱咐我不要用工程师的真名,防止猎头骚扰。

“为什么一直留在 OPPO?”我问陆研

“可能 OPPO 给我的,别人给不了。”

“那是什么?”

“对技术的企图心。”

是啊,人在荒凉的世间行走,没有企图,又如何度过漫长的日夜呢?

对于 OPPO,对于轴心自控,对于千万曾经、正在和将要义无反顾地投身于“中国制造”这个迷人词汇的工程师来说,又何尝不是如此?

参考链接:

OPPO Find X8 拆解:极窄边框背后的秘密

https://www.bilibili.com/video/BV1Jj15YtEru/?share_source=copy_web&vd_source=4d0235835b28c23833d33b2e29476bdb

往期推荐:

👉卖手机的 OPPO,偷偷干了件让全世界付费的事

精致野心

手机犟人

再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax

哦对了,如果喜欢文章,请别吝惜你的“在看”“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。

阅读原文

跳转微信打开

纳米 AI:红衣大叔的新战刀

2025-09-15 11:02:00

原创 史中 浅黑科技 2025-09-15 11:02 北京

人们想念的,是每一次站出来与高耸的技术壁垒对峙,抽出 40 米大刀的那个人。

浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。

纳米 AI:红衣大叔的新战刀

文|史中

(零)红衣大叔又抽出了 40 米大刀 

最近半年,我听到“AI”这个词,感觉越来越愤怒。

点开头条公众号:某 28 岁 AI 大神被挖走,年薪上亿;某厂搞出最新模型,股票长虹。

点开抖音小红书:各路天才选手用 AI 生成的视频段子像泥石流一样往脸上呼。

点开得到小宇宙:一众大佬说不会 Vibe Coding 就等于文盲+残废。

点开微信钉钉:发现我自己的活儿竟不会用 AI 干一点儿。。。

关掉手机屏幕,映出一张不知所措的脸。

AI 已来,只是分布不均。 这种不均,是我和马斯克的总资产有 3000 亿美元的那种不均。

我猜你和我一样,心里隐隐觉得不公平,但转念一想又天经地义:毕竟 AI 这么难,人家玩得转,活该赚大钱。

但这,正是房间里的大象!

如果一个时代的门槛比《只狼》还高一百倍,高到只有极少数天才垄断创新,并且心安理得地拿走绝大多数时代红利,这叫什么伟大的时代?

面对高耸的门槛,产品创业者眼前只剩两条路:

第一,抽身观望,泡沫破裂时别血溅了我爱马仕的长衫;

第二,躬身入局,抽出 40 米大刀,冲到 AI 的门槛前面一顿狂砍,解救被时代围困的普通人。

周鸿祎选择后者,一点儿都不意外。

遥想红衣大叔第一次抽出 40 米大刀,还是在十几年前。当时普通人买不起杀毒软件,也看不懂专业界面,360 就是用“免费+傻瓜”的大刀砍掉了网络安全的门槛,结束了人人(被迫)与毒共舞的时代。

而这一次,他的大刀叫:纳米 AI

最近,红衣大叔几乎每周都做一场直播,就是在给你我这样的普通人手残党安利纳米 AI。

你也许看过直播,但没注意在画面另一端还有个“蓝衣大叔”,他不是来给直播间配色的,而是纳米 AI 的产品负责人,也是我们今天故事的主讲人:梁志辉。

“人不能开引擎,人只能开汽车!”梁志辉的吐槽开门见山。

在他看来,各种大模型就像引擎:

引擎性能再好、再便宜,你也不会买回家自己攒汽车吧?

专业人士在发动机周围做一整套传动系统,做好底盘车架,再包一层帅气的铁皮,经过 10086 个步骤做成量产车,才能真正让这个技术走进千家万户,定义一个时代。

纳米 AI 的目标就是:做出一辆开起来最简单的车。

简单到啥地步呢?

“你会在微信群里口喷吗?将来只要一个人会用微信,就能调动一群 AI 帮你完成复杂任务!”梁志辉说。

我怀疑他在内涵某些老板。但讲真,如果有朝一日每个牛马都能翻身当老板,对“赛博牛马”呼来喝去就把班儿给上了,这画面还真挺诱人呢!

要理解纳米 AI 具体如何实现“口喷即干活”,咱得先科普一下当今 AI 的“最强组织模式”

“大模型”,就像一个眼神清澈的赛博毕业生;

教会它特定的技能,再塞给它一些工具,它的眼神就没那么清澈了,成了一只赛博蜜蜂,也叫“智能体”

面对复杂任务,需要好多个智能体协作,它们组成的业务部门就叫“蜂群”

话说,纳米 AI 的师傅们,最近半年做了很多智能体和蜂群,例如:说一句话就有一群 AI 帮你生成大电影;说一句话就有一群 AI 给你生成专业的调研报告。

但在我看来,纳米 AI 提供的最锋利的想象力,不在某个智能体或蜂群,而是“想要啥智能体就能有啥智能体的能力”

没错,它们还做了一个“360 智能体工厂”。你口喷就能创造智能体,还能口喷把一堆智能体变成蜂群!

说到这里,图穷匕见:纳米 AI 正在挥舞的大刀,不只是在砍 AI 使用的门槛,同时也在砍 AI 生产的门槛

梁志辉算了下,这半年来,官方团队拼死拼活才做出了 200 多个智能体,而在智能体工厂里,普通用户做出的智能体/蜂群已经超过了恐怖的 10 万个。

理解了这些,你或许能体会我的激动:一个*普通人*可以玩懂 AI,并且享受 AI 红利的恢宏时代正在缓缓降临。

而如今的一切,都源自一颗小小的种子。

梁志辉

(一)搜索:蜂群里的一只蜜蜂 

2023 年春天,ChatGPT 爆火,那是本轮人工智能开始邪门的起点。

评论家首先为之疯狂,他们高呼:“模型即产品”的时代到了!

但曾经手造了几个亿级 DAU 的梁志辉和同事们一起试过 ChatGPT 后,有种“有句话不知当讲不当讲”的感觉。

先不说激发模型的能力需要极其精准而冗长的提示词,就单说一个问题,靠模型自己就无法解决,那就是——幻觉。

深度学习之父辛顿认为:幻觉是智能的副产品。注意,是智能的副产品,而非仅仅是“人工智能”的副产品。(参考《辛顿的冬与春》

模型的本质是对世界的“有损压缩”(《当 AI 活成了你的样子》),它在还原世界的时候,就必然会经历反向“生成”的步骤,所以它们本质上全是幻觉。

大众意义上的“幻觉”,只是恰好生成内容和现实中的强证据存在逻辑矛盾而已。

那么,怎么让模型生成的内容和现实世界尽量不矛盾呢?

AI 您动动发财的小手,自己搜一下再说不就行啦?!

看到了吗?搜索,是大模型进化成智能体的路上擎起的第一个工具,它无异于原始人的火炬。

实际上,英雄所见略同。 就在老师傅技术验证的过程中,主打搜索的 AI 产品 Perplexity 窜红,梁志辉他们直拍大腿,决定火速研发!

你可能觉得,“让模型查搜索引擎”应该三五个人七八条枪就能搞定。

错!作为智能体家族老大哥,搜索智能体的难度在于“开模”——定义出模型使用工具的*基本范式*。

一个模型使用工具好不好,效率如何,标定了智能体的能力基线,直接影响后来“蜂群”的工作效果!

回到当下,老师傅其实没想这么深远,他们无畏地上路了。。。

刚出发就直接进坑了。

当时的 360 搜索引擎,是给人用的,不是给 AI 用的。

啥区别呢?很多,这里我挑一个最本质的说下:

人在查看网页时,大脑会根据排版、字号、颜色等等多个模态进行“权重判断”,也就是哪些话要重点看,重点想,哪些话要略过。

所以,给人用的搜索引擎只要把网页合理排序展示出来就行,信息冗余点儿不碍事。

AI 在查看网页时,只能依靠文字本身的内容来判断权重。

所以搜索引擎给到 AI 的内容,必须尽量去掉无关的文字,最好再对网页的内容进行一次总结抽象。信息越精炼越好。

这么说吧,一个 AI 搜索功能,直接把搜索引擎团队的师傅给拉下水了。。。

2023 年冬天,梁志辉写了一个规划书,建议把搜索团队和 AI 团队进行架构合并,老周全力支持,眼神殷切,搜索引擎团队瑟瑟发抖。

而后几个月,搜索引擎团队把底层索引机制全部拆开,挨个升级。新的引擎能够对每一个网页的语义都进行向量计算,它给出的信息,不仅和用户的真实意图更对应,还更简短。

2024 年 1 月,360 AI 搜索,也就是纳米 AI 的前身正式上线。

在 2024 年 10 月的榜单上,360 AI 搜索全球排名超过了 Perplexity。

如果说如今的纳米 AI 是一个蜂群,那么“AI 搜索”就是其中的一只蜜蜂,而且是只相当能打的蜜蜂。

多说一句,现在 AI 界的师傅已有共识:AI 产品要想好,三大支柱少不了——搜索、浏览器、编码能力

在当时“搜索到底重不重要”还没定论的情况下,这群人就已经冲着一根支柱跌跌撞撞走去了。这可以说是一种幸运,但更是一种嗅觉。

正因做搜索,老师傅无意间走上了一条超长的雪坡。

故事是这样的:

随着纳米 AI 逐渐火爆,很多用户开始上强度,拿各种偏门、专业的题目来“刁难”它。

难题一多,老师傅很快注意到一个问题:大模型使用搜索引擎查询到的东西,有时会相互矛盾。

于是,“搜索小蜜蜂”就不能傻傻地直出答案,而要在生成答案之前多加一道工序:选边站。

选过边的小伙伴都知道,站队是个很耗费脑力的工作,它必须得做很多判断,例如:哪个信源更权威?哪个说法更自圆其说?哪个说法和上下文能印证?

而在选边站之前,起码还得有一道工序:感知查询到的资料里是不是存在矛盾。

是不是感觉事情变复杂了?

敲黑板!这里我们要引入一个重要的概念:任务复杂度

任务越复杂,“搜索小蜜蜂”查到矛盾信息的可能性就会增加,也就更需要更多*工序*去做感知、验证、深入调查,保证最终结果质量。

于是,一个水灵灵的问题摆在老师傅面前:

怎么才能正确地计划所有工序,稳定地执行多道工序呢?

这句云淡风轻的追问,召唤着一场汹涌的技术突破。。。

(二)脑海里的“小窗地图” 

一个任务复杂不复杂,咱们基本能靠直觉判断。

你问:周鸿祎是男是女?这是个简单的任务。

你问:根据 2025 年美国各个行业对中国稀土的依赖程度,判断一下它对于中国芯片卡脖子的政策未来会有什么变化。这就是个复杂的任务。

但做工程不能靠直觉,必须追问到底:究竟是什么因素决定了任务的复杂度?

跟我一起想象:

一个像血管支脉一样的迷宫,大模型从原点出发,每一步都要在诸多岔路中选择一条,最终的目标就是找到出口。

每一步面对的支脉越多,就越难选对正确的岔路,这对应着横坐标:“任务的开放性”。

从起点到出口经历的步数越多,走出迷宫就越难,这对应着纵坐标:“任务的步骤数”。

横纵坐标一乘,面积越大,任务的复杂度就越高。

但是!以上只是站在“全知视角”的示意图。

大模型在执行某个具体工序的过程中,是不知道任务总体有多复杂的。

玩游戏的同学很容易理解这个比喻:

大模型周围存在一个“战争迷雾”,它只能处理眼前的岔路,不知道自己出发了多久,也不知道出口在多远的未来。(其实人生也是如此。)

这会导致一个严重的问题——迷路。(用文艺的话说就是:走得太远,AI 会忘记自己为什么出发。)

所以,为了让复杂的工序得以一步步正确推进,大模型必须在视野角落建立一个“小窗地图”,每时每刻都提醒自己从哪来到哪去,总体任务是什么,现在进行到第几步。

这个“小窗地图”,就叫“规划”

正所谓:“凡事预则立,不预则废”嘛!

说回 2024 年,纳米 AI 老师傅评估了一下市面上大模型的规划能力,结论是:不太行。

问题很棘手:一边是广大人民群众让纳米 AI 解决复杂问题的殷切希望,一边是 AI 无法自主规划复杂任务的废柴现状。

老师傅冥思苦想,找到一条“妥协路线”:谁说规划必须自己做?也可以遵循套路嘛!

你大概做过旅游计划。

如果你擅长,就根据实际情况亲自定计划,肯定玩得又尽兴,花钱又少;

如果你不擅长,就报一个旅行团,跟着别人规划的标准路线走,也可以嘛!

梁志辉他们绞尽脑汁,把需求分门别类,手搓了好多“工作流”,例如:有帮你做研究报告的,有帮你写小红书文案的,有帮你做旅游攻略的。。。

工作流的每一个步骤上,都挂载具体的思考方式,再配好相应的工具。

本质上,相当于这个任务的全貌(也就是复杂度)已经被人为规定了,大模型只负责在流水线上一步一步执行下去就行了。

就像酱↓↓↓

然而,这样做代价是巨大的:

梁志辉回忆,当时遇到复杂一点的工作流,整个团队要写两三个月的代码。

在赛博空间里,筑起一堆极其复杂的“脚手架”

每个脚手架都被螺丝拧死,大模型在通道里面按部就班地推理,跟八股文一样没有自由发挥的空间,用户稍微提出非分要求,AI 就选择狗带。

现在回望,2024 年冬天,是纳米 AI 最幽暗的一段时光。

老师傅每天都在寻找各种新的细分需求,然后从头到尾一遍遍焊接工作流的脚手架,到最后真是焊不动了呀。。。

就在最痛苦的时候,他们看到了援军的烟尘。

(三)“四自递递”与“三只小猪” 

2025 年春天,DeepSeek 横空出世。

普通用户只是看到它回答问题前会自己“穷嘟囔”,可梁志辉他们看到的是:模型的自主规划能力终于上了一个大台阶。

没过几天,Manus 又刷屏了。看到这里你会明白,Manus 正是利用了模型刚进化出的自主规划能力,再配上各种工具而形成的一个智能体。

今天看来,以 DeepSeek 和 Manus 为代表的产品奠定了一个 AI 蜜蜂的“工作范式”。

我愿称之为“四自递递”

1、干活之前先自主制定规划;

2、干的过程中自主决定使用什么工具;

3、自主发现工作中的矛盾和瑕疵;

4、自主判断什么时候该结束思考。

5、从原始信息开始,把每一次思考的结果不断填入模型的上下文迭代思考,传递再传递,最终得出答案。

卸掉脚手架,真是一身轻松↓↓↓

虽然蜜蜂在“战争迷雾”里行进,但因为有清晰的规划,每一步有清晰的反思,还是能找到比较好的答案。

不过,梁志辉他们尝试之后发现个问题:当时主流的国产模型在迭代次数方面是短板,最多思考 20 步。超过之后 AI 的“思想负担”就迅速变重。

换句话说:那个“小窗”太小,装不下大地图。。。

于是纳米师傅决定:博采众长,成一家之言。

他们找来几个在迭代任务上表现出色的国际模型,对自家的智脑模型进行强化蒸馏。

效果拔群!做出的模型竟然能迭代 99 步左右仍然不犯迷糊。

不知你发现了没,一开始我还在讲“搜索”,后来我悄悄把这个词换成了“任务”。

没错,你如果能让一个智能体“如如不动”迭代 99 步,它就不只能做搜索,而是能完成更丰富的创作任务了。

你可以如此理解:搜索只是任务的一种,搜索智能体也只是任务智能体的一个子集。

纳米 AI 不知不觉从“搜索智能体”进化成了“创作引擎”。

意识到这一点,老师傅仿佛中了一道闪电,这幸福的闪电告诉他们的,他们也准备告诉每一个人。

他们决定,让纳米 AI 秀一下肌肉,完成一个复杂任务。

“咱们就用一句话做一个电影,讲《三只小猪》的故事,如何?”团队有人提议。

这个任务很有深意,咱们简单拆解一下,从一句指令到最终成片大概需要五步:

1、从关键词出发,查询《三只小猪》的故事梗概;

2、写出《三只小猪》的脚本;

3、根据脚本画分镜;

4、根据分镜图片输出各段动态视频;

5、把镜头拼接在一起,加上包装做出成片。

以下就是纳米 AI 完成任务全部流程↓↓↓

这个任务的起点极低:甚至不需要完成九年义务教育的人都能给出完整指令:

这个任务的终点极高:要知道一个人类团队从编写剧本、画分镜,到草稿到绘制完成至少需要 10 人天的劳动。

这么大的高度差,其实都是这只“赛博蜜蜂”靠自己规划,又靠自己一步步徒手攀岩上去的。

“四自递递”的范式,就是这么凶猛。

纳米 AI 发布会上,红衣大叔展示《三只小猪》作品,是我路转粉的时刻。现在回顾,很多新用户注意到纳米 AI,也都是从《三只小猪》开始。

下面就是成片,你感受一下↓↓↓

AI 怕出名猪怕壮,舞台之上纳米 AI 爆火,舞台后面的梁志辉团队却被架在了烧烤架上。

他们发现,依靠现有的技术,无论换什么姿势,都没办法让一个“赛博蜜蜂”思考超过 100 步。但用户才不管这些,他们疯狂给纳米 AI 发来复杂度超越 100 步的任务,而且“变态需求”的比例还在迅速攀升。

老师傅像被霸总逼到墙角,这个变态的客,不接也得接。

他们胡思乱想:既然一只蜜蜂不够用,咱要不,养一群蜜蜂试试?

但很快又被自己的想法吓到了,要让一堆智能体组成“蜂群”,难度并不亚于管理一群真人,需要哪些工程框架?模型能不能支撑?一切都无法预料。

前面是漆黑一片的深渊,看看左右的友商,有人往下探探脚,有人对深渊喊一喊,就是没人敢纵身一跃。

梁志辉决定:你们不跳,我跳!

这是一些用户的问题和任务。

(四)蜂群之战 

人类的公司,其实是蜂群现成的仿生学教材。

老师傅从中学到的重要一课就是:层级

他们为蜂群设计了三层架构:

最高层,是“蜜蜂 CEO”,它负责把人类这个董事长布置的任务做规划,拆解成不同的子任务。

中层,是“蜜蜂经理”,它负责认领一个子任务,立下军令状,保证给 CEO 交付满意的结果。

下层,是“蜜蜂牛马”,也就是之前咱们说的智能体,宏观战略不用它思考,有意见保留,它只负责想办法把分配到手里的任务完成好!

这个班味儿十足的架构,怎么说呢,是真™有效率。。。

它的效率来自于两方面:合+分。

所谓,就像会议室。

有些任务没办法拆分,例如之前提到的《三只小猪》视频任务,先要查询故事,才能扩写故事,才能生成分镜,每一步都依赖前一步,没办法“跳步”。

老师傅索性搞了个“智能体协作空间”。它就像一个大会议室,任务就摆会议桌上,赛博经理指挥一圈蜜蜂你一下我一下进行操作,封闭开发,效率自然大大提升。

所谓,就像格子间。

有些任务是可以拆分的,例如《三只小猪》任务的分镜生成后,下面就是依据每一个分镜来生成视频。

但每一段视频之间其实是(相对)独立的。赛博经理把它分配给多只蜜蜂,拿回工位分头干,不就相当于并行处理了吗?

这样一来,整体任务完成的时间会大大缩短。

现在,所有的压力都给到这个 CEO。。。

面对一个具体的复杂任务,究竟要以怎样的方式对手下的蜜蜂排列组合呢?

这里,一个终极命题出现了:

由于蜂群总体的可能性是每个蜜蜂面对的可能性的乘积,算下来复杂度已经是天文数字,几乎没有 AI 能够短时间内找到最优路径。

就像“一个人应该如何过好一生”这种天问,本质上已经是一个偏好问题,不存在标准答案了。

面对极端复杂问题,如果放手交给 AI 自主规划,有时结果不遂用户的偏好;如果完全规定套路,又难以适配各种变化,

思来想去,他们来了个“两头堵”:

既可以通过“连线”的方式规范协作流程;也可以通过“拉群”的方式让 AI 自己决定协作流程。

比如,“一句话生成大片”是个很多人都用得到的功能,老师傅尝试了很多种套路之后掌握了一套“最佳实践”,索性就把这种组合方式用连线的方式固化下来,开放给用户直接去用↓↓↓

比如,你想让 AI 根据你自己具体的情况提供一些面试建议,就可以拉几个你信任的智能体进群,直接下命令,让它们现场研究现场写报告↓↓↓

梁志辉告诉我,把这么多智能体在一起,先不说连线还是拉群,首先面临的难题其实是:“成功率”

你可能玩过那个“传水”的团建游戏。人蒙眼站成一排,把自己桶里的水倒给下一个人。这中间,每个人都会撒出一些水,到最后就所剩无几。

而且但凡有一个猪队友,把水全撒到外面,整个 Mission 就 Failed 了。。。

简单的数学:如果一个任务需要 100 步,每一步的成功率是 90%,那么最后的成功率就是 0.9¹⁰⁰≈0.002656%。

反过来算,如果需要一个任务最终成功率是 98%,那么每一步的失败率就要低到万分之二(0.02%)。

这是极为变态的要求。

老师傅尝试了很多方法,连打带骂调教这些赛博蜜蜂,效果都不太好。最后他们发现,答案就在灯火阑珊处:“知人善任”

不同模型适合不同蜜蜂的体质,他们索性接入了全中国 16 家主流模型,给每个模型安排最合适的角色,如果失败率还是压达不到万分之二,就让模型厂商去改模型。。。

“其实模型厂商很愿意去改模型,一来我们是大客户,二来我们提供的都是真实用户需求,这对模型进化来说是非常珍贵的。”梁志辉说。

就这样折腾几个月,成功率真的稳定在了 98%,蜂群舞起来了!!

说到这,你心里可能会升起一个大疑问:光成功管啥用,干出来的活儿到底好不好啊?

这。。。是另一个神坑。

(五)创作非儿戏 

同样是你,给你一个铲子和给你一个挖掘机,干活儿的效果是不一样的。

每个蜜蜂干活的质量,也极为依赖于它手中的“工具”

幸亏,从最早做搜索智能体时对搜索引擎进行深度改造开始,老师傅一直在积累经验。

所以此时,他们的目标很明确:蜂群之中每一只蜜蜂都要能根据具体任务选择正确的工具,每一个工具都要像之前那个 AI 搜索引擎一样强大而稳定。

话说,都有啥工具呢?

比如,从分镜到视频要用到“图生视频工具”;

生成一个新闻播报员要用到“数字人工具”;

让人物说话要用“声音对口型工具”;

视频剪辑包装要用到“剪辑工具”;

还有更基础的搜索引擎工具、地图工具等等。。。

目前业界已经形成标准,这些工具都通过一个叫做 MCP 的协议被大模型使用,所以也叫 MCP 工具。

“今天市面上大概有 16000 个 MCP 工具,可是绝大部分都是玩具。”

梁志辉毫不客气。

举一个实际的例子:我有一款 A 相机,现在想拍人像,想知道哪款镜头比较好。这时,蜂群中有一只蜜蜂会去查询小红书上大家怎么说,它就必须用到——小红书内容抓取工具

这事儿如果让人来做,真的不难。

打开小红书,搜关键词,扫一眼屏幕,就能知道这个帖子的内容,有多少人点赞转发,评论区在讨论啥,信息就抓到了呀。

但这事儿给 AI 来做,可是要跨越千山万水。

AI 必须得有一个电脑用来跑浏览器吧?

AI 要想查询小红书,得有个账号登录吧?

AI 要想理解一段视频在说啥,得有图像理解能力吧?得会语音转文字吧?

AI 得理解页面布局,知道点赞、转发、评论都在哪吧?

以上每一步,但凡走不通就拿不回来信息。但凡没理解准,拿回来的信息就是错的。如此,其他小蜜蜂干得再勤奋,也是在浪费算力。

为了做好这个工具,他们专门开发了 AI 能方便使用的浏览器,又给浏览器准备了虚拟机沙箱环境,还针对小红书的页面布局做了专门的解析模块,甚至为了让工具能大规模稳定运行,连底层的 MCP 服务系统都几乎重写了一遍↓↓↓

“小红书”还只是一个工具,老师傅为各个蜜蜂量身定做或修改过的工具,算起来有上百个。

这些工作全都做在暗处,如果不说,一般用户肯定不知道。但梁志辉很有信心,他们一用纳米 AI,就能*感觉*出来。

时至今日,创作早已不是儿戏,而是很多人赖以吃饭的家伙,如果一个 AI 不能帮助创作者*稳定地达成目标*,最终是不会有人买账的。

但实话说,在现有的条件下,即便有最强模型+最强智能体组成的蜂群,也很难一次创作成型。

就拿“一句话生成视频”这个官方制作的蜂群举例。

一个 90 秒的影片,大概需要 20 个镜头,其中但凡有一个镜头出现人物一致性错误,或者出现三头六臂,或者出现解说混乱,都没办法用。

好的 AI 蜂群,需要具备“Redo”的能力。

梁志辉把这件事儿称为“反悔”,他们设计了两种反悔能力:即时反悔和延时反悔。

啥是即时反悔

就是在每一个子任务执行的过程中,经理都会进行质检,判断刚刚生成的视频里有没有“明显瑕疵”,例如出现敏感画面、人物畸形之类的肯定不行。

如果存在问题,那就不往下走了,直接返工重做。

啥是延时反悔

就是在全片生成之后,交给人类审看。人发现某个不满意的地方,还可以追溯回去,让负责这个任务的蜂群返工重做。

比如下面这张看上去像剪映的界面,就是一个“P视频”的系统,你如果对某个片段不满意,可以直接上手修改它的提示词,替换原有画面,直到满意为止。

同理,人物口播、旁白、配乐也都可以修改。

梁志辉的想法很实际,他确信在未来相当长的时间内,AI 都没办法 100% 独立完成任务,这也就要求人必须以某种(简单的)方式“在回路”。

由此看来,这个编辑界面是一个完美的隐喻,它是并不完美的人工智能和同样并不完美的人类智慧相互咬合的接触点。

藉由这种相互搀扶,人机才能各自成为左右脚,向那些宏大的、也许永远没有答案的命题里一步步迈进。

(六)当蜂群渗入人生 

“纳米 AI 的终极目标是什么样?”我问。

“我们想挑战 AI 应用的上限。具体到每一次的挑战方向不好提前预测,其实都是用户需求推动的。所以,我最怕的是用户不用。”梁志辉笑。

一瞬间,我意识到有趣的问题:很多人都在说“用户”,但当他们说“用户”时,心里想的其实并不是同一群人。

梁志辉所谓的用户,特指那些在 AI 上“没有经过特别训练”,也“没有特别天赋”的数量众多的普通人。

之所以要面对这样的普通人,是因为他们身上有“金矿”——他们不仅面对着巨量的“解决问题”的场景,甚至面对巨量的“定义问题”的场景。

中国是一个产业体系最完整的国家,此刻在看这篇文章的人,可能分布在极为广泛的垂直行业,做着彼此难以理解的工作内容,面对着复杂又具体的难题。

举一个小例子:

在医院里,医生问诊之后,需要把刚才问到的信息,结合医学常识写成一个标准格式的报告。

这会耗费医生大量的时间,降低问诊效率。

本质上它是一个可以被智能体蜂群解决的问题;

但真正困难的是,纳米 AI 的老师傅不一定知道这个问题的存在。即便知道,隔行隔山,也很难精确描绘解决问题的流程。

这也是他们开发“智能体工厂”的核心逻辑。

梁志辉告诉我,在智能体工厂里,用户不需要任何代码能力,用自然语言的方式就能给智能体描述它的职责,通过拖拽就能安排“赛博蜜蜂”的协作顺序。

然后,一个“特种蜂群”就诞生了。

如果你对它们的工作不满意,只需要调整协作顺序,调整岗位描述,就能改进他们的能力;如果还不满意,你就可以“人在回路”,在蜂群工作的基础上完善一下就好了。

这并非空想,实际上已经有医生用“智能体工厂”做出了辅助写诊断报告的蜂群,并且投入使用。

在 360 的老本行网络安全领域,也有很多同事用纳米 AI 做出了专业蜂群,使用各种安全产品做网络安全运维。

除此之外,还有各行业的老铁们做了发票报销蜂群、宣传片制作蜂群、竞品分析蜂群。。。

观其本质,“定义问题”这件事情终于从行业精英的垄断权力成为了普通职业人的日常。面对问题的同时,你可能已经离解决问题很近了。

正如前述,各行各业的用户已经在纳米智能体工厂上做出了超过 10 万个智能体和蜂群。

每个蜂群,至少对应一个“岗位职责”

坦白说,以目前的 AI 水平,无法覆盖所有岗位的所有职责,但梁志辉提出一个评价蜂群价值的客观的指标:相应人类岗位的月薪

随着技术演进,期待蜂群能替代的岗位月薪越来越高,意味着它的技术含金量越强,价值也就越大。

这个未来的降临,似乎还需要 AI 补齐一个能力,也就是三个支柱中的最后一根——编码

虽说现在大模型已经具备一定的编码能力,可以搭个网站之类。但梁志辉觉得这远远不够,AI 在工作中使用的工具,绝大多数还需要人类帮它们编写。

相比 AI 的燃烧算力,人类显然是拖后腿的猪队友。

他期待有一天,模型可以根据需要现场编码任何工具,触达任何系统。

只有这样,蜂群才有机会深入工业产线,进行实时调参,分析数据,优化排产;有机会深入游戏领域,实时 3D 建模、渲染出动画;有机会深入影视制作,自动分析画面内容,个性化剪辑。

未来,智能体之间的协作靠实时生成的上下文,模型工作靠实时编程的工具,人类编码越来越薄,人类介入越来越轻,AI 反而能像水一样渗入更多的场景。

这才是 AI 应用真正爆发的时刻。

梁志辉说。

弱小和无知不是生存的障碍,傲慢才是。

今天的 AI 并不完美,但未来不能靠一边说风凉话一边等待而降临。

大模型,正如钢铁。

人们很早就发明了冶铁技术,可这远非创新的终点。

随后几千年,人们锻出了铁犁与镰刀,铸造了铠甲和戈矛,发明了齿轮与钢筋,组装了轮船与火箭,唤醒了机器人,至今一切仍在蓬勃。。。

那是留给一代又一代梦想家的舞台与追光。

告别老师傅,我突然想起 8 年前,一篇名叫人民想念周鸿祎的文章在网络上流行。

我确信,人们想念的并不是某个具体的名字。人们想念的,是在历史的轮回里,每一次站出来与高耸的技术壁垒对峙,抽出 40 米大刀的那个人。

相关推荐:

👉辛顿的冬与春

👉当 AI 活成了你的样子,而你活成了狗

👉360想拯救与黑客作战的100000个“帕鲁”

👉360杀出一支“蓝色十字军”

👉360摄像机往事:一半芯片江湖,一半理想国度

👉最 Deep 的 Seek:AI 的“终极设计图”是什么样子?

👉“AI 蠕虫”和时代裂隙中的刺客

👉黑客的滑铁卢——美国大断网全纪实

但得蜜成功用足

不辞辛苦与君尝

再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax

哦对了,如果喜欢文章,请别吝惜你的“在看”“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。

Thx with  in  Beijing

阅读原文

跳转微信打开

当年搞出了“飞信”的师傅,如今竟扛着200多个国家的聊天、弹幕和日常?

2025-09-04 11:00:00

原创 史中 浅黑科技 2025-09-04 11:00 北京

旧时的伤疤,早已成为再次出发的铠甲。

浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。

当年搞出了“飞信”的师傅,

如今竟扛着200多个国家的聊天、弹幕和日常?

文|史中

(零)不穿制服的快递员 

930 年前,曾发生一件小事。

苏轼谪迁惠州,与家人岭海相隔。

哪怕最慢的民用邮政系统,宋朝也没有。长子苏迈与父亲失联,心忧如焚。

苏州定慧禅院的小师傅卓契顺听说此事,主动请缨。硬核徒步了四个月,横跨半个中国,把家信送到苏轼手里,然后转头就要走。

苏轼看着这个晒得黢黑,满身蚊子包的小哥,心潮奔涌,含泪说:“你是哪家快递的,咋不穿制服噻?”

往事越千年,家信内容早不重要。但这拼了命也要把信息传递的执拗,在文明的星河恒久闪耀。

如果苏轼知道后世人们只要拿起手机就能和万里之外的亲友通信,恐怕也会感慨:

通信技术,乃是人间用情至深的发明。

2025 年,仅仅在微信上,每天人们发送的消息总和就超过了 500 亿条。

但你也许不知道,在另一个同样由中国人创造的通信平台上,每天传递的信息量更加恐怖—— 超过 670 亿条。

这就是我们今天故事的主角:融云

你极有可能曾经或正在使用融云系统发送消息。

实际上,它就藏在你手机里花花绿绿的 App 里;藏在各大企业、集团的内部沟通系统中;藏在政军、公安、社区的软件里;藏在全世界 200 多个国家地区应用商店的 Top 榜单里。

就在最近的“九三阅兵”中,很多国家级新闻客户端的直播,也有它默默的支持。

融云这群扫地僧,和卓契顺一样是“执拗的快递员”——把信送到,心意具足,转身就走,功名深藏

十年间,靠着在电波中每秒三十万公里的漫长行走,靠着亿万消息被沉默而精准地送达,一个横跨全球的“赛博物流系统”峥嵘初现

你大概猜不到:这群人不是别人,就是当年手造了飞信的师傅们!

(一)“飞信”同款 

“在我地盘这儿,你就得听我der。”

21 世纪初,“动感地带”的主题曲,还有广告里按键按到手抽筋的男女,浇灌了无数孩子对新世界的蓬勃想象。

现在回望,那是智能手机崛起前的历史缝隙,也是短信时代最后的国民狂欢。

狂欢之外,有人呷着啤酒冷静思考:谁将替代短信,成为下一个“信”?

无数面孔在追光下来去,但历史腾不出半行书写,如今人们恐怕只记住两个名字:飞信和微信。

作为 2006 年入学的大学生,我目睹了飞信从大学点燃引信,迅速成为全民通信 App 的爆炸现场。

巅峰时期,每两个半中国人,就有一个飞信用户。

飞信的成功,有俩原因:

显而易见的原因是“出身好”:作为中国移动旗下产品,飞信天然掌握“电信网”与“互联网”的通路,一掌打穿 PC 和手机这两个平行世界。

不太明显的原因是“活儿好”:20 年前,在一个各种组件都极为青涩的互联网世界,撑起 5 亿人的消息系统堪称“赛博都江堰”。

说到这儿,就要提到飞信背后的技术团队,也就是来自神州泰岳旗下的“新媒传信”。

介绍一下,这位大叔,就是当年团队的“首席技师”(CTO)任杰。你用飞信发送的每一条消息,都是他和伙伴们亲手送的快递——现在你可以点赞了。

任杰

然而,独步武林的侠客们,终难扭转历史的浩荡。

2011 年起,中国移动内部飞信和短信的博弈加剧,飞信的发展受到极大抑制,也正是趁着这个电光火石的缝隙,微信开始“偷塔”。

历史的轻叹,落在普通人头上,就是轰鸣。

当时技术、产品、运营,加起来足有千把号人。出路在哪?答案必须自己找。

面对强手,谁的第一反应都是“避其锋芒”。任杰回忆,当时为了活下去,他们啥都试过:比如短信代理(就是帮公司发送验证码之类)、网络安全,甚至还下场做过一些娱乐 App。。。

可干来干去,总觉得遗憾:这群人还是最会干通信,最热爱通信,最舍不得通信。

遗憾像鞋里的石子,越想回避,越是硌脚。

他们决定仰起头,回到原点:把手里的“国民级通信技术”做成底层模块,塞进每一个需要通信功能的软件里。

无论什么行业,想用“飞信同款”吗?(啪,拍胸脯)哥们有!

恶龙在前,当为勇者铸剑。我管你这那的!

这,就是融云的起源。

要我说,放在 2015 年,融云这帮人肯定算不得“逆行者”。把镜头缓缓拉开,你会看到他们背后海啸一般的移动互联网创业潮。

那是一个勇者如星河的黄金时代。

超过一半的 App 都需要通信模块:比如直播 App 要能发弹幕,招聘 App 要能沟通,O2O 上门服务也需要发消息。

要想*同时*服务这么多开发者,那就必须得用到“云”。(融云的“云”,就是这个意思。)

为啥非得云嘞?

咱们还用快递举例子:

想必各位都上过班,你们公司每天要发很多快递,但你们会自己成立一家物流公司吗?

一般不会,你们会跟顺丰签一份合同,顺丰派个快递员每天来你们这里收件,计件收费就 OK 了嘛。

在赛博世界,快递就是一条条的消息。

一家公司如果每天有很多消息要发送,也得找个“赛博物流公司”服务。

可问题是,赛博世界的快递量极其不稳定:尤其那个年代,说不准哪个 App 突然就爆火,流量翻个千倍万倍都很正常。

如果使用传统架构服务成百上千个客户,根本来不及调配运力,快递一爆仓,服务就挂了呀。。。

诶,云的绝活就是“Q弹”!这一秒有 1 个快递员服务你,下一秒你想要 10000 个,分分钟就列队整齐,粗发!

好是好。有个小问题,云架构使用的底层模块全变了,做飞信好不容易攒下来的代码一行都不能用。。。

简言之:融云虽然脱胎于飞信,但这更多是一场只有“精神血缘”,没有“代码血缘”的创业。

重写代码,想想就腿软,但任杰却激动得像个孩子:

飞信成立太早(2007 年),摸石头过河,代码体系里有很多无法抚平的“伤疤”。八年后做融云,终于有机会重绘蓝图——做出一套心目中最完美的通信系统!!

这一杆“替天写码”的大旗挑起来,英雄豪杰云集响应。

如今融云的 CTO 岑裕,就是循着这面旗帜加入的。

当时岑裕所在的三星公司如日中天,华米OV整天扛锄头挖他。

可他却感到寂寞:

对于手机来说,硬件设计才是核心,自己做的通信技术充其量只算链条上的一环。如果能跳出来开山立派,直接扛起亿万人的生活,才不枉这一身武功呀!

岑裕

有趣的是,岑裕这样的技术信徒,只代表了融云的一群i人,彼时聚拢在大旗之下的,还有一群e人——“重度手机成瘾者”。

比如融云现在的销售负责人 Toby,妥妥就是动感地带广告里那种按手机“根本停不下来”的年轻人,当年的诺基亚手机,键盘都被他按糊了。

这群“患者”把功能机都糟蹋成这样,换成智能机,还不上天?手机里恨不能装几百个 App。

他们的特点是:鼻子灵,脑子快。

各路 App,谁需要通信模块,能怎么用通信模块,我家通信模块需要加什么功能,眼睛一转就能想明白。

就这样,一群人狠话不多的技术大侠,和一群见人就唠的社牛,奇怪的组合上路了。。。

(二)勇者的剑 

刚才咱一直把通信比作快递,其实里面有个硬伤:

一份实体快递只能发给一个人;

但消息可不然,一份可以同时发给 N 个人。

群里 N 个人同时发消息,就是 N²;

N 个群里 N 个人同时发消息,就是 N×N² 。。。

N 越大,事儿越大,专门有个黑话形容它:高并发

你以为高并发带来的问题是云端的“物流系统”受不了?非也,收快递的手机会先遭不住。。。

比如看一场游戏直播,直播间里有 10000 个人,关键时刻大家一起发弹幕,就相当于 10000 个快递员端着包裹一起冲向你家门口,大门不给你挤碎了才怪。

所以,必须像诸葛亮一样,提前埋个锦囊:高并发的时候,哪些消息先收,哪些等等再收,哪些(垃圾刷屏信息)干脆就不收。

以上只是一个小例子,真想做好一个消息系统,要把千万个锦囊巧妙埋伏在各个角落。

哪有什么神机妙算,得来全靠血泪经验。。。

反正融云这帮人的自我要求就是:无论多少消息,都要做到“三不”——不丢、不重、不乱

手握这个“三不系统”,他们不揣冒昧地冲进了移动互联网创业大军中。

刚一出门,就遭遇了逆风。

彼时市场上已经有一家友商,拿了各种知名风投的钱,在互联网创业圈已闯出一点儿名气。

棋盘上人家已经下了好多棋子,你想翻盘,那得拿出点儿真东西了。

任杰记得,他们当时的法宝之一是:开沙龙。

把各种创业者拉到一起,大家轮流上台讲讲自己的创业项目,我是搞直播的,你是上门剃头的,他是做驾校考试的,隔行不隔山,相互提提意见嘛!

那时候的创业者,很傻很天真,真是啥都说啊。一腔热血倒在台上,生怕别人听不明白自己的构想。

说到动情处,融云这群人就在台下暗暗做笔记。

哟西,原来驾校 App 准备在消息里发淘宝链接卖东西;原来上门服务的 App 有些看上去正常的“关键词”也不能给发。

这边沙龙还没结束,那边岑裕他们已经开始敲代码了。

有时甚至创业者白天说出来的需求,到了晚上,新版本里就已经加上了。

就这样,平均一周一个版本,滚动升级了一年多,创业者们突然发现,自己设想的聊天模块里的各种功能,市面上只有一家能满足——不用融云真不行。。。

只要在 App 里植入融云的 SDK,就可以享受老师傅的“顶级物流服务”。

每一艘乘风破浪的船,轮机室里都有满身油污的师傅。

当时融云建了好多客服 QQ 群,从老板到产品到一线技术都在里面,有问必答;需要产品升级的,内部马上拉群开始“吵架”。

岑裕回忆,当时有一个接口,明明觉得写得很明白,可是总有开发者用错,把屁股接到脑袋上,来吐槽不好使。

就这个小破事儿,团队吵成了两派:一派主张“客户不会你得教他啊”!另一派主张,你得做一个“防呆设计”,反着接就得让他接不上!

吵了俩小时,岑裕所在的防呆派获胜,大家心满意足,吃完饭一起去改代码了。。。

实际上,这种架吵的根本不是某个具体设计,而是底层的产品哲学。

越吵架,就越深刻;越深刻,产品就越好用;产品越好用,客户就越多;客户越多,需求就越多;需求越多,越吵架。

在这个循环里,融云收获了商业世界最珍贵的东西:口碑

口碑炸裂到啥程度?

岑裕至今都记得,当时有一个上海的直播客户,App 里除了融云的消息模块,还集成了其他厂商的音视频模块,可是那家厂商根本不提供服务,出了问题人就不见了。

客户急得够呛,直接从上海跑到北京找融云,灵魂拷问:别人家的东西,你们会修吗?

融云师傅邪魅一笑,三下五除二给弄好了,送走客户,没事儿人一样回桌前继续敲代码。。。

i 人尚且如此,e 人就更疯狂了。

Toby 回忆,当时他刚做销售,接的第一个客户是个做语聊 App 的小公司,整个团队只有五个人。

那天夜里,他加班到很晚,刚到家准备睡觉,客户突然弹出消息,问他一个技术问题,他回复完,发现不对劲:“这么晚了,你们还上班呢?”

一问客户的地址,租了个民宅,离他家不太远。

他一骨碌爬起来,点了六百多块钱的烧烤和啤酒,拿过去陪人家加班,顺便了解一下这“语聊房”到底是怎么个事儿。

一开门,这几个哥们都惊了:咋的,买融云,还送烧烤?

销售干成这样,没有理由对客户的需求不熟悉。关键是,像这样的销售,融云还趁一打。。。

那段时间,在这群技术、产品、销售团队的组团疯魔之下,各个赛道的明星 App,映客、暴走漫画、驾考宝典、WiFi 万能钥匙,都把通信模块搬上了融云。

作为一个创业公司,融云竟然吞下了市场的小半壁江山。。。

这些 logo 都是客户

只不过,再激昂的音乐也不会总在高潮萦绕。

2016年,伴随移动互联网浪潮回撤,众多创业项目折戟沉沙,只有少数拿到了下一集的门票。

曾完整见证了飞信的起落,任杰对成者和败者抱有同等的敬意。

从某种意义上说。融云是铸剑人,而创业者则是真正提剑拼杀的勇士。

破楼兰,死沙场,皆是英雄宿命。融云的本分是:不让英雄因剑不如人而落下风,即便倒下,钢锋依旧寒芒闪烁。

但相比于真实战争,现代创业更像是“战争游戏”,没人真的失去一切,有种的人总会重开一局。

焦土之上,一场“出海潮”已在酝酿。

(三)少年的海 

Toby 手机里经常收到一种消息:“你还在融云吗?”

每当看到这句话,他就知道:自己虽没变化,但对面这位哥十有八九是换项目了。

从 2016 年开始,一些老朋友找回来,紧接着就会问:“出海业务,能支持不?”

说到这儿,不妨考你个题:啥叫“出海”?

出海有个必要条件,那就是:服务的对象必须是歪果仁。

那服务歪果仁的系统应该放在中国还是在海外呢?在那个蛮荒年代,还真无!所!谓!

所以,融云一开始答应帮客户出海时,心情是放松的。

“反正全世界的互联网是通的,消息也不用办签证。俩埃及人发信息,先发到中国的服务器上转一下,再发回给埃及,不就完事儿了?和在中国有啥区别?”

但事实很快教做人。

吃惯了细粮的中国人,忘了外国的网有多差。

当时有个客户真就去埃及搞了社交软件,结果发现个问题:这玩意儿跟汽车犯冲。。。开超过 60 迈,立刻发不出去消息。。。

给创业者把完脉,岑裕他们撇撇嘴,估计是运营商基站的网络性能问题。

想必各位都送过快递:从来不怕远,就怕路不行。

网络,就是赛博世界里的“路”。

更痛的领悟来了:埃及不是特例,2016 年,全世界除了屈指可数的几个发达国家,剩下的网络基本都这德性。。。

所以,要么别出海,要出海就必须练就一套功法:在坑坑洼洼的路上驰如戴宗,保证“信息快递”使命必达。

大家讨论这些的时候,都是满脸愁容,可回头一看,技术伙伴的眼神逐渐变态。。。做了这么多年通信,等的不就是这种级别的挑战吗?

他们沐浴焚香,开启了两大工程。

一号工程:路由调度策略。

不要没苦硬吃,哪儿的网不好,提前闻出来,指挥“快递员”换条路走嘛!

二号工程:弱网应对策略。

真没躲开网络抖动,快递员掉坑里了。不要慌,尽快重连,感知手机上哪些信息受到了影响,给人家补发。

那时节,融云师傅就像达尔文,搭乘中国创业者的小猎犬号,你去哪儿我去哪儿,主打一个陪伴。

陪着陪着,东南亚、中东、北非诸多的海外交友 App 都陪到了融云上。

如果浮在太空俯瞰,你会看到奇观:

物理空间相隔很近的两个人,每一句对话都驾着孤独的光缆,每秒 30 万公里在大洲之间反复弹射。

然而,即便是光速,也有力不从心的时刻。。。

这不,一家企业准备去服务美国人民,给融云提了个小要求:咱的延迟最好别超 100 毫秒。

可两国之间的距离决定了:一条消息在太平洋上来个对穿,只要爱因斯坦的棺材板还压得住,传输本身就不可能低于98毫秒。

留给融云的系统做转发的时间,只剩 2 毫秒。。。

有人弱弱地提出:难不成,咱还得去美国租数据中心吗?

镜头一闪,孤悬海外的“快递站”——美国俄勒冈数据中心已经落成。

一开始,大家心里都在唱《忐忑》,搞个海外站是不是太激进了?

不过这个疑问很快消散。因为客户出海规模越来越大,要求越来越高,过了一年,新加坡数据中心、德国法兰克福数据中心都“被迫”建成。

这些数据中心不再孤独,而是渐渐连成一个“全球通信网”——根据收发人所在地点,信息在不同的数据中心里穿梭,自动选出一条最近、最好的路。

话说,就在融云众将满世界建站时,还有一个神秘小组,由任杰亲自带领,正在挑战一个更凶残的海外任务。。。

镜头摇向南亚次大陆:

彼时印度一家头部电信运营商 Reliance Jio 在推广 4G,为了和正在崛起的 WhatsApp 硬刚,他们想找一支全世界最强的通信技术团队,合作开发一个国民级的通信 App——JioChat。(Jio 是生活的意思)

全世界海选一遭,干过和 WhatApp 同等级别通信系统,又深刻理解运营商的,只有一支队伍——飞信的原班人马。。。

这大生意啊!有啥凶残的嘞?

注意,他们可不是用融云的“赛博物流服务”,而是让融云帮他们重建一个“物流公司”!

用任杰的话说,这俩的难度区别,就像做一杯咖啡和做一个咖啡机那么大。。。

我鼓励任杰回忆一下当时的难处,让我开心一下。

他想了半天,说出一个意外的词:不信任

对方不是不信任融云这个中国团队,而是不信任——中国技术。

举个小例子:

JioChat 只是运营商全家桶中的一个 App,要和其他软件打通、跳转,所以底层账号体系,调用接口都得打通。

遇到难点,印度老哥总是怕融云的技术方案有疏漏,要求先拿出各种技术文档、代码原型“证明一下实力”,才肯往下干。

老师傅心里万马奔腾,这玩意儿老子在中国搞过 N 次了。

结果,本来一周就能搞定的工作,光前期证明材料就来回讨论一个月。。。

可细思起来,事情没那么简单。

印度的互联网和美国有很深的渊源:不仅因为印度程序员说英语,有为美国公司工作的传统;也因为印度的互联网市场一直对美国开放,普通人大量接触美国产品,使用习惯也被西方文化深刻塑造。

所以,印度人表面上是在审视中国技术,实际上却是在比较中美两套技术体系的差异。

例如:当时 Jio 方面提出要求,消息送达,发送人这里要显示一个勾,消息被对方读取,发送人这里要显示俩勾。

中国没人这么干,融云让印度师傅解释一下。对方说了半天,感觉也没啥必要。

最后他们发现了真相:WhatsApp 的设计就是这样。。。印度人早已习惯了,说破大天,你也得顺着。

JioChat 和 WhatsApp

任杰慢慢想通了:

“虽然海是连通的,可陆上尽是藩篱。文化差异很难靠一个项目来磨平。中国技术走向世界,恐怕是一个比想象中更漫长的历史进程。”

怀揣这样的信念,师傅们渐渐安住时光,心生菩提。

2017 年,剧烈磨合整整持续了三个寒暑,项目完满交付。

私有部署的 JioChat 项目,虽然做得死去活来,但也给融云师傅一个关键启发:在咱国内,会不会也有企业需要“私有部署”的通信系统嘞?

这个念头,引爆了另一条隐秘的故事线。

(四)沉默的冰山 

在世上混,每个人至少得准备两套灵魂:牛马灵魂、居家灵魂。

脑袋里有个开关,白天切到工作,晚上切回生活。

可在相当长的时间里,通信产品似乎并未跟随这个二元结构——我们的工作生活好像都是在微信上完成。

这对吗?好像不对,好像又可以。

直到 2018 年,钉钉开始爆火,它背后的真相是:随着社会发展,生活场景和工作场景对于“通信系统”的要求,开始走向泾渭分明。

说个最明显的,安全需求:

公安部门,原本上级传达的文件都是纸质,泄密比较难。现在都是线上传达,如果用微信群,一截图就能胡乱转发。

装备制造企业,原来中国技术落后的时候,没人关心你设计了啥。现在中国技术独步世界,图纸一旦失窃,损失无法估量。越来越不敢用普通的聊天软件传输。

其他需求就更多了,例如要给企业内部每个人分配权限,通信系统要和企业内部审批软件联动,等等。。。

这么说吧:

如果把云上的公共通信服务比作水面之上的冰山,那么各行各业的私有通信需求,就像冰山水面之下的部分,庞大、繁杂。

这些行业虽沉默,却是社会结构中的“承重墙”,它们值得更好的技术。

此时退到时代的岸边,你会目睹另一个浪潮:无数梦想家正在把过去十多年在互联网领域磨炼的技术,汹涌地推向政府、金融、交通、矿产、制造业。。。

就在 2018 年,融云决定也跳入这个数字化浪潮,成立“政企事业部”,为沉默的冰山服务。

当年 JioChat 的印度人都搞定了,咱中国人还会更难搞吗?

刚接了几个客,老师傅就发现自己冒昧了:中国人果然更难搞。

就拿一个真实案例来说吧。

四川航空,每一个航班都需要有机组成员、地勤、塔台等几个小组联合保障,待所有角色都 Check 之后才允许起飞。

最早的行业实践是:相关人员会通过手台来沟通。

可后来,业内出现过疏漏:由于信号干扰,地勤手台有时接不到推出的指令,引发安全隐患。

川航要求,在融云帮他们建设的通信平台上,必须有仨功能:

1)任意航班起飞前两小时,自动把负责这次航班的机组、地勤、塔台拉到一个群里;

2)关键指令强提醒,相关人员必须做了回复,才允许进入起飞流程;

3)每次航班结束后,群组自动关闭,但所有沟通信息要保留,供后续审计和监督。

你看,如果不是在航空业里被摩擦到吐血,谁会提出这样具体而变态的要求?

融云师傅一听,来了精神:这些功能原来的系统里都没得,加紧开发啊。。。

可正是这份敬业,把他们拖入了泥潭。

你看,为川航写的功能,只能用于川航,改一改最多也只能用于航空业。但中国经济体系太完整了,还有金融、保险、采矿、炼油。。。

三百六十行,行行提需求,同行业里每个客户再维护一些专有功能,到最后,你要维护的代码版本就太多了。

杂技演员,同时扔三个球问题不大,同时扔三百个球,就不是技术的问题了。。。

这,其实就是企业级服务里的经典问题:产品碎片化

碎片化是一个温水煮青蛙的过程,不是一上来就痛不欲生,而是每天痛一点儿,有时还因为确实解决了行业问题而“痛并快乐着”。。。

等大家都累到不得不正视这个问题,四五年已经过去了,无数系统已经敲锣打鼓“嫁”进各个行业,离是离不了了。

老师傅亲手为自己攒下了巨大的历史包袱。

现在政企事业部的带头人何亮,就是在包袱最为沉重的 2022 年加入的。他迫切需要带大伙儿做两件事:

抽象 + 解耦

何亮定了个规矩,客户提出一个新需求,不准回来就做,而是要先讨论出它的抽象含义。

还拿刚才的川航系统举例,咱抽象一下,本质是:想用一个消息模块触发一个动作模块。

消息模块可以是航班执勤邮件,也可以是负责人发的信息;动作模块既可以是拉起群组,也可以是允许起飞。

所以,老师傅们要两步走:

1、先定义模块的接口,以及相互调用的规则;

2、再用这套东西去实现“根据排班自动拉群”之类的功能。

那啥是解耦呢?

在实现这些功能代码时,不写死在客户的系统里,而是做一个“乐高积木”,在客户的系统里轻松插拔。

下一个客户再有需求,不用重新开发,只要把几个更基础的“代码积木”给它拼上,不就完事儿了!

乐高的优雅在于:

宏观上看,你既可以拼出航母,也能拼出哥斯拉;

但是拆到细节,积木的种类就那么几样!

对于技术信徒来说,这难道不是更极致的快乐么?

手中的“乐高积木”和脑袋里的“乐高思维”,不仅把人效比从可怕的深渊里一点点拉回来;还在冥冥之中,帮老师傅踩中了通往下个时代的“关键垫脚石”。

(五)大分野 

历史如同一个大型横版过关游戏。它的残酷在于:不会给玩家多一秒的喘息时间。

时间一到,不管你有没有 Ready,画面都会推行。被卡在上一关的玩家,无人怜悯,无人问津。

2023 年,历史闸门再一次落下。

眼前的“新关卡”大概可以用三句话描述:

1、中美技术总体步入同一梯队,竞争白热;

2、美国押注关键技术的防守,战略放弃非关键领域;

3、传统意义上被美企通吃的市场,突然洞开给中国师傅。

如果说 2017 年那波融云还是乘着客户的小船出海;到了“大分野时代”,他们必须自己造航母了。

岑裕暗自庆幸,团队这几年攒了不少大招。

比如基础技术:在 2021 年,融云备好了 IM+RTC+X 的“全通信解决方案”。

这个方案包括即时通信(IM),也包括实时音视频(RTC),还包括推送服务、消息翻译、审核、美颜、变声等等各种周边功能(X)。

比如基础设施:2023年,融云刚把“全球通信网”升级到了 V4 版本。

这玩意儿有多夸张呢?他们用全世界 8 个数据中心、233 个国家和地区的基础设施编了一张极为细密的蛛网,在这张网上任意两点收发消息,延时都可以精准预测,路线都可以自动调度。

有这些黑科技打底,理论上全球 80 亿人的需求融云都能平趟。

但打底归打底,越往上层到具体的产品功能,中外的分野越明显。

说到“分野”,融云全球互联网业务线负责人宋清晨思绪万千。

“就拿‘群规模’来说,中外就很不同。”他说。

自 2019 年,国际上新一代社交软件 Telegram 和 Discord 开始崛起,二者都在主打一个概念:超级群。

在中国,由于法律限制,任何一个群都不能超过 500 人,客户没这需求;可是在很多海外国家,建群规模无上限,几万人几十万人像羊群一样 Pogo,玩命制造狂欢。。。

要想服务海外客户,融云就必须点亮这枝科技树。

不过,在岑裕看来,这个树杈其实早亮了:

之前师傅们为其他产品形态做过很多设计,例如:一对多发言的群主形态应该如何聚合?用户组如何分层?用户同时收到大量信息,应该用什么推送策略?

他们把这些技术重新整合,“超级群”就诞生了!

“另外,中外对于‘合规’的要求差别也很大。”宋清晨说。

比如,“黄暴”的标准,各国都不同,这就意味着要接入松紧不同的审核模块。

比如,“隐私”的标准,各国也不同,这就意味着要对主流监管框架做适配,例如 GDPR、PDPL、PDPA、CCPA、LGPD。。。。

比如,对数据的“权利”,各国也不同,有些国家要求用户即便注销也要留痕;有些国家要求注销之后必须不能留存。

具体的功能倾向的背后,是人类历史、文化、意识形态参差的迷宫。

融云的野心升腾:他们想用同一套技术底座走通迷宫的所有角落——支撑每个国家对通信的要求。

实现这个目标,目测只有一种方法,拼乐高

此时大伙儿才发现,在繁复的企业级市场里拼杀获得的“抽象+解耦”的经验是如此宝贵。

果然世上没有白走的路,每一步都算数。

每到一个国家,社牛们就出动,把当地人的独特需求收集回来,再由老师傅做成乐高块。

一开始需要从头开发的乐高很多;到后来,已有的乐高换着拼插就已经能满足各种需要了。

原来,地球也没多大嘛!

这是融云海外版的网站,一键试用,工单回复,都按照国际惯例打磨了一个遍。

2023年,随着融云在海外名声渐响,政企团队也不断接到一些特别的大单:很多国家想让他们帮忙建设一套“国家级通信平台”

有点儿像当年印度的 JioChat,但不同的是:JioChat 只是由一家运营商主导建设;现在这一波是由政府、军队等纯粹的国家力量主导。

国家用通信平台干啥嘞?

何亮给我讲了一些具体动机:

有的国家行政成本较高,想要给所有公务员建设一套通信系统,提高效率;

有的国家面临地缘压力,迫切需要一个自主可控的通信平台;

有的国家岁月静好,但就是想让国民也像中国人一样可以有一个能集打车、购物、聊天的超级 App,享受数字化红利!

简单一句话:看到了中国这几年的信息化取得了炸裂的成功,他们也!想!要!

融云的系统像“真经”一样,被各种肤色的玄奘们风风光光地带回各个大洲,从邻居吉尔吉斯斯坦,乌兹别克斯坦,到中东的沙特、伊拉克,甚至到非洲的科特迪瓦。

任杰颇有感慨:

当年,他们去印度做 JioChat,对方非要融云拿出代码级的证明才同意团队的方案;如今,无数国家却虔诚地来取经。

不只是融云变强了,更是融云所代表的中国技术人,穿行漫长的时光,终究在 80 亿人面前证明了自己。

2025,连进融云系统的设备(不去重)已经突破 100 亿个,平均每天有 670 亿条信息在融云的系统中被传递,日消息峰值可以达到 3572 亿。

无论从上下左右看,这都是值得干一杯的成绩。

但岑裕却提出了一个暴论:通信这件事儿离终局还远得很。哪怕在 2025,它的想象力也刚刚爆发。

点燃一切的引信,就是 AI

这是挂在融云办公室墙上的大屏,展示了总设备数、在线人数、消息数、全球触达情况。

(六)人跟 AI 组 CP 

AI 和通信,看上去八竿子打不着。但“庖丁解牛”一下,你就会发现:

智能的本质是信息压缩;

通信的本质是信息的传递和留存。

没错,他们处理的是同一个东西——信息

“AI 能大大增强通信,通信也能大大增强 AI。”岑裕把这几年的苦思结果直接抛给我。

先说几个 AI 对通讯的加持:

在音视频传输领域,一直有座“圣杯”,那就是压缩算法。

同样一段音视频,使用不同的压缩算法,大小能差出去百倍千倍。

但压缩就像榨果汁,同一种机器榨到一定程度,再上更多强度也很难榨出多少了。。。

我们就处在这么一个“传统压缩算法气数将近”的时代。

幸亏,AI 接过了接力棒。

AI 加持的压缩模型面对一段声音或图像,可以直接理解里面的语义,从而只传输最核心的信息,然后在接收端把信息重新生成出来。

这种“下一代压缩技术”,有希望在以前的极限上继续“榨汁”。

它有多夸张呢?岑裕告诉我,遑论音视频,就连文字这种已经很“干”的信息,都能继续压缩 5-10 倍。

你还记得当年埃及的破网么?将来别说去埃及,就算是通过窄带卫星给宇航员传输文件都毫无压力!

刚才说的还只是专用 AI 模型,如果说到现在最火的大语言模型,那可玩的事情就更多了。

举个例子:你只会中文,有人用英语给你打电话,你就需要有个翻译听电话,帮你转述。

此时,翻译的大脑承担了“压缩”的工作。

设想一下,如果在通信系统里内置一个翻译机器人,直接把对面的语言改成中文传递过来,就省去了人类大脑的压缩过程啊!

一个所有人都能用母语交流的通信系统,你觉得有没有搞头?

比起“用 AI 加持通信”,更让岑裕激动的,其实是“用通信增强 AI”。

思考一个问题:人的记忆,来自于哪里?

它几乎全部来自于你和环境的互动。

在所有的互动中,人与人的交流占据了很大一部分。

在所有的交流中,线上交流又占据了很大一部分。

作为一个生活在 2025 年的人,你的聊天记录里,很可能躺着你记忆的半壁江山!

如果有一个 AI 秘书可以对你的聊天内容进行学习,那么它就可以代替你去回复(不重要的)消息,几乎不会露馅。

这不就是你的数字分身么?

就算在生活中你想要亲力亲为,但是你大概不介意在工作中有一个分身,帮你回复可恶的老板和同事。

想象一下,在你的工作沟通软件里,有一个 AI:

它可以通过你的聊天历史来提取你的工作进度,有人来问你时,助手就会直接回答;

如果对方执意想和你本人沟通,助手就会提醒你,还能帮忙预定线上会议。

AI 秘书挡在你面前,有事儿先和秘书聊。

如果把目光超越自然人层面,玩法就更多了。

一个企业想要用 AI 提升效率,首先需要模型对业务流程关键岗位进行学习,这个学习需要大量的“教材”,也就是数据。

这是一个非常累人的活儿。讲真,过去几年,企业数字化转型中 80% 的时间都耗费在了准备数据。

可是,一个企业中大量的行业认知和工作经验,本身就藏在企业级通信平台里。这些聊天记录,不就是企业的“记忆”么?不就是训练 AI 的好资料么?

只要合理分类这些记录,有针对性地学习和参考,就可以轻松造出专属于这个企业的“数字员工”啊!

推而广之,企业所有的视频会议录像,也可以让 AI 进行学习,甚至实体会议室也可以用摄像头采集内容,从而把一个公司中的“沟通行为”尽可能多地数字化,沉淀进企业的知识库。

数字员工可以做的事情越来越多,人和 AI 组成的 CP 就越来越紧密,企业的生产效率就会进入飞轮,产生飞跃。

所有这一切狂野的想象,当然都要建立在一个底层的通信平台上。

融云这群人,就想做这个平台!

岑裕告诉我,他们的秘密项目就叫 AICP,全称是 AI Communications Platform,也就是 AI 通信平台。

AI 通信平台,就是各个地方都要有 AI。

他对这个平台的设想非常激进。

首先,既然叫“平台”,就意味着它是开放的,各种乐高都能在上面插拔:不仅融云自己做积木,其他开发者也可以贡献他们的积木,一起出海“捕鱼”。

其次,随着 AI 越来越聪明,根本不懂代码的人也能借助 AI 写软件,这个新势力被称为“公民开发者”。AICP 也准备服务他们。

最近师傅们正忙着对系统重构,让未来的 AICP 更容易被 AI 模型理解和调用。

没错,又要对底层代码动刀,融云创业时的戏码即将重演。。。

十载春秋弹指一挥间,可叹老师傅面前的 To Do List 反而更长,心目中“完美的通信系统”仍像北极星一样在穹隆闪烁。。。

但人的一切幸福,不都源自尚未抵达的狂野想象么?

(七)热爱可抵岁月漫长 

临近告别,融云政企研发负责人于剑池突然想起一个 20 多年前的往事。

2001 年,他远赴德国求学。

独在异乡,孤单的时候,只盼能给家里打个电话。

可是,即便最便宜的长途电话卡,也需要 50 马克一个小时。

穷学生拼命勤工俭学攒钱,拨通越洋电话,父母“字字如金”的絮叨,成了他的无上慰藉。

每次回国,于剑池都拼命想教会爸妈用电脑和 QQ,可是他们年龄大了,新东西记不住。

2007 年,是飞信救了他。

爸妈终于不用学电脑,只需要在手机上发短信,就能无比便宜地“越洋传书”。

那一刻于剑池感到救赎:通信技术每向前一小步,都会把时代边缘枯坐的人们重新接上列车,那是代码释放的至深善意。

正是因为这个独家记忆,他回国后毫不犹豫加入了飞信的技术团队,也最终成为融云的一份子。

如今,飞信已渐渐走入人们的记忆深处,但于剑池知道,那些温暖的技术不仅从未断流,反而在自己和伙伴的手上延续,在全世界攀藤开花。

1985年,罗大佑写了那首《明天会更好》。

四十年沉沉流逝,如今候鸟迁徙,带来的却仍是远处的饥荒和无情的战火依然存在的消息。

这是莫大的讽刺。

但正因人们彼此隔膜,通信才更有意义。

岑裕告诉我,创业至今,除了手机没电,他从来没有主动关机,因为用户已经习惯了随时询问问题,随时得到答案。

他不关心那些虚无缥缈的神明,开发者是他的上帝。

Toby 经常给销售团队布置“数学题”:

每人每天有 100 块钱的咖啡预算,必须找客户聊天一起喝掉;和客户聊天,绝不能 5 分钟完事儿,起码 30 分钟起步。

与勇者随行,是铸剑者的天命。

十年间,融云师傅们陪伴了一些项目成为顶流,也见证了一些团队短暂留在追光下,又跌入洪流。

但真正让他们幸福的是:每过两三年,开发者们总会带着新点子和一如既往的激情“卷土重来”,在这里点选趁手的利剑。

旧时的伤疤,已成再次出发的铠甲。

这,是中国创业者真正的模样。

犹海浪永恒拍打堤岸,唯热爱可抵岁月漫长。

正因如此,每当人询问:“你还在融云吗?” 他都会收到老师傅元气满满的答复:

“是的,我还在!”

热爱可抵岁月漫长

再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax

哦对了,如果喜欢文章,请别吝惜你的“在看”“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。

Thx with  in  Beijing

阅读原文

跳转微信打开