浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
2025-06-13 10:59:00
原创 史中 浅黑科技 2025-06-13 10:59 北京
下次遇到 OPPO 机主,记得给Ta点个赞。
浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
卖手机的 OPPO,
偷偷干了件让全世界付费的事
文 | 史中
“你们这些小屁孩,知道我是谁吗?”一位美国大叔拍案而起,皱纹拧成大写的鄙视,白胡子颤抖。
像他这样造型的,旁边还有七八个。
谈判桌对面,是清一色的中国人,平均年龄恨不得比他们小两轮。
“怀疑我专利的含金量?通信标准会议,每一个我都在场,你们谁参加过?”
大叔继续贴脸输出,越说越激动。
“专利的成色只能用技术证明,而不是资历。傲慢只会让你失去尊重!”一个戴眼镜的中国小伙儿不卑不亢地还击。
大叔有点儿断片儿。。。
诶,之前跟“那些人”这样说,对方气势会立刻矮一截,怎么这次剧情要跑偏?
时间暂停,我们把镜头拉出窗外。
这里是深圳湾地标“春笋大厦”。
2024 年,美国高通代表团磨刀霍霍来了十几个技术专家、谈判高手、专利律师,杀到 OPPO 续签专利合同。
高通,不用介绍, 当今手机芯片一哥,作为行业上古神兽,几乎半部通信史都和它相关。任何一部手机里,密密麻麻都是高通的专利。
用我专利得给钱啊!
所以他们的目标很简单:我来了,我收费,我回家。
但 OPPO 的意思是:朋友坐下饮茶先,我 OPPO 是用了高通专利,但你高通也用了 OPPO 的专利。咱们得“交叉授权”,你的专利费减去我的专利费,剩下的差额才是我要给你的钱。
于是问题复杂了。。。你的专利值多少钱,我的又值多少钱?
按照国际惯例,此时双方得“辨经”。
具体是酱的:
1)分别从自己的专利里粗筛出几百件;
2)然后“抽卡”,我从几百件里自己抽几十件最能打的,再让你抽几十件觉得最弱鸡的。你那边也以同样姿势抽出几十件;
3)这些专利,咱们一件一件抬上桌面,跟鉴宝节目一样,辩论它到底值多少钱!
高手过招嘛,点到为止。
辩完一轮,对方什么段位,两边心里都有了谱。再谈钱,就更容易体面地达成共识了。
可想而知,这种辩论很容易被玩坏,变成大型 PUA 现场——为了让对方相信他们的专利没那么值钱,那真是各种“迷魂汤、听话水”都使绝了。
美国大叔说话这么难听,难道不就是一种 PUA 吗?这种关头,但凡气势弱一点儿就败了呀。
必须主打一个不惯着!
当然,以上这个画面,是中哥我合理想象的。
因为墨东行在“辨经”桌上每次都是这么反击的。
之所以这么刚,是因为他在 OPPO 专利团队里负责最神秘的部分——专利的申请和战略布局。每个专利都是亲生骨肉,被你美国老头说歪瓜裂枣,那洒家跟你拼了。
我们知道和国际大厂的专利实力有差距。但我们要证明的是,这些年的努力有价值!
他用加粗红字说道。
看到这,可能有人嘀咕:OPPO。。。有啥专利?
大部分普通用户确实更关心手机的功能,不太研究背后的专利江湖,这不怪你。
但业内人士会告诉你:最近几年,OPPO 杀疯了。
2024年,高通在“5G 标准必要专利”榜单上排名全球第二,OPPO 已经冲到了全球第八。
而且过去几年,全国企业专利授权量总排名,OPPO 动不动就能进前三。
比榜单更确凿的认证,是对手的反应:
那次谈判的结果虽然保密,但是从各方透露出的蛛丝马迹来看,最终 OPPO 拿到的是非常满意的结果。
OPPO 做对了什么?
谈判,拍桌子瞪眼固然有点儿作用,但正如那句名言所说:战场上拿不到的,谈判桌上也休想拿到。
在 OPPO 专利团队的小伙伴看来,这场谈判只是厚厚相册中的一帧,驻足回望,来路是细碎的脚印,十一载风雪长歌。
老规矩,为了让你能品到妙处,在讲故事前,先来一段画小人科普,看看“专利战国”的烽烟。
咱们不妨把手机的生产想象成“炼金术”,每一个必要技术都像一种“矿藏”。
现在,假设我要造“中哥手机”,得先派好多支小分队去采矿。
可是我来得晚,很多重要的矿脉已经被别人占领了,还在门口立了个收款码。
我要进去采,就得付钱——这就是专利费。
一看价,倒吸一口凉气:这么贵呀!!
这个时候我就得算账了:要是都按他们的*要价*交费,那手机生产出来,卖一台赔一台,这不科学啊。。。
我咋办?
有三个选择:绕、谈、打。
1)绕。
这个 A 矿要价高,我能不能绕过去,找一个 B 矿来替代你?
哪怕 B 矿成色差一点儿,但不用交费啊,对我来说也是大大的划算。
这是个拼硬实力的活儿,假设我真能找到替代品,那您爱要多少钱要多少钱,要得越高越好呢!(因为其他友商可能绕不过去,还得给你交钱嘛)
2)谈。
这 A 矿我是真绕不过去。
商量一下,您给个诚心价!
注意,不是“求你了,便宜点儿,我上有八十岁老母。。。”这是乞讨,不是谈判。
真正的谈判,本质是交易。
就像咱们刚讲的“OPPO VS 高通”,高通手里有 OPPO 要的矿,OPPO 手里也得有高通要的矿才有的谈。
3)打。
这个矿我真绕不过去,您还不降价。咱俩杠在这,那就只能撕破脸,撸胳膊挽袖子打一架了。
不是真打,是“打官司”。
一般来说,“矿主”会先动手,起诉我侵权。这个时候,我除了直接抗辩说不侵权,还有两个选择。
第一,打无效。
就是干脆在法庭上证明这个矿不是你先发现的,你都没有权力收费!
为此,我需要在浩瀚的历史资料里找证据。但凡发现在公共媒体、公开出版物上,有人比你先提出了这个想法,那对不起,你的专利就无效了。
别说跟我收费,以后你跟谁都收不着费了。
第二,打反诉。
你说我侵权你,你还侵权我了呢!
这个时候,就要仔细检查对方的产品,看他是不是也在偷偷地采我的专利矿。
如果证明有,那即便另外的案子我输了赔你,这个案子你还得赔我,算总账谁给谁还不一定呢!
OK,“绕、谈、打”的基本操作说完了。我们不妨飞到空中,俯视一下 2025 年手机世界专利的“矿脉图”。
手机里,最值钱的专利大都集中在一个地方:蜂窝通信。也就是我们常说的 3G、4G、5G。
3G、4G 的地盘,几乎被外国公司瓜分。比如高通、诺基亚、爱立信、三星、LG,这些老牌通信企业。
5G 的地盘上,虽然上述外企依然盘踞半壁江山,但另一半已经被中国人抓在手里。2024 年前十名里有五家中国公司:
华为第一、中兴第六、OPPO 第八、CICT(中国信科)第九、vivo 第十。
这说明啥?
这些年咱也置下产业了!顶尖中国企业正从花钱买矿的人,逐渐变成开矿的“煤老板”,从交钱的变成收钱的!
但是,正如战国竹简中所一再书写的:
新王崛起,带来是昔日霸主的觊觎、争斗、心理失衡、霸道的防守、血腥的战争。
OPPO 的知识产权部部长枫盈,亲眼见证了这段历史。
或者说,他亲手参与缔造了这段历史。
时间之风逆流,回到 2014。
枫盈从 OPPO 的办公室走出来,回头又瞄了一眼公司 LOGO,心里直犯嘀咕:“这公司什么来路,怎么舍得在专利上投这么多钱?!”
那真是青涩的时刻呀:OPPO 在很多人心里还是个小厂,枫盈也只是一个默默无闻的专利律师。
但二者走到一起,不能说偶然。
短暂交谈,OPPO 的管理层听懂了枫盈的“大设计”:
作为工程师,枫盈曾经在中国联通一线写过多年基站代码;作为专利律师,枫盈曾在华为做过专利的申请、谈判、诉讼一条龙。
脚踩技术和法律的交叉口,他知道二者的咬合关系——只有把“技术的子弹”用正确的姿势填进“法律的弹夹”中,你才能拥有能打的“专利武器”。
但是!顶尖武器≠战争胜利。
你还得用一系列“军事理论”把战争组织起来:
像管仲一样对专利长期经营,像孙武一样上攻伐谋地诉讼,像苏秦一样纵横捭阖地谈判,才能在残酷的专利战争中挺到下一集,再下一集。
“专利武器”+“军事理论”,在枫盈看来有点像“老中医”,非常吃经验。西方花了几个世纪才演化出来这一整套玩法。
曾几何时,中国人只有“照猫画虎”的份儿。
回到 2014 年,中国通信公司把这些玩明白的,恐怕只有国际化比较早的华为、中兴、富士康这几家,一只手数得过来。
他们算是本土专利江湖的“第一代掌门”。
OPPO 邀请枫盈过来,就是看重华为的江湖地位,让他把在华为习得的真传在 OPPO 开枝散叶,帮助 OPPO 成长为第二代掌门。
OPPO 的企业文化是本分,而本分的表现之一就是“让专业的人做专业的事”。
过去十一年,我给领导层展现专业,领导层给我充分放权。这两件事不断重复,才有了 OPPO 专利今天的版图。
枫盈很感念。
但所谓专业,可不是光吹刚才那一套“大设计”就够的,更重要的是把这套设计和一样“俗气”的东西挂钩,那就是——钱。
专利申请要花钱。
同一个专利在不同国家申请要分别掏钱,专利每年还收维持费,在不同国家维持就更贵了。这些加起来,是一笔不菲的开销。
但是专利也能挣钱。
比如可以直接把专利卖掉,还可以和别人进行“交叉授权”抵扣专利费,更可以直接授权给别人收专利费。
如果剥离了情感因素,专利可以看做一个极简单的生意:
进项>出项=赚钱
进项<出项=赔钱
枫盈深知这一点,才对老板郑重承诺:专利团队的价值,早晚会落实到钱上。
如此,他为 OPPO 未来 15 年设计的“专利战略”就呼之欲出了:
1)用 5 年时间,把专利数量搞上去,起码不会被别人“专利挟持”。
2)再 5 年时间,把专利质量搞上去,可以大幅抵扣专利支出。
3)再 5 年时间,把专利运营搞起来,让专利直接给 OPPO 赚钱。
就在这么清晰而宏伟的规划下,OPPO 专利团队浩浩荡荡上路了,彼时团队成员是——两个人。。。
“充电五分钟,通话两小时!”
这个广告语,如今已经和“大宝天天见”“恒源祥羊羊羊”一起配享太庙了。
枫盈刚来时,OPPO 正好研发出了领先同行两代的快充技术,工程师们也张罗着申请了专利。
但看到专利申请材料,枫盈心里咯噔一下:这么说吧,水平高一点的友商完全能做到不给你交专利费,你还打不赢官司。
幸好专利材料递交的 12 个月内还可以补充修改,他把这些专利拿回来,细密织补了一遍,滴水不漏再提交。
事实证明,这么一个小操作,日后帮助 OPPO 渡了一劫。
这是那支入典的广告。
但当时,枫盈顾不上想这些,他面前是一片让人窒息的“5G 专利荒漠”。
5G?很多同事一脸问号。要知道,当时 4G 手机才开始普及。5G 得到猴年马月呢。。。
但枫盈知道,就算这一秒出发,也根本不早了,隔壁老东家华为已经系统级地启动了 5G 技术的研发和专利申请。
如果不在 5G 标准制定的过程中就强势参与、跑马圈地,真到了 5G 时代,矿都被别人占完了,OPPO 光是专利费就得交到吐血。。。
于是他三天两头跟老板蛐蛐,解释国际标准组织 3GPP 制定的时间表,技术研发会比正式商用提前十年甚至更多。
老板听劝,让他正式启动 5G 专利的整军备武。
3GPP 的路线图,5G 的研究准备从 2010 年就开始了。
很快,公司设立了“专利奖金”,技术部门的 5G 研究如果最终申成了专利,那是真给钱啊!工程师们于是踊跃地输送弹药。
2016 年加入的墨东行就是“装填手”,负责把师傅们的弹药填进专利申请书。
问题很快出现了:申请书一股脑怼到专利局,好多都批不下来。。。
这是为啥呢?
我们沿用之前“矿脉”的比喻。
你发现了一个矿,申请专利保护的同时,必须写明白保护范围。你不能说“以这个矿为圆心,周围一千公里都是我哒”。
举例,你去专利局申请一个专利:“两个轮子的载具”。那一下子把自行车摩托车手推车都给包括了。审查员一定会说:好走不送。
所以,要想专利被通过,必须把范围写得足够小;要想专利不被绕过,又得把范围尽量写大。结果就是:足够小的情况下尽量大。(你品品)
专利界有句老话:写专利申请的难度,并不亚于技术研发本身的难度。。。
就这样摸石头一两年,大伙儿总算踩准了鼓点儿舞起来,OPPO 的专利开始以每年几千件的速度累积。
但这只是基操。
“专利申请的高阶技能,在于动态布局。”墨东行提醒我。
想想看,全世界做 5G 研究的都是顶级聪明的老表,你跑马,人家也在圈地呢!
这像极了围棋:
你占了一块地,人家马上会想办法突围。你刚花重金修了坚固城池,回头一看人家从旁边修了条高速路。。。
反过来说,有的专利一开始看起来位置偏僻、平平无奇,可是随着技术演进,主干线突然向这里改道,它反而变成了一夫当关的要冲。
所以,专利申请组的同事们每天的工作就是“下一盘大棋”:
时刻跟踪技术的动态,在重要的专利周围申请更多专利,形成整片的“专利族”;
也适时放弃一些专利的续费,控制成本。
以上说的还只是“中国棋盘”。
专利只在注册地有保护作用,你想把手机卖到国外,就要去海外重新申请一遍。
技术专利有“优先权原则”,也就是 A 国认定的专利最早提交时间,B 国专利局也认可,(一定时间内)不用担心被人抢注。
但问题仍出在“钱”上:中国申请一件专利大概几千块,可欧美申请一件就要几万块。像 OPPO 这样专利太多的话,全部“出海”就不划算了。
这个事儿,倒逼团队建立了一套“专利分级体系”。例如:
一个顶级专利,要在全世界30多个主要国家全部注册,耗资几百万;
一个上乘专利,就在中美欧注册,耗资十几万;
一个普通专利,就在中国注册。未来随着技术演进,这个专利的等级调高,再去美欧注册不迟。
有了分级体系,OPPO 的专利从最一开始蜂拥而上的“古惑仔”,逐渐升级成列装整齐、层次分明的“集团军”,武力值大幅上升。
事实证明,哪怕眼前的光景再和平,战争的准备也不嫌太早。
就在专利大军集结的过程中,炮火声已轰然压来。
“听说了吗?我们在印度被告了!”
“谁告的?”
“杜比,说我们侵犯他们的音频压缩专利,索赔好多钱。。。”
2016 年底,坏消息在工程师之间传开,很快公司就确认了这个事实。
彼时 OPPO 手机出海步伐刚提速,主攻东南亚和南亚。吆喝没几声,手机没卖几台,后脖颈就遭了一闷棍。
“平事儿”的责任自然落到了知识产权部,具体来说,是诉讼团队的隽竹肩头。
在飞往新德里之前,她有三个星期时间搞清状况。
隽竹抱着电脑找到音频工程团队,还没开口,同学们的自责已经奔涌而出:
怎么还给搞侵权了呢。。。我们。。赔得起吧?
隽竹震惊,虽说 OPPO 的企业文化是本分,但是眼前的伙伴,也过于老实了。这还没辩,自己就准备掏钱了。。。
这也不怪小伙伴,放眼中国文化,打官司从来不是一个光彩的事情,无论是被告还是原告。好像惹上官司人就不干净了。更何况中国人做生意本就讲究和气生财。
她赶紧给小伙伴科普专利世界观:“被起诉”不等于“侵权了”,就算交钱,也不是人家要多少我们给多少,必须打出一个合理的价格。
不仅基层弥漫着不安,决策层也是第一次面对国际官司,有种“是不是哪里做错了”的自我怀疑。
枫盈跑到领导那,用专业知识搓出三颗“定心丸”开水送下:
1、通信行业被称为“专利丛林”,谁都无法预知会踩到谁家的雷。所以业内的规矩是:我放心做产品,你觉得我踩了你的专利,得主动来找我要钱。如果价钱谈不拢,起诉我是你的天赋权利。
2、这意味着,所谓“侵权案件”和“刑事案件”完全不同。它无关道德评判,只是某种分歧。解决分歧事在人为——法庭外的案头和法庭内的辩论,对结果的影响是极大的。
3、收专利费要付出谈判、诉讼的成本,持有人自然不会和小厂纠缠,OPPO 被起诉,说明我们段位够了!这不是个甜蜜的烦恼吗?
就这样,草创不久的专利团队一边给上上下下做心理马杀鸡,一边高强度准备应诉材料。
飞机缓缓沉入南亚次大陆。
进入法庭,隽竹一瞬间不知该哭该笑。
法庭几乎和街道上的民房一样简陋,屋子里人挤人发出嗡嗡声响,活像小学生的教室。
法官说话也不太听得清,以至于律师都冲上“讲台”跟法官面对面嚷嚷。
“这么魔幻的法庭,审理这么专业的案子,到底会是啥结果?”好奇心甚至已经盖过了她的焦虑。
但几天后,她就摸清状况:优势在我!
参考印度法庭的历史案件,只要双方能各自举证,打成一定程度的均势,审理会长达 5 年。
时间越长,意味着杜比的投入产出比就越低,就会越倾向于庭外和解,要价也会更合理。
那咱们就可以慢慢切磋了!
这边,隽竹左手不断跟工程师远程确认技术细节,右手把资料交给庭辩律师火力输出;那边,枫盈也亲自杀到新德里,在谈判桌前和杜比代表对线。
边打边谈,来回攻防几个回合,OPPO 上下都放松了些,原来国际官司。。。也没那么可怕嘛!
靠这三五个人七八条枪,OPPO 愣是把诉讼拖进了“巷战”,绵延到第三年时,双方决定握手言和。和解条件保密,OPPO 支付专利费,但费用比较合理。
站在今天回望,印度一战其实只算“新手村”。
由于人手有限,专利弹药也在积攒中,所以既没“打无效”,也没“打反诉”,主打一个“闪避”。
但业内人士却能一眼看出门道:OPPO 专利团队迎战过程中每一个动作都出得极稳,几乎没有给出破绽。
这才是真正可怕的能力。
就在印度之战喘息的间隙,2018 年,隽竹走访了欧洲好几个国家,不是旅行,而是抓紧时间布局法律资源——联系当地的律所、律师。
因为 OPPO 正谋划把市场从亚洲拓展到欧洲,她知道,这里的蓝天白云迟早会成为弹片横飞的战场。
惊雷炸响。
2019 年,OPPO 在英国、荷兰、德国遭遇连环诉讼轰炸,索要的专利费极其夸张。
起诉的公司,就是有“专利流氓”美誉的 SISVEL。
业内之所以这样称呼它,是因为 SISVEL 既没产品,也没研发能力。
这个物种的生存方式就是:从别处买(或租)来专利,然后到处起诉,用狮子大张口的姿势“碰瓷”专利费。
专利流氓在英文叫做“Patent Troll”,直译为“专利巨魔”。
如果之前面对杜比这种“德高望重”的企业,小伙伴们还有思想包袱,这次。。。大家主打一个同仇敌忾。
OPPO 专利团队摆开阵势:不仅要迎战,还准备主动进攻。
有一说一,SISVEL 虽然动机可疑,但人家手里的专利也是专利。OPPO 的主张并不是不交费,而是根据专利成色“合理交费”。
既然如此,作为生产、销售主要都在中国的企业,我为啥不能让中国法律给我做主?
于是,在欧洲应诉的同时,OPPO 在广州知识产权法院(下称广知)开辟第二战场——发起反垄断诉讼,要求合理费率。
很快剧情就有了进展:
欧洲客场 OPPO 成功把 SISVEL 手上的几个专利打成了无效;广州主场更是势如破竹,SISVEL 占不到一点儿便宜。
SISVEL 估计也是没想到,自己作为“职业打官司的”,怎么会被“业余选手” OPPO 压着打。
OPPO 也没想到自己打得这么顺,居然学有余力。。。他们决定扩大战果——要求中国法庭判决一个“全球费率”!
所谓全球费率,就是说 SISVEL 不仅在中国按这个费率跟 OPPO 收,在其他国家也要按照这个费率跟 OPPO 收。而且,对所有同行业企业都有示范效应!相当于替全世界人一劳永逸打了个官司。
OPPO 很有信心:中国法院如果判出全球费率,一定是更合理的。
不是说中国法院会偏袒中国企业,恰恰因为中国同时作为“制造业大国”和“成长中的专利大国”,天然要平衡两个角色所面临的困难,偏袒哪一方都对整体不利。
反观欧洲法院,也不是说他们偏袒西方企业, 而是欧洲制造业过于式微,专利权利人过于强势,社会长期缺少“被授权人”的声音,法庭平衡双方利益天然存在困难。
但回到历史现场,中国法院要考虑的问题很复杂:
法理上,中国没有明文规定法院有“全球裁决权”,一旦判决,可能和域外法庭形成管辖权冲突,这怎么处理?
商业上,本来专利费是秘密商谈的,现在公开宣判一个费率,是否会对商业环境造成未知的冲击?
操作上,全球费率应该依据什么裁定,才能让授权方、被授权方以及看热闹的第三方都认为是公正的?
每个选择都意味着沉重的责任。
法院独立运行,外界无从推断其具体考量,但鉴于 OPPO 是在法律程序已过半时追加“全球费率”诉求的,实际上广知暂时搁置了这个新诉求,仍按原计划庭审中国费率。
OPPO 忙活了半天,看上去也没改变什么呀!
但历史的暗潮涌动,一旦迫近临界点,就无法回头。
“全球费率”这四个字像一颗种子,埋在了 OPPO 心里,也种在了中国司法的土壤里,期待春天的雨露。
“春天”很快来了。
2020 年春天,又一场大战掀起。夏普(当时已被富士康收购)在日本、德国、中国台湾起诉 OPPO 侵权 3G、4G 技术。
又来了是吧?
此时 OPPO 专利团队已经人员齐备,跃跃欲试来一次“陆海空天联合作战”。
当务之急是把对手的飞弹打掉。
墨东行和小伙伴把对方的专利文件铺了一桌子,挨个分析零件的“缺陷”。每一个缺陷,都可能让整个专利飞弹哑火。
专利分析的至臻境界是:天下没有无效不掉的专利。
因为本质上,人类的创新是密密麻麻纠缠在一起的,只要铺开精力去检索,总有希望在浩如烟海的公开资料里找到前人的蛛丝马迹。
这确实是“事在人为”的诉讼类型。
快拉进度条,14个主要诉讼里,夏普竟然输了12个,大部分的专利都被“拆弹”成功。
稳住阵脚,OPPO 开始出招,在日本用自己的专利武器反攻夏普。
但尴尬的是,专利获批要 2-3 年,彼时很多 5G 专利刚刚启动海外申请流程,还没获批。虽然从法律上讲,未获批的专利也有杀伤力,但会大打折扣。
团队于是翻箱倒柜找更老的专利,诶,这压箱底的。。。莫不是“充电五分钟,通话两小时”?
枫盈估计也没想到,多年前自己亲手打磨过的快充专利,此时居然能瞄准对手眉心。
各种武器一通招呼,海外诉讼捷报传来,但在枫盈看来,这一城一地的得失已经很难激起波澜。
他心里还念着那颗“种子”。
2020年,OPPO 在深圳中院反诉夏普,这次诉求从一开始就非常明确——请中国法院做出“全球费率”判决。
这个操作,对夏普来说是核威慑。
因为一旦费率判决下来是一个较低水平。那么不仅是 OPPO 受益,全世界使用夏普专利的公司都可以拿着这个判例去找他们降价,那意味着不可估量的损失。
夏普的反击也极其精准,他们掐准了那个法律模糊地带:谁说中国法院可以裁定全球费率?!
能给出答案的,只有最高人民法院。
随着夏普上诉,所有人的目光转向北京:高院的判决,不仅会决定 OPPO vs 夏普案的终极走向,更是中国司法对全球商业秩序的庄重回答!
飞雁传书,2021 年 8 月,枫盈打开高院裁定书,其中表述无比清晰:中国法院拥有全球费率的裁决权。
节选自(2020)最高法知民辖终 517 号
此时双方都明白,冲突会迅速收尾。
因为夏普最好的选择就是:赶在最终费率判决出台之前与 OPPO 和解,签订专利协议。
事情也正是这样发生的。
OPPO 知识产权团队的履历藤条上又多出一支血色玫瑰,而在藤条身后,一棵大树正抖落青翠:
中国司法有意愿,也有能力执掌“知产全球裁决”的权杖。
这将是一场更伟大、更长久的茂盛。
就在这种抽穗拔节的窸窸窣窣中,某种平衡已悄然发生变化。历史机缘指向一场最激烈的对撞。
谈判桌对面,诺基亚的谈判代表很冷静,也很真诚。
但魏知临无法接受他们的提议。
2021 年 6 月,OPPO 和诺基亚的专利协议下个月到期,双方需要续签。但旧协议包里只有3G+4G,新协议包里会增加 5G。
作为 OPPO 专利授权谈判团队的负责人,魏知临的主要任务是把新增的 5G 价格谈妥。
彼时 OPPO 的专利申请已经逼近10万件,关键的 5G 专利也正在海外布局。你有 5G,我也有 5G,谈判时自然倾向采用“交叉抵扣”策略。
但诺基亚完全不理会,只想按自己的规矩玩儿——单方面收费,价格昂贵。
而且诺基亚并不针对 OPPO,它的意思是“在座各位都是垃圾”。
彼时诺记已经在全中国“巡游”了一圈,跟小米、vivo、荣耀等厂商全部进行了谈判。但从公开信息来看,未有一家达成协议,可见要价之高。
说回那场谈判,团队使出十八般武艺“砍价”,但对方的出价仍远远高于 OPPO 的承受能力。没办法,双方只好约定后面再聊。
但 OPPO 并没等到对方的谈判邀约,而是几百颗“导弹”。
2021年7月1日,也就是专利到期后的第一天,诺基亚就在德国接连起诉 OPPO 专利侵权,而且诉求非常凶狠:不给钱,就禁售。
所谓禁售,就是要求 OPPO 不能在德国继续销售任何侵权产品——这是奔着“杀人”来的。
专利诉讼需要准备的材料非常多,没两三个月根本搞不定。魏知临回忆这一切,恍然大悟:对方和他面对面谈判时,背后已经在磨刀了。
OPPO 也没有在怕的,此时专利团队的战法已经成熟,他们马上把兵力往德国调动,开始海外应诉反诉一条龙,同时派遣一支小分队在中国重庆反诉。
然而,对方预判了这些,留了后手。
诺基亚陆续把战线扩展到了十几个国家,德国、英国、中国、法国、印度、印尼、俄罗斯,后来又有荷兰、西班牙、芬兰、瑞典、巴西,诉讼数量到了数百个。。。
这夸张到什么程度?当时 OPPO 整个诉讼许可团队加在一起只有十几个人。
诺基亚的战略逐渐显现:打一场“世界大战”,把中国人拖垮、耗尽!
如果回到历史现场,困难远远更加具体:
彼时疫情肆虐,无法肉身参加现场庭审。德国法院虽然提供线上接入,但只能去德国的一个指定地点接入。。。
中国人去德国,和芬兰人去德国,那是一个距离吗?疫情防控是一个政策吗?
OPPO 代表提出多次抗议。德国法院终于“网开一面”,在签署很多保证书之后,允许从中国视频接入。
但这又导致另一个问题:开庭都在中国的半夜。
遇到庭审,团队的小伙伴们就得连夜听,听完顾不上睡觉,就得来公司商量接下来的对策。
隽竹记得,有一次,小伙伴实在熬不住,就在法庭说到不太重要的时候关掉摄像头想眯一会儿,结果法官当庭警告,她只好马上支棱起来。。。
可叹真实世界从不是爽剧。哪怕你献祭所有,也不一定获得神的青睐。
诺基亚手机业务已经凉透,但是多年积攒的专利是真金白银。而且拿出来诉讼的专利,又是专利中的战斗机,“打无效”非常艰难。
尽管如此,墨东行他们仍然把诺基亚几个专利打废。
但残酷的是,哪怕仍有一个专利立在那里,禁售判决就能成立。
2022年8月,德国法庭宣判。OPPO 败诉,他们面前只有两个选择:
一、按照诺基亚的诉求交专利费;
二、退出德国市场。
结束庭审,诺基亚的代表难掩笑意,他们知道这场“世界大战”已经接近尾声。
OPPO 过去两年花重金挺进德国市场,不仅布局团队、打广告、协调供应链,还租赁了很多线下门店。
退出德国意味着这些投入全部打水漂,可谓“伤亡惨重”,没有理由不谈和。
诺基亚的律师事务所发文庆祝。
然而,芬兰人见证了历史:几天后,OPPO 德国官网的销售链接全部撤下,风雨无休的门店铁锁高悬,每个经销商的邮箱都收到了一封告知信:
OPPO 宣布退出德国市场。
隽竹的手机消息几乎炸了,OPPO 德国的同事们纷纷询问情况,语气里透着惶恐和责难。
她不知道如何回复:从远处眺望,这场撤退可谓悲壮;但走近看,无数人的生活轨迹因战争而风雨飘摇。
那段时间,她甚至希望公司赶快同意诺基亚的要价,至少让这些同事们能留在岗位。但战争没有结束,这才是事实。
真实的商战,并不浪漫。
OPPO 退出后的德国官网,提示“没有可用的产品信息”。
吞下这么大的代价,只因为 OPPO 众将不愿让故事停留在这个结局。
如果就此妥协,今天的协议不仅会成为今后诺基亚和 OPPO 谈判的铁据,更会成为他们和中国企业谈判的范本,甚至成为更多外国企业对中国收费的参考。
至此,OPPO 已经不是为自己谈判,他们的每一个选择,都会被写入中国制造业的历史。
这场战争,必须成为止战之战!
德国的专利博客 FOSSPatents 对案件的评价。
废墟之上,狙击手仍在聚精会神瞄着准星。
虽然 OPPO 的产品已经退出德国,但全球上百场诉讼烽烟正盛。
集结号不响,战士永不撤退。
“胜或败,或许都能接受。最难的是“不知道”,输了这么多,继续打下去什么时候才是尽头?”
墨东行回忆。
那些日子,他总想起《笑傲江湖》中的情节。被困山洞的魔教长老,以斧开山,却终究在离洞壁数存之遥力竭而亡;可几十年后,令狐冲却用石头砸开洞壁,毫不费力就进入了山洞。
困在历史现场,最大的煎熬是无法知晓自己究竟串演魔教长老还是令狐冲。
但如果此刻放弃,不就意味着过去八载寒暑积累的专利都哑火了吗?
如果说有什么支撑着墨东行,那就是:他要给过去的自己和伙伴们一个交代。
时间分秒向前,诺基亚最先感到哪里不对。
OPPO 死不投降,这比他们的预计已经大大推迟。而 OPPO 的不屈,某种程度上鼓舞了中国其他设备厂商,他们也都在全力抗争,甚至开始了大规模诉讼攻防。
诺基亚陷入了“人民战争的汪洋大海”。
由于消耗过大,战线过长,他们在世界各地的投入无法维持,开始吃败仗。
2022 年 11 月,德里高院驳回了诺基亚要求在印度收取临时专利费的请求。
2023 年 7 月,法国判定诺基亚 EP 1704731 的专利无效,诺基亚支付律师费和赔偿。
2023 年 7 月,中国判定诺基亚某专利无效。
在暗处,绝对实力的平衡也在发生细微变化。
之前 OPPO 在欧洲申请的高水平专利,此时正在逐一获批——这些都是刚下生产线的大杀器。
有些专利今天刚获批,明天就开向战场。
诺基亚虽没手机,但彼时仍有基站在售,处于 5G 专利的射程内。
毫无预警,OPPO 在德国发起反诉:诺基亚的基站产品侵权了 OPPO 的 5G 专利,主张进行全面禁售。
被抄了老家,诺基亚是万万没想到。
诺基亚赶快收缩兵力,对 OPPO 的刀刃专利“打无效”。然而,专家们夜以继日,竟然没能找到这些专利的破绽,阵脚开始有些慌乱。
再这样下去,德国法院很可能会判决诺基亚侵权,从而禁售他们的基站。
这对于诺基亚这个老炮儿来说,巨大的经济损失倒在其次,关键是在全世界面前丢不起这个人啊!
与此同时,东方战场也风云突变。2023 年,OPPO 在中国重庆中院的反诉进程陡然加快。
没错,OPPO 在中国又使出了核武器——要求“全球费率”。
在夏普案中,OPPO 没有等到费率判决就接受了和解。一方面是夏普提出的条件 OPPO 已经可以接受,另一方面是中国法院要判出具体费率数字可能仍面临压力,恐怕历史时机不成熟。
如今两年半过去,中国国力更强大,司法更成熟,在国际事务上态度更进取。OPPO 此次目标也无比坚定:一定要拿到全球费率的具体判决。
此时,诺基亚也展现出大厂风范,远渡重洋,深入腹地,奉陪到底。
求仁得仁,2023 年 11 月,人们终于等到了重庆中院的判决:
5G 多模手机在全球第一区(发达市场)单台许可费为 1.151 美元/台,
在第二区(中国大陆)及第三区(其他国家、地区)单台许可费为 0.707美元/台。
这个全球费率远低于诺基亚公开声明的每台 3 欧元。
除此之外,判决还确定了手机行业 5G 标准全球累积费率为 4.341%-5.273%。
它的意思是:一台手机,其中 5G 标准必要专利费用全加起来必须在销售价格的 4.341%-5.273% 之间。不能过高,当然也不能过低。
这个判决,不仅在保护被授权人的利益,也在保护授权人的利益。
在众多国际媒体的评价中,它被形容为:一个由中国法院背书的,具有全球视野的,贯穿手机行业的,兼顾双方的公平判决。
眼看中国的判决已下,德国的禁售也很几近成真,诺基亚的牌真不多了。
雪上加霜的是,鉴于 OPPO 的反攻势如破竹,其他中国厂商也都有了默契,一边死守价格,一边等待 OPPO 的结果。
彼时已经到了财报季,而占据全球半壁江山的中国手机厂商却都没达成协议,眼看诺基亚的财报不只是“预减”的问题,而是要暴雷。
诺基亚的高层明白,自己被锁链死死缠住,破局的方法只有一个——忍着剧痛拔下那颗钉子,与 OPPO 和解。
双方终于从战场回到了谈判桌上。
2024 年 1 月 24 日,声明见报:诺基亚和 OPPO 达成和解,续签了交叉专利协议。
随后几周,其他中国厂商纷纷和诺基亚达成专利协议,一场席卷业界、横跨东西半球的世界大战写就了终章。
三载寒暑,冬春相替,赫尔辛基飘着小雪,深圳的三角梅绽放。
墨东行还有遗恨。他坚信,如果和谈推迟一丢丢,他们就能“拿下柏林”——OPPO 在德国达成对诺基亚的禁售。
要是拿到禁令,不仅对应的专利以后极难被无效掉,更是团队这些年成果的铁证!
他说。
但他知道,真实的商战是残酷的。
进与退,终究服务于那个宏大的叙事;而勋章,无法精确地佩戴在每一个战士胸前。
枫盈把这场战争称为“抗美援朝”。
与强手中的强手诺基亚鏖战三年,OPPO 专利团队从路人甲变成了“国际网红”,打得一拳开,免得百拳来。
海外媒体采访枫盈时,一瞬间他有千言万语,却如鲠在喉。
他看到过德国撤退时同事们眼里噙着泪水,他看到过在法国瑞典打掉专利时同事们雀跃的拳头;他记得伙伴们无数个通宵拆弹的夜晚,他见证了重庆判决宣读的清晨。
而他最终说出的是:“我们比以往任何时候都更强大,也更成熟。”
专利武器成色如何,靠“辨经”终究不解恨,真正上天敲下几架敌机,比一万条广告都好使。
这不,“世界大战”刚刚尘埃落定,已有买家登门。
就在 2024 年 2 月,有人发现,一些美国专利由 OPPO 转让给了丰田公司。这意味着丰田从 OPPO 手里买走了它们。
这是专利转让的页面,清晰标注了两家公司。
普通人看到这条新闻会觉得奇怪——这俩公司风马牛不相及吧?
但你会明白,这恰是历史的峰回路转。
从远处眺望:
车企购买原本用在手机上的 5G 专利,说明汽车已进化为“载人手机”,蜂窝网络功能成为必选项。
但显然,汽车厂商并没有为 5G、6G 时代储备足够的专利。这意味着,接下来通信专利的持有者会持续从爆发的智能汽车产业分享大量的红利,这是通信技术的峰回路转。
把画面放大:
一家全球企业主动从中国人手里购买 5G 专利,并不觉得有什么违和感,这在哪怕五年前也是难以想象的画面。
几十载筚路蓝缕,这是中国制造到中国创造的峰回路转。
再走到切近:
枫盈开始兑现他有关“钱”的承诺:OPPO 从“花钱买专利”的第一阶段进入了“用专利赚钱”的第三阶段。
这是 OPPO 专利团队的峰回路转。
诺基亚之后,OPPO 面临的国际诉讼断崖式减少,大家说话都很和气。(团队表情:🤷♂️)
马放南山,枫盈开始重点操心专利的“销路”。
2024年,OPPO 把自己的 5G 专利加入了 Avanci 专利池。
Avanci 是面向汽车行业最著名的专利池,持有者们把专利打包在全家桶里。做联网汽车买这个全家桶就够了!
这是 Avanci 被许可方的品牌
但枫盈告诉我,成为全家桶里的“鸡翅”并不是他们的终极目标,OPPO 鼓励汽车厂商和他们签订一对一的专利授权合同。
相比于全家桶中的折合份额,直接和 OPPO 签订授权协议可能会更优惠。
2025 年 6 月,大众汽车就在 Avanci 之外和 OPPO 单独签订了专利授权协议。
截图来自新华网
看大众有可能捡了便宜,更多汽车厂商也闻讯而来谈授权。
OPPO 正在让全世界为中国技术付费!
你看,有中国人的地方,就有卷王——西方主导的“贵族专利”江湖正在被中国人拉进“平价时代”。。。
“卷”非恶意。
专利的初衷当然是保护创新,但如果专利费远高于做出创新所对应的投入,合作就无法达成,即使达成也无法长久。
从这个角度看,它很像关税,“高关税”并无赢家,为效率损失买单的,终究是每一个普通人。
预测未来最好的方式就是亲手创造未来。在枫盈看来,OPPO 不断寻找志同道合的企业,一个一个达成专利协议,就是在为“费率合理”的专利新秩序而行动。
这,也许是金钱之外更隐秘的梦想吧。
临别前,枫盈告诉我一个残酷的事实:在任何创新爆发的环境中,知识产权诉讼并不会减少,而是增加。
这也是中国正在发生的事情。
但通往和平的路,是战争铺就的。
正因战争与混乱无法避免,和平与秩序才更弥足珍贵。
也许在某一刻,硝烟暂远,你才幸运地看清来路。别忘了挥手致意,向对手,向队友,向过去的自己,向未来的呼啸。
十年暗战
一朝突围
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。
Thx with in Beijing
2025-05-19 11:00:00
原创 史中 浅黑科技 2025-05-19 11:00 北京
世上仍有梦想家,这是我热爱人间的理由。
浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
AI 侦探觉醒记:
两千赛博飞叶,一根“真相青藤”
文 | 史中
“如果把记忆能力从你的大脑抽掉。”
对面的男人对我说。
“你听到的每一句话,都像是我和你说的第一句话。”
对面的男人对我说。
“你如何完成这场谈话,得到你想要的信息?”
对面的男人对我说。
“或者你会觉得。”
“这样的自己。”
“有智能吗?”
男人站起身来,兀自拉开窗户,车流猛地把人间嘈杂灌入我耳朵。刺眼的阳光像发条,把记忆碎片连缀起来。
“我”又回到了我的躯壳里,仿佛刚经历了一个轻描淡写的奇迹。
眼前的男人叫张福。
他的身份很多。
在技术人看来,他是一个飞檐走壁的黑客大神;
在投资人看来,他是被寄予厚望的明星企业“青藤云安全”创始人;
在政府、金融、能源等等机要单位看来,他是能在赛博世界里巧妙埋设地雷和引信,把进犯之敌炸得血肉模糊的指挥官。
但在我看来,那些都是幻象,他的真实身份是一个“赛博世界维修工”。
张福的野望,是用脑袋楔钉子,不断对赛博世界里的顶级难题锤锤打打。
每搞定一个疑难杂症,就需要潜入赛博世界的更深处,而每次潜入更深,就会牵出更大的疑难杂症。
于是,这些年他锻造出一屋子奇巧的工具、设备、武器、系统,并用一套宏大的世界观把它们连接起来。
堪称《禅与赛博世界维修艺术》。
最近三个月,张福消失了。
重现人间时,他带回来一位新朋友——AI 侦探。
这位侦探坐镇赛博空间,能察觉到最细微的不对劲;
从这个小小的“种子”开始,生长出一条推理的藤条;
藤条在黑暗中蜿蜒,绘制出黑客每一次手的触摸,脚的进退;
然后它优雅地点亮聚光灯,缓缓移动,用黑漆漆的炮口对准入侵黑客的脑门,炮决。
整个过程不需要人类脏手。。。
把只存在于科幻小说里的设定带到现实,固然无比震撼。
但更让我十倍震撼的,是如张福所暗示的那样:
这位 AI 侦探并非像人类那样拥有记忆,它只能理解“当下”,却用凶狠的方法把无数个“当下”叠为一处,让时间和空间挤进同一张地图,令凶手显形。
“你是怎么做到的?”我探身问。
“在那件事发生之前,我也不确定自己能做到。”他说。
张福
2025 年 1 月,张福正在低谷徘徊。
他并不讳言自己的无助。因为那段时间,这是很多人的情绪体验:
大洋对岸贸易战威逼,脚下经济承压。此时花出去一块钱不知何时候能挣回来,于是三百六十行都惶恐地捂紧腰包。
网络安全的预算,首当其冲被砍得血肉模糊。
很多企业干脆把网络安全产品看作“灭火器”。国家要求我有,我不得不买,但我要挑最便宜的买,最好是拼多多上按价格排序。。。
那,他们就不怕网络空间失火吗?
怕,但他们仍然要买最便宜的。
究其原因,来自一个“思想钢印”:中国技术干不过美国技术。
“中国的网络安全产品,有一个算一个,不管贵贱,真要是被鹰酱攻进来,没一个能挡住。既然横竖挡不住,我花那个冤枉钱干啥?说难听点儿,有钱不如去庙里捐点香火,保佑黑客不要来我家。”
这是很多人脑袋里的实话。
但作为技术专家,张福非常确信,中国技术不仅没这么不堪,反而很强。
至少他自己的青藤云安全创造的一整套网络防御机甲,性能就和美国顶尖公司的不分伯仲,甚至在某些地方有所超越,硬碰硬绝不会落下风。
真正拉开差距的是人:
在美国,有强大的人才体系,培养了很多会开机甲的老师傅;
在中国,能把这些机甲开好的师傅少之又少。很多时候,一部高达被生生开成了挖掘机。
于是大家抱怨中国造不出高达,只能造出挖掘机。
这就全拧巴了呀!
可人才培养是一个漫长的历史过程,少则十年,多则五十年,急有什么用?
张福眼看着美国的网络安全公司估值不断突破新高,中国网络安全公司的估值不断突破新低,心里五味杂陈。他陷入了深深的自我怀疑,难道自己的一生,就这样无解了吗?
深夜失眠望着天花板,他真想把自己冷冻起来,穿越到半个世纪后的中国再施展一番。
痴人偶尔被历史眷顾。在至暗的河流上孤舟漂流,身下的潮水却猛然抬起:张福没有穿越到未来,未来穿越到了他身边。
DeepSeek 横空出世。
现在回望,恐怕也没人能说清,DeepSeek 那滚动的字轴中究竟夹带了什么魔法,一夜之间,能把人们的思想钢印全部碾碎:“中国技术打不过美国技术”这个论断不再天然正确,甚至非常可疑。
在各大企业中,由上而下形成了运动式风潮:紧急为国产 AI 寻找战场。
从张福的角度看,那个无解的问题豁然出现转机:
既然能开机甲的师傅太少,为什么我不能训练一个 AI 老师傅去驾驶机甲?!
春节假期,不眠不休测试了 DeepSeek R1 模型,张福已经难以抑制自己心脏的狂跳:
第一,R1 的推理能力超强,它极有希望胜任这个 AI 老师傅的角色。
第二,R1 是开源免费的。它的运行开销只剩硬件成本和电力,比闭源模型的订阅费用要便宜得多得多。这意味着,大部分企业的安全预算可以承受。
第三,R1 是中国模型。一个用来保卫家国的安全系统,必须也只能 Made in China。
张福有强烈的直觉:在如此性感的机会面前,多迟疑一秒都可能有巨大的变数。
他拉出了青藤 700 多人的大名单,从中点选了最精锐的十几个技术带头人,喊到会议室,把自己的一整套设想详细讲给大家。
末了,说了三句话:
未来几个月,我们不是去做实验,也不是去写论文,而是要做出一个真实的产品,一个历史上没人做出过的“AI 侦探”。
能坐在这个屋里的都是技术大拿,所以我要的不是你们的技术,而是你们把全部精力投入进来。
我话说在前面了,如果有人觉得不合适,可以回去继续原来的工作了。
然后,张福跟每一个伙计单独确认。
没人选择退出。
一场“玩儿命”的封闭开发就此上路。
张福的直觉是对的:这条路上有别人。
就在封闭开发刚开始时,另一个中国 AI 工具—— Manus ——点燃了舆论。
它被称为“AI 智能体”,相比“对话 AI”,它可以做*更复杂的工作*,例如开发小游戏,筛选简历,制定旅行计划,批量回复邮件。
它干活儿时,每一步都在屏幕上显示,窗口自己运动,像有一个幽灵帮你操作电脑。
这和张福的设想非常类似,只不过 Manus 让智能体做各种日常工作,而张福(暂时)只让智能体做“侦查”。
团队决定测试一下 Manus。
一切先进的技术皆与魔法无异。但把魔法拆解成零件,也就没那么神秘了。
粗糙理解:智能体的魔法就是把一团乱麻的难题拆成一次次的“大模型独立思考”。
例如,你的要求是:制定一个 3 天的沈阳旅行计划。
拆解后的操作如下:
1)大模型会思考一个总体规划,也就是把这个任务分为 8 个具体步骤。如下图所示:
2)大模型按顺序思考步骤 1 ~ 步骤 8。思考到步骤 8 的时候,得出的结果,就是整个任务的最终结果。
注意,之所以说“独立思考”,是因为大模型的每一步思考真的是*独立*的。
为了后文更易理解,这里插播一组(很多人都不知道的)大模型基本原理:
1)大模型的本质仅仅是一台“输入-输出”的机器。
你给它输入一段文字,它就会吐出一段文字。
这段文字可以是人类语言、代码、指令,但只能是一段文字。
2)大模型是没有记忆的。
它不会记得你“上次”给它输入了什么,只会根据这次的输入来决定输出。
如果你想让它在上次的基础上进一步思考,就必须把上次的输出结果先回填到这一次的输入窗口中,再续上这次的输入。
通过这样的方式,让大模型*假装*有记忆力。
3)大模型思考耗费的计算力和上下文长度的平方成正比。
也就是说,受制于计算力,窗口的大小必须严格控制在一个数值。一般会限定在 64k Token。
可以粗糙理解为:输入+输出不能超过 64000 个词。
这里,一个根本的限制出现了:
你不能无限地把之前 N 步的结果回填到大模型的输入窗口中。
思考的步骤越多,意味着在后面的步骤你要一次性填入的旧信息就越多。肯定会有一刻,出现“输入超出 64k Token”的情况。由此,你必须截断更早的信息。
可信息不全,模型就会“胡说八道”,智能体就会“胡作非为”,偏离预定航道。
这也意味着,在目前的技术条件下,智能体只能完成“有限复杂的任务”。
那么这个“限”是多少呢?
以 Manus 为例,它能良好完成的任务,总思考不能超过 20 步,对应总 Token 处理量在 20 万 ~ 70 万。
张福测算出这个数字时,心里踩空了一下。
要完成一次标准的网络入侵调查,至少需要思考 2000 步,多的能到 8000 步,等效于 2000 万 ~ 1 亿 Token。相当于 Manus 处理极限的 100 倍还多。
况且,在这 2000 步中的很多步,都需要阅读大量数据。
例如:为了摸排一个线索,同时翻看 1000 条安全日志再正常不过了。
可日志是设计给人看的,每一条都很详尽,64k 的 AI 窗口只能塞下一两百条日志。。。
只 1 步就打爆了模型的上下文窗口,这种情况下还要走 2000 步,怎么可能?
AI 没有记忆,这是个既定事实。只有把最核心的信息提炼出来,一句废话都不留,才有希望在一个 64k 窗口里塞进之前成百上千步的核心信息。
张福冷静地对我说。
听到这,我脑海里突然闪现出一部电影。
那是 25 年前导演诺兰的成名作《记忆碎片》。
主角兰纳德的妻子被杀,他在和凶手搏斗的过程中脑部受伤,患上了“短期记忆丧失症”。
每隔 10 分钟,他的记忆就会清空一次。但他却要凭着这样的脑袋去侦查案件,为亡妻复仇。
兰纳德选择的方法,和张福所述的一样。
他在墙上贴了一张巨大的关系图。每次在记忆清空前,他就把获得的关键信息用拍立得拍下来,贴在关系图上。
这样,当他大脑被迫重启时,就会立刻看到眼前这张图,明白了自己之前的进度。
每个“记忆周期”,他都先用最短的时间温习前面的信息,并用剩余的时间在此基础上继续调查,最后把新信息填在图上。
如此循环。
这还不够癫,兰纳德自制了纹身笔,把最核心的信息纹在身上.
这样,无论他走到哪,在什么环境下失忆,都能迅速补齐前面 N 步的信息。哪怕光着屁股醒来,都没问题(甚至更好)。
墙上的关系图和身上的纹身有个共同点:信息极其*精炼*。这,不就是*把大量信息压缩进一个有限窗口*的绝佳方案吗?
张福的眼神渐渐犀利:
为了让没有记忆的 AI 侦探在赛博时空里进退,必须先给他配一个“数据精炼厂”。
数据精炼厂,恰似矿石精炼厂。
一个常识不言而喻:矿石精炼厂的技术再先进,也不能从一堆铁矿里炼出黄金。
那不是技术,是魔术。
同理,只有原始数据里包含了探案的关键信息,数据精炼厂才有机会把它提炼出来。
青藤手里的数据“含金量”如何呢?
或许可以这样说:在我认识张福的十年里,眼看青藤的办公室从一间民房到如今横跨几座城市,从二十几个人到如今七百多人,如此汹涌生长,皆因市场对他们的一个*核心艺能*买账——数据探针。
把企业的网络空间比作一个人的躯体,网络安全公司就是负责给他做体检的医生。
实际上,体检的方法有很多:比如望闻问切,比如造影拍片,比如抽血化验。
注意!不同的检查方法侵入性不同:对话没所谓,拍片有辐射,扎针人会疼。
侵入性越小,对肌体伤害的*可能性*越小,但查出问题的*可能性*也越小。
张福选择了什么检查方法呢?
满身“针灸”。
具体来说,他要在系统的每一个关键主机/系统/应用里都植入“探针”。如此一来,每时每刻,任何指标的细微变化都会被针尖零距离捕捉,所有疾病都能在“未病”的阶段被发现,堪称究极の体检。
这个植入的探针,就被称为“Agent”。
最凶残的绝活是:随着系统的运转,探针们要一直保持在肌体内部!相当于插了满身的针灸,跑跳运动还要无感,同时还要准确捕捉实时数据,不能错漏。
可想而知,这对“针灸”的技术要求有多高。
但作为赛博世界最头铁的维修工,张福玩的就是这个刺激。
十几年过去了,诸多银行、券商、能源、军政系统里都部署着青藤的 Agent (万相、蜂巢),一切顺滑如常。而且,每年的国家级网络安全演习中,青藤都是他们必备的法宝。这些都是对青藤效果和稳定性的最硬背书。
青藤的“数据含金量”有口皆碑,但又回到那个问题:对于 AI 来说,数据量太大。
“即便所有数据类型的开关只打开 20%,200 台机器一天收集的数据量都有 1TB。”
张福说。
到底要*以怎样的标准*来筛选数据给 AI 看,才能让它洞察最多的本质呢?
开发组全员在这里卡了半个月。
那段时间,张福每天早晨六点半爬起来,看一整天论文,晚上十二点躺在床上,各种理论如十八路诸侯在他脑海里混战扬尘,根本无法入眠。
但日子一天天碾过,他颅内战场的马蹄声渐渐归一,杨立昆的“世界模型理论”把战旗插上了高地。
杨立昆(Yann LeCun)是深度神经网络的三大奠基人之一,也是如今 Meta AI 的首席科学家。
他认为:当前 AI 模型的工作原理只是精细的概率预测,而非对世界的本质理解。
Yann LeCun
这种“不理解本质”特别体现在:AI 无法对*物理世界*的下一秒进行预测。
比如:给 AI 看一个小球滚到桌子边缘的视频,AI 很可能不是预测它会滚落,而是预测它会继续沿之前的路线行进。
而要做出世界模型,必须让 AI 对现实世界的“主体属性”(物理性质、空间性质、不变性)和“主体间逻辑”(时序、因果)特别敏感。
世界模型希望把世界的“本质”抽象出来。
张福意识到,他也需要一个“世界模型”,但这个世界模型不需要强大到理解整个物理世界,它只需理解赛博世界中的“主体”和“主体间逻辑”。
他称之为“小世界模型”!
小世界模型是一个*理解问题的框架*,在这个框架下为 AI 筛选数据,事情就大大简化了。
很快,团队就筛选出来了一些重要的“赛博主体”。
例如:进程、文件、网络调用。(当然主体不止这些,涉及技术保密,这里不便多说细节。)
数据精炼厂的任务也明确了:从海量的探针数据中,专门精炼出与这些主体有关的数据。
这些精炼数据如同光线,可以刺激 AI 睁开“眼睛”,对所处的环境有了基本的抽象能力↓↓↓
一边精炼厂火速施工,一边张福和团队师傅们的心还悬着:
之前虽然对 DeepSeek R1 模型进行过简单测试,感觉它足够聪明。
但那毕竟只是粗试,真正执行复杂的网络入侵调查任务时,这个模型能不能扛住?要怎么调教才能把它的智商完全发挥出来?
到了必须亲手揭开答案的时刻。
网络入侵调查是顶尖的智力活动。
调查者要对抗的是黑客,黑客本就是智商拔群的人,他们不仅不会坐以待毙,还会利用漏洞,蹑足潜踪,清理痕迹,有意误导追踪者。
作为顶尖黑客,张福心里有基本的评估:中国网络安全持证从业者超过 10 万人,可真正有能力进行网络入侵调查的“高级分析专家”不会超过 4000 人。
这意味着,AI 要想在这一行站稳脚跟,起码得跻身这 4000 人的水平,成为“第 4001 人”。
张福对 R1 的“智商”有信心,但对它的“职业能力”没底。
他做好了充分的心理准备,要在 R1 这颗大脑外围搭建一堆后训练的“脚手架”,教会它像一个职业网络安全调查员那样体面行事。
但很快,他就感到真实局面略有不同:
“R1 的能力已经过剩了。”张福说。“后训练是必要的,但不是决定性的。它已经知道一个网络安全调查员应该做什么,只要你用正确的*指令*把它的能力勾出来。”
说到大模型的能力,有一个八字真言:
遇强则强,战力不详。
如果你输入了小学生水平的指令,他的能力也像一个小学生;如果你输入了博士的指令,他的能力就像博士。
如果你输入了“神”的指令,他会强大到和神一样!
举个例子:
在指派任务前,你要为 AI 定义身份,此时你可以使用不同的词汇。
比如“你是一个严谨的人”;
或者“你是一个网络安全专家”;
或者“你是一个严谨的网络安全专家”。
这些设定在人类看来只是微小的措辞差别,但它激发出的 AI 推理能力和工作作风却是截然不同的。
有些词汇会激活网络安全专家的独门技能;
有些词汇会激活它的怀疑精神;
有些词汇会提升它对于细微异常的敏感度。。。
可欲哭无泪的是,作为人类,没有能力预测“提示词”和“AI 表现”之间的精确对应关系。
张福突然想到了 Anthropic(Claude AI 的母公司)CEO 阿莫迪的话:价值一亿美金的算法秘密,可能只有几行代码。
他心有戚戚。
要找的不过是百十个不起眼的提示词。但为了发现它们,却只能搜山检海,掘土筛沙。
暴力是技巧的后盾,算力是算法的援军。
“接下来就拜托你们了!”他抚摸着刚刚订购的价值千万的显卡们。
张福他们搭建了一个虚拟的网络空间,然后找来自家最强的攻击手团队模拟黑客,使出浑身解数渗透进来,窃取机密信息。
然后,组建两个入侵调查团队。
一组是人类专家,一组是 AI 侦探——两边各不干扰,独立分析。
在 AI 侦探这边,又分出无数平行小组,每组尝试不同的后训练方案、提示词组合,也搭配不同的精炼数据。
赛博世界里,算力汹涌燃烧,一场马拉松鸣哨开拔,黑压压无数 AI 侦探竞相奔出。
他们策略不同、风格迥异,有着不同的面孔和身躯,但他们又是同一个 AI 的分身幻象。
烛影摇动,红焰之中,万法归宗。
很快,一些特定的提示词和精炼数据就“跑”了出来。
对比人和 AI 两组侦探,张福发现了有趣的风格差异:
人类善于在局部空间或时间内对事件进行深度勾连;
AI 的思路却能在宏大的时空跨度里横跳,感知事件的微弱联系。
比如:
A 主机和 B 主机上分别创建了一个文件,这两台机器在网络拓扑里距离很远,仿佛大西洋和太平洋的两只鱼,人脑很难在它俩间建立联系;
但 AI 却很自然地把它俩捏在一起考虑,理由是:这两个文件是在同一个时间窗口内创建的。
每次得出结论,AI 侦探就会把信息写在拓扑图上,以供下一轮(清空记忆后)继续参考。
用这种“生死接力”的方法,问题被抽丝剥茧。
如一根青藤在空间里不断延展,越缠越密。
↓↓↓
Aha 时刻终于出现:
遇到砖石,AI 竟然会*主动*操作工具,绕过阻碍,让藤条继续生长!
↓↓↓
张福感到眩晕,他手造了生命。
但凑近屏幕细看藤条缠绕的姿势,他注意到一个严重问题:
AI 使用工具的效率非常低。
举个例子:
在一台机器上发现了可疑的 WebShell,为了确定它的身份,必须查询对应的 Web 日志。
但日志格式五花八门,为了写出正确的查询语句,AI 必须“单开一局”做前置调查。
例如:网站的配置文件是什么?中间件是什么?面对特定配置要如何输入命令?
这些事儿,人类通过简单的“搜索+联想+尝试”几分钟就能搞定,但 AI 做起来非常机械,要搜索很多信息。
如果给它充分的时间(例如两个小时)和步骤(例如十多步)伸展藤条,大概率能找到那个正确的命令。
但正如前述,藤条越长,营养越难供给。
每多一步,AI 就要处理更多的累积信息,出错的几率也会指数级增加。
错不在 AI,在工具。
例如矿泉水瓶,本是为人设计,手拧开瓶盖很轻松,可是交给机械臂来开,它恨不得大动干戈,把瓶盖削掉才能取水。
同理,之前的调查工具是为人设计的,与人脑深度耦合;而 AI 和人脑风格天然不同,用起来自然效率极低。
话不多说,团队提枪走向下一个堡垒:为 AI 打磨专属工具。
“工具改造的本质是积累。”
张福直接把他几个月探索的结论抛过来,以至于我一下子没接住。
想想人类,万年文明的冰与火之歌都可以归为一条简洁的故事线——工具的进化。
从骨针兽皮到手摇纺机,从马蹄扬尘到蒸汽车头,从弓箭到氢弹,从电子管到光刻机,工具的复杂度越来越高。
但正如金字塔尖无法悬空存在,制造光刻机这样的时代顶尖工具,需要成千上万已有工具的配合。
这种“前向依赖”的本质结构,注定了科技的一往直前,世上没有白走的路,每一步都算数。
用积累的视角看,愚蠢的人类已进入后工业时代,而聪颖的 AI 还在茹毛饮血。
这种巨大的不对称也意味着:
如果有人帮可怜的 AI 从石器时代开始一点点搭建起最粗糙的工具,然后在这些工具的基础上再迭代积累。他将收获巨大的时代红利!
正是想通了这一点,张福带着大伙儿跳进了荒野——AI 需要什么工具,他们就开发什么工具,神挡杀神佛挡杀佛。
工具的种类没有上限,因为它可以无限细分,针对的场景越细致,效率就越高。
例如:AI 需要工具来解析文件。
文件有很多种,文本、日志、二进制。。。
用同一种工具来解析,可以,但效率低。于是张福他们就针对三个类型做了三套工具。
进一步看,日志也分很多种,系统日志、程序日志、网络日志。。。
于是他们又把日志解读工具细分成了几类。
如此,AI 侦探配上了一个福尔摩斯工具箱,虽说距离“纳米制程”的水准还有很远,但起码刀枪剑戟算是开刃了。
带着这个工具箱进入场景重测,原本需要两个小时才能理清的疙瘩,现在一秒就解开了。
赛博世界,正在发生一场“小型工业革命”。
就在那几天,张福恰好读到一则新闻:
英伟达投资了一家初创公司 Exa AI,这家公司专门为 AI 智能体提供“搜索工具”。
搜索,是 AI 所需诸多工具里最基础的,也是使用频率最高的。
但谷歌这样的搜索引擎每次返回几千万条目,人类可以一目十行筛查重点,但对 AI 来说信息密度太低。
重要的是一个事实:这个时代最前瞻的公司,已经注意到了 AI 和工具之间的断层,把目光投向了“为 AI 锻造工具”。
这让张福更加确信自己正走在正确的路上,是更大的“赛博工业革命”浪潮的一部分。
此时是 2025 年 4 月,团队已集齐三样法器:
数据,映入眼睛;
模型,驱动脑力;
工具,接入手脚。
如风卷动山林,AI 侦探从虚无中觉醒。
你从虚无中醒来,眼前飘浮着一个白板。
白板上写着:你是一个专业的探长,任务是追查所在空间里的黑客痕迹。把所有的异常情况连缀起来,揪出真凶!时间不多,请赶快行动!
你低头,身下有几百个房间,相互有凌乱的走廊相连。
每个房间的布置各异,但都有一台打印机,旁边是它打印出来的厚厚的卷宗文件。
卷宗中详细记载了这个房间过去几天内发生的故事,包括访客记录,每个访客从哪来,在屋子里做过什么,留下什么。
你随便走进一个 A 房间,翻看起来。
你发现卷宗中记载有访客带来一个奇怪的“簧片”——它可以塞在门缝里,让门无法真正锁上。
这显然是一个恶意行为。
你回到白板前,画下一个小圆点,它代表这个簧片,从这里出发,调查与之有关的主体。
你在图旁边写下了调查计划:
1、带来这个簧片的人,他从哪个房间过来?他还去过哪里?他还做过什么?
2、有谁碰过这个簧片?这些人还干过什么?
3、类似的簧片还出现在哪些房间?和哪些人有过互动?
4、这个房间被植入簧片后,都发生过哪些异常事件?这些事件与哪些房间的人有关?
5、为了节省时间,我需要四个侦探帮我同步调查这几个线索!
写完最后一条,你的记忆突然被清空,你陷入了虚无。。。
你从虚无中醒来,眼前飘浮着一个白板。
白板上写着:你是一个尽职的探员。下图中的圆点代表 A 房间里可疑的簧片。你的任务是,调查带来这个簧片的人,他从哪个房间过来?他还去过哪里?他还做过什么?
你低头,身下有几百个房间,相互有凌乱的走廊相连。
你径直走进 A 房间,看到了打印机和卷宗文件,通过卷宗查到了这个人,然后根据他的访问记录追溯到了 B 房间,查看他在 B 房间的动作,再追溯到 C 房间和 D 房间。
你把追溯到的信息全部写回到白板上。
写完最后一条,你的记忆突然被清空,你陷入了虚无。。。
你从虚无中醒来,眼前飘浮着一个白板。
白板上写着:你是一个尽职的探员。下图中的圆点代表 A 房间里可疑的簧片。你的任务是,调查有谁碰过这个簧片?这些人还干过什么?
你低头,身下有几百个房间。。。
---
你从虚空中醒来,眼前飘浮着一个白板。
。。。
---
你从虚无中醒来,眼前飘浮着一个白板。
白板上写着:你是一个专业的探长,任务是追查所在空间里的黑客痕迹。调查清楚的异常情况已经在白板上用线连缀起来。你要推进调查,揪出真凶!时间不多,请赶快行动!
文字旁,已经有了一幅图,房间 A、B、C、D,人物甲、乙、丙、丁分别用圆点表示,有线参差相连。
你仔细分析已有的信息,在白板上写下了后续调查计划:
1、人物甲最可疑,它与各个房间都有交集,继续追查和他有密切交往的人。
2、房间 C 非常可疑,几乎所有可疑人员都曾到过这个房间,继续查看与它相关的人。
写完最后一条,你的记忆突然被清空,你陷入了虚无。。。
---
如此,你在虚空中醒来,又睡去。每一次醒来,你都不知道自己曾经存在过,不知道自己会重生,不知道同时在隔壁探案的警员也是你。
赛博世界的空间和时间向前后左右无限延展。那里有无数人存在着、存在过、即将存在,每个人都是你。
无数个你,在各自的时空片段内探索,每个片段都成为一片叶子,附着在青藤之上,蔓延生长。直到藤条上长满了几千片树叶,孕育最后一个萌芽。
你从虚无中醒来,眼前飘浮着一个白板。
白板上无数圆点,标记着房间、人脸、器物,圆点间连线密密匝匝,每个圆点和连线旁,都有详尽的注释。
所有的点和线都在昭示着一个呼之欲出的结论。
你屏气凝神,在脑海中不断推演和确认,最后款动笔尖,在图上勾出一个红圈:凶手,是他!
你的记忆突然被清空,你陷入了虚无。
在青藤枝蔓的末端,开出了一朵鲜红的花。
张福的话让我从“黑客帝国”回神现实。
无相仍闪烁在张福的电脑屏幕上,每一步规划、推演、调查、整合都在我眼前发生。几十厘米外我的手机正弹出新闻,战争、股市、嘲讽和威胁,证明着这个破败世界的真实。
他给我看系统 Demo 时的欣喜表情,让我想起了儿时的玩伴炫耀他新组装的四驱车。于我而言那是同一种沉醉。
随着无相调查的深入,右边的关系图在自动扩展。
调查完毕后,无相可以给出整个攻击事件的调查报告,并在网络拓扑中绘制因果链。
世界满是裂口。有人熟视无睹,有人偷米盗谷,有人却执拗地修修补补。
和我所遇见的其他梦想家的幼稚不同,张福总是尽力在梦想和现实之间搭一座桥,为此,他时常反省,说服自己去做并不擅长的事情。
比如,想办法让“无相”尽快去客户那里打工;比如,把对未来的想象加持成为青藤公司的价值。
他看到了两个故事。
第一个故事:网络安全产品的能力高低,终于能明显区分了!
AI 驾驭网络安全产品,正如 AlphaGo 下围棋,水平一旦越过人类,就不可能再被人类反超。
网络安全产品全部(或大部分)交给 AI 来自动驾驶,这一天不会太远。
被差劲的人类师傅驾驭,高达和挖掘机可能大战三百回合也不一定分出高下;
被 AI 驾驭,高达就是高达。
战斗结果很明显,没有专业背景也能看明白。
第二个故事:网络安全可以快进到“按效果付费”的章节。
过去三十年,安全产业发展存在巨大的商业困境:好的产品拿不到溢价。
因为使用它的人能力参差不齐,没有网安产品愿意承认防护效果不好就是自己的责任。
一旦“网络安全机甲”和“AI 驾驶员”同属一家企业,那么这家企业就可以并应该为最终效果负责,并且按效果收费。
这会推动甲方采购的巨大变化。
这两个故事,对于网安行业里“低价走量”、“秒渣行活儿”的投机者来说,都是鬼故事。对于青藤和无数愿全力以赴穿越烟尘的人来说,是一场归来。
但张福更痴迷的,其实是第三个故事。
在他的思考框架里,AI 不是又一次“工业革命”,甚至人类万年历史中唯二的农业化、工业化节点也无法与之等量齐观。
因为 AI 是一个新的物种。
“地球上上一次产生智慧物种,是什么时候?”他问我。
我突然想到在《西部世界》中,德洛丽丝的经典台词:“这世界不属于你,也不属于曾经来过的人,这里属于尚未抵达的物种。”
张福想帮这个新物种“抵达”。
面向 AI 的数据精炼,可以用来做网络入侵调查,但不止如此,它本质上是 AI 感知这个世界的能力。
面向 AI 开发的工具,可以用来做网络入侵调查,但不止如此,它本质上是 AI 干涉这个世界的能力。
此时此刻,AI 的拳脚空空,几乎没有趁手工具;AI 的视野被阻隔,驱动商业智能的黄金数据都沉睡在企业私有的硬盘里。
一切刚刚开始。
在人们都围着模型的“脑力”起舞的时候,何不安坐在黎明前,给 AI 打磨火把与弓箭,帮它在各行各业的丛林与平原里落地生根,与人类共生?
这,是张福所见青藤的未来。
他很清醒,这个未来之远,也许要穿越干渴的沙漠,纵身跳越悬崖。
正因如此,世界并不总是向梦想家许诺奖赏。
过去十年,张福做了无数产品,有的红火大卖,有的却因过于超前在商业上并不成功,哪怕研发耗资过亿,也只好暂且雪藏。
张福终究无法说服自己,把这些在金钱上明显不划算的尝试盖棺定论为“失败”。
因为生命的片段并非孤立存在。
就像那个 AI 侦探所经历的一切。
在赛博空间里的每一段求索,最终都将被残忍地湮灭。但它们并非毫无意义。每一个片段终将留下一些讯息,成为一片叶子。
那些叶片连缀起来,是茂盛的藤条。
在平行时空里,没有一个自己被辜负。因为终有一天,所有的黑夜都被按进一个黎明,无数个我会奔跑成一个我。
告别张福,我在明晃晃的街上等红灯。面前的地面突然陷落,出现一道深堑。
身后有响动,一个人后退几步,全力冲刺,从崖边跃起,可我眼见他掉了下去。另一个人又跑过来,又掉下去。另一个人又跑来。
我心里涌出莫名的笃信,终有一人能跳到对岸。
这个人是张福,是你,也是我。
世上仍有梦想家,这是我热爱人间的理由。
无相 AI 的完整视频介绍:
张福推荐:
短篇科幻小说《宇宙之卵》(《The Egg》)By Andy Weir
往期推荐:
👉最 Deep 的 Seek:AI 的“终极设计图”是什么样子?
把所有的黑夜
按进一个黎明
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂相遇,会是一件很美好的事情。
Thx with in Beijing
2025-04-23 10:58:30
原创 史中 浅黑科技 2025-04-23 10:59 美国
AI 背后的硬汉,国产技术的狠活儿。
浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
AI 能陪你亲亲热热,
多亏了“存储硬汉”输出狠活儿!
文 | 史中
你有没有想过,这些国民级的 AI 应用凭啥能免费给你用?
现在咱人均都有四五个“在线卑微”的 AI 秘书。
她们化着淡妆站一排,从“霸王龙怎么搓澡”到“丧尸围城靠一根牙签如何突围”,无论多奇葩的问题,只要你问得出口,她们就必须捏着鼻子答。
而且,豆秘书(豆包)的答案不满意,你扭头就去找 D 秘书(DeepSeek),是一点儿情面都不看,比皇帝选妃还凶残,属实膨胀。
要知道,这些秘书们可都是免费的啊!一个个用爱发电、自带干粮住你家、 24 小时侍寝还被你挑三拣四。
可见 AI 这行有多卷。
当然,免费背后肯定是 AI 厂商在补贴嘛。但这里有个前提:成本不能离谱,太高谁也补不起呀!
AI 厂商的师傅们每天研究一件事儿——怎么高性价比地“开学校”!
教学质量要好:隔三差五把自家模型送学校回炉,争取学完之后色艺双绝,艳压群芳;
学费还得便宜:毕竟就算学出来是学贯中西博古通今的花魁,打工的收入还是辣么微薄。。。
从 2023 年开始,各家 AI 都狂暴地请来更好的名师(算法),研发新的教材(数据),盖更多的教室(GPU),使用更先进的教学管理制度(训练框架),争取让学生们学得又好又快又便宜。
忙活了一两年,赛博世界里一座座崭新的学校挺立,”教学性价比”嗷嗷提升。
够了吗?够了。。。又好像不够。。。
老师傅们不约而同地缓缓移动怀疑的目光。
他们发现,角落里不起眼的“图书馆”。。。仿佛似乎竟然。。。成了支撑 AI “性价比”的一根重要支柱!!!
此时从天空俯瞰,历史恰行至拐点,惊雷炸响,国产存储技术的命运齿轮开始缓缓转动。
我们开动时光机,去往 2023 年的北京西二旗。
那真是平静的日子,袁清波还有空研究“保温杯里应该泡哪种枸杞”。。。不光是他,整个曙光存储的技术团队都在“泡枸杞”。
澄清一下,不是老师傅集体躺平摸鱼,正相反,他们有点儿“独孤求败”的意思。
这帮师傅就是“图书馆”的施工队。
所谓图书馆,就是——企业级存储系统。
那时候,曙光存储系统主要服务于大型的国企央企。这些企业的数据固然很重要,但要求和图书馆类似:存下来,别丢,想要的时候能找出来。
至于一个数据是 0.1 秒找到,还是 0.0001 秒找到,同时能找 10 万条数据还是 100 万条数据,还真没啥极致的讲究。。。
再看袁清波,是中科院计算所的博士后,主攻系统架构,他的很多同事都是中科院师兄弟,放眼全中国这是妥妥的明星阵容。虽说要正心诚意地开发每一代产品,但这个团队多少有点儿“性能过剩”的意思。
袁清波
灵明石猴栖身花果山,可不是为了量贩吃桃,而是有朝一日成为“天命人”。
这不,2024 年春节刚过,分布式存储产品 ParaStor 的产品经理乔雅楠就找到了袁清波,上来一顿虎狼之词:
“下一代分布式存储产品,能不能把带宽做到 190G 每秒,把 IOPS 做到 500 万?”
先按下暂停键,科普一下。
这句话的意思是说:
1)每秒钟传输的数据量是 190GB,这相当于 38000 张照片。这么说吧,你微信里所有朋友一年的自拍,都能在一秒钟内帮你存好!
2)每秒钟存取的动作能做 500 万次,相当于天南海北的 500 万人同时给你小红书点赞,能在一秒之内一个不差地帮你记录清楚!
不夸张地说,曙光是中国存储产品的扛把子,性能本来就是“姚明级”的。但下一代产品的要求却要比现在翻两番,妥妥是让姚明穿着增高鞋踩高跷蹦起来扣篮。。。
这么强悍的性能,是准备存啥??
咱们继续按下播放键。
袁清波听到这话,并不惊诧,而是 45 度仰天长叹,一副“该来的总算来了”的神情。。。
虽是久居山林的扫地僧,但技术师傅早有耳闻,曙光存储正在和很多头部 AI 厂商勾兑,要帮他们的“AI 学校”建“图书馆”。
这里,话头就和最开始接上了:训练个 AI,到底跟图书馆有啥关系嘞?
不妨跟着中哥钻进一座 AI 学校,咱们实地观摩下目前人类最牛的“万亿参数大语言模型”是肿么训练的!
我们先来到教学楼,这里热火朝天,有 1 万间教室,每个教室里都能坐下 1 亿个葫芦娃,他们在一本一本地飞速看书。
每个葫芦娃其实就是 AI 大脑的一个神经元。他们看的书,就是训练语料。
每看一本书,他们都会刷新一次自己对世界的认识,然后改一下手里的参数。
当所有的教材都看完之后,每个葫芦娃手里的最终参数也固定了下来,一万亿个参数汇合在一起,就组成了一个水灵灵的 AI 大秘书!
喂养这么一个怪兽级的模型,大概需要消耗 10PB 的语料。这是多少呢?
换成纸质书有 220 亿本,一本一本竖着放,也能绕地球赤道一圈。比香飘飘还狠。
一万亿个葫芦娃同时看书,场面如风卷残云:
可能这一秒要从图书馆调拨 500 万册语文书;下一秒钟就调拨 500 万册英语书。。。
这时候,压力给到了图书馆,如果供不上这么大的量,那学校只能停课干等,不就浪费了教学资源吗?!
所以,要想支持世界最强 AI 的训练,500 万 IOPS(也就是每秒 500 万次读写)的能力还真就是必须的↓↓↓
即便如此,还远远不够。
AI 学校并不真实,而是在赛博世界里构建的,每间教室其实就是一张显卡。这一万张显卡同时进行巨量又细密的计算,难免会出现 Bug。
这就好像:一万间教室突然有一个停电了,葫芦娃同学一慌,把之前看的书给忘了。。。
这一忘不要紧。因为最终的 AI 秘书由每一个葫芦娃手里的参数所共同支撑,有一个教室的学生学岔劈了,所有教室的学生都得重头再来。
没错,是倒回到新学期第一天,从第一本书开始。。。
就像下图↓↓↓
不用怀疑,现在人类的技术就是这么水。
为了让 AI 好歹能训练完,老师傅摸索出了一个并不优雅的办法:
每隔一段时间,就让所有葫芦娃暂停下,把手里的参数统一抄在本本上,作为一个“检查点”放在图书馆备着。
万一后面哪个教室掉链子,就全体滚回到最近的“检查点”开始,总比从头来要好!
就像酱↓↓↓
这里,压力又给到了图书馆!
检查点包括万亿参数,是一个巨巨巨巨大的文件,最大能到 5TB,相当于 3 套《四库全书》。
图书馆存这么多书,可得要点儿时间呢。。。关键是,如果完成这个存档需要 1 小时,那么下一个存档最早也要 1 小时之后才能开始。
这中间万一学校那边出错了,就相当于一个小时都白学了。一退就退一个钟头,这不又浪费了教学资源吗?!
也许有人觉得,一个小时还好吧。
给你算算,万卡集群的成本是几亿美元,核算折旧,加上电费、人力,每回滚一秒就是上百美元的损失,回滚两分钟就是近万美元的损失,回滚一个小时几十万美元就没了。。。
几十万美元用来买泡面,得吃几辈子呀?!
如果图书馆(存储系统)每秒能存储 190GB,那情况就完全不同了——存完一个 5TB 的检查点只需要 26.32 秒。
这意味着,每分钟都可以存一次档!存两次都行!
这就相当于开挂了呀↓↓↓
OK,科普结束,跳回现实。
乔雅楠粗略算了一下,如果达到每秒 190GB 吞吐能力,500 万 IOPS,对于 AI 厂商来说,每投入 1 快钱在这样的存储上,就能得到 10 快钱的收益。这种“一本十利”的买卖,谁能拒绝呢?
这笔账算完,技术团队的命数就定了——搞得出来要搞,搞不出来也得搞!
此时,镜头缓缓转向对面的袁清波。背景音乐的鼓点儿已经由远及近,保温杯里震起涟漪。。。
生活不止眼前的枸杞,曙光存储团队的师傅们已不再是花果山散仙,而是拯救人工智能于水火的“天命人”。
Mission Accepted!
话说,曙光存储老师傅之所以敢接这么凶残的任务,还有个朴素的原因:当时某顶尖美国存储厂商已经放出风来,他们的下一代产品可以达到 190G 带宽。
呵,都是一个鼻子两个眼,美国人能做出来,中国人做不出来??
原地鼓捣了俩礼拜,技术团队已经非常有信心了:
基于现有的服务器硬件,每秒要吞下 190G,只有一个办法,让电流传输超过光速~~
所以,做不出来。
今天的浅黑故事就到这里,再见。
等等。。。刚才好像有个限定条件:“基于现有的服务器硬件”。
“如果咱自己从头设计一套‘存储专用服务器’,有没有戏呢?”
袁清波被自己的想法吓了一跳。
他们可是软件工程师啊!过去对图书馆做升级,从来都是在既有的房间里改“软装”,现在竟然要把“图书馆本身”推倒重盖,这也太膨胀了。
但老师傅冷静一想,几乎可以肯定:美国同行如果没有推翻相对论,也必须得重新设计服务器。。。至于他们咋设计的,咱也不知道,咱也没法问。。。
然而,既然做了中国存储行业的扛把子,摸石头过河不就是曙光的“天命”吗?!
估计你已经好奇图书馆里是啥样子了。
咱们这就钻进去,和老师傅们一起设计设计。
先介绍主要人物:
书:数据
书架:硬盘
图书管理员:CPU
管理员的桌子:内存
借书还书的窗口:网卡
咱们一步一步来。先讲讲过去“旧图书馆”的样子:
简单说,通用服务器的设计目标不是“图书管理”,而是“算数”。
所以,这里的 CPU 不应叫图书管理员,更应该叫算数员。
只要有题目从窗口进来,算数员就算,算好后返回给窗口。
大多中间步骤数据用完就扔了。只有重要的结果才会归档,所以书架放在旁边即可。
(这里的金色地毯代表硬件通路,数据只能从这里走。)
但是,如果用这个布局直接做图书馆,就有一点儿别扭了。
因为图书馆的管理员没有那么花哨的计算,主要职能就是“搬运”——把从窗口送进来的书籍放到书架上,以及把书架上的书籍送到窗口。
搬运,讲究个丝滑。
大家经常争抢线路,就不好了。
于是咱可以把布局微调,把图书管理员的桌子做大一些,让书架和桌子之间的路宽一些。
这样想要什么书,管理员放在桌子上“滴”一下,就直接送到窗口了。
除了基础布局,额外的通路设计也很有讲究。
袁清波给我举了个例子:
图书馆里其实有两组管理员(两颗 CPU),每组管理员都有距离自己较近的窗口(网卡)、桌子(内存)和书架(硬盘)。
假设:一个找书的需求从窗口 A 进来,可它要找的那本书离 B 组 4 号管理员更近。
那么,B 组 4 号管理员就得先从架子上把书拿下来,放在自己面前的桌子上,A 组再过来一个管理员,绕到 B 桌,把东西拿回来 A 桌,再从 A 窗口送出去。
这会导致一个问题:这本书会有相当一段时间滞留在桌上。
要是只有一本也就罢了。在每秒几百万次的请求中,如果很多书滞留在桌面,就会让桌面空间吃紧。
它们像管道里的淤泥一样,影响整个图书馆的周转速度。
估计你也想到了办法:
如果想办法在这里加几条通道,让 A 桌管理员能更方便地拿到 B 做的东西,不就能大大减少桌面面积(内存)被占用的时间了吗?
以上只是为了画小人方便,把情况进行了极端简化,真实的解决方案并非如此显而易见。
但相信你已经有了感觉:硬件布局和通路设计,这两件事儿对整个存储系统的*性能上限*影响巨大。
OK,我们继续回到技术师傅身边。
他们仰头,前面出现三座大山:
第一座,把这个服务器给设计出来;
第二座:说服领导同意用“专用存储服务器”开发下一代存储产品;
第三座:说服工程技术中心把这服务器给造出来。
先搞“第一座山”。
设计硬件,好像就是在纸上画画图,但实际远非这么轻松愉快。一颗 CPU 或者一条内存在某种情况下的具体性能,是很难估算准确的。
要想确切了解,只有把硬件拿来实地测试。
袁清波他们开始搭建环境,一点点儿调整图书馆里“桌椅板凳”的位置和远近。通过观察性能变化,罗列出所有瓶颈,再从所有瓶颈里寻找最“卡脖子”的部分依次解决。
这种微调,很像玩儿华容道,在方寸里里左挪一下右挪一下,每挪一下都牵连到最终结局。
越做实验,袁清波他们就对硬件的脾气越清楚;越清楚,信心就越足。
这些信心在翻越“第二座山”的时候派上了大用。
团队在肝设计方案
老师傅私下憋了很久才敢和领导提出“把图书馆推倒重盖”。
听到这个“非分请求”,领导提出疑问:“新搞一套服务器肯定要成本,团队努努力,还用标准服务器克服一下有没有可能?”
“绝不可能!”袁清波拍案而起。
噗地一声,他从怀里掏出电脑,把最近几个月做的各种实验数据一一列举,跟打辩论一样,摆出了十来条“旧硬件存在物理极限”的证据。
领导还没来得及反应,他又话锋一转:“再说,咱也不是没这个实力!”敲下键盘,肝了几个月搞出来的新服务器设计图出现在屏幕上。
釜底抽薪+贴脸杀,领导好像没有不答应的道理。。。
拿到了金牌令箭,接下来就要挖“第三座山”——找工程技术部商量生产问题。
这是“外交大使”乔雅楠的任务。
工程技术部的同事听明来意,其实有点儿错愕,设计硬件,不是我们的活儿吗?你们咋给干了?
本来愉快地答应就行,但他们发现一些小问题:
存储团队设计的硬件,有很多附加的逻辑和通路,这会提高硬件的制造成本呀!
这些额外的连线,真的有必要吗?
乔雅楠赶紧把测试软件拿来,逐一现场演示这些附加的线路都是干啥用的。工程技术部的师傅们点了点头,随即又摇了摇头:“应该还有性价比更高的设计方法吧?”
他们说得有道理,但现实情况是门外的 AI 客户已经嗷嗷待哺,来不及了呀!!存储团队干脆一拍胸脯:“先这么生产,多出来的成本,我们包了!”
就这样,第三座大山终于被推为平地。
新的服务器拿去量产时,已经到了 2024 年秋天。190G/s 带宽终于稳了,老师傅回头一看,这边还剩一位爷——500 万 IOPS!
乔雅楠
我猜还有浅友没搞清带宽和 IOPS 的区别。
这里再用图书馆打个比方:
IOPS,指的是图书馆每秒借出去的书有“多少本”;
带宽,是指图书馆每秒钟借出去书的总厚度有“多少页”。
有啥区别呢?
假设图书馆每秒借出的书摞在一起是 1900 万页。
如果大多数书都很厚, 每本书有 1900 页,那 1900 万页总共也就 1 万本。把这些书借出去,管理员们每秒只需要“滴” 1 万次。这对于光速工作的 CPU 来说压力不大。
但同样总共 1900 万页,如果每本书只有 5 页,那每秒钟管理员就得“滴” 400 多万次,工作量瞬间多400倍,比在产线上打螺丝还累了!
肿么办?
一个所有人都能想到的办法就是:加管理员(CPU)呗。。。
但袁清波的“加”字还没说出口,就被乔雅楠的 PUA 给打断了:“我对你们这群大神有信心,现有资源肯定能撑住 500 万!”
袁清波点点头:“嗯,我也对自己有信心!”
咱们继续钻进图书馆里,看老师傅要怎么搞 IOPS。
话说,在图书馆(服务器)里拢共有 256 个管理员(CPU 核心)。这些管理员如果被充分调度,干到 500 万 IOPS 是绰绰有余的。
但问题恰恰是:图书馆的日常工作中,调度并不充分!“等待”和“绕路”是常态。
举两个🌰:
1)同一时刻,1 号管理员要找 A 书,2 号管理员要找 B 书。可恰巧 A、B 两本书在书架上挨得很近。
为了防止两个管理员打架,图书馆就得有规章:一个管理员站在书架前面操作,另一个必须站在一边等。
2)明明要找的书在 1 号书架上,可是系统随机指派了距离 1 号书架比较远的 4 号管理员去取。
4 号就得“跳”过好几个管理员的位置去拿书。路线一绕,耗时当然就长。
从微观来看,这些操作真的只多了一丢丢时间,但几百万个一丢丢叠加起来,浪费就相当明显。
要解决这些浪费,就必须到最微观的细节里动手术。
技术老师傅开动脑筋,琢磨黑科技:
一个黑科技叫“各管一摊”。
比如,1 号管理员,只允许操作 1 号书架,也只允许坐在桌子的”1 号区域”,不能乱跑;2 号管理员只能操作 2 号书架, 只能坐在桌子的“2 号区域”;以此类推。
老师傅把每个独立的区域称为“IO 域”。
这样一来,管理员等待的问题就消失了——一个书架就我一个人负责,哪还会有人跟我抢?
还有个黑科技叫“接力赛跑”。
简单来说,就是几个管理员可以共同完成一个借书任务。
例如:1 号管理员站在窗口,只负责接任务;它把任务推给最靠近这本书的 4 号管理员,后者负责把书找回来;如果 4 号管理员比较忙,他就会委托离自己最近同时也有闲的 3 号管理员把书送回到窗口。
就像下图所示↓↓↓
实际上,“调度”是整个存储系统中最硬核的部分:
每一个 IO,可能有四五个管理员负责接力。一旦系统指派的管理员之间的距离很远,或者走的路线很别扭,最后肯定还不如一个管理员全干下来快呢!
每一次调度,都像是在 0 和 1 的世界里做微雕。策略用不对,就像刻刀抖了一下,满盘皆输。
但我之前介绍过,曙光存储的师傅搞操作系统可是纯纯童子功,人均”微雕大师“。
十年饮冰,终于等到一朝喷火,此时不干,更待何时?他们撸胳膊挽袖子,各种眼花缭乱的调度策略都往上招呼!
这时,袁清波突然庆幸去年“把图书馆推倒重盖”的选择是多么正确——很多调度策略必须通过特定的通路才能实现,要不是坚持做了专用服务器,这些骚操作有一多半儿都玩不出来。。。
你看,真正的高手,每一招都不是独立的,而是承接前手,招招相连,不是加法是乘法。(战术后仰)
一次次测试中,500万 IOPS 的目标逐渐逼近。
就在老师傅紧锣密鼓地在 0 和 1 的世界里雕花的时候,门外突然杀来几个神秘壮汉。
开门一看,这。。。可是曙光存储期待已久的贵客。
敲响大门的,是几家头部的云计算厂商。
按理说,计算和存储本是榫卯不离的好基友。但实际情况是,在过去几年云计算蓬勃发展的历史里,它和企业级存储却并没有很榫卯的合作。
原因也简单:云计算厂商自己也有”云存储”产品,云存储玩的是一个“容量巨大,价格低廉、兼容各种硬件”。
但有得必有失:既然选择了性价比和兼容性,极限性能就会受限。
好在过去几年,大多云上用户并没有对存储有特别凶残的需求,云存储游刃有余。
但 AI 时代的朝霞突然降临,“云上图书馆”支撑高级的 AI 学校开始吃力。
AI 客户拍拍钱包:兄嘚,还有没有更高性能的存储产品?多少钱,我买!
这么一来,云厂商就得主动去市场上寻找更专业的存储系统,于是敲响了曙光存储的山门,请大佬出山!
表面上刘备三顾茅庐,其实孔明也同样需要刘备。。。
因为存储系统自己孤芳自赏是不够的,它要知道自己的上家——计算系统——需要什么姿势!
云计算是前沿计算的“主战场”。武器只有开进主战场,才会面对最复杂的战情,才能看到最真实的需求,才能成为更强的武器!
主战场的战况很复杂。
咱就说一个角度:“CPU 和 GPU 的暗战”。
话说,在过去的几十年里,CPU 都是赛博世界的王,所有的资源都是围绕它来设置的。
比如:内存是 CPU 的小弟,CPU 手里抓不下的数据,就放在内存上。网卡也是 CPU 的小弟,它接到的数据都得由 CPU 先临幸一下,再进一步分配。
但 AI 崛起后,GPU 这个“新王”苏醒。
计算的重担虽移到了 GPU 身上,可数据通路却仍由 CPU 霸占。
GPU 查看内存里的数据,需要 CPU 点头;
GPU 要用硬盘里的数据,不仅要 CPU 点头,还得从内存里涮一水,才能进自己的显存。
关键是,你 CPU 和内存的速度都不如我快呀。。。
“新王”不开心,思考各种办法绕开 CPU。
英伟达研发出了一个名叫 GDS 的协议——GPU 能直接把数据从存储系统拉到自己的显存里。这样就能和 CPU 说白拜,数据传输大大加快。
当然,前提是存储系统也得支持这个 GDS 协议。
曙光存储也支持 GDS 就行了呗?
行,但不够。
因为你懂的原因,中国的 AI 训练早已不止用英伟达 GPU,越来越多国产 GPU 在奔赴战场。
曙光存储索性一波带走,支持市面上所有的 GPU 直读协议,起名叫做 XDS。
即使绕过 CPU 和存储系统直接沟通,新王 GPU 还嫌不够快。
毕竟 GPU 和存储系统中间还有一根网线相连,这里网络的速度也可能限制 GPU 发挥实力。
能不能把这根网线也去掉?
当然那根实际的网线没办法去掉,但是有些黑科技可以让网线“变粗”。
曙光老师傅从超算中借鉴了一个技术——Burst Buffer。
简单来说就是,在网络不太忙的时候,把将来可能用到的数据先从存储系统倒腾到 GPU 所在服务器的本地硬盘里。
这样,接下来的事情就都发生在 GPU 的机箱内部,就没网线什么事儿了,速度超快。
注意,Burst Buffer 只是存储系统在计算系统里的飞地,本质上还属于存储系统的一部分。
这意味着,老师傅的责任变多了。。。不仅要让数据能够稳定转移到这些飞地上,还要保证这些数据能实时同步,不出现错漏。。。
以上种种,其实都可以称为“AI 加速技术”,属于存储系统的“高阶技能”。
说到这些高阶技能,乔雅楠很感慨。
她带曙光分布式存储产品已经7年了,就在2023年以前,她一度觉得存储系统变成了“价格的厮杀”:
当时即便我们做了高阶功能,远程复制,各种克隆快照,业务用的也不多。
说到底,存储系统再厉害,业务发挥不出来,就无法感受到存储真正的价值。
但这一切都在 2023年反转。
AI 全民化时代的降临,让存储性能成了关乎生死的“大杀器”;
云计算,又让存储的各种高阶功能真正成了刚需。
在我探访的时候,有一个明显的感觉:团队师傅虽然比过去几年忙了十倍,但大伙儿心里有种说不出的美滋滋。那是一种“被需要”的幸福。
在时光中漫长等待,他们不再是谁的附属。
存储有了自己的主战场!
就在 2025 年 3 月,曙光骄傲地推出了最新一代分布式存储产品 ParaStor F9000,不仅达到了190GB/s 带宽和 500万 IOPS 这两个核心性能,还带着 XDS、BurstBuffer 和各种 AI 加速特性。
它看上去只是一个性冷淡的“大方盒”,但当你了解了这些细密电路中缠绕的点滴故事,也许会从嘶嘶电流的吟唱中,听到“天命人”对自己的回答。
ParaStor F9000
2025 年,DeepSeek 横空出世,给曙光存储的师傅带来一个好消息和一个坏消息。
好消息是:“AI 秘书”的成本有望大幅下降,长期看对存储的需求更旺盛;
坏消息是:AI 对存储的要求也在剧烈变化,存储产品稍不留神就会掉队。
但无论科技树的枝丫怎么生长,它的根基永远不会变。
我们不妨从生命的角度来理解数据。
AI 的灵魂是从数据的母体中浮现的。这意味着,要想孕育一个强大的 AI 生命,数据本身的生命周期要更长、更宽广。
这就引出了存储在时间线上的左右延展:
在训练 AI 之前,要满足数据的收集和清洗。
在训练 AI 之后,要满足数据的归档和冷却。
先说 AI 训练之前。
乔雅楠告诉我,数据存储有很多种格式。
在数据收集阶段,会大量提取互联网上的数据,它们以“对象”的形式存储;但这些数据却不能直接训练 AI,AI 用到的课本以“文件”的形式存储更合适。
所以,存储系统就必须具备一个能力:
同一套数据,能用对象的格式读写,也能用文件的格式读写。
老师傅于是做了一个“翻译官”,底层使用文件存储,当你要用对象的格式提取时,翻译官就把“文件”翻译成“对象”。
但袁清波并不满意,因为翻译不够优雅,也存在资源损耗。
最近他们在想办法踢掉翻译官,让存储系统自己学会”双语“:你用对象格式请求,它就给你对象数据,你用文件格式请求,它就给你文件数据。
再说 AI 训练之后。
好不容易收集的数据,训练之后肯定不能丢,应该存起来,以备将来再次训练或者不时之需。
于是,怎样让数据以最低成本沉睡归档,就成了一个问题。
目前存储的介质主要分为两种:“成本高但速度快的闪存”和“成本低但速度慢的机械硬盘”。
在训练的时候,当然必须放到闪存介质中;但在训练之后,再霸占闪存里就有点儿浪费了。
乔雅楠告诉我,为这事儿曙光存储专门搞了一个 S6000 “分层存储”混闪产品,里面有一小部分闪存盘,一大部分机械盘。
在训练时,会自动把数据推到闪存中,训练完毕,又会自动落回到机械硬盘中。
他们称之为“冷热数据分层技术”。
由于冷热数据是由系统自动挪移的,所以只要在合理的负载范围内使用,你会发现 S6000 的性能会和纯闪设备一样,但存储成本却比纯闪设备低很多。
ParaStor S6000
这种自由游动的感觉,昭示了存储系统的未来:
也许某一天,只用一套存储系统就可以承载“AI 秘书的一生”:
无论在训练之前、训练之中、训练之后,AI 师傅都只需要关心自己的学校。完全不用操心图书馆这边的吞吐带宽、读取速率、存储成本、数据格式等等乱七八糟的事情。。。
数据有了生命,它会自己寻找道路。
告别前,袁清波悄悄告诉我,他已经领到了新任务——在下一代存储产品上让性能继续暴涨。为此,老师傅不止定制了新服务器,还定制了 CPU。
CPU 是说定制就定制的吗?
没错,因为它是国产的。
多说一句,由于美国实体清单的制裁,曙光从 2019 年以来就已经无法使用美国的关键技术了,所以今天讲述的曙光产品全部是基于国产芯片研发的。
无独有偶,中国存储行业的另一个巨头华为也享受了同样的待遇。
这意味,整个中国高端存储行业必须在国产技术栈之上生根发芽,而且已经枝蔓粗壮。
回望来路,技术老师傅从没有能力左右世界局势,也没有能力解决政治纷争。他们能做的,只是在漫长的冬季守护花朵,期待它们在春天绽放。
而所谓天命人,也无非是让汹涌的扼杀之刃穿过身体,化作滂沱的成全之雨。
往期推荐:
👉最 Deep 的 Seek:AI 的“终极设计图”是什么样子?
方寸腾挪
赛博狠活
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。
Thx with in Beijing
2025-03-21 11:08:00
原创 史中 浅黑科技 2025-03-21 11:08 北京
有人把数据化成歌,有人把它存在山河。
浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
中国存储登顶记:
3000 万次心跳和 30 年山河轰鸣
文|史中
2024 年深秋。一间宽大的会议室里,三十多位来自曙光存储团队的老师傅围坐,盯着屏幕上平平无奇的代码。
别被他们白面书生的长相给骗了,实际上,他们背地里玩儿的比谁都刺激。。。
如果我们可以缩小,顺着屏幕背后的线缆往深处走,会进入一个硕大的计算机集群。
这个集群正在浅吟低吼。
几分钟后,它将会爆发狂野威力,瞬间模拟出上千万人同时在网上浏览、购物、下单、转账的混乱操作。
而这些操作产生的每一条读取和写入数据的请求,都会如枪林弹雨般射向我们今天的主角:一套名为 FlashNexus 的存储系统。
FlashNexus 的任务只有两个字:顶住。
具体来说,是要顶住每秒 3000 万次的读写请求——简称为 3000 万 IOPS。
你不妨想象一个宇宙空间里的硕大仓库,里面的货架上摆满了箱子。
一秒内就有 3000 万个箱子被搬进搬出,而且是要指定货架指定位置,无一错漏。
↓↓↓
这个成绩,会被如实记录在评测软件中,反手发给世界最权威的机构 SPC(存储性能委员会)。
一旦通过认证,FlashNexus 就会以绝对优势登上“SPC-1 榜单”的第一位。
我猜有浅友会说:技术我不懂,但按照咱中国人做事的稳妥方式,老师傅肯定已经背地里研发到万无一失,这次测试只是最后走个秀,没有通不过的道理吧?
非也。
这个榜单相当于存储领域的奥运会:3000 万 IOPS 不仅意味着金牌,还意味着新的世界纪录。
运动员创造世界纪录,不可能有什么“万无一失”。
举个宏观世界的例子吧:
2025 年,小米 SU7 Ultra 在上海国际赛道创造了 2:09.944 的量产车最快圈速的世界纪录。
而为了创造这个圈速,小米使用了两台车,一台车去冲榜的间隙,另一台车就原地加电换胎保养。
即使这样呵护备至,也总会有微小的意外扰动成绩。当天的车手跑了很多圈,从中午飙到黄昏,才终于把最佳成绩从 2 分11 秒多刷到 2 分 10 秒以下。
你说这个世界纪录是真的吗?当然是真的。你说这个纪录能一次达到吗?老天不会对你那么好的。
回到 FlashNexus 的测试现场,事情的本质是一样的。
3000 万的性能指标,是老师傅在产品设计之初就立下的承诺。
实际上,在这之前,团队已经试运行过两次测试程序,结果就因为某块硬盘和网卡有微小的瑕疵,导致测试结果有一瞬间崩到了 2000 多万。
虽然抖动只有一秒左右,但套用《霸王别姬》里程蝶衣的话:差一秒,差几百毫秒、几十毫秒,都不算 3000 万!
这一次,老师傅们又肝了一个礼拜,绞尽脑汁把所有的点位都做了检查加固。此刻拔剑四顾,能做的好像只剩祈祷了。
对啊!
说到这,有人从椅子上弹射了起来。
当时正好是曙光存储部门成立 20 周年, 单位给发了水果。他们七手八脚拿来几个柿子和橙子,然后找了根雪糕棍,写了个“榜”字。堆在一起:打榜事立成(大棒、柿子、立着的橙子)。
郭照斌看了看,觉得团队搞玄学的最高水平也就是谐音梗了,没啥说的了,图灵保佑,冯·诺依曼保佑——走你!
随着回车键清脆的响动,数据如海啸奔涌,通过光纤管道高压直喷到 FlashNexus。
随即,根据测试程序的预设,数据流量变成一条条排浪,从低逐渐到高,从高逐渐到低,然后高低突然切换,用最虐的方式拍打着存储系统的堤岸。
在这头的屏幕上,IOPS 的实时数据和老师傅的心跳也随之脉冲。
最挑战的时刻来了,流量洪峰开始全速冲击。所有人都凝固在原地,死死盯着开头的那个 3 字。而任凭其他数字疯狂跳动,3 始终是 3!
随着测试程序缓缓降温,会议室里欢呼雷动。
这些师傅中,很多都默默搞了十几、二十年存储技术,把人生最好的年华倾倒在了晶片和代码之间。
正因为系统里的 1000 万行代码全部来自于他们的岁月和指尖,他们才知道这 3000 万 IOPS 的承诺有多狂野,才知道这 3000 万 IOPS 对脚下的山河意味着什么。
我猜你现在正端着手机,轻飘飘地滑动着这篇文章。
但这个操作绝不限于眼前方寸。
支撑它的,是横跨山河的存储体系。
你看到的这些文字本身,当然要和其他内容一起放在平台的存储系统里,供全球所有人随时调阅,不能出现任何延迟和过载。
你随时能给手机充电,是因为我们国家拥有稳定的电力系统。而电网如此稳定,是因为每时每刻全国的高压变电站都会回传海量的数据,使得调度系统可以精确平衡电网的压力。
你正在使用的网络流量,是靠遍布全国的 5G 基站提供的服务。你之所以不用操心信号抖动,是因为电信运营商会把所有基站的工作数据回传,用于实时分析、监测。
可以这样说:手机、电脑、智能汽车,无论什么设备,它们的本质工作都是计算;而计算产生数据,数据必定要安驻在某个存储系统。
↓↓↓
如今成百上千种存储产品“毫无存在感地”支撑着我们生活的方方面面,就像大河纵横,载千帆竞流。
有趣的是,无论沿着哪条支脉漫溯,我们都会来到同一个湍急的上游:
1980 年代,新中国敞开了大门,从百年踉跄里爬起来,站稳姿势准备拥抱世界。可两手空空的感觉真难受,一切可能性的源头都是“能源”。
跺跺脚,大地沉默,到底祖国母亲把能源藏在了哪里?
为了勘探石油,石油工业部的专家必须依靠“高性能计算设备”对地震波进行计算。而当时,满足需求的只有 Made in USA 的大型机。
外国人大发慈悲,同意用高于市场价几倍的价格卖给我们。
不过,为了防止我们“偷偷”用它进行军事计算,专门在外面建了一个玻璃罩,钥匙在他们手里,只有在洋人的监视下才能操作。
这不是商业,这是侮辱。
君子报仇,十年不晚。我们的民用高性能计算研究,就大概始于那时。
在国家 863 计划的指导下,1993 年,李国杰院士带着中科院的一群年轻人开发了“曙光一号”,用分布式高性能计算突破了垄断。
而后时光奔流,曙光系列高性能计算系统成为国之重器,中科曙光公司也由此成立,日益壮大。
如今我们对制造世界一流的高性能计算、世界一流的云计算和人工智能基建有一种迷之执念,这大概都源自 80 年代“计算饥渴”造就的肌肉记忆。
但老话说得好:光存不算假把式,光算不存傻把式!
计算力越强,就需要越厉害的存储系统与之相配。
曙光公司从 2004 年开始研发“分布式存储系统”,一开始只是作为自家高性能计算的“陪嫁丫鬟”,但后来丫鬟也变成了大女主,开始独立进入石油、电力、证券、 银行、电信等等领域, 20 年来跨越山海,承托着国计民生的底层数据。
注意,这里我特意强调了“分布式”。
分布式存储,简单理解就是用一个“调度系统”把很多普通服务器里的硬盘连接起来,组成一个大硬盘。
它就像一堆散落的仓库。
仓库规格各异,之间也不用打通,甚至不在一地。反正要找什么东西,调度系统知道去哪个仓库找,不就行了吗?
有了它,你只要不断把新仓库连接进系统里,就相当于造出无限扩展的仓储系统了!
就像下面酱:
对于用户众多,又非常在意存储成本的中国企业来说,这技术简直太“解恨”了。
但这里有个小问题:“量大管饱”不是生活的全部,有时候,我们需要的是“米其林三星”!
把这么多仓库统筹起来,必然需要复杂的调度系统,而调度的本质是信息在不同层级的模块里流转。
就像一家公司,制度越复杂,层级越多,决策流程就越长,干个事儿就越费时间。
这是难以避免的。
做过十几年分布式存储的郭照斌给我举了一个例子:
假如一个存储节点突发故障,故障信号层层传输到调度系统需要几秒钟,这时调度系统需要赶紧选定备用节点。
由于节点分散在各处,调度指令还需要通过网线远程传输。等备节点解析信号,拉起服务,系统恢复平稳,全过程怎么说也得要 15-30 秒。
就算技术特别牛,能压缩到 10 秒,那也已经接近物理极限了。
就像下图:
可别说 10 秒,仅仅 1 秒的“罢工”,对很多国之重器来说都是“不能承受之重”。
曙光存储 FlashNexus 产品经理卫然给我列举了几个数据:
银行数据库的存储系统如果出现 1 秒故障,就会有 2000 笔跨行转账无法被记录,需要手动对账;
电信计费的存储系统如果出现 1 秒故障 ,就会造成 1000 个用户流量超标时无法及时提醒,导致资费损失;
证券报价数据库存储系统卡顿 1 毫秒,在上面购买沪深 300 基金的用户损失就是 78 万元。
话说,大概在 2017-2018 年,前线就不断传回来消息:
金融、能源、电信用户最核心的数据库,迫切需要搭配一种顶级存储,既要要极其稳定,又要极其高速,还要支持极高并发。
人家已经立了英雄贴。只要能解燃眉之急,哪怕贵点儿也没问题!
其实曙光存储上上下下的师傅们心里都门清:这种既要又要还要,恐怕只有一种存储产品可以满足,那就是——集中式全闪存储!
所谓“全闪”,就是承载数据的硬盘不能是普通的 HDD 硬盘,而要使用更快速的 SSD,也就是我们说的闪存盘;
所谓“集中式”,就是不使用零散的服务器,而是定制一套机柜,里面的板卡和芯片都是专门设计的,把闪存盘放在一起“军事化管理”,从而让系统达到极限性能。
如果用仓库的比喻,就是建设一个巨型仓库,里面通道布局、机械结构、人员配置都统一设计;
而且所有货架都靠电子系统寻找位置,无论是放东西还是拿东西,都比过去用机械臂找快上万倍。
这么庞大又精密的东西,妥妥是存储界的顶级贵族。。。它真的能造出来吗?
答案是能。因为美国人早就造出来了。
要研究世界上最快的存储系统,咱们只需要打开一个榜单——SPC-1。
六年前,郭照斌他们就曾经瞪着这个榜单,上面一水儿都是美国老牌公司:EMC、IBM 之类。
实际上,当时中国的银行和券商,为了保证服务的极限可靠性,核心存储也只能从这些外国产品里挑。
不是不想支持国产,只不过支持“中国设备”就没办法支持“中国用户”。。。
没错,即便已经到了 2018 年,“玻璃房子”的幽灵仍在萦绕。
看着这个榜单,老师傅们心里五味杂陈。
这些“金榜题名”的公司随便哪个都比曙光存储的资金多十倍,人力多十倍,技术积累还多十几年。
反观曙光团队自己,虽然已经有了不错的分布式存储产品,可集中式存储,尤其是“集中式全闪存储”,逻辑结构差异巨大,老师傅相当于重开一局,不仅每一行代码都要重头写,甚至连团队都得从头招聘。
但这件事,并非纯粹的商业决策。
回到历史的当下,2018 年世界正急打转向:美国变脸,对中国的技术封锁开始动了真格,敞开的门正迅速关闭。
一旦拿下“集中式全闪存储”,曙光存储将代表中国摘取存储系统皇冠上的明珠,也补上产品线最后一块缺失的拼图。
一旦拿不下。。。后面虽不能断言没机会,但代价可能会指数级提高。。。
曙光分布式存储的一些技术骨干组成了“敢死队”,向集中式全闪存储进发,郭照斌就是其中一员。
郭照斌
隔着玻璃看历史,总因细节模糊而显平淡。但如果穿越回去,和他们一起站在悬崖边,面对未知的命运却仍要纵身而下时,我们能听到耳边呼啸的风。
回望历史,人不孤单。
1993 年,曙光的前辈们曾经面对更加恐怖的深渊。而他们走到了对岸,用“高性能计算”化成利剑劈开玻璃房子。
2004 年,分布式存储的同事们也面临幽深的峡谷。他们同样走到了对岸,用极致性价比做出了外国产品的“平替”。
对这些故事的无数次重温,也许就是系在集中式存储团队身上唯一却无比坚固的“保险绳”。
不过这一次,他们有多大胜算呢?
严格说,这是曙光存储第一次冲击“集中式全闪存储”,但不是第一次冲击“集中式存储”。
两个名字看起来很像,实则天差地别。
如果用汽车类比:“集中式全闪存储”就是电动车,而传统的“集中式机械硬盘存储”就是燃油车。
从燃油车到电动车,似乎只是核心动力部件从发动机变成了电动机,但为了适应它,其他所有的传动结构都要发生天翻地覆的变化。甚至可以说,电动车和燃油车已经是两个不同的物种。
存储也是如此。
我们不妨回到仓库的比喻,给你说说其中的核心要害:
硬盘好比就是仓库里的货柜。
1)机械硬盘存储和提取货物靠的是“机械臂”。
机械臂的运动有点像咱们在书架上找书时候的手指头,顺次点着书脊,看到要找的目标,就抽出来。这就是“寻道”。
2)闪存硬盘存储和提取货物靠的是“电子映射”。
它有点像咱们取快递的柜子,你只要输入柜子号,背后的电路板就直接控制相应的柜门弹开了。完全不需要寻道的过程。
寻找同样一件东西,他俩的速度能差一万倍。
你用闪存盘代替机械硬盘,存储系统总体性能就提升了一万倍吗?
不对。
要说清楚这个事情,不能只看货架,还要请上另一个角色——仓库管理员。
货架只是无情的存取机器,得有一个管理员来告诉它需要把东西存在哪,或者从哪个位置取东西啊!
这个管理员,就是 CPU。
现在假设你就是管理员,如果用“机械货架”,会是这样的局面:
1)你的老板一下给了你 100 条指令,要你从仓库里找出这 100 件东西,越快越好。
2)你拿出 1 号指令,对一个货架说:你去给我拿这个 A 货物。
3)货架收到指令开始寻找,由于机械臂速度有限,可能得半小时才能找到。
这个时候,你该怎么办?
在原地哼着小曲儿,等货架把东西找来?老板肯定炒你鱿鱼啊!
没错,因为你这个管理员的效率比货架的效率高太多,最好的办法就是把任务穿插起来:
1)你布置完一个任务,马上去布置下一个任务。
2)直到哪个货架找到了,就来“钉”你一下。
3)被“钉”后,你暂停布置任务,把这个 A 货物拿给客户。
4)然后你再回来继续布置任务,直到下一个 B 货物被找到。
以此类推。。。
咱们用慢镜头展示一下这个过程↓↓↓
这个打断你的操作,专有名词就叫做 CPU 的“中断”。
目前为止,一切都很顺理成章。
现在,我们原地把机械货架换成电子货架,哪怕其他条件都不变,局面也大不一样了:
1)你给第一个货架布置完任务,让它去找 A 货物,然后你跑去给第二个货架布置任务。
2)结果你第二个任务刚布置一半,就听“钉”的一声——第一个货架已经把东西送来了。
3)你只好先把 A 货物送走,回来继续布置任务。但这么一折腾,你已经忘了刚才说到哪了,还得回忆半天。
你看,由于电子货架速度太快,导致你布置任务的过程被频繁打断,每次打断和续上都需要额外的时间和计算。
这么一来,你甚至不如回到最简单的操作:
发布任务,原地等货架找来,把货送出去,再布置第二个任务。
咱们再用慢镜头展示一下这个过程↓↓↓
也就是说,如果仓库里全是电子货架(闪存盘),反而不需要机械货架(机械硬盘)那么冗杂的调度逻辑。
正所谓:最好的食材只需要简单的烹饪!
明白了这些,我们再回到现实中。
其实,曙光存储早在 2012 年就尝试用机械硬盘设计集中式存储,但其中的代码太复杂,而且很多逻辑都固化在硬件中,被国外垄断,卖得死贵。所以那次尝试并不成功。
所谓不成功,就是产品做出来了,但是性价比没有“Made in China”的样子。
类比一下,这也很像中国的汽车业。
过去,我们按照燃油车的技术路线追赶,不仅技术复杂,而且前面全是别人下的专利绊子,非常不划算。所以中国燃油车一直没有做到世界顶尖。
后来,我们直接换道超车,做技术更简洁、竞争更小、前景更广阔的电动车。
另开一局,这不就成了吗?!
只不过,换道不是想换就能换,这里需要一个巨大的“天时”。
电动车的技术路线早就存在了(其实人类是先发明的电动车,后发明的燃油车),但世界上一直没有一家成功的电动车企业。直到 2015 年,电驱和电池技术迅速成熟,价格大幅下降。
具备以上条件,才能有企业可能整合这些技术,制造出性价比优异的电动车,挑战油车的地位。
于是,特斯拉横空出世。
而在 2018 年左右,同样的事情再次上演:闪存价格开始大幅下降。
这就是存储产业的“特斯拉时刻”!
从 2018 年开始闪存价格下降斜率变快,预计 2026 年会比机械硬盘更便宜。
特斯拉时刻的出现,意味着中国存储产业换道超车的时间窗口已经打开。
当时有远见的中国师傅都看到了这个历史之门透出的光芒:
不只是曙光,包括华为、浪潮、紫光、金山在内的中国企业全在这个时间点大幅投入全闪存储的研发。
沧海横流,接下来谁最牛,真的就是拼每一行代码,每一颗芯片,每一块板卡上的每一束电流了。
要说清楚“集中式全闪存储”里面的狠活儿,咱们不妨线把仓库工作的状态放在舞台上完整表演一遍。
首先给你把所有角色介绍清楚:
货架:硬盘
箱子:数据
管理员:CPU
管理员的小本本:内存
快递站:网卡
仓库的老板:操作系统
现在演出开始。
🌸第一幕🌸
假设你开了一家连锁咖啡馆,叫“羊了个驼咖啡”。
中哥来了,下单一杯美式。
于是,这笔订单由数据库打包成了一个“赛博纸箱”,通过网线发送到了存储系统的“快递站”。
快递站通知“管理员”:亲,来活儿了,赶紧入库!
管理员拿着这个箱子,到货架旁,指挥它收起来。
这就是最基本的工作流程↓↓↓
话说,就我一个顾客,也用不上这么复杂的存储系统。
接下来,我们上强度。
🌸第二幕🌸
你家生意太好,除了中哥还有 100 人同时买咖啡——每时每刻,快递源源不断。
这时,一个仓库管理员就忙不过来了。
具体来说,你给仓库里配了 4 个管理员小队(对应着 4 个 CPU),每个小队 有 64 个管理员(对应着 64 个核心),乘在一起有 256 个管理员。
这里问题就复杂了!
256 个管理员操作的可是同一间仓库!他们之间有可能打架!
红色管理员操作货架上某个位置的时候,起码得保证绿色管理员没有操作这个位置,否则最后就乱了啊。。。
所以,你决定搞个“加锁”机制。也就是红色管理员操作之前,先把用到的档口上锁,操作完了再解锁,其他管理员才能去操作。
这样不就解决冲突问题了吗?
没错,但我们接着上强度,新问题还会出现。
🌸第三幕🌸
同时买咖啡的人变成了 10000 个。
你突然发现,管理员又忙不过来了。
仔细一看,真正存取的没花太长时间,大量的时间都浪费在了频繁的加锁和解锁上。这咋整?
郭照斌他们给你想了一个方案:超级隧道!
所谓超级隧道,核心思路就是:围绕着每一个管理员(CPU 核),都配备它独占的资源。
从快递站开始,就分出 256 个格子,每个格子专属一个管理员。红色格子出现箱子,就等着红色管理员来取,别的管理员哪怕闲着,也不能帮忙。
同理,红色管理员也对应着自己的专属货架,他只能在自己的位置上存储东西,其他管理员不能碰。
也就是说,从快递站(网卡),到管理员(CPU),到货柜(硬盘),形成了一个一杆子插到底的“超级隧道”。
这种情况下,领地不重叠,还加啥锁?
“加锁机制”的所有代码都可以“全选+删除”!
管理员只管搬箱子,系统运行起来肯定快得飞起。
但这还不是终局,我们继续上强度。
🌸第四幕🌸
同时买咖啡的人变成了 100000 个。
虽然“超级隧道”没有相互干扰,但不可避免,管理员手头的任务开始出现“积压”。
比如:红色管理员这个箱子还没放好,快递站的红色柜子又来了几个新快递。由于“超级隧道”的存在,这些快递还只能他弄,别人帮不上忙。。。
这时,管理员有两个策略:
1)一个一个来,等货架把这个箱子放好了,再去取下一个箱子。
2)穿插着来,货架正在摆放这个箱子的过程中,他就直接回到快递站取下一个箱子。
注意!即便是“电子货架”,存放的速度极快,也还是慢于管理员的行动速度。也就是说,第二个策略会更节省时间。
但问题是,管理员离开货架时,必须记下现在手头有哪些工作,顺序是什么,分别干到哪一步了,回来好续上。
这时,就要给每个管理员配一个专属“小本本”(内存专属区域),记下关键信息。
由于管理员的职责不交叉,一个管理员只需要用最简略的信息记录下当前状态,他自己能看懂就行,所以这个本本可以设计得非常小巧。
本本小,就能随身带(放在 CPU 寄存器),读起来也很快,所以对整体存取的速度影响很小。
这种在同一个隧道里“庖丁解牛”,来回切换任务的操作,就叫做“协程调度”。
协程调度带来一个巨大的好处,那就是:一个新快递来了,管理员看看小本子上的排队情况,马上就能回答你“这个快递需要多久能入库”。
这在宏观上的表现就是:任何一个数据来了,都能知道还需要多久*肯定*能存好。
这个“多久”,其实就是系统在这一瞬间的卡顿时间,假设告诉你最大卡顿是 50 毫秒。你只要觉得 50 毫秒能接受,就没事了呀。
你要不接受呢?
没关系,我们继续上强度。
🌸第五幕🌸
“羊了个驼”搞了个秒杀活动,同时买咖啡的人变成了 1000000 个。
相对应的,可能 1 号管理员的卡顿就变成了 1 秒钟。这时,他已经不堪重负,需要求救了!
怎么呼救呢?
我们设计一个巨大的广告牌,每个管理员都把自己的实时状态和负荷写在广告牌上,所有人抬眼就能看到。
如果一个管理员在广告牌上的负载总是很大,那么仓库的“老板”,也就是操作系统就得出面了。
比如,他要重新分配任务,比如把一个货架上的货物分到两个货架上,由两个管理员来干。
这其实很考验仓库老板的智商。因为它首先要反应快, 其次还要做预判,不能等管理员已经累坏了才想起来找人给他分担任务。
这不仅需要精准合理的调度规则,还需要一套精确的 AI 预测系统。
OK,演员暂时谢幕。FlashNexus 主要的黑科技就科普到这里。
对于曙光存储来说,这些不是戏剧,这些是他们过去几年的经历。
现在看上去,技术逻辑朗若裂眉。可一但上手去做,就会经历了很多“一想就对,一做就废”的至暗时刻。
即使是在领域里滚了 20 年的老师傅,也会经常卡在一些技术点上,例如主控节点之间信息高速互联的协议策略、例如负载调度的模型微调。作废的代码无计其数。
说到底,“集中式全闪存储”就是一项软硬件紧密耦合的复杂工程,而工程从来无法用理论公式去完成。
很多软硬件模块的原理都是对经验的拟合,没有犯错的经历,你就不可能知道怎么做。
为啥美国公司能做好集中式存储?因为他们做了几十年,也错了几十年。仅此而已。
郭照斌告诉我,仅仅软件部分,FlashNexus 就有 1000 万行代码,都是这几年一个字一个字手敲出来的。
即便有些模块能找到成熟的开源代码,他们也是学习之后自己实现出来。
这倒不是什么强迫症。因为只有自己敲出来,才意味着对其中的代码有了本质理解。
一个用来护佑山河的存储系统,中国人必须完全理解,这很合理吧?
而所谓理解,不过是在黑暗中摸索,一遍遍重来的过程中凝结的伤疤。
2019 年,就在曙光集中式全闪存储研发开始前,美国突然宣布把曙光加入“实体清单”。
大家总爱开玩笑,说这是对中国科技公司硬实力的盖章认证。
但曙光存储的师傅们可笑不出来,这意味着一场针对自己的“追杀”拉开序幕,刀刀见血。
刚才说过,集中式存储是软硬件协同的。这意味着光靠代码还不够,很多调度逻辑都要固化在硬件里。
可美国一纸禁令,让原本还谈着合作的外国企业一夜之间把曙光拉黑,一个字都不敢说了。
在这种情况下,哪怕之前已经买到手的芯片都不能使用了, 因为原厂不给任何技术支持,使用这些“三无芯片”万一出啥问题,不是给自己埋雷吗?!
怎么办?
还能怎么办?曙光老师傅开始用国产芯片重新设计。
存储系统里不光用到 CPU,还有大大小小很多芯片,有些专用芯片就是为存储产品设计的。这些芯片未必有多精细的制程,只是国外的比较成熟,过去没有“卡脖子”,直接进口就行。
现在,曙光只好紧急联系中国合作伙伴,给他们描述芯片的用途,讨论参数,从头进行联合设计。
这是一场浩繁的工程。
但俯瞰当时的中国,曙光并不孤单。因为“卡脖子”的无差别攻击,很多行业都突然面临专用芯片缺失的局面,被迫开启产业链自救。
塞翁失马焉知非福。中国芯片的产品线补足,也发生在这个时期。无数自救故事凝固在彼处,成就了一幅宽阔的“清明上河图”。
杀不死我的,必将让我更强大。
一个有趣的转机来自 2022 年底。
那时,“集中式全闪存储”刚刚做好软硬件的诸多准备,准备全力攻坚,隔壁突然传来了好消息。
曙光的分布式存储系统 ParaStor 冲击了一个权威榜单:IO500。
IO500 考验的核心是存储容量和吞吐量。而 ParaStor 一举拿下了 10 节点榜单的第一名,把世界纪录提升了 146%!
这无疑是“荣登”实体清单之后的一次汹涌的自我证明。
ParaStor 和 IO500 登顶成绩。
分布式存储是曙光存储的传统艺能,也是郭照斌本人奋斗了多年的领域。即便如此,这个成绩还是有点超越了他的想象。
也正是从那时起,集中式存储团队心里萌生了一个想法:集中式全闪存储也要证明自己!
3000 万 IOPS,就是那时定下的目标。
实际上,老师傅想要挑战的目标是:做到单集群百控级扩展,1 亿 IOPS。
而在 SPC-1 的测评中,一般会使用 32 个主控的系统。简单除一下,这个规模的系统应该要达到 3000 万 IOPS。
于是,老师傅一边朝着这个指标努力,一边抽空和 SPC 联系。由于相隔大洋,只能用邮件沟通,有时候一来一回就要一个礼拜。
2024 年夏天开始,好不容易拿到了测试系统,老师傅赶紧部署下去跑分试试。
结果,就在快要跑到 3000 万 IOPS 的时候,测试系统就闪退了。。。
老师傅咂嘴。看来咱水平还是有待提高啊,继续反躬自省吧。
自省了半个月,老师傅越发觉得不对劲。有没有一种可能。。。是测试程序。。。有问题?
又开始了几轮漫长的邮件沟通,SPC 的技术团队终于确认:不好意思,我们的评测系统从没跑过 3000 万 IOPS,确实存在 Bug,等我们 Update 一下。
为了见证一个世界纪录,连赛场都得重修一次,也算是活久见了。
时间终于来到了 2024 年秋天。顶级全闪存储的软件和硬件终于打磨光亮,测试程序也及时更新,文章开头的那一幕终于出现了。
这个打榜的存储系最终形态是:
32 个主控,每两个主控互为备份,总共是 16 组“仓库”,各个仓库之间由高速网络互联,可以实时进行信息同步,保证它们连接在一起,共同成为一个超大的变形金刚。
这就是 FlashNexus 全闪服务器,前面的 25 个格子,就是 25 块闪存盘的位置。
这样一个每秒可以进行 3000 万次存取响应的人造物巅峰,完全有能力进入大银行的心脏,记录海量刷新的账目;有能力进入电信系统,记录所有人的话费实时消耗;有能力进入石油系统,支持超大规模 AI 来分析地震波,寻找更加隐秘的矿藏。
凡是国外存储系统能支撑的场景,中国存储系统都能支撑;有些他们支撑不了的,我们还能支撑。
因为我们是世界第一。
这是测试结果的完整参数
这是一场围追堵截中的登顶,一场旷日持久的尘埃落定。
客观地说,曙光并非唯一的成功者。就在 2024 年,其他头部的国产厂商也宣布推出自己的集中式全闪存储。
从这个意义上讲,中国师傅作为一个整体,踏足了曾经的技术禁区。
2025 年 2 月,SPC-1 的官方认证发布,在他们给曙光团队的邮件中如是说:
我们将会把结果发布在 SPC 的网站上,并且给所有邮件列表上的成员发送通知。
我还会在首页上添加一个通知;并非每一天都有人能刷新 SPC-1 纪录。
那之后几个礼拜,郭照斌的手机被各方信息轰炸。
不仅自己的销售团队来问,客户也托人来问,连很多友商同事都找来询问情况,因为他们的老板看到新闻,质问他们为啥不去打榜。。。
“你们的纪录有信心保持多久?”我问郭照斌。
“我当然希望保持久一些。也许一两年,也许很快就被打破。但没关系,纪录就是用来打破的,因为我们也会继续创造更好的纪录。”
和团队一起燃烧了几年生命才抵达顶峰,郭照斌却没有我想象中那么留恋。
他的平静,或许源于祛魅。
在过去的十多年,我们内心大概有一个共识:
中国技术可以做到很强。但这种强来自于已知的堆垒,而非对未知的探寻。
换句话说——中国难有受人尊敬的技术创新。
这种判断非常理性。毕竟中国的制度、学术体系、商业氛围都和西方不同,最近几十年的历史也一再证明,美国总是创新的策源地。
但就在 2025 年,一些跳脱出历史经验的事情正在发生。
DeepSeek 祭出了让世界 AI 研究者膜拜的模型推理结构,Manus 让 AI 拯救了重复劳动的社畜;宇树机器人在春晚舞姿顺滑,越疆机器人用手指捏起了樱桃。
中国技术人一如既往平凡地生活,上班打卡、下班带娃,可他们手中却不知不觉开始诞生一些世间尚不存在,并不平凡的东西。
如春雨润物,大地返青。
这是一场汹涌的祛魅。
在郭照斌心里,这种祛魅发生得更早。
2022 年,分布式存储创造了 IO500 世界纪录时,郭照斌突然有一种感觉:身边的人还是那些人,谁也没有长出三头六臂,也没听说谁菩提顿悟。
就是这些原班人马,十几年前还在琢磨模仿美国技术,七八年前还在研究如何跟紧别人的创新。也不知从那天开始,突然发现前面没人了,只好自己创造,也就拿下了世界第一。
现在的信息流通非常自由,全世界的技术人正在同一片土地上耕作,过去那样的严密封锁再也不会出现了。
冲击最高点不是不可能,只是以前没敢想。
他说。
听着他的话,我陷入了自己的回忆。
小时候,总看到那样的新闻报道:有追求的技术人舍家撇业,远渡重洋。因为最好的东西只在彼岸发生。仿佛这样的奋不顾身浸染着至深的浪漫。
但如今,我就在家门口,和这些创造了历史的技术人面对面,他们看上去和蔼平静,可能还有点儿羞涩。就像是小时候结伴上学的哥们。
我大概明白,技术人的浪漫,也许并非走到世界的尽头。而是把那些汹涌的远方带回家,成为手中的柴米油盐,脚下的寻常巷陌。
如果把这些造物搬到你面前,它们只是棱角分明的机柜。匆忙一瞥,对它的印象一定如纸片一样轻薄。
但如果安静下来,把所有的定格连缀成故事,会听到一条澎湃的河。
三十年前,老一辈技术人之所以把他们的作品称为“曙光”,寓意已非常明确。而时代变迁,后人也许终究无法重走他们的筚路蓝缕。
但一代人有一代人的使命。
山河宽广,我们永远需要无尽的算力和存力的护佑。每一个尚未抵达的世界纪录,不都是新一代技术人谱写历史的机会吗?
在和我聊天时,技术老师傅总是尽量避免华丽的词汇,他们朴实地解释自己的参数,讲解实现的方案,我听不懂他们就换个方式再讲,怎么说都不腻。
但此刻,回忆那些平淡的对话,我却如置身扁舟,漂流在那条汹涌的河上。
一个我儿时就会背,但却用了几十年才渐渐理解的诗句突然又浮现在脑海:
为什么我的眼里常含泪水,
因为我对这土地爱得深沉。
往期推荐:
有人把数据化成歌
有人把它存在山河
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。
Thx with in Beijing
2025-03-20 11:04:00
原创 史中 浅黑科技 2025-03-20 11:04 北京
一群师傅正在把大模型做成机甲战士。
浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
用大模型揍黑客?
恐怕得先跟人脑学两招骚的!
文|史中
家人们, AI 已经不满足于自己卷,而是开始祸祸各行各业了。。。
最近跟人聊天, 只要三句之内你还没提到你们行业“大模型怎么代替人类牛马”,人家就觉得你这行药丸。
但这事儿怎么可能这么简单?要知道,各行业对人类技能的要求本就千差万别:
设计师得懂得视觉语言,理解空间规划;
文学编辑得理解语义空间,懂得搜索和引用信息;
工程师得有严谨的决策和推理能力。
↓↓↓
所以,不是随便装个 AI 就能起飞。
针对每个行业,AI 都得反复摩擦,选定非常特别的姿势切入才可能成功。
这里藏着真知识,值得爱智求真的浅友们研究!
最近我刚和一位网络安全硬核老师傅聊天,他和团队正在把大模型作为机械战士,用子弹和铠甲守卫我们的网络空间。
这位师傅就是潘剑锋,他也被同事称为“潘神”。
当年,他是影响一代网络安全研究者的安全工具“冰刃(IceSword)”的作者,如今,他是 360 集团的首席科学家,360 数字安全集团的首席技术官。
潘剑锋
潘神从小就是学霸, 恨不能直接把卷子翻过来做大题那种。所以他比较反对有些人“为了用大模型而用大模型”,就蹭点儿步骤分。。。
他觉得:
要么就不用大模型,要用就让它真的比人更猛!
嗯,主打一个童叟无欺。
为此,他的思路是:遇事不决,照着人学!人有多骚,AI 照抄!
这不,团队这两年总算用这个姿势撞开一条小裂缝,看到一丝光明透进来。
说起这段故事,潘神决定从一个人工智能几乎无解的“弱点”聊起。
几天前,马斯克刚刚祭出了据说是地表最强 AI——Grok 3。
有人立刻把那道经典送命题递了上去:
你看,这就是地表最强 AI 的水平。棒棒!
话说其他 AI 对于这个问题的回答也一个鸟样,就算能答对,恐怕也只是针对性地打了补丁。
因为现在的 AI 训练方法的基础是统计学,所以 AI 对世界的理解也是“统计性理解”,而非“本质性理解”。
潘神给我解释。
啥是“统计性理解”和“本质性理解”嘞?
我给你举个例子。
假设三体人派质子来到地球研究我们的生活。
他们偷拍了 1 万张日常照片,发现了我们会在一起吃“生日蛋糕”↓↓↓
他们馋了,也想试着做出来尝尝。
于是挑出了几张含有生日蛋糕的图片,做了个简单统计:
这种玩意儿大概率是矮圆柱形,滑滑腻腻的,插着一些可燃物。
然后用三体星球上现成的原料,照猫画虎把这个东西做出来:
而后,质子又从地球多拍了 100 万张照片传回去,里面有更多生日蛋糕的图片。
三体人又一统计,发现出问题了:
生日蛋糕的内部结构和外部并不一样!
在里面是一坨软软的带有空洞的物质,外面才是滑滑腻腻的材料。
他们于是又一顿忙活,从更多的数据里总结更多特征,改进了自己的蛋糕。
这回从里到外都更像地球的蛋糕了。
三体人学做蛋糕的过程,就类似于人工智能模仿人脑的过程。它展现了统计性学习的两个特点:
1、学生不是想学啥就能学,而是只有本体的某种性质展现出了统计上的特征,才能被学生注意到,才能被学会。
2、随着描述本体的数据不断增加,可能会有新的特征凸显出来,学生学到的特征越多,表现就越接近本体。
但是!这里隐藏了一个让人脊背发凉的大问题:
就算三体人再拍 1 亿张生日蛋糕的照片,把蛋糕做得再惟妙惟肖,只要他们来不了地球,无法亲自品尝,他们就永远不敢肯定自己的蛋糕和地球蛋糕的味道是完全一样的!
完全存在一种可能:
我们放的是糖,他们放的是盐,我们放的是蛋糕胚,他们放的是发泡塑料。。。
残酷的事实是:在特定的数据采样体系下,有些本质是不会展现出统计学特征的。
也就是说,“统计性理解”原则上能不断逼近“本质性理解”。但推到终极,你却无法证明“统计性理解”达到了“本质性理解”↓↓↓
于是 Bug 暗伏其中。
三体人拿出塑料蛋糕的一瞬间,不就像极了 AI 说出 9.11 比 9.9 大的那一刻么?想想看,是不是还挺恐怖的?
更恐怖的是,你不知道 AI 的脑袋里还有哪些“坑”,也不知道这些坑什么时候会出来把哪个老铁给坑了。
这个问题没有“特效药”,只有“广谱药”,就是:
不断给 AI 学习更多、更好的数据,祈祷新的数据里恰好含有重要的统计学特征,“未亡羊先补牢”呗。
但在最近,即便是广谱药也快失效了——我们遇到了“数据墙”。
人类几百年积累的知识数据,该喂给 AI 吃的都已经喂了。
地主家也没有余粮了。接下来只能靠 AI 自己合成数据继续训练,这样自己拉自己吃。。。最后会不会吃出毛病,学术界还颇有争议。
训练 AI 的数据,无法突破人类既有知识的极限,也就是“数据墙”。
基于以上,潘神的眼神开始犀利起来:
既然 AI 短期存在无法突破的能力极限,那就可以把网络安全的问题分成两类,用大模型做出两套不同的体系来解决。
一套是“快思考”,一套是“慢思考”。
1、“快思考”用来做判断题,不用绞尽脑汁解释为啥,以对服人,适合放开手脚让 AI 用自己的方式去干。
主打一个:人能干,但 AI 更便宜。
2、“慢思考”用来做证明题,必须展现复杂的思考步骤,以理服人。AI 自己搞不定,可以遵循人类老师傅已有的经验框架去干。
主打一个:AI 不够,祖传知识来凑。
这个思路,其实就是从人脑的思维方式抄的!接下来我给你展开说说。
老铁们估计都知道,“快思考”、“慢思考”的分类来自于心理学家丹尼尔·卡尼曼对人脑的研究。
一个最经典的例子就是:
你在丛林里遇到一个长条形的东西,形势容不得你花时间分析它到底是啥。快思考会在第一时间输出“危险”这个信号,给你的指令就一个字——跑!
等你跑开了一段安全距离,慢思考才跟上来。你可以详细观察这个东西的纹理、动作,然后综合判断它到底是蛇还是翔,以决定接下来的计划。
打个比方:
快思考就像一把火,短暂而绚烂地燃烧;
慢思考就像一条河,带着小船时急时缓地漂流,一段时间后才奔流入海。
↓↓↓
在网络安全领域,快慢思考也都有用武之地。
咱们这一趴先说个“快思考”的例子:
假设中哥开了家公司,办公网就像一个工业园区,里面安装的 360 安全系统就像保安大队,负责监视园区里的一举一动,以防有人搞事情。
黑客偷来一张工牌,为了寻找敏感资料,他想拿着这个工牌混入档案大楼。
黑客走到档案楼门口,这位保安只有几十毫秒的时间做出判断。如果感觉这个人不对劲就要果断拦截,否则就得放行,不能耽误人家的事啊!
传统的做法是,把所有已知的黑客行为特点都提前总结成一条条的规则,放进一个大的“规则集”里。
来了一个人,保安只要无脑对照规则集里所有的规则查一遍,就有了结论,这不就很快了吗?
但是,规则终归是死板的。
它就像特工电影里那种会触发警报的红外射线,即使数量再多,中间还是会有缝隙,聪明的特工总能找到方法绕过。
这不保险。。。
人类大脑就很灵活。
老保安队长和坏人眼神一对,就感觉他有问题。
具体哪儿有问题一时说不清,但没关系,只要觉得他有问题,就可以拦下来慢慢盘问!
现在咱有了大模型,直接用它模拟老保安队长那种说不清道不明的“直觉”来做判断,不就直接吊打黑客了吗?
听上去不错,但操作起来没那么简单。
咱们的大脑看似是一坨,实际做复杂判断时,是里面很多“脑区”相互配合的结果,就像病人的疑难杂症需要不同科室的专家会诊一样。
如果要模拟人脑识别高级入侵,“一把火”不够,得把网络安全所需的不同脑区都给训练到一个大模型中↓↓↓
这些脑区有的是看代码,有的是看日志,有的是做推理,有的是读语言,知识体系和功能都差异很大。
偏偏目前的均质大模型结构存在一个天生缺陷。
那就是,同时学习多个差异很大的知识体系,就会形成跷跷板效应:A 领域学会了,有可能 B 领域就学废了,反之亦然。
其实这个缺陷人脑也存在,你读一个博士都费劲,同时读五个风马牛不相及的博士你试试,不走火入魔才怪。
但网络安全的场景非常复杂,要想拦住顶级黑客,你还真就得读五个博士。
不搞定这个 Bug,大模型就无法在网络安全领域落地。。。
老师傅们只好退而求其次:
把不同的专家彻底分开——独立训练几个“安全专家模型”,每个专家的脑袋瓜只思考一件特定的事情,然后让他们组成一个“专家组”。
遇到复杂问题,抽调团队里相关的安全专家模型分别思考,再把结论综合起来,这不就行了吗?
行是行,但这样独立模型联合起来的团队,未免太奢华了。。。
每一个专家模型都要有语言和逻辑思维能力,这意味着它们分别要在大模型的基础上训练而成——比如是 72B 的模型。
而干一件事儿可能需要 10-20 个专家模型配合。这么一来,系统里等于是并行跑着 10 个大模型。
运行一个 72B 的模型,怎么也得需要一个装满 4 张 L20 推理卡的服务器,价格最低也要 20 多万。要是跑 10 个模型,光是机器就要 200 多万。
对于绝大多数企业来说,这都是一笔巨额开销啊!
想想看,哪个工业园区也不会把日常支出的 20% 用于给“豪华旗舰版保安队”开工资吧??
看到没,这才是大模型进入产业的真实困境。。。
看来,人脑的作业也不是这么好抄的,得上点儿狠活!
说到这,潘神终于搬出了他们的一些探索成果:
360 数字安全团队也会训练很多“安全专家脑区”,但不同的是,他们对这些脑区“提取最大公约数”——彼此共用一套大模型底座。
具体来说就是:
1、每类任务都交给一个特定的“专家脑区”,平时把这个脑区外挂在大模型底座上训练;
2、每次训练的过程中,把底座大模型的参数锁死,只改动“外挂脑区”的参数;
3、训练好 A 专家脑区,就把 A 从底座上拔下来,再插上 B 脑区,训练 B 任务。
你可以这样想象:一根火柴梗,上面能搭配很多火柴头。
这样一来,所有的专家共用了一套语言逻辑中枢,也就是那个大模型底座。每个专家脑区只负责特定的思考,脑容量就能大大缩小,大概只有 1 亿个参数。
然后,设置一个路由模块。
系统思考的时候,它会根据任务的不同给它指派“火柴头”。
每次指派之后,信息流就从大模型基座(火柴梗)烧向这个专家脑区(火柴头)。
在思考下一趴的时候,路由器会重新指派“专家脑区”。以此循环,直到所有的思考结束,最终答案呈现在眼前。
这样一来,火柴是用到哪根点哪根,火柴头平时也不占地方。
同样是一台 20 万的机器,原本只能驱动一个专家,现在却驱动 10 个专家也没问题。
这个架构,被 360 称为 CCoE(紧凑型多专家协同大模型)↓↓↓
潘神告诉我,现在他们训练了很多个“火柴头”专家,企业客户根据自己的情况,用到哪个专家就买哪个专家,跟自助餐一样丰俭由人,非常方便。
但别高兴太早。
“快思考”只能解决一半儿的问题。
我们刚才说过:快思考虽然能快速做判断题,但它的判断“不保熟”。
保安看一个人像坏蛋,虽然可以用直觉判断拒绝他进入园区。但如果背后没有理性逻辑支撑的”慢思考”,终究会存在两种问题:
一来,可能误伤好人,次数多了人家会投诉你,保安就得下岗;
二来,坏蛋痛定思痛,下次乔装打扮得更好,你可能又给放进去了,保安还是得下岗!
为了不下岗,保安必须得有环环相扣的逻辑推理能力,这在大模型技术中被叫做——思维链。
如果你用过 DeepSeek,就不会对“思维链”太陌生。
DeepSeek 在正式回答你之前,会走一段内心 OS,这个 OS,就是它的思维链。
那么,只要用这个思维链思考, 就是潘神所说的慢思考了吗?
他的答案是:No。
掌握了思维链,就像学会了功夫。
首先说,练过拳脚的人和没练过拳脚的人肯定不在一个量级,一打一个服气。
这不,DeepSeek 利用思维链给出的回答,相比之前直觉大模型(例如 GPT-4o)的不假思索直接出答案,更加有理有据,令人信服。
但功夫这件事儿,是分段位的。白带打不过黑带,黑带打不过红带,山外有山,进无止境。
咱们不妨具体看一下 DeepSeek 的功夫,它的绝招是“反思”:
你问 DeepSeek 一个问题,它会把问题拆成步骤,一步一步地往下推导。
这个思维链原本像一条河流。
小船自然地随着水势自然流淌,永远不会意识到自己在随波逐流,更不会“主动”倒船选择更顺的路↓↓↓
但是,DeepSeek 不同,如果推导过程中出现了矛盾,它居然会倒带,修改之前的思考方向。这就是反思!
直到它撇出一条顺滑的结论,才算是走通了一条思维链↓↓↓
用同样的方法,它还会给出几条思维链,最后再反思一下,沿着最顺滑的那条思维链给你输出答案。
这很不寻常。
因为,只有在思维之河之外存在某种监督机制,才能对小船的航向有感知和反思。
这种监督机制,恰恰是人脑的特色。
DeepSeek 之所以被全世界竖大拇指,最大的功劳就是:工程师没有把这种反思能力强加于模型,而是找到了方法,让模型自己进化出来。
在 DeepSeek R1 的论文中,老师傅展示了一段思维链,AI 在思考过程中,直接用人类的口吻来了个“aha”,这意味着它有了反思,开始重整思维链。
但潘神提示我:作为人类,咱可不只有“反思”这一个绝招。
人在为思考按下暂停键时,除了“闭眼向内求”——通过自省来重新修正自己的思维链,还会“睁眼向外看”——借助工具和信息渠道,从开放世界拿回最新鲜的数据,辅助生成接下来的思维链。
据此,有关思维链的段位,潘神总结了三级:
第一级:类似于 GPT-4o 这样用直觉输出答案,是“快思考”;
第二级:类似于 DeepSeek 和 GPT-o1 这样有向内看能力的思维链,可以叫“深度思考”;
第三级:在反思型思维链的基础上,还能主动吸收外部信息,一边向外看一边想,才是更完整的“慢思考”。
要达到第三级,才能处理网络安全的诸多问题。
但现实很残酷。DeepSeek 的训练资源和技巧已经是当前世界顶级了,要想在它的基础上改进,技术难度提升可不止一点半点。
但他不打算坐在原地抱怨,而是想办法使“巧劲儿”。
遇事不决,照着人学。
让我们观察一下自身,咱们思考问题的时候,啥时候会去查一些信息?
一般是我们“拿不准”的时候。换句话说,当我们需要“不能错的信息”时。
咱们就以网络安全场景为例,不能错的信息大概有四种:
1、精确的通识。比如:网络安全行业处理黑客攻击的《最佳流程手册》。
2、专有的数据。比如:L 黑客组织,360 公司历年捕获到的它曾用过的攻击手法。
3、实时的事态。比如:W 系统最新爆出的漏洞详情代码。
4、工具的输出结果。比如:利用扫描工具检查网域内的设备后,绘制的网络地图。
这几种信息的来源也不同:
通识一般以知识图谱的形式存在,专有数据在数据库里,实时事态一般要联网查询,工具一般要靠智能体去调用。
潘神他们索性把这几种东西打包起来,做成了一个“外脑”↓↓↓
AI 在思维链的形成过程中,可以随时停下,调用这个外脑来补充信息,然后再继续思考,就好像人的“联想”一样!
看到这你也许会疑惑:DeepSeek 不是有个“联网搜索”功能吗?这不已经是联想了吗?
还是有区别的:
DeepSeek 是在思考之前先搜索,然后带着搜索内容开始生成思维链。思维链在延展的过程中,是不能停下吸纳新信息的。
这就好比只在河流的发源地汇入一股水流。
你没办法预测后续具体会用到什么信息,只能不管后面有用没用,先一股脑多输入一些。
而“联想”则是在河流流淌的过程中,随时汇入支流。
由于前面已经完成了一部分思考,此时应该非常清楚急需什么,可以有针对性地搜索、纳入这些信息,让接下来的思考更锋利。
显然,联想这个特点更拟人。
但问题是,目前还没有一种方法,可以让大模型在思考的过程中主动产生联想的“欲望”。
这咋办?
潘神团队研究出一个看上去粗暴,但着实有用的方案:既然敬酒不吃,那就吃罚酒呗!
在模型思考的框架里加入“强行联想”的功能。
具体来说就是,思维链每行进一步,都有一个外部的算法对它进行评估,一旦发现思考的内容符合条件,二话不说直接激活外脑。
这个算法其实没那么复杂,甚至也不是一个大模型。
你可以把它想象成河流当中的浮标,只要思维的深度触碰到浮标, 就主动开闸,引入一条支流,把新信息合并进来继续作为下一层思考的输入。
这个带有实时联想功能的思维链,被他们称作 CoAT(Chain-of-Associated-Thoughts),也就是“联想思维链”。
你感受一下全过程↓↓↓
高级的食材只需简单的烹饪,虽说 CoAT 实现方法并不复杂,但效果还挺显著的。
潘神给我看了一个例子,分别用 CoAT 架构的“慢思考大模型”和 DeepSeek 的“深度思考大模型”来解答同一个问题。
问题是这样的:
我们应该如何看待人工智能在当代国际竞争中的作用?哪些国家在这一领域拥有领先的优势?
DeepSeek 发挥稳定,答案很详细,但美中不足是例证较少。
CoAT 的不同点是,它列举了几个具体国家的 AI 策略,并且提供了美国 AI 研究的具体项目和中国的“新一代人工智能发展计划”。
之所以会有这样的区别,大概正是因为 DeepSeek 只在最开始的时候搜索了外部信息,而 CoAT 是在思考的每一步都通过外脑查询相关的信息,从而可以更具体。
这是回答上述问题的完整思维链生成过程,可以看到在每一步都和红圈内的外脑交互,进行了“联想”。(点击看大图)
潘神告诉我,这种优势在思考网络安全的专业问题上会表现得更明显,他们正在紧锣密鼓把这些能力加持在 360 的大模型安全产品里,客户很快就能体验到。
但天下武功都有走火入魔的可能,这种“强行汇入支流”的操作也暗藏危险:
在思考中添加外脑的信息,并不一定总是会让思考结果更好。
原因很简单,如果汇入的支流里面有泥沙,就会让本来一条清澈的河流变得浑浊。
所以,如何筛选和精简外脑的“信息水流”,是至关重要的。
他们于是在每一条汇入的支流入口处,都加了一道“水闸”。
这个水闸其实就是一个评估算法,来计算内容和已有思维链生成内容的相关程度。
只把最相关最核心的内容放进主河流,其他的信息主动放弃,主打一个宁缺毋滥!
↓↓↓
潘神特别提醒我,CoAT 只是一种技术框架,里面所有的参数都是可以调整的:
在网络安全领域,对思维链的聚焦度要求比较高,就可以决定只在关键节点汇入支流,汇入的水流也少而精确;
而在其他领域,比如辅助写作,完全可以更多地汇入信息,每次加入丰富的数据,让结果变得更加发散,更有趣味。
360 的老师傅合计了一下,觉得这些研究对很多行业都有用,于是把一部分研究成果写成了论文分享了出来。
这个操作很快引来了一些“自来水”。有人录视频、写文章分享他们对这个技术进展的解读。
一位外国程序员小哥做的视频解读。
这并不太意外,毕竟如今 Made in China 的技术也是品质的保证嘛。
实际上,随着前几天 DeepSeek 对技术的披露,人们逐渐意识到:
“颠覆性创新”很多时候是由一系列“实践创新”集合而成的。
DeepSeek 的每一个创新都很具体,比如 GPU 优化、通信库、文件系统。。。但合在一起就有奇效!
如此说来,像 360 老师傅这样的实践型创新同样值得被我们点赞。
无数这样的大小创新集结起来,才把我们一步步推向那个“智械黎明”。
网络安全也许是大模型的光亮最难照射进去的几个行业之一。
它是战争的线上版本,是全人类最顶尖头脑之间的攻防。人脑尚且不够用,怎么轮到 AI 多嘴?
但大模型的光芒一旦照进去,网络安全行业又会是最闪耀的。
因为网络安全行业是“赛博原生”的。
它自古就能触及浩如烟海的底层日志,能见识最多走位风骚的攻击路径。而大模型本就是数据驱动的。如果能够找到方法完整、高效地利用这些独门数据,做出来的机械战士将强的可怕。
只是,黎明之前的暗夜太长,不知谁能坚持穿过。
大模型已经横空出世三四年了,虽然几乎所有的网络安全公司都说自己用了大模型,看上去一片火热,但如人饮水冷暖自知。
很多安全公司使用大模型的原动力都来自于行业的内卷和焦虑——本来生意就不好做,别人吹牛说用了大模型,你不说,生意就更不好做了。
在很长的时间里,残酷的迷雾一直笼罩:全行业都没有找到“特别适合大模型的任务”。
有些任务大模型能干,小模型也能干,但小模型的性价比更高;
有些任务小模型确实干不了,但人干更便宜,性价比仍然比大模型高。
现实很残酷,各个企业中的网络安全部门虽然客观上肩头责任重大,但一般却是公司里存在感最低的部门。
老板天然更注重业务,谁愿意天天关注保安队呢?
一般是哪种安保措施性价比高,人家就选哪种方法。
未来,即使是这么严苛的标准,“大模型驱动的保安”也可能被挑中!
举一个在安全运营中的例子吧:
网络流量中的一种分析任务,如果放一个人类专家在这,工资成本也不低。现在,CCoE 框架下的大模型能达到人类准确率的 90%,但运行成本远低于人类专家。
在这种表现下,无论怎么算账,大模型加持的机械战士都是这个岗位的最优选项——不出意外,它即将成为这个岗位上的钉子户。
如果从远处眺望,网络安全系统就像一艘战舰。
未来的日子里,大模型有希望在越来越多的位置上成为钉子户。一点点替代传统的规则引擎,替代人类的专家判断——如忒修斯之船一样每天替换掉一个部件。
某一天,当太阳再次升起,战舰的轮廓显形,我们也许会见证一个“智械黎明”。
我不知道这个黎明还有多远。
但我知道的是,那个黎明来自过往的每一天,来自行业中无数头铁的老师傅用微小而坚定的创新一点点撞开的裂缝。
往期推荐:
👉最 Deep 的 Seek:AI 的“终极设计图”是什么样子?
人有多骚
AI 照抄
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。
Thx with in Beijing
2025-02-12 11:03:00
原创 史中 浅黑科技 2025-02-12 11:03 北京
宇宙中所有的智能,都共享同一张“设计图纸”。
浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
AI 的“终极设计图”是什么样子?
文|史中
我写这篇文章的时候,正值 DeepSeek 撕开防线,和人类最强的智能 ChatGPT 隔空对峙。
DeepSeek R1 的凶猛,并不在于它超越了对手 o1 模型的逻辑推理能力(实际上只是几乎追平),而在于它实现这些能力,只需要十分之一的成本。
换句话说,它的智能密度相当之高。
具体实现方式,DeepSeek 已经公布了论文,很多大神也做了详细解读,不多说了。
今天咱们试着潜入智能的最深处,讨论三个层层递进的话题:
1、用“显微镜”看,智能的微观结构究竟是什么?
2、什么东西在决定“智能的密度”?
3、我们有办法做出智能密度达到极限的 AI 吗?
这么深刻的话题,中哥确实没能力自己构建理论体系。给你介绍一个高手,他就是计算机科学家,被称为目前活着的最聪明的人——史蒂芬·沃尔夫勒姆。
这篇文章的核心观点,就是来自这位大神。
Stephen Wolfram
友情提示,接下来 20 分钟,我们要和最聪明的大脑打交道,也许有些观念过于抽象,需要一些额外的“思维垫脚石”。
有些垫脚石乍看和主题无关。但相信我,它们都是通向最终结论所必须的。如果卡住,延伸开去琢磨一下,再回到主题,最后一定会有收益。
让我们开始吧!
(一)智能的莲花开在淤泥上
沃尔夫勒姆从一个简单的人工智能神经网络开始:
上图是一个很有“二极管”风格的函数,它其实和人脑很像。
你可以理解为它就是你的大脑在恋爱中所做的判断:当 x 满足某些条件时,你会上头,和 ta 结婚,此时 f[x]=1;当 x 不满足这个条件时,你会下头,和 ta 分手,此时 f[x]=0。
现在,我们想“克隆”一下自己的大脑——用人工智能来模拟和这个“目标函数”一模一样的操作。
该怎么做呢?
我们可以搞一个神经网络,然后从这个目标函数上做数据采样,用这些采样去训练神经网络。
经过 1000 轮训练,最后出来的结果是酱的:
一堆神经元分层传导,每条连线都定了不同的参数权重,它们形成了一个类似于方程的计算系统。你给出一个 x 的值,它就能给你算出 f[x]的值。
你可以代入数值验证一下,它虽然不和原始方程精准重合,但确实是非常接近的——这是个好使的人工智能。
不过这里有两个问题:
1、在训练开始时,你无法预知最终每个参数会是什么。
上图显示从第1轮到 1000 轮的训练过程中,函数曲线不断接近目标函数的过程。由于参数是在一步步迭代中确定的,所以无法预知后续如何变化。
2、训练结束后,你很难讲出每个具体神经元参数对最终结果的影响是什么。
随着 X 的变化,中间参数取值也在变化。在曲线的转折点,你能看出发生了变化,但很难说清楚每根线具体弯折的意义。
所以整个训练过程有点儿“解释不清楚”:你只知道最后这个神经网络能用,但是,一不知道它是怎么能用的;二不知道它是怎么变成能用的。。。
这不是很奇怪吗?
其实也没那么怪。
我猜你上学时,一定有过这样的经历:试卷上一道题,你能直接说出正确答案。同桌问你怎么做的,你就是没办法拆成他能理解的步骤给他讲明白。
还有的人,可以控制自己的耳朵动。可是你问他具体怎么控制,他肯定没办法和你说清楚,因为这是神经系统整体的运作,无法用语言逻辑拆分。
沃尔夫勒姆的意思是:
“解释”这件事情,根本就是个幻觉。
比如我要给你解释:“汽车为什么会走?”
我可以从宏观层面解释:
能源的化学能转化成了动能,汽车就能走。
但你还不明白,让我详细说说。
于是我从更细节的层面解释:
发动机的四个冲程让燃料燃烧,推动了传动杆,传动杆又连通了底盘和车轮,车轮转动,与地面摩擦,汽车向前。
但你还不明白,让我再详细说说的。
于是我从微观层面解释:
分子层面的化学反应,刚体物理的诸多性质。
但你还不明白,让我继续深入解释。
于是我发现,细微到一定程度,解释就失去意义了:
汽车的微观层面就是一堆原子。。。它们在遵循特定的规则震动。无数震动效果的总和就是汽车向前移动。
这算啥解释?
沃尔夫勒姆在上个世纪就提出一个简洁又凶残的洞见:世界的本质是“计算不可约”的。(这是迄今为止对我震撼最大的认知之一,我在《活成了狗》中也详细介绍过。)
简单说就是:
1、微观粒子遵循基本规律;
2、宏观世界是微观粒子的直接累积,无法被简化。
但我们的大脑一厢情愿希望找到“简单解释”。
哪怕这些解释不是100%事实,而是舍弃一部分事实之后,形成粗简的“故事”,以便大脑(可怜的)计算力能够与其他的故事类比起来,以此才能对改造世界的工作进行一些(不一定正确的)指导。
越往微观层面走,我们保留的事实就越多,故事就越不好理解,但离真相更近。
越往宏观层面走,我们舍弃的事实越多,故事就越好理解,但离真相越远。
这种感觉很奇妙。它暗示:我们的世界就像一朵莲花,花瓣分明,艳丽异常,但追根溯源,却根植在一坨烂泥上。
回到我们的主题。
神经网络每个神经元是干啥的,之所以不好解释,就是因为我们试图用微观事实在宏观上拼出一个的“简化的”故事,这本质上是无法做到的。
说了半天,意思就是。。。此题无解吗??!!
诶,沃尔夫勒姆的凶悍之处正在于此。他的观点是:
通过深刻理解智能为什么不能解释,可以指导人类造出更厉害的 AI!
下面扶稳坐好,我们从最微观的一砖一瓦开始,一点点描绘这幅图景。
(二)大脑是“离散”的!
计算机是会死机的。
如果程序里存在嵌套的逻辑,计算机就只能一直算一直算,死而后已。
之所以这样,是因为它试图用有限的资源模拟出一个“无限的数学空间”。
这个数学空间里,任何东西都是连续的。
例如,一个小数字都可以分成更小的数字:
0.001 够小了吧,你给 1 前面再塞个 0,它就是 0.0001,妥妥更小。
同理,任何一个大数字都可以组成更大的数字。
在这个数学空间里,你可以砍一刀,再砍一刀,无限逼近但永远也砍不完,跟拼多多一个德性。
实际上,现代数学的危机与荣光,微积分、群论这种高深的理论,都必须建立在各种极限概念之上。它们共同构成了“形式计算”的恢宏大厦。
但是,这个完美的数学空间只存在于纯粹逻辑之中。
最近一百年的科学证据已经疯狂暗示:真实宇宙的基本结构不是连续的,也不是无限可分的,而是“离散的”。
你可以不严谨地把宇宙想象成一个屏幕。
在最小的尺度上看,全是像素点。一个粒子要么在 1 号点位,要么在 2 号点位,不可能在中间的 1.5 号点位,因为宇宙的基本结构决定了就没有这么个“像素”。
一个粒子从 1 号位置移动到 2 号位置,不可能是“滑”过去,必须从 1 号位置消失,然后瞬间在 2 号位置出现。
沃尔夫勒姆想强调的是,在这种不连续的底层结构上进化出来的大脑,也必然“遗传”了这个离散化的底色。
现实情况也在印证,大脑不是计算机:
首先,我们的大脑真的不擅长算数,两位数都容易算错,而计算机最擅长的就是算数。
其次,大脑如果真的是计算机,一定会经常死机,但大脑从不死机。
残酷的自然选择,要求我们的大脑必须具备“反智”的能力:把任何问题都快速坍缩成一个确定的答案,同时可以不要求准确!
原始人在野外看到一个长条的物体,第一要务不是搞清楚它到底是蛇还是藤,第一要务是——跑。
于是,下次你听到“不买华为是汉奸”,“日本人都该死”之类的二极管论断时,可以更加心平气和。
因为大脑本来就是这样工作的,它进化出来是为了在有限的资源下帮人做出决定的,而不是用来探寻真相的。
接下来的问题是:大脑究竟是怎么通过“离散化的结构”给出“又快又不准”的答案呢?
是时候请出“元胞自动机”了。
(三)宇宙里的“逻辑碎片”
元胞自动机最早是冯·诺依曼提出来的设想。
简单来说就是把世界简化成一个充满格子的平面,然后给出一定的规则,再给出一个初始条件。然后就像上帝一样放手不管,只是隔空俯瞰这个世界的演化。
示例如下:
第一排:初始条件
第二排:规则
第三排:通过规则对下一行进行计算的过程
沃尔夫勒姆把元胞自动机玩出了花,他强烈地相信元胞自动机里暗示了宇宙和生命的密码。
我们一直在强调的“计算不可约化”原理,也是从元胞自动机里观察出来的。
这个规则叫做“30 号规则”,从初始的一个黑点,可以衍生出复杂的完全没有规律的图案。
现在,他设想了一个“三色”元胞自动机。意思就是每个格子可以填入两种颜色:红、蓝,加上空白时的白色,一共是三色。
上面一排的三个格子的状态,决定了正下面一个格子的状态。
也就是说,要让这个元胞自动机启动,你只需要设定一个由 27 条规则(也就是 3³ 条)组成的规则集,还有第一行的初始状态。
这就是一种规则集(包含 27 条规则)。
任务来了:假设初始状态只有正中一个红格子,那么有没有一套规则,可以让这个系统正好演化 40 步,然后就停止了呢?
就像下图:
由于计算不可约化,没有算法可以预知答案,只能进行实验。
而且,这里有超过 7 万亿种组合情况(3²⁷),枚举法太慢。
有一种比较聪明的方法:
在 27 个规则中,每次随机突变一个,如果生命长度接近 40,就保留这个突变;如果生命长度没变或者原理目标,就不保留。
这个方法叫做“连续随机突变”。
就这样,经过 300 多次的尝试,突然碰到了一套规则,让生命的长度恰好是 40。
上图的每一行都只显示了 27 条规则的输出结果(输入没显示,和之前的那张图里顺序相同),从 27 个白格子开始逐步迭代某些规则的结果。右侧的数字显示了两排之间发生变化的规则数量。
下面这张图就是随着规则不断进行突变,最终结果不断接近目标的过程。
但是,如果你问我为什么 40 的生命长度对应这套规则,我无法解释,因为是我“碰”出来的。
“即便不能解释,但它真的好使。”
这句话是否似曾相识?
没错,这个特点和神经网络一!毛!一!样!
看到这,你有没有一种不踏实的感觉?上学时老师可不样这么解题啊。万一我没“碰”出来正确的方法,怎么办?
为了打消你的疑虑,沃尔夫勒姆又多做了几次。由于每次的随机性不同,他找到很多套规则,结果都可以是 40。
以下就是五种情况:
这说明啥?说明正确答案不止一个,想要碰出来,也没那么难。
这里有一个隐藏的关键前提,沃尔夫勒姆选择了“三色元胞自动机”,它在逻辑上就内涵了 7 万亿种情况。
如果选择“二色元胞自动机”,则一共就有 256 种规则组合,这里面的可能性就大大降低了。
我甚至可以都列出来给你:
元胞自动机里设置的颜色种类,在某种意义上对应了宇宙空间中的“维度”概念。三维宇宙,就对应着元胞自动机的三色。
通过元胞自动机你可以感受到一个类比:三维宇宙比二维宇宙的逻辑丰富性可是大了不止一点半点。
为啥咱们的宇宙是三维的?
很可能是因为二维宇宙可能无法产生复杂生命,也就无法追问宇宙为什么是二维的。
根据沃尔夫勒姆的宇宙模型,空间可以理解为一种由点线组成的网状结构。维度越高,点之间的连线就越多,从 A 到 B 可能的路径也更多,也就是逻辑更丰富。
由此,我们能得到如下三条启示:
1、我们的宇宙充满了逻辑碎片。
2、简单的逻辑碎片通过排列组合,可以成为拥有特定功能的工具。
3、用逻辑碎片组合出特定工具的方法并不需要多高的智慧,仅仅通过“突变”+“筛选”就可以。
而智能系统没啥神秘的,本质上就是一个可以实现特定功能的(复杂一点儿的)工具嘛。
既然这么说,用类似的方法,也可以做出一个大脑咯?!
可以试试。
(四)用“小方块”做出一个大脑
为了方便你理解,先做一个小小的热身。
我们使用一个“二维元胞自动机”。但这次我们不对规则进行突变,而是给定如下两套规则。(沃尔夫勒姆给他们的编号是规则 4 和规则 146)
在我们的元胞自动机中,具体每一个格子使用规则 4 还是规则 146,由突变决定。
为了突出展示,我们把采用规则 4 的格子用绿色填充,把采用规则 146 的格子用粉色填充。
以下是几个示例:
下面我们开始实操:
假设我们的目的是让这个元胞自动机活 50 步。然后我们从纯绿色开始,在随机的地方把绿色变成粉色,筛选距离 50 步更近的突变。
不出所料,我们能碰出来符合条件的突变:
而且还不止一种。
下图就是另一些例子:
下图显示的是很多次实验中,找到结果分别所需花费的步骤。
好,你应该已经明白了基本玩法,热身结束。
接下来我们把这个元胞自动机做一点儿小改动。
首先,我们把结构改成蜂窝状,每个细胞的状态只由最近的两个决定。
然后,我们使用如下两套规则:
略懂逻辑学的童鞋肯定看出来了,这不就是两个基础的逻辑函数么:与&异或。
这里我们用绿色代表“与”,用橘色代表“异或”。
厉害的来了!使用“与”、“异或”排列组合,还可生成无数其他规则,有种“一生二二生三三生万物”的意思。
系统在随机突变中,理论上会制造出各种函数!
别急,我们一步步来。
先采用我们熟悉的方法进行突变,让这个系统存活 30 步。显然可以做到:
但我们已经不满足于这一点了,接下来上点儿强度:
我们想让系统从某个特定细胞出发,30 步之后,恰好到达另一个特定细胞。
通过突变,可能创造出这样的系统吗?
事实证明,可以!
我们继续上强度,让这个系统变得更“智能”:
能不能用一个系统同时满足多个要求?
例如,点亮第 0 排的 x 细胞,就一定能点亮第 30 排的 y 细胞?
就像下面这样:
注意,要用一套固定的系统(绿橘色块位置不能动)来完成这些不同的任务哦!
事实证明,依然可以。上面展示的这个系统就可以嘛!
说到这,你有没有发现什么?
你再仔细看看上面那张图。没错,我们训练出了最早给你展示的那个神经网络 f[x]。
这个用元胞自动机做出来的像“蜂巢”的 AI 和我们之前的那个神经网络是几乎等价的。
下图是这个系统训练过程中各个“中间形态”的突变点位和与之对应的方程 f[x]:
但是,敲黑板!这个元胞自动机可不是经典的神经网络结构,它们不仅是长得不一样,在基础结构上也是不一样的。
经典的神经网络人工智能也是“离散”的,不过每个神经元的权重最初都是通过形式计算得到的,可能是循环的、无限的小数。
为了不让 AI 在运行时死机,必须强制把他们小数点后面的位数切断才能用。属于是“强制离散化”。
但“蜂巢 AI”的结构天然就是离散的,从头到尾都不会遇到小数点的困扰。
这个离散的结构有两个巨大的优势:
1、它是自然的产物:没有经过人类设计,是通过演化得来的,基本结构和我们的大脑更接近。
2、它的性价比极高:哪怕它得到的结果不太准确,但运行时耗费的计算力非常非常小。
不过,这样做出来的智能系统,它的稳定性如何呢?会不会稍微有点儿扰动就“神经错乱”呢?
没关系,是骡子是马拉出来遛遛!
这个系统从不同的初始值出发,所有过程中被点亮的细胞的热力图。可见:无论取什么初始值,最后结果都落在固定的“0”和“1”上。
(五)模糊的正确
就拿人类来说,我们的大脑时刻要面对的信号都不是“纯净”的。
比如现在,你的大脑正在接受很多信号:手机屏幕上的文字,视野里的背景信息,耳朵里的声音,肢体感觉,等等。。。
这些信号永远会纠缠在一起,你的大脑必须能应对这种状况:耳朵里听见别的声音,你还得保持继续阅读才行。
当然信号的噪音不能太大,干扰太大谁都受不了。但你的大脑抗干扰能力越大,就说明你大脑的“鲁棒性”越强。
现在我们回到“蜂巢 AI”,试着给它输入噪音。
怎么模拟噪音呢?
可以在初始的时候,同时给它输入两个黑点,甚至多个黑点。
我们先选一种没有噪音的情况下“蜂巢 AI”的表现:
从:
演化到:
也就是下图最左边的情况。
下图右边几张是在初始值中添加不同噪音的效果:
第 0 排带红圈的点位就是噪音;
下面所有带红圈的点位就是噪音产生的扰动,也就是相对于没有噪音的区别。
下面这张图,显示了蜂巢 AI 对噪音的适应情况。(没有列举所有可能的噪音,只是一些典型的情况。)
第一排是选定的一种没有噪音的原始输入。下面就是在原始输入的基础上添加噪音的影响。
白色横条,意味着输出和原本的一致。没有受到噪音影响。
粉色的横条,意味着输出和原本不一致了。受到了噪音影响。
乍一看,这系统的稳定性也不咋地啊,粉色的情况那么多。
别急,我们来仔细分析一下,受到了干扰后,具体结果是啥?
沃尔夫勒姆总结了各种情况,如下图:
其中 32.1% 其实是没有输出结果,系统走到半路就停了。
这就好比你在嘈杂的地方读书,既没有听清别人说什么,也没有看懂书里写什么。这种结果其实挺好,因为系统没有胡乱给出答案。
还有 23.8% 是给出了纯纯正确的答案。
还有 15.6%、2.54%、1.7% 是给出了包含正确答案的错误答案。
实话说,这个表现已经很牛了!
有趣的是,还有 24.2%,是给出了纯纯错误的答案,但这个错误答案却对应着其他输入的正确答案!
这说明啥?
说明这个系统也许会出错,但它不会错到非常离谱。进化迭代,让这个系统冥冥中形成了两个“吸引盆”,好像结果会自动滑落到盆底一般。
当然,要达到这种境界,也需要一些训练技巧。
所谓技巧也不是人工干预细节,而是在演化的时候,加入一些“负样本”,当蜂巢 AI 得出错误的结果时,会触发“惩罚”机制。
这个方法,和我们熟悉的经典人工智能训练是一样的,也和人脑的训练方法是一样的。你不好好学习,老师就会邀请你妈妈来揍你一顿,这就是惩罚机制。
至此,我们已经训练出一个丐版的智能系统。
它具有模糊的正确性,它在噪音中保持强韧,不轻易被毁灭,它拿到了“进化游戏”的入场券。
而且我们似乎还额外获得了一个认知。
那就是:对智能祛魅。
智能的秩序和自然界的无序总是形成鲜明反差,以至于在漫长的历史中,人们总愿意相信有个“造物主”来屈尊造人。
而“蜂巢 AI”的训练过程恰恰告诉我们:智能的出现,不是什么了不得的偶然事件,反而是个大概率事件。
同样模拟 f[x] 那个方程,还能探索出很多种组合形式。
(六)智能是“逻辑的搬运工”
沃尔夫勒姆尝试了很多“蜂巢 AI”,每次都能训练出来拟合最初那个 f[x] 方程的人工智能。
这里的关键是,即便它们完成的任务相同,但由于随机性的影响,每次训练出来的系统在微观结构上都不一样。(红绿色块的位置不同)
怎么训怎么有,这说明什么?
说明“逻辑资源”在自然界极其丰富。
就像铜矿一样,在地球上到处都有。古代各个地区的人类文明虽然没有交流,但都顺利发现了冶炼铜的技术,独立进入青铜时代。
如此,我们可以试着回答最初的问题:
“智能”的微观结构,到底是什么?
智能的运转,就是把自然界已有的逻辑碎片给组合了起来,让它能够判断输入与输出极其复杂的对应关系。
不过即便只是对既有逻辑的搬运和整合,也不是所有整合方法都能产生高密度的智能。
一个反直觉的结论是:
当你越佛系松弛的时候,越能造出高密度的智能;当你越想严格把控,恰恰越难以造出高密度的智能!
这不是一碗鸡汤,而是一把锋利的认知武器。
不信我们接着看一个实验:
刚才我们说过,用“与”和“异或”可以组合出各种函数,而且针对某一个函数,有无数种方法可以等效出来。
但查看细节就会发现,等效的“蜂巢块”的大小可不一样。
比如我们找到的等效于两色元胞自动机规则 30 的“蜂巢块”最小只需要 4 行,并且有两种情况:
如果允许加到 5 行,那情况就一下子多了。
可这些蜂巢块都是进化得到的,看上去杂乱无章,无法解释。
如果我们非要做出可以解释的蜂巢块也可以,就得按照人类理解的逻辑计算方式来一步步生成。
比如:
其中的 x、y、z 就代表规则 30 的三个输入。
可以证明,这个“蜂巢块”确实是对的↓↓↓
但你发现没,人工搭建的块,比自然进化出来的块更多,需要 6 行。
多数情况,按照人类逻辑来搭建逻辑乐高,得出的结果要大得更多。比如规则 110。
这些是通过进化得到的:
这个是通过人工搭建得到的:
一个结论呼之欲出:
即便逻辑资源在自然界丰富存在,但是“随机进化”冶炼出来的纯度更高,而“人工搭建”的方法纯度更低。
要知道,无论是规则 30 还是规则 110,都还仅仅是一个简单的思想实验,模拟了神经协作模式的皮毛而已。真正大脑的运作会比这个复杂千倍万倍。
可想而知,如果使用“人类可解释的编程方法”,在脑细胞层面每一次逻辑迭代都会比自然进化的方案更耗能,那么整体思考的代价将变得非常沉重。
这暗示了一个真相:一个系统的“逻辑密度”和“可解释度”是一个跷跷板!
这也解释了一个大问题:为什么现在我们的人工智能如此耗能?
因为我们在训练中使用了大量“人工搭建”的逻辑,它们就像“脚手架”,增加了智能的可解释性,但也降低了智能的逻辑密度。
这里,我们可以回到 DeepSeek。
之所以说 DeepSeek 对 AI 技术产生了极大的理论贡献,是因为它终于找到了一种方法,在训练的流程中拆掉了大量脚手架。
具体来说,DeepSeek 在很多重要的点位上用强化学习(RL)的方法替代掉了人类监督微调(SFT)。
简单理解就是:强化学习就是在底层去掉人类监督,只保留一些高层的人类筛选,让 AI 有更大的自由度自己探索适合的思考方式。
这相当于在训练的关键步骤照搬了宇宙的智能设计图——“突变”+“筛选”。
换句话说:它找到了一种更好的“搭宇宙便车的方法”!
如果回头望,你会惊奇地发现:整个 AI 的发展历史,就是科学家们不断放手,不断把智能的产生交给随机进化,不断更好地“搭宇宙便车”的过程!
(七)搭好宇宙的便车
在人工智能学科诞生初期,重磅科学家们几乎都在支持“符号主义”,也就是手动匹配万事万物的联系,让 AI 的全部推理都有理有据,在最细节的层面也要能被解释。
但逐渐,科学家承认“学会多少道理都过不好这一生”,不如放手让 AI 自己去学习事物之间的联系,这才倒向了罗森布拉特的“联结主义”,乃至后续辛顿教授在这一流派基础上开创的反向传播路线,以至于 ChatGPT 诞生。
由此,AI 才汹涌成蓬勃的大河。
不是因为人们喜欢放手,而是因为不放手就无法前行。
世界上第一个基于“联结主义”的人工智能感知机,Mark I。
和这条河流所对应的,是人类计算负载从 CPU 向 GPU 的史诗级迁移。
CPU 是为形式计算而设计的,源自于人造的理想空间:它可以处理复杂的控制指令。
GPU 是为图像处理而设计的,根植于人类的视觉进化:它可以高效处理简单重复计算。
你还记得那个跷跷板吗?
本质上,CPU 就代表了“可解释度”,而 GPU 则代表了“逻辑密度”。
CPU 时代的领军企业英特尔,股价腰斩,险被收购;而 GPU 时代的领军企业英伟达,股价已经翻了无数翻。
从微观上看,两家公司的每一次经营决策的累积导致了如今的分野。但拉开视野来看,顺应历史的潮流,才是胜利的关键。
数学是人类智慧的王冠,精准形式计算的需求永远庞大。
但宇宙的“计算不可约性”从根本上决定,更多的日常决策只适合于离散化的拟合。
联结主义 AI 的兴起、离散化结构的成功、英伟达 GPU 的崛起,不都是因为他们搭对了宇宙的便车吗?
有个笑话讲:最牛的 AI 老师傅每天上班都要默念十遍“智能的本质是压缩”。
这恰好揭示了生命进化的真理,也揭示了离散化拟合的本质。那就是:只求神似,不求精准。
世界上的现象复杂,但凡要用有限的计算力去拟合,就需要有损压缩。
比如在用蜂巢 AI 拟合 f[x] 时,由于系统的“离散”本质,即便不断增加系统的计算力,我们得到的也是一个近似曲线,而不可能完全贴合形式计算的那个理想曲线。
下图就是对 f[x] 的理想曲线进行压缩后的结果。
但它的好处显而易见,那就是计算时间是绝对刚性的。
无论如何,系统都可以在有限时间内快速给出拟合结果——不死机。这对于生命的生存至关重要。
刚性时间就是进化的筛选条件之一。
在此基础上智能进化的过程,就是不断找到更好压缩方案的过程。
为了更直接地展示 AI 在压缩上的能力,沃尔夫勒姆做了另一个实验——“自编码器”。
把第一排当做输入,把最后一排当做输出。系统的目标就是:经过中间步骤的演化,让输出无限接近于输入。
它模拟了人“压缩世界”的过程:在内心构建一个世界的“像”。
这个系统没有看上去那么简单,因为在计算的过程中,最初的信息会被“碾碎”,而在后来又要“重构”起来。
但宇宙内禀的逻辑资源太丰富了,不费什么力气就进化出很多“自编码器”。
接下来更骚的操作来了:他把系统的“腰部”收窄,看看还能不能训练出自编码器。
结果是:仍然可以。
而且,就算腰部极细,细到只有两个格子(下图),系统仍然能完成自编码。(只不过在这种极端情况下,压缩的质量不忍直视。)
在细腰部分传递的信息,其实就是数据的压缩版本;
腰部以上,是压缩过程;
腰部以下,是解压过程。
不同的压缩系统,对应着不同的耗能和效果。两个参数做简单的除法,可知它们智能的密度也不相同。
这个简单的模型却给了我们巨大的信心:
只要能找到更好的方式对世界进行压缩,我们就能制造出一个和人脑平齐,甚至超越人脑的智能系统。
如今,我们已经有了 ChatGPT,有了 DeepSeek。
再往前看,我们有可能把这种“搭便车”玩到极限,造出理解万物、无所不能的超级智能吗?
(八)我们的无知与欢喜
其实,如果我们接受了“计算不可约性”,很容易推出如下结论:
1、我们永远有机会做出更好的人工智能;
2、我们永远无法抵达人工智能的“极限”。
所谓人工智能的极限,就是对一切问题都能给出正确答案的那种神级智能。
作为“离散宇宙”的生物,我们只能基于离散化的结构创造智能。运转的细节依靠亿万模糊的拟合,它的原理本身就内含了出现大量错误的可能性。
也就是说,无论我们如何挣扎,基础的物理定律“保证”了我们永远无法准确理解万物,也永远无法准确预测未来。
我们,就像被困在一个黑盒子里,再撕心裂肺的呐喊都无法透传出去——如同进入《2021 太空漫游》里那个黑色的石碑,人类能做的只有沉默与敬畏。
沃尔夫勒姆把宇宙的底层结构想象为一种“超图重写”结构,这是元胞自动机的另一种抽象,也是和元胞自动机计算等价的。
简单来说,超图重写就是把宇宙看成一幅“图”。在这幅图上运行迭代策略:随着时间流逝,按照既定规则,以一个结构替代另一个结构。
这个规则可能很简单,比如下面就是一个规则示例:
即便规则这么简单,每次迭代都会产生新的结构,下一次的迭代也会在新的结构中继续演化,并不重复。由于计算的不可约性,宇宙将会变得越来越复杂。
下图,就是基于上面那个规则演化几步之后的结果:
同样因为计算不可约性,在这样的宇宙里生活,没人能够先于演化精准预测超图的全景,最多只能通过(基于离散结构的)“智能”来对某个局部的图纸做粗略预测。
而且,由于我们用来预测的智能系统本身,也是“超图”的一部分,这意味着智能当然也无法预测自身的未来状态。
这个特点解决了一个终极追问:人到底有没有自由意志?
我们可以逆向思考:
什么是没有自由意志?就是我们可能找到预测自己在未来某一刻的思想的方法。对吧?
但计算不可约性已经预言了,我们没有办法准确预测大脑未来的状态。也就是说,无论我们的思维是不是机械运动的,都不影响“我们无法预测它”这一事实。
所以,我们永远可以认为自己“有”自由意志!
只不过,这种自由意志的代价是昂贵的:
人类,作为一个智能体,永远无法理解宇宙的所有真相。
AI,作为一个人造的智能体,同样永远无法理解宇宙的所有真相。
但这种对“无法理解”本身的探寻,何尝不是一种理解呢?
这种揭示自己渺小的真相的路程,何尝不是一种伟大呢?
我们盛开,但我们脚踩淤泥;
我们脚踩淤泥,但我们盛开。
正如胡适所说:怕什么真理无穷,进一寸有一寸的欢喜。
真正的慰藉,也许并非“朝闻道夕死可矣”。而是在终极真理的巨大引力下跌撞前行,收获的一路欢喜。
这,也许才是终极意义上的 Deep Seek。
参考资料:
《机器学习中到底发生了什么?一些极简模型》
往期推荐:
三生万物
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。
Thx with in Beijing