2025-08-01 22:45:05
播客主持人Lex Fridman与人类学家、历史学家杰克·韦瑟福德(Jack Weatherford)的对话,始于探讨成吉思汗的早年生活。韦瑟福德强调,理解成吉思汗的故事,必须追溯到他出生前的事件,尤其是他父母的相遇。他的父亲也速该(Yesügei)在一次狩猎中,看中了一位名叫诃额仑(Hö'elün)的新婚少妇,并与他的兄弟们将其从其丈夫手中抢走。诃额仑为了保全丈夫的性命,劝说他独自逃离,这一戏剧性的绑架事件为成吉思汗家族未来的仇恨与冲突埋下了伏笔。
成吉思汗,原名铁木真(Temüjin),意为“钢铁之人”,这个名字来源于他父亲在与塔塔尔人作战时杀死的一名敌人。他的童年充满不幸与创伤。他有一位被掳掠的母亲,作为父亲的第二位妻子地位不稳,而他本人则以父亲的敌人命名。幼年时,他甚至在一次迁徙中被家人遗忘,后被泰赤乌部(Taichiud)人找到并短暂收留。
八岁时,铁木真的父亲带他去寻找未来的妻子,将他留在了孛儿帖(Börte)的家庭。然而,在返家途中,父亲被塔塔尔人毒杀。这使得铁木真的家庭瞬间失去支柱。在随后的春天,氏族举行祭祖仪式时,诃额仑因其被俘虏的身份而受到排挤。当氏族迁移时,他们抛弃了诃额仑一家,包括她和前妻所生的所有孩子,让他们在严酷的草原上自生自灭。
在绝境中,母亲诃额仑展现了惊人的坚韧,她“拉下帽子,拿起黑色的棍子,沿着河岸奔跑,挖掘树根来填饱她孩子们的饥肠辘轆的肚子”。她通过采集和捕捞,成功带领全家度过了寒冬。这段经历深刻地影响了铁木真,使他早早地认识到亲属关系的不可靠性,因为背叛他的正是他父亲的亲兄弟。
铁木真的磨难并未就此结束。他曾被泰赤乌部人俘虏,并被戴上形似牛轭的木枷。在一个夜晚,他利用木枷作为武器,击晕看守的男孩后逃脱。他藏在河水中躲避追捕,最终向一个曾善待他的家庭求助,成功获救并重返家人身边。这段经历不仅是他个人坚韧意志的体现,也成为了蒙古人“任何移动的东西都是武器”这一信条的早期例证。
此外,铁-木真还杀死了他的同父异母兄长别克帖儿(Behter)。在蒙古社会,长兄对弟妹拥有绝对权威。别克帖儿仗着长兄身份,时常夺走铁木真辛苦捕获的食物。韦瑟福-德认为,这背后更深层的原因可能关乎铁木真对母亲诃额仑的控制权——根据传统,别克帖儿成年后有权迎娶继母诃额仑。铁木真无法忍受这种双重压迫,于是与弟弟合撒儿(Qasar)联手杀害了别克帖儿。此事激怒了母亲诃额仑,她严厉地斥责了他,但别克帖儿的生母和弟弟别勒古台(Belgutei)却留在了家中,后者更成为铁木真一生忠诚的追随者。
十六岁时,他与童年订亲的孛儿帖成婚。这段短暂的幸福时光是他人生的转折点。然而,几个月后,蔑儿乞人(Merkit)前来突袭,绑架了孛儿帖。韦瑟福德认为,这次事件是塑造了“征服者成吉思汗”的决定性时刻。与父亲不同,铁木真决心不惜一切代价夺回妻子,他认为“没有孛儿帖,生命就不值得活下去”。这一决心标志着他从一个挣扎求生的少年,向一位未来的军事领袖转变。
为了营救妻子孛儿帖,铁木真开始寻求盟友。他首先拜访了克烈部(Kerait)的首领王罕(Wang Khan),他是铁木真父亲的旧主。铁木真献上孛儿帖母亲带来的黑貂皮袄作为礼物,王罕同意出兵相助,并建议他同时请求札木合(Jamukha)的帮助。
札木合是铁木真童年时的挚友,两人曾在冰上结为“安答”(anda),一种超越普通友谊、持续终生的血盟关系。他们出身相似,都早年丧父,但札木合的成长环境相对优越。尽管如此,两人建立了深厚的友谊,并两次交换信物立誓。接到王罕的讯息后,札木合立即响应,率领部队与铁木真的力量汇合。
在营救行动中,札木合展现出好斗和激进的言辞,声称要将蔑儿乞人斩草除根。他们夜袭蔑儿乞营地,铁木真在混乱中高声呼唤孛儿帖的名字,孛儿帖听到后从逃跑的牛车上跳下,与他重逢。铁木真明确表示,夺回妻子是此行的唯一目标。
此后,铁木真与札木合的部族共同生活了一段时间。然而,在妻子孛儿帖的劝说下,铁木真认为札木合对他控制过多,于是决定分道扬镳。他们在一个夜晚悄悄离开,结束了这段亲密的共处时期。
尽管分开了,铁木真和札木合最初仍共同效忠于王罕。但随着铁木真屡立战功,声望日增,王罕的儿子桑昆(Senggum)开始感-到威胁,并阻止了铁木真之子与王罕之女的联姻。这导致了铁木真与王罕的决裂。在随后的冲突中,札木合站在王罕一方,两-位安答的部队首次兵戎相见。
最终,铁木真击败并取代了王罕,成为蒙古中部的统治者,并被拥立为“成吉思汗”。札木合同-时转向投靠西边的乃蛮部(Naiman)。然而,当成吉思汗进攻乃蛮时,札木合却临阵脱逃,并未与铁木真直接对抗。乃蛮部战败后,札木合试图自立为“古儿汗”,但他的追随者却将他俘虏,并献给了成吉-思汗。
成吉思汗处死了这些背叛首领的部下,因为他们违背了忠诚的信条,而札木合是他的安答。他邀请札木合重归于好,但札木合认为自己已经背叛,无法再获得完全的信任,并请求被赐予“不流血”的尊贵死法。成吉思汗最终应允,以毛毡包裹札木合后,或用马匹践踏致死。他的遗体被安葬在一处高地。韦瑟福德指出,这段与札木合的复杂关系,无论从积极还是消极的层面,都是成吉思汗成年后除妻子孛儿帖外最重要的人际关系,深刻地塑造了他对忠诚的理解。
杰克·韦瑟福德指出,成吉思汗最令人瞩目的特质之一,是他从未被权力与财富腐化。他出身于一无所有的境地,即使后来成为世界上最富有的人,掌控着巨大的财富流,他依然保持着简朴的生活方式。他曾说:“我吃我的士兵所吃的,穿我的士兵所穿的,过我的士兵所过的生活。我们是一样的。”
他一生对物质财富毫无兴趣,从不贪婪或追求奢华。这种对权力的警惕性体现在他严禁任何形式的个人崇拜上。他禁止为他作画、雕像,也不允许修建任何以他为名的宫殿、陵墓或寺庙。甚至在他去世时,也未留下任何墓碑。这种做法极不寻常,韦瑟福德认为这显示了成吉思汗深刻的智慧,他明白个人崇拜是通往腐败和脱离现实的危险道路。通过保持简朴和匿名,他得以始终与他的人民保持紧密联系,并能清醒地选拔有能力的领导者。直到他去世51年后(1278年),才出现了第一幅他的肖像画,而第一座雕像则是在21世纪才建成。
《蒙古秘史》是研究成吉思汗生平最独特且珍贵的文献。韦瑟福德指出,由于成吉思汗生前禁止任何关于他个人事迹的记录,这部史书是在他于1227年去世后,由他收养的塔塔尔人、后来的最高法官失吉忽秃忽(Shigi Qutuqu)于1228年编撰完成的。失吉忽秃忽作为成吉思汗家庭的一员,亲身见证了许多历史事件,因此书中包含了大量不为外人所知的私密细节,例如成吉思汗与妻子孛儿帖在卧室中的对话。
这部文献最初仅供黄金家族内部传阅,因此被称为“秘史”。它在很长一段时间里不为外界所知,直到19世纪,一位在中国的俄罗斯学者发现了一份奇特的中文手稿。这份手稿使用汉字来音注蒙古语的发音,从而得以保存了《秘史》的原始内容。
《秘史》的叙事始于蒙古民族的神话起源——“苍狼与白鹿的结合”,并记录了从神话祖先到铁木真崛起的详细谱系和历史。尽管早期内容带有神话色彩,但韦瑟福德认为其具有很高的史料价值,尤其是关于铁木真生平的部分,其精确的地点记载和亲密的叙事视角,提供了无可替代的第一手资料。韦瑟福德强调,他将《秘史》作为研究的核心文本,并通过亲身探访书中提到的蒙古各处地点,来感受历史的真实脉搏。他认为,历史不仅活在书籍和档案中,更活在人民的记忆和土地之中。例如,通过与当地牧民的交流,他得以确定孛儿帖被绑架事件发生在冬季,因为只有在冻土上,人才能感觉到马蹄的震动,这一细节为后续事件的时间线提供了关键依据。
韦瑟福德生动地描绘了蒙古草原的景象,强调这片土地自成吉思汗时代以来几乎没有改变。他形容草原“一望无际,如同海洋”,空气永远清新,夹杂着青草或尘土的气息。水在蒙古文化中占据核心地位,他们将世界定义为“水和人”,而非土地。因此,蒙古人对水源极为敬畏,遵循着自成吉思汗时代流传下来的严格规定,例如不在河边扎营、不直接在河中沐浴,以防污染水源。
这种与自然紧密相连、在严酷环境中生存的方式,塑造了蒙古人的思维和生活方式。韦瑟福-德认为,要理解成吉思汗如何思考、狩猎以及制定战争策略,就必须深入了解这片草原和生活在这里的人民。即使在今天,手机和太阳能板进入了牧民的生活,他们依然在以传统的方式放牧,与自然保持着一种在世界其他地方罕见的亲密关系。
马是蒙古文化不可或缺的一部分,韦瑟福德形容“蒙古人与马密不可分”。这种关系体现在他们生活的方方面面:从对马匹颜色的精细划分词汇,到将马的汗水与尘土擦在自己额头上的神圣仪式。蒙古儿童从极小的年纪就开始学习骑马,三岁时便能独自驰骋。这种从小的训练使他们具备了超凡的骑术,能在马背上完成各种高难度动作,如站立、搏斗和射箭。
这种精湛的骑术与蒙古复合弓相结合,构成了一件在近代火器出现前“世界上最致命的武器”。蒙古士兵能在时速高达60公里的飞驰马背上,精准命中200米外的目标。他们掌握了特殊的拇指拉弓法,并能在马匹四蹄腾空的瞬间射击,以保持稳定。这种能力不仅源于个人技巧,更依赖于与马匹之间心意相通的默契。韦瑟福德强调,虽然马背射箭是草原游牧民族的普遍技能,但成吉思汗的真正天才在于他如何将这种个人技能组织、协调并运用到整个军队的战略战术中,从而创造出一支所向披靡的力量。
成吉思汗的军队规模不大,最多时约十万人,却能征服广袤的土地。韦瑟福德将这归功于成吉思汗卓越的组织才能和战略思想。他强调,军队的成功建立在以下几个关键因素之上:
绝对忠诚与精英选拔:成吉思汗打破了以血缘为基础的传统,转而提拔基于能力和忠诚的普通人。他身边的将领都是从平民中选拔的,对他忠心不二,从未有过背叛。
严密的组织结构:军队采用十进制编制,以十人为一班(阿-班),百人为一队,千人为一营。这种结构确保了指挥的清晰和高效。士兵之间互相保护,战后必须带回所有成员或其尸体,培养了极强的集体责任感。
高度的机动性与自给自足:军队完全由骑兵组成,没有步兵或笨重的后勤部队。每位士兵配备五匹马,轮换骑乘,确保了极高的行军速度和持久力。他们携带自制的干奶制品(-如“-阿-鲁-尔”)和针线,能在数天内不生火,实现完全自给。
战术灵活性与创新精神:成吉思汗从不拘泥于固定的战术。他初次面对城墙时,立即想到利用水攻,尽管首次尝试因经验不足而淹没了己方营地,但他从中学习并不断完善,水攻后来成为蒙古军队的常用战术。这种不断从失败中学习、拥抱新技术(如攻城器械)和新思想的能力,是其军队保持优势的核心。
赏罚分明的军事文化:他赏罚分明,但从不因失败而惩罚将领。例如,当最高法官失吉忽秃忽在阿富汗战败后,成吉思汗没有处-罚他,而是与他一同复盘战场,帮助他从错误中学习。这种宽容和注重培养的态度,使得将领们敢于尝试、敢于撤退以保存实力。
韦瑟福德总结道,成吉思汗的军队是一件“超级武器”,其威力不仅在于士兵的个人技能,更在于他将这支军队打造成了一个纪律严明、忠诚高效、且能不断学习和进化的军事机器。
成吉思汗的军队以其独特的战术和战略闻名于世,这些战术充分利用了其骑兵的优势。
高度机动性与突袭:由于每位士兵拥有多匹马轮换,蒙古军队能够以惊人的速度长途奔袭,其通讯系统(驿站系统)甚至能在六周内将消息从蒙古传递到匈牙利。他们不依赖道路,习惯在开阔地带行军,这使他们能够从敌人意想不到的方向发起突袭,实现战略上的出其不意。
佯败战术(Feigned Retreat):这是蒙古军队最著名且屡试不爽的战术。他们会派遣小股部队发起攻击,然后假装溃败,引诱敌军主力脱离阵型追击。蒙古骑兵精通“帕提亚射术”,能在撤退时向后方射箭。一旦敌军被引至预设的埋伏圈,隐藏在两翼的蒙古主力便会合围,将其歼灭。韦瑟福德感叹,尽管这一战术被反复使用,但敌人似乎总是会因求胜心切而中计。
心理战与恐怖策略:成吉思汗深谙心理战的重要性。他会有意让一些城市的难民逃到下一座城市,通过他们散布蒙古军队残暴的恐怖故事,如“长着钢牙、生吃孩童”等,从而在精神上瓦解敌人的抵抗意志。当蒙古大军伴随着震动大地的马蹄声和漫天尘土出现时,这种恐惧感本身就成为了一种强大的武器。
明确的投降政策:在攻城前,蒙古军队总会先派遣使者提出明确的投降条件:如果城市和平投降,所有居民的生命和财产将得到保障,只需向蒙古人纳税。这种政策使许多城市选择不战而降。然而,对于抵抗的城市,蒙古人会处决其所有领导层和军队,但会保全所有工匠,因为他们看重技能。最严厉的惩罚则针对那些投降后又反叛的城市,这些城市会遭到彻底的屠城。
情感失控的例外:尽管成吉思汗的战争策略通常是冷酷而理性的,但也存在例外。当他在阿富汗巴米扬山谷失去自己最心爱的孙子后,他下令进行了长达数周的报复性屠杀,并禁止部下为之哭泣,而是要“让敌人哭泣”。这是他为数不多的因个人情感而导致战争行为失控的例子。
在讨论成吉思汗及其帝国造成的约4000万人口死亡这一惊人数字时,韦瑟福德提出了一个具有挑战性的视角。他认为,不应以双重标准来评判历史人物。他指出,包括美国在内的现代国家,也常以和平、民主或国家利益为名发动战争,并造成大量平民伤亡,例如在二战中对广岛和长崎投下原子弹,以及在越南、伊拉克和阿富汗的军事行动。
韦瑟福德强调,他并非为成吉思汗的屠杀辩护,而是呼吁人们在谴责历史上的“野蛮人”时,也应诚实地审视自己国家的行为。他认为,所有战争本质上都是残酷的,而胜利者往往会将自己的行为合理化。从这个角度看,成吉思汗的行为与其他历史上的征服者(如亚历山大大帝、凯撒)并无本质区别,都是人类扩张、探索和积累权力欲望的一部分。战争是地狱,而每个国家在历史上都曾扮演过杀戮者的角色。
对话提及了著名历史播客“硬核历史”(Hardcore History)的主持人丹·卡林(Dan Carlin),他制作了关于蒙古帝国的系列节目《可汗之怒》(Wrath of the Khans)。
卡林提出了“历史纵火犯”(historical arsonists)的概念,用以形容那些造成巨大破坏,但同时也为新发展和进步铺平了道路的历史人物。韦瑟福德在一定程度上认同这种“创造性破坏”的观点,承认蒙古帝国确实带来了巨大的历史变革,例如统一了中国、韩国和俄罗斯等地区,为现代国家的形成奠定了基础。但他同时指出,蒙古人之所以能轻易征服这些地区,很大程度上是因为这些旧有帝国自身已经腐朽不堪。
卡林曾批评韦瑟福德的著作过于强调蒙古帝国的积极影响,而对战争的残酷性着墨不足。韦瑟福德坦然接受这一批评,并解释说,他的研究重点并非征服本身,而是蒙古帝国在征服后长达150年的统治时期所带来的深远影响。他认为,一个仅有百万人口的民族之所以能统治数亿人,绝非仅靠武力,而是因为它提供了当时人们所渴望的东西,如贸易安全、宗教自由、法律体系以及对女性和少数族裔权利的保障。他强调,故事的重点在于征服之后发生的一切。
成吉思汗推行的宗教自由政策是其帝国最引人注目的遗产之一。韦瑟福德指出,这项政策的起源具有很强的实用主义色彩。当穆斯林维吾尔人向他求助,希望摆脱一位强迫他们改变信仰的统治者时,成吉思汗出兵帮助了他们。此后,他制定了蒙古帝国的第一条针对外部民族的法律。
这条法律的革命性在于,它保障的是个人的宗教选择自由,而非仅仅容忍不同的宗教机构。法律规定,任何人都有权选择自己的信仰,他人不得强迫。韦瑟福德认为,这一思想在当时的历史背景下是前所未有的,甚至启发了后来的托马斯·杰斐逊。
从实践上看,这项政策为成吉思汗带来了巨大的政治利益。它有效地防止了不同宗教派别(如什叶派与逊尼派、基督徒与犹太人)联合起来对抗他,并为他赢得了各地少数宗教群体的广泛支持。
成吉思汗本人对各种宗教抱有浓厚的兴趣,他曾召集各派学者进行公开辩论和讨论,但他自己从未改变信仰。他信奉的是一种泛灵论,早期崇拜曾庇护过他的圣山不儿罕合勒敦山(Burkhan Khaldun)。随着帝国的扩张,他的信仰逐渐转向了更为普世的“长生天”(Tenger),认为天空是覆盖所有民族的唯一、普遍的神灵。他相信,每个人内心都知晓道德,并能直接与天沟通,而无需依赖经文或教士。这一理念构成了他包容所有宗教的思想基础。
韦瑟福德强调,贸易对蒙古人至关重要,因为他们自身生产力有限,高度依赖外部产品。成吉思汗和他的后继者极大地提升了商人的社会地位,这在当时视商人为社会底层的中国社会尤为突出。
蒙古帝国为贸易创建了一个前所未有的统一、安全的网络,即著名的“丝绸之路”。他们采取了多项措施来促进商业发展: 1. 安全保障:帝国为商队提供全程保护,如果途经危险区域,甚至会派遣军队护送。 2. 统一税制:商人只需缴纳一次国家税,免除了在各个城镇被层层盘剥的困扰。 3. 驿站系统(Yam):建立了完善的驿站网络,为商人提供食宿、新鲜马匹,甚至还发行了可在全帝国通行的纸币收据。 4. 支持商业:蒙古统治者对商人非常慷慨,有时甚至会以高于要价的价格购买商品,以示对商业的鼓励。
这一系列政策的实施,不仅促进了商品的流通,更重要的是开启了东西方之间持续不断的思想、技术和文化交流。火药、印刷术、数学(如“零”的概念)、农作物等都在此期间广泛传播。马可·波罗安全地穿越整个亚洲大陆的旅程,正是这一“蒙古治下的和平”(Pax Mongolica)时期的生动写照。韦瑟福德总结说:“自成吉思汗以来,东西方之间的联系从未中断过。”
蒙古帝国的成功不仅在于其传统的马背射箭技术,更在于其卓越的武器创新能力。韦瑟福德指出,蒙古人具有一种独特的天赋,能够将从不同文明中学到的技术融会贯通,创造出全新的武器系统。
一个典型的例子是火炮的诞生。这个过程整合了三大文明的优势技术: 1. 中国的火药:当时主要用于烟花和原始的手榴弹。 2. 中东的石脑油(希腊火):一种用于制造火焰喷射器的燃烧剂。 3. 欧洲的铸造技术:欧洲人精于为教堂铸造巨大的钟。
蒙古人将欧洲的铸钟技术(将钟侧放形成炮管)、中东的火焰喷射器原理以及中国的火药结合在一起,最终发明了原始的火炮。这种跨文明的技术整合能力,使得蒙古军队在攻城战中获得了巨大的优势,并在成吉思汗的子孙辈(尤其是在围攻巴格达时)开始投入使用。
忽必烈是成吉思汗的孙子,是其第四子拖雷的次子。他出生于1215年,即蒙古攻克金国中都(今北京)的同一年。与在马背上长大的堂兄弟们不同,忽必烈自幼接受了更为多元的教育,包括汉学和佛学,这使他对中国文化有更深的理解。
在兄长蒙哥汗去世后,忽必烈通过内战击败了其弟阿里不哥,巩固了对蒙古帝国核心区域,特别是中国的控制权。他面临的最大挑战是征服当时由南宋统治的中国南方。南宋拥有当时世界上最强大的水师,他们将战船连在一起,形成了一道坚固的“海上长城”,有效地抵御了来自陆上的蒙古骑兵。
为了攻克南宋,忽必烈和他的将领们展现了卓越的创新精神。他们认识到,南宋城市的防御重心在陆地,而沿水一侧的城墙相对薄弱。于是,他们从波斯的伊尔汗国请来工程师,将巨型投石机(trebuchet)进行了改造,使其能够安装在船上。这支新组建的“炮舰”舰队,从水上攻击南宋城市最薄弱的环节,取得了决定性的成功,沿长江一路势如破竹。
在征服南宋期间,忽必烈两次发动了对日本的远征。韦瑟福德认为,这并非单纯的军事冒进,而是出于多重战略考量:切断日本向南宋供应的硫磺(制造火药的关键原料),防止南宋皇室逃往日本,并起到“杀鸡儆猴”的威慑作用。尽管两次入侵最终都因日军的顽强抵抗和被称为“神风”的台风而失败,但它们在战略上成功孤立了南宋,并消耗了大量收编的南宋降军。
最终,南宋因内部腐败、将领怯懦而在1279年彻底灭亡。忽必烈完成了对中国的统一,建立了元朝,其疆域囊括了现代中国的核心版图、西藏、满洲、朝鲜半岛及蒙古,奠定了现代中国的地理基础。
尽管忽必烈的孙子铁穆耳(Temür Öljeytü)曾短暂地在名义上重新统一了蒙古帝国,并致力于将帝国重心从征服转向商业,但帝国的衰落已不可避免。其瓦解的原因是多方面的:
内部分裂与同化:庞大的帝国分裂为四大汗国(元朝、金帐汗国、察合台汗国、伊尔汗国)。随着时间的推移,各地的蒙古统治者逐渐被当地文化同化,例如在波斯和中亚的蒙古人皈依了伊斯兰教,从而与蒙古本土的传统和联系日益疏远。
黑死病的冲击:14世纪中叶,黑死病(the Great Plague)沿着蒙古帝国建立的繁荣贸易路线迅速蔓延,从中国南部传播到世界各地。这场瘟疫摧毁了帝国的人口、经济以及赖以维系的通讯和贸易网络。当这个系统崩溃时,维系帝国的纽带也随之断裂。
失去统治合法性:随着贸易体系的瓦解,被统治的各地人民不再能从蒙古的统治中获益,帝国的存在失去了基础。
1368年,元朝被明朝推翻,统治中国的蒙古人撤回了蒙古草原。韦瑟福德形容这次撤退“如同又一次季节性的迁徙”,他们并未被中国同化,而是回到了自己的故土。此后,庞大的蒙古帝国在世界各地的统治相继终结,逐渐瓦解。
关于2003年一项著名的基因研究,该研究声称当今世界约0.5%的男性人口是成吉思汗的直系后裔。对此,韦瑟福德持审慎的怀疑态度。他指出的核心问题是,研究人员并未获得成吉思汗本人的DNA样本,因此无法科学地证实这一庞大基因谱系的始祖就是成吉思汗本人。他认为,这个共同的祖先也可能是成吉思汗之前的某位蒙古部落领袖。
然而,主持人莱克斯·弗里德曼(Lex Fridman)提出了不同的看法。他认为,这一发现不应被简单地理解为成吉思汗及其后代进行大规模强奸的结果。相反,它恰恰反映了成吉思汗及其家族在广阔疆域内享有的极高社会地位和持久影响力。在数百年的时间里,与黄金家族的血脉联系成为一种荣誉和优势,这自然促进了其基因的广泛传播。从这个角度看,这一基因遗产是蒙古帝国稳定、繁荣和强大影响力的一个侧面证明。
对话中还提到了成吉思汗的安葬之谜。他要求被葬于一处不留标记的秘密地点,以“让我的身体离去,让我的国家永存”。蒙古人至今仍信守这一遗愿,其墓地被视为神圣禁区,具体位置虽有传说,但绝不允许任何人打扰。这种对身后名的淡泊,与他生前所取得的巨大功业形成了鲜明对比。
韦瑟福德总结了可以从成吉思汗身上学到的适用于当今世界的几点教训:
具体的政策理念:
普世的领导原则:
女性的关键作用:韦瑟福德特别强调,成吉思汗的成功离不开他生命中女性的支持。他的母亲诃额仑、妻子孛儿帖以及他的女儿和儿媳们,在帝国的建立和管理中都扮演了至关重要的角色,她们的智慧和影响力不容忽视。
在研究人类历史的过程中,韦瑟福德坦言,他对个体的人抱有热爱,但对群体和制度,尤其是僵化的机构,则怀有深深的怀疑。他认为,制度常常会变得腐败和低效,而成吉思汗成功的一大原因就是他敢于打破和重塑旧有制度。
另一方面,他从蒙古人民身上学到了关于人性的积极一面。他观察到,蒙古人能在严酷的环境中世代生存,保持着对土地的深厚情感和对陌生人的无私好客。这种根植于文化深处的韧性和善良,让他看到了人性的希望。他认为,真正的希望并非来自宏大的政治口号或制度,而是存在于人与人之间具体的、善意的互动之中。
对于希望访问蒙古的旅行者,韦瑟福德给出了几点建议。他认为蒙古的每个地区都有其独特的魅力:
对于追寻成吉思汗历史足迹的游客,可以前往他的故乡肯特省(Khentii)。尽管蒙古人非常崇敬他,但并未过度商业化其历史遗迹。其中,最著名的地标是世界上最大的成吉思汗骑马雕像。据传说,这里是铁木真找到一根马鞭的地方。韦瑟福德解读说,这根马鞭象征着铁木真在关键时刻掌握了自己的命运,找到了驾驭自己“风马”(Khiimori,指内在的精神与命运)的力量。
在访谈结束后,主持人莱克斯·弗里德曼分享了他对丹·卡林关于大西洋奴隶贸易的播客节目的反思。他指出,许多在今天看来显而易见的暴行,在当时的历史背景下却被视为常态。这揭示了人类道德观念的演变过程,以及人们为自身行为进行道德辩护的普遍倾向。他以托马斯·杰斐逊为例,这位高喊“人人生而平等”的伟人同时也是一位奴隶主,体现了历史人物的复杂性。弗里德曼认为,研究历史的价值在于,它不仅揭示了道德沦丧如何滋生世代仇恨,也让我们看到,即使在最黑暗的时代,也总有不完美的人们在努力为更美好的未来奠定基础,印证了马丁·路德·金的名言:“道德宇宙的弧线很长,但它终将倾向于正义。”
最后,莱克斯·弗里德曼就加沙局势发表了个人看法。他明确表示,他认为加沙正在发生的是一场“暴行”,以色列政府对此负有直接责任,而美国政府的援助应立即停止。他强调,在21世纪,任何一个孩子的死亡都是一场悲剧,无论其肤色、宗教或国籍。他承认哈马斯在10月7日的袭击是“明确的邪恶行为”,但他认为以色列政府随后的军事行动已导致了不成比例的巨大伤亡(尤其提到了超过17,000名儿童死亡)。他担忧,如此规模的苦难只会滋生更多的世代仇恨,让世界变得更加危险。他希望能有机会与加沙的普通民众对话,因为他相信,真正的、更深层次的真相存在于他们的生活、痛苦和希望之中。
2025-07-24 06:56:03
Google DeepMind负责人、诺贝尔奖得主杰米斯·哈萨比斯(Demis Hassabis)在与莱克斯·弗里德曼(Lex Fridman)的第二次对话中,深入探讨了人工智能的未来、模拟现实、物理学、视频游戏以及人类文明的重大议题。作为当今世界在理解和构建智能、探索宇宙奥秘方面最杰出和引人入胜的人物之一,哈萨比斯分享了他对从自然界的可学习模式到通用人工智能(AGI)路径的深刻见解。
哈萨比斯在他获得诺贝尔奖的演讲中提出了一个核心猜想:“自然界中能够生成或发现的任何模式,都可以被经典的机器学习算法有效地发现和建模。”他解释说,这一猜想源于DeepMind在AlphaGo和AlphaFold等项目中的成功经验。这些项目所处理的都是组合性极高、维度巨大的空间,通过暴力枚举寻找解决方案是不可行的。
他指出,成功的关键在于构建了对这些环境的模型,从而能够智能地引导搜索过程。以蛋白质折叠为例,这一过程在人体内以毫秒级速度完成,表明物理世界本身就存在一种高效的解决方案。哈萨比斯认为,这是因为自然系统并非随机的,它们经过了演化过程的塑造,具有内在的结构。无论是生物演化、地质变迁(如山脉的形成),还是行星轨道,都遵循着某种“最稳定者生存”(survival of the stablest)的原则。
这种非随机的结构形成了一个可学习的“流形”(manifold),使得神经网络等经典算法能够通过学习这些模式来高效地预测或找到解决方案。他对比道,对于一些人造的、缺乏内在模式的抽象问题,如大数分解,可能就需要量子计算机。但对于大多数我们感兴趣的自然现象,其背后都存在着可被学习和发现的结构。
哈萨比斯将他对自然模式的猜想与理论计算机科学中的经典难题“P vs NP”联系起来。他透露,自己正在思考是否可以定义一个新的复杂性类别,专门描述这些可通过神经网络过程解决的、存在于物理世界并具有结构性的自然系统问题。
他秉持“信息是第一性的”宇宙观,认为信息比能量和物质更基本,整个宇宙可以被看作一个信息系统。从这个角度看,“P vs NP”不仅是数学问题,更是一个根本性的物理问题,其答案将对我们理解宇宙产生深远影响。
他认为,AlphaGo和AlphaFold的成功证明了经典计算机(图灵机)的能力远超我们过去的想象。这些系统通过对问题环境进行建模,将原本指数级的搜索问题转化为多项式时间内可解的问题。哈萨比斯表示,AGI的最终实现将是经典计算能力的极致体现,而探索经典系统能力的边界,正是对“P vs NP”问题的直接回应。
在讨论经典计算的边界时,他提到混沌系统可能难以建模,但对许多其他复杂系统,如流体动力学(纳维-斯托克斯方程),AI模型已展现出惊人的能力。他以Google的视频生成模型Veo为例,该模型能相当精确地模拟液体、材质和光照效果,这表明系统通过观察海量视频,逆向工程出了物理世界运行的潜在规律。这进一步支持了他的观点:现实的大部分可能都存在一个可被学习的低维流形。
哈萨比斯对Veo 3最感兴趣的并非其生成逼真或有趣的视频内容,而是其对物理世界的模拟能力。他认为,Veo 3能够连贯地预测视频的下一帧,这本身就是一种“理解”形式,尽管并非人类哲学意义上的深刻理解。它更像是一种“直觉物理学”(intuitive physics),类似于孩童对世界运行方式的朴素认知,而非物理学博士的精确数学描述。
这一成就挑战了传统观念,即获得物理世界知识必须通过具身智能(如机器人)与环境进行物理交互。哈萨比斯坦言,他曾也持有此观点,但Veo 3的成功表明,通过被动观察也可能学习到深刻的物理规律。这再次暗示了现实世界本身可能具有某种易于学习的内在结构。他设想,这类技术的下一步是发展成可交互的“世界模型”,允许用户进入并探索生成的场景,这将是实现真正AGI的关键一步。
作为一名资深游戏爱好者和前游戏开发者,哈萨比斯对AI在游戏领域的应用充满期待。他引用了网友的推文,畅想未来能够“玩”由Veo 3生成的视频。他认为,AI有潜力彻底改变开放世界游戏的制作方式。
他回忆自己早年参与制作的《主题公园》(Theme Park)等游戏,其核心是创造一个模拟世界,让玩家的体验独一无二。然而,传统方法制作开放世界游戏成本高昂且内容有限。他设想,在未来5到10年内,AI系统将能够根据玩家的想象力动态生成内容、叙事和情节,实现真正的“终极选择你自己的冒险”游戏。玩家的每一个行为都可能导向一个独一无二、由AI实时创造的世界。
哈萨比斯将这一愿景与他对现实本质的探索联系起来:一个极度逼真的开放世界模拟游戏,本身就是对“宇宙是什么”这一问题的探讨。他表示,如果未来有休假的机会,他的两大项目将是研究他的物理学理论和亲手打造一款终极AI游戏。
哈萨比斯介绍了Google DeepMind的另一项前沿项目——AlphaEvolve,一个利用大语言模型(LLM)引导演化算法来发现新算法的系统。他认为,这代表了一种非常有前景的“混合系统”研究方向,即把基础模型(如LLM)与其他计算技术(如演化计算、蒙特卡洛树搜索)相结合。
这种混合系统旨在解决AI的创造力问题。基础模型可以学习和概括现有数据,而搜索算法则可以在此基础上探索未知的解决方案空间,从而实现真正的“发现”。AlphaGo的“第37手”就是这一模式的经典案例。
传统的演化计算难以进化出全新的、涌现的属性,但与强大的基础模型结合后,或许能克服这一瓶颈,模拟自然演化过程,从简单的起点孕育出巨大的复杂性和全新的能力。
在讨论AI作为科学研究工具时,哈萨比斯指出了当前AI系统的一个核心局限:缺乏“研究品味”(research taste)或科学判断力。他认为,这是区分优秀科学家和顶尖科学家的关键。提出一个好的猜想,即一个深刻、有趣、可检验且能有效分割假说空间的问题,比证明它要困难得多。
他表示,当今的AI系统(如在数学奥林匹克竞赛中取得银牌的AlphaProof)已经能够解决非常困难的问题,未来甚至可能解决千禧年大奖难题。但它们尚不具备爱因斯坦那样的“想象力飞跃”,无法自主提出值得研究的重大科学问题。如何让AI具备这种高级创造力,是通往超级智能路上的关键挑战。
哈萨比斯分享了他长达25年的梦想:创建一个完整的“虚拟细胞”(Virtual Cell)模型。这个项目的宏大目标是,在计算机中完整模拟一个细胞(例如结构简单的酵母菌)的内部运作,使科学家能在此虚拟环境中进行实验(in silico),从而极大地加速生物学和医学研究。
他将自己的职业生涯视为一个分解并实现这一宏伟蓝图的过程。AlphaFold解决了蛋白质的静态3D结构问题,是第一块关键拼图。AlphaFold 3则开始涉足动态交互,模拟蛋白质、DNA和RNA之间的相互作用。AlphaGenome则连接了基因突变与功能。未来的步骤将是模拟整个生物通路,最终整合为完整的细胞模型。
这个项目面临的挑战包括处理不同时间尺度的生物过程,以及在不模拟到量子力学等底层细节的前提下,选择合适的抽象层次来捕捉关键动态。
哈萨比斯认为,AI同样有潜力帮助探索“生命起源”这一终极谜题。他将此问题视为一个在巨大的组合空间中的搜索过程:在给定的初始化学物质(原始汤)和条件下,AI能否模拟出一条通往类细胞结构的路径?
他强调,AGI是他毕生追求的目标,因为他相信AGI是帮助人类解答这些关于生命、意识、时间、现实本质等根本问题的终极工具。他对人类社会普遍不被这些宏大谜题所困扰感到不解,并认为我们亟需理解“我们周围到底发生了什么”。
哈萨比斯预测,到2030年,我们有50%的概率实现AGI。他对AGI的定义标准很高:它必须具备与人类大脑相当的认知能力,并且是全面、一致的,而非目前AI系统所表现出的“锯齿状”智能(在某些方面超强,在另一些方面有明显缺陷)。此外,它还需具备真正的创造力和发明能力。
要确认AGI的到来,他提出了两种测试方法: 1. 全面测试:通过数万个已知人类能完成的认知任务进行“地毯式”测试,确保其能力的广度和一致性。 2. 专家验证:让数百名各领域的顶尖专家(如陶哲轩这样的数学家)试用数月,看他们能否发现系统的明显缺陷。
除了这些,他还期待AGGI的“第37手”时刻,例如: * 提出新的科学猜想:比如,给系统1900年之前的所有物理知识,看它能否独立推导出相对论。 * 发明全新的复杂系统:比如,能否发明一款像围棋一样深刻、优雅、美观的游戏。
哈萨比斯认为,仅靠扩大模型规模(Scaling Laws)仍有巨大的潜力可挖,这包括训练、后训练和推理等多个环节。但他同时指出,未来AI的发展是继续依赖规模化,还是需要新的研究突破,目前尚无定论,他认为是“五五开”的局面。
因此,Google DeepMind采取双轨并行的策略:一方面将现有技术规模化到极致,另一方面投入大量资源进行“蓝天研究”,探索全新的AI范式。他对自己团队深厚的研究底蕴充满信心,认为如果需要新的突破(如Transformer架构或AlphaGo),DeepMind最有能力实现。
对于数据瓶颈问题,他并不十分担忧。他认为现有数据足以训练出非常好的模型,而这些模型一旦足够强大,就可以用来生成高质量的合成数据,从而解决数据稀缺问题。
计算资源的规模化对AGI至关重要,且需求不会放缓。需求来自三个方面: 1. 训练:训练更大、更强的模型。 2. 推理:为全球数十亿用户提供AI服务。 3. “思考”:新型AI范式表明,给予模型更多的推理时间可以让它变得更智能。
他预测,未来推理所需的计算量可能会超过训练。这驱动了硬件(如Google的TPU)和能源效率方面的创新。
哈萨比斯坚信AI是解决未来能源问题的关键。AI可以应用于提升数据中心能效、优化电网、控制核聚变反应堆(如等离子体约束),以及设计全新的能源材料,如高效太阳能电池板、室温超导体和更优的电池。
他最看好核聚变和太阳能。他认为,一旦实现清洁、廉价、近乎无限的能源,将连锁解决水资源短缺(通过廉价海水淡化)、太空探索(通过电解水制造无限火箭燃料)等一系列问题,带领人类进入一个“激进丰裕”(radical abundance)的时代,摆脱资源稀缺的零和博弈困境。
即便在资源丰裕的时代,人性中的冲突和竞争本能依然存在。哈萨比斯认为,体育和游戏(如足球、国际象棋)是引导这些本能的健康渠道。它们提供了一个安全的模拟环境,让人类练习决策、体验成败、追求精通,从而将潜在的破坏性能量转化为建设性的活动。
哈萨比斯回顾了过去一年Google在LLM产品竞争中的“逆转”。他将此归功于杰出的团队、强大的计算资源,以及将原Google Brain和DeepMind的顶尖人才和思想融合后形成的高效研究文化。
他的领导理念是在大公司内部保持初创企业的“无情执行”(relentless shipping)文化和活力,打破官僚壁垒,让研究和产品快速迭代。在产品设计上,他借鉴了游戏设计的经验,强调“品味”和“直觉”,致力于打造简洁、优雅且能预见技术发展轨迹的AI原生产品。他预言,未来的AI交互界面将超越简单的文本框,向多模态、个性化、由AI动态生成的方向发展。
哈萨比斯认为,用“赢得竞赛”来形容AGI的研发是错误的框架。鉴于其巨大的潜在影响,所有前沿实验室的共同责任是“为了全人类的利益,安全地将这项技术引入世界”。因此,他与其他实验室负责人保持着良好沟通,并认为这对于未来的安全合作至关重要。
对于人才竞争,他承认市场薪酬水涨船高,但他相信,顶尖人才的核心动机是参与AGI这一伟大事业的使命感,以及在技术发展的最前沿施加积极影响的愿望,而不仅仅是金钱。
哈萨比斯预测,编程将是受AI影响最快的领域之一。在未来5到10年,善于利用AI工具的程序员将变得“超人般高效”,顶尖程序员的生产力可能会提升10倍。人类程序员的价值将从编写具体代码转向更高层次的架构设计、系统引导和代码审查。
这场变革的速度和影响将远超工业革命,他估计“影响大10倍,速度快10倍”。他呼吁社会各界,包括经济学家和哲学家,现在就开始认真思考如何应对这种剧变,并探讨如“全民基本供给”(Universal Basic Provision)等解决方案。
在谈及本哈明·拉巴图特的著作《疯子》(The Maniac)时,哈萨比斯表达了对约翰·冯·诺伊曼的敬佩。他认为冯·诺伊曼早已预见到“生长而非编程”的智能系统,如果他活在今天,会对AI的发展感到着迷但并不惊讶。
从冯·诺伊曼参与曼哈顿计划的经历中,哈萨比斯汲取的教训是:纯粹的理性不足以引导强大的技术。我们需要一种人文主义或精神层面的维度来确保技术向善。他希望AGI的研发能走向类似CERN(欧洲核子研究组织)的国际合作模式,而非新时代的曼哈顿计划。
哈萨比斯拒绝给出一个具体的“毁灭概率”(p-doom)数字,认为这会造成一种虚假的精确性。他只表示,这个概率“非零,且可能不可忽略”。
面对巨大的不确定性和极高的风险与回报,他主张采取“谨慎乐观”的态度。一方面,AI是解决气候变化、疾病、资源短缺等人类重大挑战的希望;另一方面,其风险真实存在。因此,最理性的做法是通过科学研究更精确地定义和应对这些风险。
哈萨比斯回顾了李世石在与AlphaGo对弈中的“神之一手”(第78手),视之为人类天才与AI相互启发的经典时刻。他认为,探索AI的过程,也将帮助我们反思“是什么让类与众不同”。他引用了一个关于意识的定义:“意识是信息在被我们处理时所产生的感觉。”
哈萨比斯表示,他与罗杰·彭罗斯(Roger Penrose)在意识问题上存在友好分歧。彭罗斯认为意识是量子现象,但哈萨比斯认为,目前没有令人信服的证据支持大脑中存在宏观量子效应。他倾向于认为,大脑的运作是经典计算,因此其产生的现象(包括意识)原则上可以在经典计算机上模拟。
然而,他承认“感受质”(qualia)或主观体验的“硬问题”可能与基底(碳基vs硅基)有关。即使一个硅基AI表现出所有意识行为,我们也无法确认它是否“感觉”到意识,因为我们无法共享其运行基底。未来的脑机接口或许能帮助我们跨越这一鸿沟。
在播客结尾,莱克斯·弗里德曼分享了他对作家大卫·福斯特·华莱士著名演讲《这就是水》的感悟,强调了对日常现实保持批判性意识、在平凡中寻找意义以及保持谦逊和转换视角的重要性。
弗里德曼也借此机会澄清了关于他个人学术背景的网络传言。他重申,他在麻省理工学院(MIT)担任了十多年的付费研究科学家职位,并自豪地拥有德雷塞尔大学(Drexel University)的学士、硕士和博士学位。他表达了对这两所机构的深厚感情,并分享了研究工作对他个人幸福感的重要性。
2025-07-13 01:33:51
David Heinemeier Hansson(DHH)分享了他曲折的编程学习之路。他的兴趣始于五岁时在朋友家玩的一台 Commodore 64 电脑上的游戏《Yie Ar Kung-Fu》。然而,他父亲给他买的却是一台 Amstrad 464,这让他初次尝试编程就遇到了挫折。当时,他试图通过从杂志上抄写代码来获取更多游戏,但由于英语不佳和缺乏对变量等基本概念的理解,他屡屡失败。
大约在 11、12 岁时,DHH 拥有了 Amiga 500,这是他至今最喜欢的电脑之一。他再次尝试学习一种名为 EasyAMOS 的“简易”编程语言,但仍然无法独立完成一个简单的游戏,这让他开始怀疑自己是否不够聪明。尽管如此,他对 Amiga 在欧洲盛行的“演示场景(demo scene)”深感着迷。这是一个程序员们通过邮件交换磁盘,在图形和音乐竞赛中一较高下的亚文化圈。这些活动让他深受感染,但由于缺乏编程技能,他转而通过运营BBS(电子布告栏系统)来参与其中。在 14 岁时,他在哥本哈根的卧室里安装了三条电话线,运营着一个主要用于分发演示作品和盗版软件的 BBS。
DHH 的编程之路在将近 20 岁时迎来了真正的转机。他在九年级的一次学校活动中初次接触了互联网和 HTML。当他发现只需输入一个简单的标签就能让文字在网页上闪烁时,他获得了前所未有的积极反馈。这一刻重新点燃了他学习编程的热情,因为他意识到自己可以创造出全世界都能看到的东西,而无需任何人的许可。
此后,他开始与演示场景的朋友们合作创建游戏网站,负责 HTML 部分。他逐渐接触到动态网站技术,从 ASP.NET 开始,最终在 PHP 上取得了突破。DHH 称自己“100% 归功于 PHP”,因为 PHP 不仅让他能够独立开发 Web 应用,更重要的是,它设定了一个极高的开发者体验标杆。他盛赞 90 年代末 PHP 的开发模式:“你编写一个脚本,通过 FTP 上传到服务器,它就立刻部署好了……这基本上是让动态网页运行起来的最简单方式。” 他认为这种简洁高效的体验是自己整个职业生涯一直在追求的“快感”,并批评当下许多开发者为了应对“CRUD 猴子”(只会做增删改查的程序员)的“存在主义恐惧”而将事情过度复杂化。
DHH 将 90 年代 PHP 开发的简洁体验与他目前在 Rails 8 中追求的“零构建(No build)”理念联系起来。他认为,现代计算机性能远超以往,开发工作理应变得更简单,而非更复杂。
他将 Web 开发在过去十到十五年中最令人厌恶的部分归咎于 JavaScript 生态系统,尤其是 2010 年至 2020 年被他称为“黑暗时代”的时期。他澄清自己并不讨厌 JavaScript 语言本身,甚至称其为“第二喜欢的编程语言”,尤其欣赏 ES6 之后引入的现代化语法。然而,他猛烈批评了那个时代的构建流程和工具链,如 Webpack。他抱怨道:“我刚放下一个用 Webpack 和所有这些依赖项的 JavaScript 项目, буквально五分钟后,它就编译不了了。” 他认为这种由框架和工具驱动的“荒谬的”高流失率和持续重写是一种“群体性歇斯底里”。
DHH 认为,这一黑暗时代的出现,部分原因在于浏览器技术一度停滞(IE5 时代),但更重要的是,大量聪明的开发者涌入 Web 领域,他们的首要目标并非“程序员幸福感”,而是其他优先事项,这导致了复杂性的急剧增加。他指出,像 Facebook 这样的大公司将 Web 开发角色细分成“前端构建流程配置师”等微小岗位,本身就注入了大量复杂性。
不过,他也承认这种复杂性是一个必要的“桥梁”,推动了浏览器技术的发展。如今的浏览器功能“令人难以置信”,可以直接运行现代 JavaScript,无需任何预处理。他强调,现代浏览器能够兼容并渲染几乎所有历史上创建的网页,这是一项“阿波罗计划”级别的工程奇迹,但也导致了创建新浏览器引擎的极高门槛。
DHH 将美国司法部(DOJ)试图将 Chrome 浏览器与谷歌分拆的举动称为一场“灾难”。他虽然同情反垄断斗争,并认为科技行业存在垄断问题,但他坚信浏览器领域并非问题所在。
他高度评价了 Google Chrome,称其为“对全球 Web 开发者和整个 Web 平台的完整礼物”。他认为,如果没有谷歌及其对开放网络的依赖,苹果和微软可能会任由 Web 衰落,让位于他们完全控制的原生应用生态。Chrome 的出现推动了竞争,激发了 Web 技术的繁荣。
DHH 认为,将反垄断的矛头指向 Chrome 是“选错了目标”。他指出,开放网络依然是开放的,用户可以自由选择 Firefox 或 Safari 等替代品。他认为,更严重的问题在于移动应用商店的“收费站”模式。他将 DOJ 的行为与欧洲的 GDPR 法规相提并论,后者虽然意图良好,但最终只带来了人人都讨厌的“Cookie 横幅”,他称之为“良好意图直通地狱的纪念碑”。他尖锐地指出,Cookie 横幅非但没有保护隐私,反而让整个互联网变得丑陋和低效,是官僚主义失败的象征。
对于 Chrome 凭借在 Android 上的预装优势获得主导地位的说法,DHH 并不认同。他强调,与苹果的 iOS 不同,Android 平台允许第三方浏览器使用自己的渲染引擎,这构成了真正的竞争。他总结道,尽管谷歌在广告等领域可能存在垄断问题,但 Chrome 是凭借自身优点赢得了市场,他本人作为 Web 开发者也因此选择使用它。
DHH 将 PHP 视为让他从一个网页制作者转变为能独立开发 Web 应用的程序员的工具,但他从未对 PHP 产生真正的热爱。他视其为“敲打电脑直到它产出我想要的 Web 应用的工具”,而非一种事业。
真正的转变发生在他为 Jason Fried(他至今的商业伙伴)工作后。2003 年,他们在开发内部项目管理工具(即 Basecamp 的前身)时,DHH 首次获得了完全的技术选择自由。当时,他通过《IEEE》杂志上 Dave Thomas 和 Martin Fowler 的文章接触到了 Ruby。这两位作者使用 Ruby 作为示例代码来阐释编程模式,因为 Ruby 的语法“读起来就像伪代码”,易于理解。
DHH 被 Ruby 吸引,决定花两周时间尝试用它构建一个概念验证。结果,他只用了一个周末就“完全被迷住了”,感觉这门语言“像是为我的大脑量身定做的手套”。他发现 Ruby 剔除了大量他认为不必要的“行级噪音”,如分号,这体现了其“为人而非为机器”的设计哲学。这段经历让他第一次将自己视为一名真正的“程序员”,并深深地爱上了编程这门手艺。
DHH 深入阐述了 Ruby 在“代码之美”方面的特质,他认为这是他此前使用 PHP 或 ASP 时从未考虑过的维度。他通过对比 Ruby 和 Python 来强调这一点。
他列举了几个核心例子来展示 Ruby 的美学优势:
方法调用:Ruby 允许在原始类型(如整数)上直接调用方法。他举例说 5.times { ... }
是一种极其简洁的循环表达方式,几乎没有任何其他语言能将一个五次迭代的循环精炼到如此程度。
类的初始化:他批评 Python 的 def __init__(self, ...)
写法,认为双下划线和 self
参数在美学上“令人反感”。相比之下,Ruby 的 def initialize
更为自然,甚至在没有参数时可以省略括号。他认为,initialize
虽然更长,但更具可读性,这体现了 Ruby 优先考虑美观而非简写的原则。
条件语句:他认为 Ruby 的条件语句是“诗意的”。
if user.admin?
,方法名后的问号是为人设计的,增强了可读性,同时省略了不必要的括号。user.upgrade if user.admin?
,将动作前置,更符合自然语言习惯。unless
关键字:user.downgrade unless user.admin?
,用一个优雅的词代替了 if !...
这种充满“行级噪音”的写法。他将这些设计归功于 Ruby 的创造者松本行弘(Matz),其首要目标是“程序员的幸福感”。这与 Java 设计者 James Gosling 的理念形成鲜明对比,后者认为“普通程序员是愚蠢的”,需要严格的限制以防犯错。
DHH 还强调了 Ruby 允许开发者扩展核心类的能力,比如他在 Rails 中为数字添加了 .days
方法(如 5.days
),使其返回代表五天的秒数。他认为,Matz 信任一个素未谋面的陌生人(指他自己)去扩展他的语言,这种信任“基本上是闻所未闻的”。
DHH 将元编程描述为将 Ruby 的优雅特性“提升到 11 级”的强大功能。他简单地解释道,元编程就是“编写能够编写代码的代码”,允许开发者为语言添加新的“关键字”。
他以 Rails 的核心组件 ActiveRecord 为例。在定义一个模型类时,开发者可以写下 has_many :comments
这样的代码。这行代码看起来像是 Ruby 的一个内置关键字,但实际上是一个方法调用。这个方法会在运行时为当前类动态添加一系列用于管理关联关系的方法(如创建、更新评论等)。
这种技术使得创建领域特定语言(DSL)成为可能。Rails 通过元编程将通用的 Ruby 语言定制成一个专门用于描述 Web 应用和数据库关系的语言。DHH 强调,Ruby 实现这一切的方式是如此无缝,以至于“你无法分辨我的元编程和 Matz 的关键字”,并且“没有任何行级噪音”。
DHH 坚决捍卫动态类型,并称之为“Ruby 的基石”,表示愿意“为之奋斗至死”。他反对为 Ruby 添加静态类型的呼吁,认为这会破坏其美感和核心哲学。
他反对静态类型的原因有三:
User user = new User()
为例,认为这种重复声明是“污染”。他认为,对于像他这样主要开发中小型应用(如 Basecamp)的开发者来说,动态类型的优势远大于其所谓的弊端。他通过单元测试和集成测试来捕捉错误,而不是依赖编译器的类型检查。他强调,不同的项目规模需要不同的工具,不能将适用于千万行代码库的规则强加于一个单人开发的项目。
DHH 针对“Ruby on Rails 无法扩展”这一流传已久的迷思进行了有力驳斥。他将 Shopify 誉为 Rails 扩展性的“旗舰应用”,并提供了关键数据:Shopify 承载了全球约 30% 的电商网站,在“黑五”期间处理高达每秒一百万次的动态请求。DHH 指出,这个规模是大多数程序员一生都无法触及的。
他进一步阐释了对“扩展性”的理解,将其分解为两个层面: 1. 运行时性能(延迟):单个请求的处理速度。DHH 的目标是将延迟控制在 100 毫秒以内。 2. 吞吐量(水平扩展):通过增加更多服务器来处理大量并发请求的能力。他认为,几乎所有编程语言都能通过增加服务器来实现水平扩展,真正的瓶颈通常在于数据库,而非应用层。
基于此,DHH 将 Ruby 形容为一种“奢侈品语言”,如同“编程语言中的可可·香奈儿”。他承认,对于每个请求价值极低的某些应用,使用 Ruby 可能成本过高。然而,对于绝大多数 Web 应用(包括 Basecamp 和 Shopify)而言,最大的成本并非 CPU 时间,而是“人的核心”——开发者的生产力。
他曾计算过,在 37signals,服务器成本约占运营预算的 15%。即使换用一种快一倍的语言,最多也只能将总成本降低 7.5%。但如果 Rails 能让程序员的效率提升 10%,其带来的价值将远超节省的服务器费用。他认为,这与当前人们对 AI 提升生产力的兴奋点是同源的:提升人的能力比优化机器周期重要得多。Shopify 对 Ruby 生态系统的一大贡献是 YJIT(一个即时编译器),它显著提升了 Ruby 的执行效率,这在 Shopify 的规模下能节省巨额成本。
DHH 讨论了人工智能(AI)在编程中的角色。他认为,AI 的兴起反而凸显了像 Ruby 这样人类可读性强的语言的价值。他引用伊隆·马斯克的比喻,将编程语言视为人与机器之间的“带宽”,Ruby 凭借其简洁和高表达力,提供了比其他语言更高的通信带宽,这在与 AI 协作时至关重要。
他本人也乐于与 AI 协作,但方式是“在一个独立的窗口里”,而非让 AI 直接驱动他的代码(如使用 Cursor 等工具)。他分享了自己的亲身体验:当他让 AI 为他编写不熟悉的 Bash 脚本时,他感觉自己的“能力正从指尖流失”,因为没有亲手输入,他就无法真正学会。他坚信“你是用手指学习的”,就像弹吉他一样,必须亲手实践才能掌握。
他不想让自己沦为“一群 AI 乌鸦的项目经理”,因为编程的乐趣不仅在于最终产出的程序,更在于创作过程本身。不过,他也承认 AI 是一个强大的工具,尤其是在查找 API、获取第二意见或快速生成草稿方面。他已经离不开 AI,并认为正确使用 AI 能让他每天都变得更聪明。他总结道,他使用 AI 是为了让自己学习,而不是让 AI 代替自己学习。如果未来编程完全变成一种像骑马一样的“娱乐性活动”,他也能坦然接受,因为他已经享受了近 30 年以编程为生的美好时光。
对于年轻程序员的建议,DHH 认为,如果想真正学习编程,就不能仅仅依赖于 AI 生成代码。他认为“vibe coding”(通过提示词让 AI 写代码,然后进行修改)无法建立真正的技能。如果任何人都能做到,那它就不是一项有市场价值的技能。
DHH 承认,当前正处于“AI 未来炒作的高峰期”。他对 AI 的能力感到敬畏,特别是看到像 DeepSeek 这样的模型能够“与自己对话”来构建回应时,他坦言“有点害怕”。
然而,他也告诫不要过度预测。他以 1995 年的电影《割草者》为例,当时人们以为虚拟现实(VR)将在五年内普及,但三十年后的今天,VR 仍未成为主流。他用飞机发展的历史作类比:从莱特兄弟首飞到喷气式飞机诞生只用了约 40 年,实现了飞速发展,但自 50 年代波音 747 的设计定型以来,航空技术就进入了一个相对平稳的时期。AI 的发展也可能遵循类似的S型曲线,而不是无限的指数增长。
他指出,即使是专家也无法准确预测未来,社会中仍有大量关键基础设施运行在 COBOL 这种几十年前的语言上。因此,他认为 Ruby on Rails 的代码很可能在 50 年后依然在运行。
对于向他寻求建议的年轻程序员,他的核心观点是:“没人他妈的知道任何事。” 无法预测哪种技能会永远有价值。因此,最好的策略是追随自己的兴趣。“如果你喜欢编程,你就应该学习编程。” 他建议人们选择一条即使未来需要转行也不会后悔的道路。对他而言,这意味着享受过程本身,无论结果如何,都能在其中找到价值和乐趣。
DHH 对“vibe coding”(指主要依靠 AI 生成代码,然后进行修改的编程方式)作为一种学习途径持强烈批判态度。他认为,如果一个人有志于成为一名程序员,就必须将更多时间投入到“从头开始编写代码”中。
他用了几个生动的比喻来阐明观点:“你不可能通过看健身视频来变得健美,也不可能通过看 YouTube 视频学会弹吉他。”他强调,人类的学习机制要求亲身实践,仅仅观察是无法将信息转化为技能的。
他认为,vibe coding 产生的学习效果是“完全的空洞卡路里”,虽然表面上看起来学到了东西,但实际上并未建立起真正的能力。更重要的是,他指出:“如果任何人都能通过 vibe coding 做到,那你就不是一个程序员了。” 这意味着这种方式无法构建起具有市场竞争力的技能。
虽然 Lex Fridman 提出“编辑 AI 生成的代码”本身可能是一种可以培养的技能,但 DHH 对此表示怀疑。他认为,一个优秀的编辑必须首先是一个优秀的创作者。他把 AI 当前的编程能力比作一个初级程序员:能够构建一个看似可行的“表层”,但内部充满了各种缺陷,并且当你试图修改时,很容易陷入“打地鼠”的困境,修复一个问题会引发更多问题。
DHH 阐述了他在 2012 年为 Ruby on Rails 写下的九条核心原则,他认为记录这些价值观对于社区的存续至关重要。
exit
和 quit
都可以退出,因为这更符合人的习惯。DHH 分享了他对管理者,特别是工程管理者的批判性看法。他讲述了 37signals 曾尝试引入传统工程经理的经历,但几年后得出结论:这是一个错误,管理者是“不必要的负担”。
他的核心论点是: 1. 打扰深度工作:管理者的存在往往意味着更多的会议、一对一谈话和状态更新,这会打断程序员需要的“长时间、不间断的”深度工作时间,而这正是幸福感和生产力的源泉。 2. 无法提供有效反馈:他认为,程序员若想提升技艺,需要向比自己更优秀的从业者学习。而大多数管理者一旦脱离一线编码,很快就会“失去感觉”,无法对代码质量提供有价值的反馈。 3. 扼杀创新:他引用 id Software (Quake的开发者) 和 Gmail 的早期开发等例子,指出历史上许多重大创新都诞生于没有管理者的“小团队”。
他承认,在极大规模的组织中,管理或许是一种“必要的恶”,但他坚信对于中小型团队而言,应该尽可能地避免。他本人也极度厌恶扮演管理者的角色,并认为如果他需要花大量时间进行管理,他宁愿退休。
DHH 坚定地认为小团队是实现高效和创新的最佳模式。他指出,37signals 的默认团队规模是两人:一名程序员和一名设计师共同负责一个功能。这种模式的优势在于:
他强调,“小不是垫脚石”,而是一种值得追求的、可持续的理想状态。这让团队能够享受工作的乐趣,而不是仅仅为了成为一个更大的公司而奋斗。
DHH 澄清了杰夫·贝佐斯(Jeff Bezos)对 Basecamp 的投资性质。贝佐斯并非投入增长资本,而是通过购买“二次股”(secondaries)的方式,从 DHH 和 Jason Fried 个人手中购买了一部分股权。这笔资金直接进入了创始人的个人账户,而不是公司。
DHH 解释说,这次交易的意义在于为他们提供了财务上的“安全垫”,使他们能够有底气拒绝风险投资(VC)的更大支票和随之而来的增长压力。这笔钱让他们可以安心地按照自己的节奏发展公司,而不必担心因拒绝外部资本而错失机会。
他赞扬了贝佐斯发现潜力的眼光和超前的长远思维。贝佐斯对他们的商业模式表示了支持,并分享了“不同意但承诺执行(disagree and commit)”这一宝贵的管理经验,DHH 认为这对维持他与 Jason Fried 长达四分之一个世纪的合作关系至关重要。
DHH 认为会议是“有毒的”,并且是他和他的商业伙伴 Jason Fried 能够长期成功合作的关键原因之一。他估计,在他们 24 年的合作中,两人面对面开会的总时长可能还不及一家大型科技公司三个月的会议时间。
他将这种工作模式的成功归因于以下几点: 1. 异步与远程协作:他们从一开始就习惯了远程工作,这减少了不必要的摩擦和会议需求。 2. 保护个人时间和精力:他认为人际关系像电池一样有“有限的电量”,过多的会议和交流会耗尽它。通过减少直接互动,他们得以保持长久的合作关系。 3. 专注实干而非空谈:他批评许多高管沉迷于“想法领域”,通过会议来“告诉别人做什么”。而他和 Jason 更喜欢亲手实现想法,这自然减少了开会的必要性。
当被问及远程工作可能带来的孤独感时,DHH 半开玩笑半认真地给出了他的解药:“找个妻子,生几个孩子。” 他认为,家庭是对抗孤独感的最佳方式,工作不应该是满足所有社交需求的场所。通过在工作之外建立充实的生活,包括家庭、朋友和爱好,才能实现可持续的职业生涯。
DHH 坚决反对传统的退休观念,他称之为“莫吉托岛的幻想”。他认为,对于有创造力和雄心的人来说,完全停止工作、无所事事地躺在沙滩上是“地狱”,而非天堂。
他引用了米哈里·契克森米哈赖(Mihaly Csikszentmihalyi)的“心流”(Flow)理论来支持自己的观点。他指出,人类的幸福感并非源于无所事事的放松,而是在于“将自身能力推向极限”的时刻。编程、赛车等活动都能让他进入这种忘记时间、全神贯注的心流状态,这才是快乐的巅峰。
因此,他批判了硅谷那种“牺牲一切以换取最终退出”的创业文化。他认为这种模式从任何角度看都是失败的: * 如果成功退出,你会很快感到无聊。 * 如果创业失败,你会为浪费的十年光阴而懊悔。 * 即使成功并继续经营,工作压力也永远不会减轻。
他倡导一种可持续的模式,将工作视为可以享受一生的旅程,而不是一个有终点的冲刺。
DHH 对“努力工作”的定义提出了独到的见解。他承认,在职业生涯的某些阶段可以“冲刺”,但他强烈反对将冲刺变成长达十年的常态。他认为,为了事业牺牲掉整个 20 多岁或 30 多岁的生活,是一种非常糟糕的交易,因为这段时光一去不复返。
他引用了 Derek Sivers 的一个比喻:骑自行车时,你可以拼尽全力用 19 分钟完成,也可以用 21 分钟轻松完成,同时欣赏风景。为了节省区区两分钟而放弃整个旅程的乐趣,是不值得的。
DHH 坦言,自己很早就意识到他“不够聪明,也不够有才华,无法在任何单一领域成为世界顶尖”。这种“谦逊的祝福”让他摆脱了必须成为“世界第一”的执念。他满足于在五个不同的领域都做到前 5%,而不是在一个领域做到前 0.1%。这种多领域发展的策略让他能够享受写作、编程、赛车、经营公司和家庭生活等多种乐趣,避免了单一专注可能带来的“异化感”。他认为社会在颂扬顶尖卓越的同时,也应该认可并庆祝这种多元、均衡的生活方式。
DHH 回应了关于他决定将 37signals 的服务“迁出云端”的争议。有人批评他这是在“捡芝麻,丢西瓜”,即专注于节省几百万美元的基建成本,而放弃了可能成为百亿级公司的机会。
DHH 坚决反驳了这一观点。他认为,每年节省 200 万美元对他的公司规模而言是“完全值得的”。更重要的是,他发现业务中的低效“在美学上令人不悦”。当他看到公司的云服务账单在摩尔定律下不降反升时,他开始了对云成本的深入调查。
DHH 详细阐述了他对 AWS 等云服务的批判。他认为,云服务最初“更容易、更便宜、更快”的承诺,在实践中对他的公司而言是“根本性的谎言”。
这次迁移历时六个多月,涉及七个主要应用,并且没有增加任何运维人员。DHH 认为,这次行动不仅节省了巨额资金,也让他重新找回了运营硬件的自主权和满足感,并认为这是对互联网最初“去中心化”设计理念的一种回归。
DHH 承认,运营自己的服务器确实有其“痛点”,但所有计算机系统都存在问题。他认为,拥有硬件所带来的责任感和控制感,让这些痛苦变得更值得。
他澄清了一个普遍的误解:他们并非亲自去数据中心插拔服务器。相反,他们与一家名为 Summit 的公司合作,享受“白手套服务”。当需要更换硬盘或添加新机器时,他们只需提出请求,由专业人员完成物理操作。对他们而言,体验与云服务类似,只是成本大幅降低。
DHH 对此感到非常兴奋,甚至开始探索“家庭实验室(homelabbing)”——即在自己家中部署服务器并直接连接到互联网。他认为,随着个人光纤网络速度的大幅提升和硬件性能的增强,这种“车库创业”的原始模式再次变得可行。他相信,技术进步已经悄然改变了游戏规则,许多人尚未意识到自建基础设施的巨大潜力。
DHH 认为,伊隆·马斯克(Elon Musk)之所以能吸引顶尖人才,主要原因并非他擅长“寻找”,而是他通过其“宏大无畏的使命”来“吸引”。无论是登陆火星、推动电动车革命,还是用星链覆盖地球,这些目标本身就像一座灯塔,让最优秀的人才主动前来。
他认为马斯克的另一个秘诀是“他真的懂行”。马斯克具备评估技术工作成果的专业知识,能迅速分辨出谁是夸夸其谈,谁是能真正解决问题的人。这种能力使他能够果断地提拔有真才实学的人,而不管其背景或履历。
DHH 将这一原则应用于自己的公司。在招聘程序员时,他最看重两点: 1. 求职信:作为一家远程公司,良好的书面沟通能力是必需的。 2. 编程测试:通过一个模拟真实工作场景的编程任务来评估候选人的实际编码能力和代码品味。
他强调,这种基于实际工作成果的评估方式,是招聘到优秀人才的“超能力”。
DHH 讲述了他与苹果公司从“热爱”到“战争”的复杂关系。他曾是苹果长达 20 年的忠实粉丝和传道者,尤其是在苹果转向基于 Unix 的操作系统后。他欣赏苹果的设计、品味和创新。
然而,随着 iPhone 和 App Store 的崛起,这种关系开始变质。他认为,苹果利用其在移动设备上的垄断地位,建立了一个“收费站”,这种模式扼杀了创新,并在公司内部滋生了“腐朽”。
真正的决裂发生在 2020 年,当他们推出新的电子邮件服务 HEY 时。苹果在批准 HEY 的 iOS 应用上架后,突然以“未集成应用内支付”为由,威胁要将其下架。这意味着 HEY 必须向苹果上交 30% 的收入,并放弃与客户的直接关系。DHH 团队对此表示了坚决的“不”,并选择将这场斗争公之于众。由于事件发生在苹果全球开发者大会(WWDC)前夕,引发了巨大的舆论压力,最终苹果做出了让步,双方达成了一种“休战”协议。
DHH 对 Epic Games 的创始人蒂姆·斯威尼(Tim Sweeney)在与苹果的反垄断诉讼中取得的胜利表达了极高的敬意。他称之为一场“令人难以置信的”胜利,并认为“整个开发者生态系统都欠 Epic 一份巨大的人情”。
他指出,这场官司耗费了超过 1 亿美元的法律费用,这是只有像 Epic 这样由创始人掌控且财力雄厚的公司才能承担的。他赞扬了斯威尼“坚持原则的非理性”,认为这种品质是推动这场斗争并最终获胜的关键。
这场胜利最重要的成果是,法院裁定苹果不能阻止应用链接到外部网站进行支付。DHH 表示,他的公司将立即利用这一裁决,更新 HEY 应用,从而绕过苹果的 30% 抽成,并与客户建立直接的计费关系。
DHH 坦诚,他起初并不确定自己是否想要孩子,是在妻子的说服下才走上了为人父的道路。他将这段经历描述为一次“变革性”的体验,极大地扩展了他对生活满意度的认知。他用一个比喻来形容:“我曾以为人生的满足感量表是从 1 到 10,有了孩子后才发现,这个量表其实是从 1 到 100。”
他认为,孩子是他生命中“最重要的事情”,愿意为此“在心跳之间交换所有其他一切”。这种深刻的联结和喜悦,是他之前通过任何事业成就或个人爱好都未曾体验过的。
他感觉到,现代西方社会对婚姻和家庭等传统价值观存在许多负面论述,因此他认为自己有“义务”去“宣传”为人父母的积极面。
在谈到对生产力的影响时,他认为有了孩子后,他的工作时间变得更加结构化和高效。由于需要在特定时间(如下午 5 点)结束工作以陪伴家人,他必须在有限的工作时间内保持高度专注,这反而提升了他的工作效率。
DHH 直到 25 岁才拿到驾照,但很快就对赛车产生了浓厚的兴趣。27 岁时,他在芝加哥的一个赛道上第一次驾驶了真正的赛车,并立即被这种体验所吸引。他将赛车描述为一种能稳定获得“心流”状态的活动,因为在高速驾驶时,大脑必须 100% 专注于当下,没有任何杂念。
他热爱在“附着力边缘”驾驶的感觉,这是一种在技巧与危险之间寻求极致平衡的“令人陶醉”的体验。他给自己设定了参加“勒芒 24 小时耐力赛”的目标,并在开始正式比赛三年后(2012 年)就实现了这一目标。2014 年,他赢得了自己所在组别的勒芒冠军。
他解释说,赛车是一项团队运动,需要与队友和技师紧密合作。在比赛中,他最关注的是如何像“机器人”一样,精确、稳定地执行为每个弯道预设的“程序”,同时应对轮胎磨损、天气变化以及与其他赛车互动等动态因素。
当被问及有史以来最伟大的汽车时,DHH 毫不犹豫地选择了帕加尼 Zonda(Pagani Zonda)。他拥有一辆于 2010 年为他定制的、独一无二的“HH”版本。他称赞这辆车是“世界上最漂亮、声音最动听的汽车”,并表示永远不会出售它。他强调,Zonda 是一辆为公路驾驶而设计的杰作,虽然在赛道上表现平平,但在公共道路上能提供无与伦比的驾驶乐趣和舒适感。
DHH 分享了他当前的编程环境,这在过去一年半里发生了重大变化: * 操作系统:从使用了近 20 年的 macOS 切换到了 Linux。他使用的是基于 Ubuntu 的发行版,并加上了自己定制的 Omakub 配置,以实现一个“完美”且可复现的开发环境。 * 显示器:他仍然使用苹果的 32 英寸 6K Pro Display XDR 显示器,认为其无与伦比。他偏爱单一大屏幕,而非多显示器设置。 * 键盘:他盛赞 Lofree Flow84 矮轴机械键盘,形容其敲击声和手感“如同天使在歌唱”,并后悔没有早点发现它。 * 鼠标:使用罗技 MX Master 3。 * 编辑器:从长期使用的 TextMate 切换到了 Neovim。他推荐使用 LazyVim 发行版,因为它极大地简化了 Neovim 的配置过程。他大约用了一周时间就适应并爱上了 Neovim 高效的键盘驱动编辑模式。
对于想学习编程的初学者,DHH 推荐了三门语言: 1. Ruby:他认为 Ruby 对初学者来说具有“魔力”,因为它语法简洁,几乎没有样板代码,能让学习者快速理解核心概念并获得成就感。如果目标是开发 Web 应用,他建议直接上手 Rails,在实践中学习 Ruby。 2. JavaScript:作为 Web 开发的通用语言,他认为这是任何想在互联网领域工作的人“必须学习”的语言。 3. Go:适用于特定的底层网络任务,例如编写 HTTP 代理,Go 语言在性能和原语支持方面表现出色。
他再次强调,自己更认同“软件作家”(software writer)的身份,而非“软件工程师”(software engineer),因为他的工作更侧重于表达、沟通和美学,而非纯粹的工程计算。
DHH 阐述了他对开源的核心理念:它应该是一场“礼物交换”,而非商业交易。
DHH 评论了 WordPress 创始人 Matt Mullenweg 与托管公司 WP Engine 之间的公开冲突。他首先肯定了 WordPress 作为一个开源项目的巨大成功和对互联网的贡献。
然而,他尖锐地批评了 Matt 的行为。他认为,核心原则是:你不能在以开源形式赠予软件后,又回过头来向那些基于你的软件成功创业的公司索要“赎金”。他认为这种行为违反了开源许可证的精神和文字,无论对方公司(及其背后的私募股权)是否值得同情。
他将此事件与苹果的 30%“苹果税”相提并论,认为两者都源于一种不合理的“权利感”。他担心这种行为会破坏整个开源生态系统的信任基础,让商业公司不敢再依赖开源软件。他希望 Matt 能认识到自己的错误,并放弃这种有损社区的斗争。
DHH 坦言,权力,比如作为 Rails 的“国王”,难免会“让人上头”。但他努力保持清醒,以“热爱编写 Ruby”作为自己的“北极星”,不让外界的赞誉或批评过多地影响自己。
他回应了“为什么不为 Rails 收费”的问题。他表示,自己通过经营公司已经获得了“绰绰有余”的财富,不需要去追逐那些建立在 Rails 上的公司所创造的巨额利润。他引用了金·凯瑞的名言,大意是希望每个人都能得到他们想要的财富,然后就会发现那并不是幸福的答案。
他再次引用了可可·香奈儿的名言:“生命中最好的东西是免费的,第二好的东西则非常、非常昂贵。” 他认为,关键在于分清主次。家庭、友谊、爱好这些“免费”的东西才是幸福的基石,而那些“昂贵”的东西虽然也很好,但其带来的乐趣深度和持久性远不及前者。他认为,当一个人实现了财务自由后,就有能力将其他更有意义的事情(如心流与安宁)置于更高的优先级。
DHH 表示,他选择对未来保持乐观,因为悲观于事无补。他引用斯多葛学派的名言:“我们在想象中承受的痛苦比在现实中更多。” 他认为,无论是气候变化还是其他全球性挑战,人类都不应在事情真正发生前就陷入绝望。
他强调了“知识的谦逊”。以新冠大流行为例,许多顶尖专家也犯了严重错误。这让他更加坚信“没人知道任何事”,世界过于复杂,无法准确预测。
最后,他认为人类有解决问题和创造美好事物的基本愿望。我们制造问题,也会建造“火箭”来解决问题。他相信,人类精神中蕴含的合作与同情心,终将引导我们走向一个更好的未来。
2025-06-27 07:43:20
好的,作为一名资深新闻编辑,我将对这份 Lex Fridman 播客逐字稿脚本进行专业综述。
本节节选了播客中的关键对话片段,展示了两位嘉宾在核心议题上的尖锐对立。Mark Dubowitz 强调通过强大的威慑力避免战争,认为面对伊朗核武器等威胁时,美国需要使用“选择性的、有重点的、压倒性的军事力量”。Scott Horton 则质疑“和平通过力量”的逻辑,认为美国正在走向“永久的军事化和永久的战争”。Dubowitz 反问 Horton 是否认为美国没有对手,而 Horton 则驳斥 Dubowitz 的说法“完全错误”,并对伊朗核能力的具体技术细节和相关证据的真实性提出质疑,特别是对 Mossad 收集的“核档案”提出伪造指控。本节迅速勾勒出双方在力量哲学、战争根源、伊朗意图和证据可靠性等方面的根本分歧。
本节由主持人 Lex Fridman 介绍本期播客及其嘉宾。本期播客 #473 是一场关于伊朗与以色列的辩论。嘉宾 Scott Horton 是一位作家、Antiwar.com 的编辑主任以及 Scott Horton Show 的主持人,他在过去三十年里一直是美国外交政策和军事干预的坚定批评者。另一位嘉宾 Mark Dubowitz 是美国民主防御基金会(Foundation for Defense of Democracies, FDD)的首席执行官和 Iran Breakdown Podcast 的主持人,他在过去二十多年一直是伊朗及其核计划的顶尖专家。Lex Fridman 表示希望这场讨论能够进行细致入微的交流和辩论,并尽可能地“替对方立场辩护”(steelman opposing perspectives)。
Lex Fridman 开场询问了当前伊朗与以色列之间“勉强稳定的停火”的背景和最近两周的关键事件,以及冲突的深层根源。
Mark Dubowitz 回顾了自特朗普总统上任以来推行的对伊朗政权的“极限施压”策略,目标是阻止伊朗拥有核武器。他提到特朗普清晰地表示,伊朗要么在美国监督下摧毁其核计划,要么“有人会替他们炸毁它”。尽管有以色列方面推动军事行动的因素,特朗普仍授权特使 Steve Witkoff 在阿曼与伊朗进行了五轮谈判。Dubowitz 描述了美方提出的协议草案:允许临时进行地面铀浓缩,地下设施(如 Fordow)需变为“非运作状态”,并在三到四年后建立一个非伊朗领土的国际联合体进行燃料棒生产。这一提议包含大量制裁减免。Dubowitz 对伊朗最高领袖哈梅内伊拒绝这一“好提议”表示震惊,认为哈梅内伊误判形势,以为可以像对待奥巴马一样继续施压,以便在特朗普卸任后保留并发展核能力。谈判破裂后,以色列发动了持续12天的“毁灭性打击”,攻击了伊朗的关键核设施、武器科学家和高级军事指挥官。Dubowitz 特别提到高度加固的 Fordow 浓缩设施,指出以色列虽能造成破坏,但彻底摧毁需要美国的军事力量。特朗普总统随后下令美国空军派遣 B-2 轰炸机投掷12枚重达3万磅的巨型钻地弹(Massive Ordnance Penetrator),以“严重削弱”Fordow。行动后,特朗普再次向伊朗提供谈判机会,并在阿曼达成停火。Dubowitz 总结称,当前的停火是特朗普迫使伊朗和以色列达成的,后续取决于伊朗是否重返谈判桌。
Scott Horton 对此表示,从特朗普第二任期开始的“极限施压”及随后的谈判,在他看来“本质上只是战争的借口”。他认为,特朗普及其团队深知哈梅内伊不会放弃所有铀浓缩,因为这是伊朗的“潜在核威慑”,其立场是“别攻击我们,我们就不会制造核武器”。美国则声称“如果你制造核武器,我们就会攻击你”,这本是一种僵持。Horton 认为美方要求“零浓缩”是“红线”,且是故意为之的“毒丸”,伊朗不太可能放弃。他指出,轰炸 Fordow 并未摧毁所有离心机,伊朗已宣布在更深的山下建设新设施。他认为这种军事打击是“滑坡效应”,只会促使伊朗加速发展核武器,并可能导致美国进一步军事介入甚至推动政权更迭。他警告说,政权更迭可能引发内战和更大混乱,类似伊拉克、利比亚和叙利亚的后果,导致“宾拉登式的组织”崛起,各种派系争夺权力。Horton 质疑美方声称伊朗核计划已被摧毁的说法,认为现在哈梅内伊更有可能改变想法,认为需要核威慑。他强调,伊朗一直有能力进行铀浓缩,但之所以没有“突破”制造核武器,是因为一旦这么做全世界都会知道。他驳斥了美方(如 Marco Rubio)声称伊朗拥有60%丰度铀是“奔向核弹”的说法,认为这是“荒谬的谎言”。他解释说,伊朗早在二十年前就掌握了浓缩技术,达到60%是为了应对以色列的破坏(科学家暗杀、Natanz 设施攻击),作为谈判筹码,就像在 JCPOA 下他们曾将浓缩铀运往法国转化为燃料棒一样。他认为伊朗只是想让美国重返 JCPOA,当前情况是“幻觉”,伊朗并未制造核武器,这只是内塔尼亚胡及其利库德集团(甚至其前任奥尔默特政府)编造的威胁借口。
Lex Fridman 接着询问美国在伊朗核计划上的目标和红线是什么,以及伊朗对潜在核威慑的需求是否应被接受。
Mark Dubowitz 详细展开了他的观点。他首先强调伊朗伊斯兰共和国自1979年掌权以来,被多届美国政府列为主要的恐怖主义支持国,造成了数千美国人以及中东地区数十万人的伤亡。他指责伊朗在核计划上撒谎,隐藏核设施(后被伊朗反对派、西方情报机构和国际原子能机构 IAEA 揭露)。他提到过去的多次外交尝试,包括2015年的 JCPOA。他认为,如果伊朗真的只需要民用核能,全球有23个国家拥有核电站但不进行铀浓缩和钚再处理,这些国家遵循的是“黄金标准”,从国外购买核燃料棒。他认为伊朗伊斯兰共和国与这些国家截然不同,因为它致力于恐怖主义,是危险的政权,不应保留开发核武器的关键能力。他回到当前的谈判,再次强调美方在阿曼的提议并非“零浓缩”,而是允许临时地面浓缩和未来建立国际联合体。他认为哈梅内内伊拒绝是因为想保留全部核设施和能力,以便在特朗普离开后迅速发展核武器。
Dubowitz 列举了伊朗核计划的特点来证明其武器意图:建造深埋地下、向国际社会隐瞒的浓缩设施;曾有一个活跃的核弹头计划“AMAD”,目标是制造五枚原子弹(他强调该计划在2003年美国入侵伊拉克后形式上结束,但有详细的蓝图和设计,这一点通过 Mossad 在德黑兰获取的“核档案”以及 IAEA、美国情报机构的分析得到证实);前 AMAD 计划的科学家继续从事弹头相关的初步工作(冶金、计算机建模)。他认为伊朗花费了高达五千亿美元用于核计划(包括直接成本和制裁损失),而其核电产出仅占其电力需求的3%,而阿联酋遵守“黄金标准”只花了200亿美元却满足了25%的电力需求。他提到伊朗从俄罗斯购买的布舍尔(Bushehr)反应堆是防扩散的(俄方供应燃料棒并回收乏燃料),但伊朗自己建造的阿拉克(Arak)重水反应堆则可用于钚武器途径,因此在 JCPOA 下不得不向其核心浇筑混凝土。他认为所有这些都指向哈梅内伊希望拥有核武器的意图。他认为最近的情报(美情报部门 DNI、CIA 局长 Radcliffe,以色列情报机构,华尔街日报文章)显示伊朗核武器科学家已开始弹头初步工作(根据 JCPOA T 段的定义,包括冶金和计算机建模),这表明哈梅内伊已开绿灯或科学家超前行动。
Scott Horton 对 Dubowitz 的大部分说法进行了强烈反驳。他认为伊朗在1990年代试图购买防扩散的轻水反应堆,但被克林顿政府阻止,这才转向黑市从 AQ Khan 获取技术,从而走上铀浓缩道路。他坚持认为伊朗从未拥有钚再处理设施,JCPOA 下阿拉克反应堆的乏燃料会运回俄罗斯,不存在钚武器途径(尽管 Dubowitz 强调美国坚持浇筑混凝土正是担心其潜力)。关于“核档案”和 AMAD 计划,Horton 坚称这与2003/2004年的“冒烟的笔记本”(smoking laptop)是同回事,他认为那完全是以色列伪造的,通过“伊朗人民圣战组织”(MEK,他称为以色列/美国的“傀儡”)传递给美国情报机构。他引用 David Albright(与 David Sanger 在《纽约时报》)曾驳斥了笔记本中关于弹头设计的说法(因为弹头设计与伊朗导弹实际弹头锥不同)。他指责 MEK 多次散布关于伊朗核计划的虚假信息(如新的卫星图片、金库大门照片)。他反驳了伊朗隐藏核设施的说法,认为 Natanz 和 Fordow 的存在是由 David Albright(而非 MEK/Mossad)首先部分揭露的,且伊朗是在IAEA规定时间前向其通报了新建的 Fordow 设施,遵守了保障协定,而之所以深埋设施是为了防御以色列的攻击。他坚持认为伊朗发展浓缩能力和深埋设施是为了建立潜在威慑,证明自己能制造核武器,从而阻止攻击,而不是真的打算制造。
Horton 进一步反驳了伊朗是恐怖主义支持国并杀死数千美国人的说法。他认为这主要指1983年贝鲁特美国海军陆战队兵营爆炸案和伊拉克战争中的 EFP(爆炸成型弹)袭击。关于贝鲁特,他引用前 Mossad 官员 Victor Ostrovsky 的书《骗术》(By Way of Deception),称以色列事先知情但未告知美国(他承认 Ostrovsky 被广泛质疑,但他认为这仍是需要考虑的可能性)。他还提到当时以色列与伊朗仍有来往,且里根政府后来还通过以色列向伊朗售卖导弹。他质疑是否有直接证据证明德黑兰下令了贝鲁特的袭击,认为即使有也已是几十年前的事。关于伊拉克 EFP 袭击,Horton 坚称这是迪克·切尼和戴维·彼得雷乌斯等人发动的“巨大宣传运动”,目的是为攻击伊朗寻找借口。他引用多名记者(如《纽约时报》的 Alyssa Rubin)、军官和前官员的说法,证明这些 EFP 是在伊拉克什叶派地区本地制造的,没有证据表明来自伊朗,更没有证据表明受伊朗圣城旅或最高领袖直接指挥。他引用戴维·沃姆泽(“清洁突破”战略作者)的话,称其曾在2007年试图与以色列合作迫使小布什总统对伊朗开战。他提到2007年美国情报机构的《国家情报评估》(NIE)结论(后被 CIA、国家情报委员会以及特朗普政府 DNI 图尔西·加巴德重申)是:伊朗最高领袖 没有决定 寻求核武器,尽管他们拥有相关的技术能力和研究(在2003年结束)。他认为这些官方评估与 Dubowitz 的说法相悖。
双方就伊朗袭击美国目标的历史事实和归责进行了激烈辩论,并对彼此引用的消息源(美国政府报告、情报评估、记者报道、前官员回忆录、智库分析、甚至奥萨马·本·拉登自己的声明)的可靠性提出质疑,特别是关于 Khobar Towers 袭击(Dubowitz 称 Hezbollah/Al-Qaeda 合作,Horton 坚称是 Al-Qaeda 且源于沙特驻军和支持以色列的美国政策)和 EFP 袭击。Dubowitz 嘲讽 Horton 总是相信敌人(Hezbollah, Al-Qaeda, Ayatollah)而不信美国和以色列政府。Horton 反驳自己从未说相信 Ayatollah 或 Hezbollah 的话,只相信通过监视、检查和协议验证的事实(引用里根的“信任但要核实”原则),并引用了美国情报官员、记者和前官员的说法。Dubowitz 回应称 IAEA 最新报告显示在战争开始前已无法对伊朗进行完全核查。他还重申了伊朗隐瞒 Natanz 和 Fordow 的事实。
Dubowitz 认为伊朗是一个“革命性和扩张主义政权”,通过建立恐怖代理人网络(Hezbollah, Hamas, Houthi 等)扩张势力,认为这在去年10月7日达到高潮(他认为这是哈梅内伊的重大误判)。他同意哈梅内伊可能不会首先使用核武器攻击以色列或美国,因为他并非自杀式,但他希望拥有核武器作为其常规力量的“后盾”(类似于朝鲜的金正恩模式),以此阻止美国军事干预,使其可以自由使用导弹等常规力量打击敌人(例如他认为伊朗已拥有大量可达以色列的导弹)。
本节深入探讨了铀浓缩的技术细节和核武器的构成要素。
Mark Dubowitz 详细解释了不同浓缩度(3.67%、20%、60%、90%)的含义及其在武器开发中的阶段。他指出,达到3.67%丰度已完成了到武器级所需步骤的70%;20%完成了90%;而达到60%则完成了99%。他强调,伊朗目前积累的15-17枚炸弹所需的60%丰度铀,距离武器级(90%)“非常接近”,只需1%的额外浓缩步骤。他补充说,虽然90%是通常定义的武器级,但60%也可用于制造粗糙的核装置。
Dubowitz 阐述了可交付核武器的三个关键组成部分:武器级铀;运载工具(导弹),提到伊朗拥有中东最大的导弹库存(战争前约3000枚,其中约2000枚可达以色列,还有洲际弹道导弹计划针对欧洲和美国);以及弹头或粗糙核装置。他引用美国政府和核专家的估计,认为伊朗制造粗糙核装置需要约4-6个月,制造弹头(可安装在导弹上)约需一年半。
Scott Horton 在此补充了一些技术细节。他纠正了自己之前在其他场合的说法,指出从铀制造核武器最简单的是“枪式核弹”(如广岛原子弹),它只需要武器级铀,技术要求低,甚至无需测试,但不能小型化用于导弹,只能空投(他认为伊朗重型轰炸机很难突破以色列空域)或陆路运送(“基本上对他们没用”)。而用于导弹的核弹通常是钚内爆式,或更难的铀内爆式,这需要多年的实验和测试,除非中俄提供技术/蓝图(他认为没有迹象表明这一点)。他提到 CIA 曾通过“梅林行动”向伊朗提供有缺陷的蓝图,但伊朗未上钩。他再次驳斥了伊朗在帕尔钦(Parchin)设施测试内爆系统的说法,坚称那里是用于制造纳米钻石(引用科学家 Robert Kelly 的说法),而测试内爆系统需要在户外进行大量复杂实验。他引用了战前 CIA 的估计(一年获得裂变材料,三年拥有弹头),认为这可能是基于需要开发内爆系统的时间。他总结说,如果伊朗选择退出条约并制造核武器,他们要么快速制造“无用”的枪式核弹,要么花大量时间尝试制造内爆系统。
Dubowitz 再次对 Horton 关于帕尔钦的说法提出质疑,认为 IAEA 并不了解该设施的用途并一直在向伊朗提出疑问(Horton 反驳称伊朗曾提出允许 IAEA 检查特定数量设施,并称 IAEA 后来的说法是假的)。Dubowitz 重申了 AMAD 计划和 Albright 的书证实了伊朗曾有活跃的核武器计划来制造五枚原子弹。
本节详细讨论了2015年的 JCPOA 核协议。
Mark Dubowitz 解释了 JCPOA 的由来和内容。他指出,在美国于2013年签署的临时协议中,首次承认了伊朗进行铀浓缩的权利,这与联合国安理会此前要求伊朗停止浓缩和后处理的五项决议相悖。在2015年的 JCPOA 中,伊朗获准保留浓缩和后处理能力,但受到 временных (临时) 限制。他描述了协议中的“日落条款”(sunsets):对伊朗核计划的许多限制会随时间逐步取消,到2031年,大部分限制将失效,伊朗可以发展工业规模的浓缩能力,安装先进离心机,并浓缩至更高丰度(理论上协议没有明确禁止达到90%)。奥巴马政府的设想是在15年后政权可能改变,或者届时可以重新谈判延长限制。
Dubowitz 是 JCPOA 的批评者,他认为协议的根本缺陷在于允许伊朗保留关键能力以及日落条款,担心15年后伊朗可能拥有大规模核计划并利用制裁解除获得的数千亿美元资金。他承认自己曾主张在退出协议前,美国应与欧洲盟友(英法德)合作,共同向伊朗施压,要求延长日落条款,以和平方式解决问题(他称这是一个“细致入微”的立场,两边不讨好)。他解释说,特朗普政府曾试图与欧洲谈判延长日落条款,但欧洲盟友拒绝了重新谈判,伊朗也完全反对,特朗普因此在2018年决定退出协议。
Scott Horton 部分同意 Dubowitz 关于应与欧洲谈判的观点。他认为特朗普原本可以尝试改进协议,但他批评特朗普退出协议是“巨大错误”,认为 JCPOA 下伊朗将浓缩铀运出国外且无法用于制造核弹头的状态是有效的。他认为“通俄门”等国内政治因素限制了特朗普与俄罗斯合作对伊朗施压的可能性。Dubowitz 承认“通俄门”指控是“嘲讽”和“不成立的”,确实瘫痪了特朗普政府约两年半。
关于伊朗是否对美国构成威胁,Dubowitz 坚称伊朗及其代理人自1979年以来持续袭击美国目标(他重申 Khobar Towers 袭击涉及 Hezbollah 与 Al-Qaeda 合作,以及伊朗支持伊拉克什叶派武装杀死美国士兵),并认为伊朗通过建立“抵抗轴心”(Hezbollah, Hamas, Houthi 等)在中东扩张势力,并最终导致了去年10月7日的事件(他认为是哈梅内伊的误判)。他同意哈梅内伊可能不打算用核武器发动首次攻击,但希望将其作为常规力量的威慑后盾,以便在不受惩罚的情况下使用导弹等常规武器攻击以色列和美国盟友。
Horton 则坚持认为伊拉克 EFP 袭击是美国内部宣传运动,Khobar Towers 是 Al-Qaeda 所为(引用本拉登本人及前 CIA 官员等),其动机是美国在沙特的驻军和对以色列的支持(他认为这源于以色列推动的“双重遏制”政策)。他认为伊朗对美国没有实际威胁,其对外政策本质上是谨慎的,只是在自卫。他认为伊朗的核计划是防御性的潜在威慑,而非进攻性的武器计划,并且是应对美国/以色列敌意和制裁的结果。他认为美国政府和以色列在许多问题上向公众撒谎。
本节继续围绕“核档案”的真实性和意义展开激辩。
Mark Dubowitz 引用核不扩散专家 David Albright(他建议听众阅读 Albright 关于此主题的书)对 Mossad 获取的“核档案”的分析。他坚称,该档案是真实且详细的,包含数千页文件和蓝图,“确凿地”证明了伊朗在2003年之前曾有一个名为 AMAD 的活跃核武器计划,目标是制造五枚原子弹。他直接质问 Scott Horton 是否认为 Mossad 伪造了整个档案。
Scott Horton 坚持认为,他“不相信以色列人的任何说法”,并认为所谓的“核档案”包含了与先前被他称为“冒烟的笔记本”的以色列伪造文件相同的信息。他引用 David Albright 曾对笔记本中的弹头设计提出质疑的事实来支持他的观点。他认为,即使档案是真实的,它也只涉及一个在2003年结束的“研究项目”,当时伊朗甚至还没有可运作的浓缩设施(Natanz 直到2006年底才开始运行离心机),因此与当前伊朗是否制造核武器无关。他再次引用记者 Seymour Hersh 的报道,称伊朗在2003年结束研究是因为美国入侵伊拉克推翻了萨达姆,伊朗因此不再觉得需要核武器来对抗伊拉克。
Dubowitz 驳斥 Horton 引用 Hersh 的说法,认为 Hersh 不是核专家,并且偏离了档案真实性的核心问题。他认为伊朗结束的只是一个“活跃的、结构化的”核武器计划,但保留了关键能力(浓缩、后处理潜力)并将科学家分散安置(由 Mohsen Fakhrizadeh 领导),目的是在未来时机成熟时可以迅速恢复。他认为伊朗一直在玩“三维核棋局”,对外声称发展民用核能,同时暗中保留并发展能力。他认为哈梅内伊拒绝特朗普在阿曼的提议是一个“悲剧性错误”,因为他误判了特朗普不会采取军事行动,如果他接受了那个允许临时浓缩的提议,他本可以在特朗普离任后进一步发展。
Lex Fridman 要求两位嘉宾展望短期内(未来几年)伊朗局势的最好和最坏情况。
Mark Dubowitz 认为最好情况是,伊朗重返阿曼谈判,并同意“和平地、永久地、彻底地拆除”其核计划。这意味着伊朗关闭剩余设施,放弃可用于制造核武器的离心机和浓缩材料,允许 IAEA 监督,并承诺不再重建核计划。作为回报,美国及国际社会将帮助伊朗发展民用核能,但不包括铀浓缩或钚后处理能力(他称之为“黄金标准”)。Dubowitz 认为特朗普目前的立场就是“零浓缩,彻底拆除”。
Dubowitz 认为最坏情况是,伊朗在谈判中保持强硬,拒绝放弃浓缩能力,保留剩余能力并在未来(可能在特朗普卸任后)重建核武器计划,从而招致进一步的军事打击、战争和痛苦。他指出,比这更糟的情况是伊朗直接“突破”制造核弹,届时美国或以色列可能不得不采取军事行动。他强调,负责任的政策制定者必须考虑到伊朗制造核武器的可能性,并通过谈判或军事手段来阻止。
Dubowitz 进一步探讨了“最坏情况”中的“地面入侵”可能性(美国派遣数十万军队入侵伊朗),他认为这将是一场“灾难”,也是从伊拉克战争中吸取的教训。但他认为不能完全排除这种可能性,例如在伊朗政权崩溃后,美国可能需要进入伊朗以确保其军事和核设施不落入交战派系手中。他倾向于支持伊朗人民实现政权转型,而非通过“斩首式打击”杀死哈梅内伊,因为后者可能导致混乱。他提到以色列军队有能力(虽然 Horton 对此表示质疑)在混乱中保障松散的核材料。他总结说,最好的情况是谈判达成彻底拆除,最坏的情况是持续军事打击导致局势升级,更糟的是斩首打击导致政权崩溃和混乱。
Scott Horton 将 Dubowitz 提出的最坏情况(地面入侵)解读为“以色列游说团”想要的结果,认为他们不关心美国士兵的生命,引用9·11事件(他认为是因以色列在中东的行为和美国对以色列的支持而起)和伊拉克战争(他声称以色列帮助误导美国参战)为例。他指责 Dubowitz 在为“外国势力”服务,引发了与 Dubowitz 关于“双重忠诚”和“不爱国”的激烈个人指责(Lex Fridman 多次介入平息)。Horton 坚称美国公民首先关心美国,指责某些支持以色列的人无视美国利益。
Horton 回到他对最好和最坏情况的看法。他认为最好的情况是“我们现在就停止”,特朗普找到方法回到类似于 JCPOA 的协议中。他认为 JCPOA 是一种不错的协议,尽管可以改进,但美国应该尊重伊朗作为 NPT 成员国拥有民用核计划和浓缩的权利(尽管他承认这在 NPT 中存在争议)。他认为美国坚持“零浓缩”是一种“毒丸”,因为哈梅内内伊永远不会放弃作为潜在威慑的浓缩能力。
Horton 认为最坏情况就是像 Dubowitz 提到的那样,战争不断升级,美国可能需要进行全面的政权更迭。他指出,尽管 Dubowitz 称不应杀死哈梅内伊,但以色列总理内塔尼亚胡却公开表示这样做可以解决问题。他认为,美国目前的行动正在将伊朗“推向”核武器,而不是阻止它。
双方再次就伊朗是否拥有核武器计划、60%丰度铀的意义、以及谁应该为当前局势负责进行短暂争论。Dubowitz 重申根据 JCPOA,伊朗被允许保留浓缩能力和少量低丰度铀库存,并可随着时间推移增加浓缩丰度。
本节重点讨论了最近的美国对伊朗设施的军事打击(Operation Midnight Hammer)。
Scott Horton 认为现在判断这次行动是成功还是失败、是加速还是阻止了伊朗核计划还为时尚早。他承认美国摧毁了一些设施,但这让伊朗非常愤怒,不确定他们是会屈服、加倍努力还是维持现状。他再次解释说,伊朗最高领袖哈梅内伊了解美国的强大实力,知道无法对美国本土构成威胁,并且对外政策谨慎(引用伊朗在苏莱曼尼遇刺、无人机被击落以及最近导弹袭击美国基地时的有限和象征性反应,且未造成美方人员伤亡),这表明他并不希望爆发全面战争。Horton 认为,鹰派人士将伊朗描述为“非理性”和“宗教狂热”的政权是错误的,他们的行为显示出的是“保守主义”,试图维持现状,建立潜在威慑以避免被攻击。他认为,这些袭击反而验证了伊朗需要潜在核威慑的逻辑,因为他们看到尽管没有制造核武器,美国和以色列还是袭击了他们。他再次强调,60%浓缩度不是“奔向核弹”,只是威慑和谈判筹码。他认为这次行动可能会促使伊朗真正考虑突破。
Mark Dubowitz 认为特朗普在谈判中表现出“善意”。他重申他相信伊朗及其支持的恐怖组织自1979年以来一直杀死和伤害美国人。他同意哈梅内伊在对外政策上表现出谨慎(引用1988年伊朗被迫接受停火结束两伊战争,因为无法与美国对抗)。他认为哈梅内伊现在必须决定是否“饮下毒药圣杯”(与特朗普达成协议)或选择其他选项。他担心恐怖袭击是伊朗可能采取的报复手段之一(提到伊朗针对美国目标和境内外伊朗异议人士的暗杀企图)。他认为哈梅内伊可能会想,如果在拥有核弹头之前,美国和以色列就不会军事打击,那他后悔没有更快地发展核武器。他引用了利比亚(放弃核计划,卡扎菲被推翻)和乌克兰(放弃核武器,两次被俄罗斯入侵)的例子,认为哈梅内伊会将其视为证明拥有核武器才能保障政权生存的教训。
Dubowitz 称这次美国对 Fordow、Natanz 和 Isfahan(他补充说特别是 Isfahan 的铀转化设施,可以将90%丰度铀转化为金属,这对制造核弹头至关重要,他注意到伊朗目前没有90%丰度铀,但可能有60%)的打击显示了美国“认真的军事力量”。他认为这次行动在摧毁设施和杀死了15名顶级核科学家(比作二战前曼哈顿计划关键团队被清除)方面取得了“重大进展”,将伊朗的核武器计划“推迟了数年”。他认为关键问题在于伊朗是否还有足够的能力在秘密地点重建,或者这次袭击是否足以威慑哈梅内伊,让他意识到进一步发展核武器会危及政权。
Dubowitz 总结说,这次行动向哈梅内伊和世界各地的反美政权发出了明确信号,即特朗普不会任由伊朗发展核武器并威胁美国。他认为这次行动是一次“地缘政治上的成功”,传递了“力量的信息”,即如果试图发展核能力将受到惩罚。然而,他同时也强调“克制你的热情”,认为哈梅内伊和政权依然危险,受伤的动物最危险,伊朗仍然保留着关键能力,未来仍然充满变数。他重申自己主张“无条件投降”,意即“零浓缩,彻底拆除”(与特朗普的公开立场一致,尽管特朗普有时在 Truth Social 上发表过更激进的言论)。
本节讨论了这次行动对未来10-30年核扩散趋势的影响。
Mark Dubowitz 认为这次美国对伊朗的军事打击,如果最终成功阻止伊朗发展核武器,将 减少 全球核扩散的风险。他解释说,如果伊朗获得核武器,中东地区将出现“核扩散链”,沙特、土耳其、阿尔及利亚等国将寻求核能力。同时,日韩台等国可能因不信任美国的核保护伞而寻求发展核武器以应对中国的威胁。Dubowitz 认为,成功阻止伊朗将向这些国家传递信息:(1)他们不需要核武器,因为伊朗的威胁已经被遏制;(2)如果他们试图获得核能力,美国将利用包括制裁和出口管制在内的反扩散工具阻止他们。他还强调,在中东地区,阿拉伯领导人最担心的是伊朗的威胁,而非以色列(体现在“亚伯拉罕协议”中),阻止伊朗核扩散将增强地区稳定性。成功阻止伊朗也将恢复美国的信誉,让盟友相信美国会履行承诺,从而减少其自行发展核武器的动力。
Scott Horton 则认为,这次袭击很可能 加剧 核扩散。他认为,这只会进一步印证朝鲜、伊拉克和利比亚的教训——“你最好获得核武器来阻止美国的攻击,而且要快”。虽然他认为沙特等与美国关系密切的国家可能不会这样做,但对于其他担心国家主权受到威胁的国家,拥有核弹的激励大大增强。他也对《不扩散核武器条约》(NPT)的未来表示担忧,指出以色列(非 NPT 缔约国)在美国(NPT 缔约国)协助下攻击了伊朗(NPT 缔约国且他认为当时并未制造核武器),这损害了 NPT 的信誉和基于规则的国际秩序。他提到了俄罗斯前总统梅德韦杰夫暗示可能向伊朗或巴基斯坦提供核武器的可能性,认为这可能导致 NPT 分崩离析。他认为,美国对 NPT 的“冷漠”态度(引用克林顿政府对协议的态度)削弱了其约束力。关于东亚,他认为中国对台湾的威胁(他认为台湾在历史上是中国一部分)是一个不同情境,不应通过武力或威胁解决,而应与中台谈判和平统一方案。他质疑美国是否有能力防御台湾,认为应通过谈判避免战争。他重申,美以攻击一个未制造核武器的 NPT 成员国是对条约的极大损害。
Lex Fridman 询问 Scott Horton 的自由意志主义(Libertarianism)核心理念及其如何影响他对世界的看法。
Scott Horton 解释说,自由意志主义的核心是“不侵犯原则”(non-aggression principle),即个人之间不使用武力、盗窃、欺诈,保持克制。他认为这一原则也应适用于政府。自由意志主义者分为无政府资本主义者(anarcho-capitalists)和极简主义者(minarchists),后者主张政府应仅限于执行合同、保护财产权等最基本功能(“守夜人”式国家)。他引用自由意志主义理论家 Murray Rothbard 的观点,认为战争是理解整个自由意志主义的关键,特别在美国,维持世界帝国使得在国内建立有限和去中心化的政府变得不可能。他认为“孤立主义”(isolationism)是干预主义者和国际主义者用来攻击反对他们议程者的“污蔑性术语”,他更倾向于使用“不干预主义”(non-interventionism)、“独立”和“和平”。
Horton 认为,美国只需要拥有极少的核威慑力量(例如 Ron Paul 所说的“几艘好的潜艇”),足以防御海岸和威慑任何攻击美国本土的敌人。他怀有理想主义愿景,认为美国可以成为全球和平会议的主办国,帮助解决各种悬而未决的冲突(例如 Donbass、Transnistria、台湾、朝鲜、克什米尔等由欧洲列强划定的人为边界导致的冲突),而不是诉诸武力或结盟。他相信特朗普总统具备成为“伟大的和平缔造者”的潜力,可以通过与伊朗、俄罗斯、中国、朝鲜等国谈判实现和平。他认为自冷战结束以来,美国一直被新保守主义的“美国统治”政策主导,导致了在中东的战争(攻击了七个国家)、东欧的灾难以及在东亚的潜在冲突,而这些本来是不必要的。他提到中国已经基本放弃了马克思主义,经济改革极大改善了人民生活。
关于核武器,Horton 希望美国拥有“极少的核威慑”,并致力于实现“无核武器世界”,他承认这听起来乌托邦,但引用了里根总统和戈尔巴乔夫在1986年雷克雅未克会谈中曾“非常接近”达成彻底核裁军协议的例子,认为这并非不可能,虽然那次努力最终失败(他归咎于里根团队中鹰派的阻挠)。他认为“信任但要核实”原则意味着严格核查而非盲目信任。
Lex Fridman 询问 Mark Dubowitz 所领导的美国民主防御基金会(FDD)如何看待和应对世界问题。
Mark Dubowitz 表示他欣赏 Scott Horton 描绘的愿景和部分自由意志主义理念,但他认为美国是“不可或缺的力量”。他认为,自二战以来,基于规则的国际秩序正是依靠美国的实力和威慑得以维持。他相信“通过力量实现和平”(peace through strength),认为如果敌人相信美国会果断使用军事力量,他们就不太可能挑战美国及其盟友,从而减少战争的可能性。他认为不能指望侵略者遵守“不侵犯原则”。
Dubowitz 反驳了 Scott Horton “美国是全球冲突的挑衅根源”的说法(他认为这部分源于 Horton 指责美国被以色列或美国犹太人“诱惑或收买”)。他承认美国是一个不完美的国家,犯过“严重的、有时是灾难性的错误”,但他认为世界上存在“邪恶之人”希望伤害美国,必须阻止他们。为此,美国需要一支强大且得到良好支持的军队(他强调这不是为了服务“军工复合体”,而是有选择性、有重点、压倒性且致命地使用力量)。他称赞特朗普总统在这方面做得很好(例如击毙苏莱曼尼和巴格达迪,同时在伊朗击落无人机和袭击沙特石油设施事件中保持克制)。
Dubowitz 阐明 FDD 的目标是“捍卫民主”,而非“推广民主”。他个人认为美国不应将民主强加给中东或其他地区,因为这方面的尝试往往失败。但他认为伊朗是一个例外,作为一个非阿拉伯的、具有悠久历史和文明的国家,在正确的领导下有巨大潜力(至于采取何种政体应由伊朗人民决定)。他承认像 Scott Horton 所言,军事化可能导致永久战争(引用了伊拉克、阿富汗、利比亚、叙利亚、也门等例子)。但他认为特朗普的做法是“打得狠,但保持短暂”(指最近对伊朗的袭击),这是一种学习了教训但不“过度学习”而导致瘫痪的策略。
Dubowitz 再次否认自己或 FDD 受外国势力影响,并再次为美国与以色列的关系辩护,认为这种关系强大是因为双方利益一致(反恐、反扩散)。他认为以色列是美国理想的盟友模式:一个愿意并有能力为自身防御而战、不要求美国派遣地面部队的国家。他认为世界上需要更多这样的盟友来应对共同威胁,从而减少美国军队的风险(例如在台湾问题上)。
Lex Fridman 询问,既然特朗普总统经常谈论和平,为什么他未能促成乌克兰与俄罗斯停火?并希望从中学到适用于伊朗的经验。
Mark Dubowitz 承认自己不是俄乌问题专家(并提到自己被俄罗斯制裁),但他认为关键在于让普京像哈梅内伊一样明白他有两个选择:坐下来谈判停火(这是特朗普反复发出的信号)或者面对美国增强的施压杠杆(如参议院两党支持的制裁方案、军事援助)。他批评拜登政府早期限制了乌克兰的军事能力,未能让普京尽早认识到无法通过消耗战取胜。他认为,美国需要通过行动展示其影响力,才能促使普京认真考虑谈判。
Dubowitz 将这一逻辑应用于伊朗问题。他认为特朗普在伊朗问题上表现出了这种领导力:先是提供谈判机会(阿曼的提议),在被拒绝后施加经济压力,然后采取军事行动(对关键核设施的打击),这是一种构建谈判筹码的方式。他认为特朗普的这次行动是经过计算的,意在向哈梅内伊发出明确信号。他认为哈梅内伊可能后悔拒绝了阿曼的提议,因为这次袭击对伊朗的核计划造成了重大损害(例如 Fordow 和 Isfahan 的设施以及杀死关键科学家),从而削弱了伊朗的核能力。他认为特朗普是在主导局势,而非受任何人摆布。他认为特朗普给了和平机会、停火机会和谈判机会,但同时也向伊朗传达了明确信息:如果不接受提议,美国将以审慎和有选择性的方式使用其军事力量,就像过去所做的那样。
Lex Fridman 提出二战作为一个极端的案例来哲学地探讨军事干预的边界,强调这与当前的伊朗问题无关。
Scott Horton 认为,从不干预主义的角度看,美国应该尽可能避免卷入二战,直到受到攻击(日本袭击珍珠港,德国对美国宣战)。他认为希特勒对美国宣战是“愚蠢的”,可能是想促使日本从东方进攻苏联,但最终失败,且对德国而言是一个巨大失误。他认为让德国的破坏力集中在苏联是更好的结果。
Mark Dubowitz 认为二战前的1930年代美国国内关于是否介入欧洲冲突的辩论更为有趣。他提到当时强大的孤立主义运动(以 Charles Lindbergh 等为代表,主张“美国优先”,不卷入“纠缠联盟”)。他认为当时这些孤立主义声音让希特勒误判了美国不会参战,从而使其敢于将主要力量用于欧洲战事。他认为,这与当前的情况有一定相似之处,即哈梅内伊可能也误判了美国在特朗普政府下不会对其采取军事行动(可能受美国国内某些“孤立主义”声音的影响,例如 Tucker Carlson 的观点),结果导致了最近的袭击。Dubowitz 认为,这是一种“误判”的平行性,但他也明确表示将现代对手比作希特勒是过度简化和不恰当的,因为希特勒的邪恶是“独特的”。
Lex Fridman 提出更宏观的问题:如何避免在未来75年内爆发可能导致人类文明毁灭的第三次世界大战或核战争,考虑到伊朗、乌克兰、中国、朝鲜等多个冲突热点。
Scott Horton 认为,避免战争是目标。他重提朝鲜问题,认为克林顿政府曾与朝鲜达成协议,后被约翰·博尔顿破坏(他称博尔顿是“战争贩子”),特朗普政府时期也曾有机会(他认为博尔顿再次阻挠了协议)。Dubowitz 认为这是推卸责任,是朝鲜独裁者破坏了协议,并质问 Horton 是否会责怪美国的对手或认为美国没有对手。Horton 否认没有对手,但他认为许多问题是美国和以色列的行为导致情况恶化,并引用了伊朗在波斯尼亚问题上曾配合美国等例证。Dubowitz 再次将 Horton 的立场概括为“总是我们的错”。
Dubowitz 总结说,从历史中(包括伊拉克、阿富汗、越南等)学习是必要的,但不能“过度学习”导致行动瘫痪。他认为美国的力量是世界上的积极力量,尽管会犯错,但必须面对现实中的敌人。他强调需要在过度使用和不足使用军事力量之间找到平衡。他认为,为了避免战争,必须有“认真的威慑”,敌人需要明白美国在面临伊朗核武器等威胁时会使用“选择性的、窄范围的、压倒性的军事力量”。他认为延迟行动只会让威胁壮大(“忽视正在聚集的风暴”),因此有时需要早期行动来阻止更大的冲突。
Lex Fridman 最后询问两位嘉宾对美国和人类未来的希望来源。
Scott Horton 表示他对美国充满希望,热爱其土地、人民、文化和资源。他相信如果美国能建立一个纯粹的自由市场资本主义体系,人民能拥有和改善财产,自由交易,将是比现在更好的社会。他认为美国将大量财富浪费在中东等地的军事行动上,错失了完善自身社会的机会。他认为,伊拉克、阿富汗、利比亚、叙利亚、索马里等国家的悲惨状况,最主要的原因是美国的战争干预,因此美国没有资格批评这些国家的内部问题。他认为,停止对外干预是改善美国的关键。
Mark Dubowitz 表示他对美国人民的智慧充满信心,相信大多数美国人明白美国有对手,并能识别出真正的威胁(他认为不是伊朗人民,因为80%的伊朗人憎恨现政权,希望自由繁荣;真正的威胁是试图制造核武器和从事恐怖主义的伊朗政权)。他认为美国人民高度尊重军人,需要审慎使用这支强大军队。他强调理解威慑的重要性,以便在威胁变得严重之前加以阻止。他承认美国面临巨大的经济挑战(包括巨额赤字)。Dubowitz 坚信美国是世界上最强大的积极力量,尽管会犯错。他认为,只要美国能够识别真正的对手,审慎使用军事力量,并理解威慑的重要性,就能避免大规模战争。他再次强调,特朗普政府最近对伊朗核设施的行动,是通过有针对性的军事手段向伊朗政权发出信号,阻止其发展核武器。他表达了希望未来局势能朝着好的方向发展,但承认前路曲折。
播客最后,Lex Fridman 对两位嘉宾表示感谢,并引述了美国前总统德怀特·D·艾森豪威尔关于战争代价和军工复合体的著名讲话,强调战争的经济和人力成本,以及警惕军工复合体不当影响的必要性。
2025-06-15 08:52:55
以下是对Lex Fridman播客#472中Terence Tao逐字稿的专业综述:
本期播客的主题是与被广泛认为是史上最伟大数学家之一、常被称为“数学界的莫扎特”的Terence Tao的对话。Tao曾获得菲尔兹奖和数学突破奖,并在数学和物理学的广泛领域做出了开创性的贡献。Lex Fridman表达了此次对话的荣幸。
Terence Tao回顾了他职业生涯中遇到的第一个真正困难的研究级数学问题——Kakeya问题(Kakeya Needle Problem)。该问题起源于数学家Soichi Kakeya在1918年提出的一个谜题:如何在二维平面上用尽可能小的面积将一条长度固定的“针”(线段)旋转180度(掉头)。他解释说,虽然简单的中心旋转或三点掉头会占用一定的面积(分别为π/4和π/8),但数学家Besicovitch证明了实际上可以用无限小的面积来完成旋转。Tao表示二维情况已完全理解。接着他提出了更高维度的Kakeya问题:在一个三维空间中,如何用最小的体积旋转一个具有微小厚度(delta)的“针”(例如哈勃望远镜),使其能够指向所有方向。猜测是所需的最小体积随厚度delta下降得非常缓慢,大约是对数关系,这一点经过大量工作已被证明。Tao指出,这个看似简单的谜题与偏微分方程、数论、几何学和组合学中的许多问题有着令人惊讶的联系。例如,在波传播中,能量的集中(聚焦)现象与Kakeya问题几何地相关,潜在的“吹爆”(blowup)可能导致物理定律失效。
讨论进一步聚焦于数学物理中的一个著名未解难题——Navier–Stokes正则性问题。该方程描述了不可压缩流体(如水)的运动。问题的核心是:如果流体的初始速度场是光滑的,速度是否可能在有限时间内在某个点变得无限大(形成奇点),而这在现实中似乎并未观察到。这是克莱数学研究所悬赏一百万美元的七个千禧年大奖问题之一,目前只有庞加莱猜想被解决。Tao提到他2016年发表的一篇论文,研究了一个“平均化”的三维Navier–Stokes方程的有限时间吹爆。他解释了数学家与常人的区别:关心是否在所有100%的情况下都成立,而不仅仅是99.99%。流体动力学模型的复杂性使得证明其普遍规律变得困难,他借用“麦克斯韦妖”的概念来比喻数学中难以排除的“异常”或“阴谋”配置(如圆周率数字的无模式性)。在Navier–Stokes方程中,存在两种竞争的力量:粘性(耗散)趋于平息运动,而非线性输运项趋于集中能量。如果能量以某种方式持续集中到越来越小的尺度,且速度足够快以抵抗粘性效应,就可能发生有限时间吹爆。他指出,过去试图通过能量守恒等技术证明Navier–Stokes的整体正则性(即速度始终保持光滑)都失败了。他的“平均化”方程工作旨在解释为何难以反驳有限时间吹爆——通过精心设计关闭某些相互作用,他成功地构造了一个吹爆的例子。这提供了一个“障碍”,表明任何试图证明实际Navier-Stokes方程正则性的方法必须利用他的模型中被关闭的某些特征。他将此与物理学中的“超临界性”概念联系起来:在三维Navier-Stokes方程中,非线性输运项在小尺度上比粘性项强得多,这是其困难之处;而在二维中是“临界”的,已证明没有吹爆。超临界性是区分方程是否“可预测”的关键特征。
Terence Tao将流体动力学的复杂性与元胞自动机(cellular automata)联系起来,尤其是康威的生命游戏(Conway's Game of Life)。生命游戏在一个离散网格上通过简单的局部规则演化,可以产生令人惊叹的复杂涌现结构,如“滑翔机”(glider)和“滑翔机枪”(glider gun),甚至自我复制机器。他认为,生命游戏的这些发现为Navier-Stokes方程中可能通过精心设计的初始条件构造奇点(类似流体图灵机)提供了先例,尽管一个离散系统与连续系统的数学形式不同,但在涌现复杂行为方面有相似之处。他也强调,生命游戏中复杂结构通常需要精心准备的初始条件,随机初始条件通常只会导致混乱或死亡。这引出了数学中的一个反复出现的挑战:结构与随机性之间的二分法。大多数数学对象看起来是随机的,但一小部分具有模式。证明一个特定对象(如圆周率的数字)没有某种奇怪的模式是很困难的。他提到自己在此领域的工作,即“结构定理”或“逆定理”,这些定理提供了判断何时一个对象具有结构性的检验,并表明如果一个函数表现出某种近似结构(如几乎可加),那是因为它与某个完全结构化的对象相关。
作为结构与随机性讨论的例子,Tao提到了Szemerédi’s定理,该定理证明了任何具有正密度的整数集合都包含任意长度的算术级数(等差数列)。这个定理适用于高度结构化的集合(如奇数)以及看似随机的集合(如通过抛硬币从奇数中随机挑选的子集)。这再次体现了结构与随机性的二分法。他引用了“无限猴子定理”(Infinite Monkey Theorem)来进一步说明,在一个足够长的随机序列中,任意有限模式最终都会出现(例如莎士比亚的《哈姆雷特》剧本,或任意长度的算术级数),并指出“无限”可以吸收很多复杂性。对于人类如何理解无限,他认为可以将其视为对一个“无上界”的有限数的抽象和理想化。尽管现实世界中没有真正的无限,但在数学模型中,将事物理想化为无限或零常常能使数学变得更简洁。他也提到在处理无限时需要注意陷阱(如无穷级数的重新排列),并指出近年来人们开始将无穷极限下的结果进行“有限化”,即给出“何时”发生的具体速率,这使得问题更具体、更直观,尽管有限化后的证明常常更复杂。
Tao阐述了数学与物理学作为学科、理解世界方式的区别。他认为科学总体上是现实、观察和心智模型之间的相互作用。数学专注于模型本身,从公理出发探索其推论和预测。物理学则收集观察数据,并提出模型来解释数据并进行预测。数学的独特之处在于它可以从假设(公理)出发进行推测,而其他学科通常是结论驱动的。他讨论了物理学中理论与实验的张力,认为两者相互促进:模型预测异常指导实验寻找新数据,实验结果反过来指导模型修正。数学内部也存在理论与实验成分,但直到最近,理论一直占据主导。他提到计算机兴起后才有了更多实验数学(如研究素数分布)。但他指出,某些数学问题因“组合爆炸”难以通过直接计算研究(如1000个数的子集数量)。他认为AI可能在未来助推数学实验,例如使用AI分析国际象棋引擎数据来改进棋类理论。
Lex Fridman提到柏拉图的洞穴寓言,问数学家和人类是否都在观察现实的影子。Tao回应说,现实、观察和模型是不同的本体论概念,但它们可以随着时间推移互相靠近,这常常需要抛弃最初的直觉(如从平地球到圆地球的模型转变)。他指出,当今我们有符合大量观测数据的模型,如解释宇宙膨胀和加速的暗物质/暗能量模型。他认为一个好的物理/数学理论是对宇宙的一种“数据压缩”,用少量参数解释大量观测数据。这引出了“数学的不合理有效性”(unreasonable effectiveness of mathematics)——宇宙竟然是可压缩的。Tao提出“普适性”(universality)作为部分解释:宏观复杂系统往往从微观简单相互作用中涌现,宏观规律常常仅依赖于少量参数(如气体的宏观属性)。中心极限定理(高斯分布的普适性)是基本例子。但他警告普适性可能失效(如系统性风险),强调数学有助于理解模型局限性,而科学则验证模型是否符合现实。他进一步讨论了自己的广博研究风格(狐狸型),喜欢在不同领域之间寻找联系,将一个领域的技巧移植到另一个领域。
Terence Tao表示他相信存在一个“万物理论”,能够统一广义相对论和量子力学。他引用了物理学历史上统一的趋势(如麦克斯韦统一电磁学,牛顿统一天体和地面运动)。他认为,当前的挑战在于广义相对论和量子力学各自非常成功,覆盖了绝大多数可观测现象(99.9%),仅在极端条件下(如超高能粒子、早期宇宙)才会出现偏差,而这些条件下的实验非常困难。他指出,数学家常会先于物理学家发展出所需的数学工具(如黎曼几何之于爱因斯坦的广义相对论),他相信解释宇宙的理论往往涉及那些在解决数学问题时也有效的数学对象,因为它们都是组织数据的有效方式。统一理论可能需要找到新的“语言”或基本概念来取代空间和时间等传统观念,类似能量(哈密顿量)在经典力学和量子力学中的核心地位。他认为找到能组织一切的“哈密顿量类比物”是关键。简要提及弦理论是过去的主要候选理论,但因与实验不符而渐失宠。
Tao谈到了他在广义相对论相关领域的贡献,特别是对“波映射方程”(wave maps equation)的研究。这个方程描述了时空上的某些场,而非时空本身,是爱因斯坦场方程层级中相对较低但仍具挑战性的非线性方程。他研究了其全局正则性问题,证明了在特定情况下能量不会集中导致奇点。他解释了方程的非线性(源于流形曲率)以及他如何使用“规范变换”(gauge transformation)来降低非线性效应,使方程更易于处理。他形象地描述了这一过程,就像通过附加摄像机来稳定麦田波动,以及他在头脑中想象向量场运动来寻找变换的灵感。
Terence Tao分享了他解决难题的方法,他称之为“战略性作弊”(cheating strategically)。这意味着不是以最大难度去硬解,而是通过简化问题来逐个攻克难点。例如,如果有10个因素导致问题困难,先构造一个只保留其中一个因素的版本来解决,从中学习处理该特定困难的方法,然后依次处理其他困难。他将这比作香港武打片中英雄总是逐个击败敌人,而不是同时被围攻。他主要使用纸笔(特别是黑板)进行思考和演算,辅以绘图和只有自己能懂的涂鸦。他开始越来越多地使用计算机,特别是AI工具(如GitHub Copilot),来辅助简单的编码和探索性计算,这大大降低了技术门槛。
讨论转向AI辅助定理证明,首先介绍了形式化证明语言Lean。Lean不仅执行代码,还能生成证明的“证书”,保证推理的100%正确性(如果信任编译器)。他解释了用Lean写证明与手写证明的区别:Lean非常严格和冗长,需要明确每个数学对象的“类型”,但数学家们已努力使其语法接近数学论证。Lean拥有庞大的形式化数学库Mathlib。AI(特别是大型语言模型LLMs)正被用于Lean的辅助工具,例如帮助搜索Mathlib中的引理,作为一种“花哨的自动补全”,尽管目前仍有幻觉问题。他估计将一个证明形式化比手写耗时10倍,但巨大的优势在于修改证明时能迅速定位错误,尤其是在参数变化时,这大大提高了效率和可靠性。Lean也使得原子尺度的证明协作和“无需信任的数学”(trustless mathematics)成为可能。
Tao进一步阐述了Lean如何促进数学协作。它允许将大型证明分解为更小的、可独立解决的子问题,形成一个“蓝图”。这种模块化使得分布式协作成为可能,理论上可以有成千上万的贡献者。他认为Lean和其他软件工具(如GitHub)将极大地推动“实验数学”的发展,不仅是数据实验,更是证明的实验。他介绍了他的“等式理论项目”(Equational Theories Project),旨在系统研究抽象代数中2200万对代数定律之间的蕴含关系。这个项目需要大规模众包(涉及50位作者)和计算机验证,在Lean出现之前是不可行的。项目已接近完成,仅剩少数问题。他探讨了基于协作数据的指标化和游戏化潜力(如ELO评级),但对学术界可能的使用方式表示谨慎,更倾向于非正式的贡献分类。他提到了先前的Polymath项目(无Lean的众包),受限于人工验证的瓶颈,以及署名问题的经验教训。
Terence Tao评论了DeepMind的AlphaProof项目,该项目使用强化学习在形式化的IMO(国际数学奥林匹克)问题上训练证明系统。他指出,证明难度随步骤呈指数增长,AI在长证明中容易走错。他也提到将自然语言数学描述映射到形式语言的困难。他认可AlphaProof在解决高中奥数级别问题上取得了令人印象深刻的成就(相当于银牌水平,但需要协助和额外时间),但指出目前其扩展性受限(单个问题需要大量计算资源),且AI生成的证明看似流畅但常含“愚蠢”的错误,缺乏“数学嗅觉”。他希望未来能有AI数学奥赛,让AI在规定时间内用自然语言解决问题。
Tao探讨了人类数学家相对于AI的独特之处。他认为,例行计算和标准方法的应用将越来越被自动化取代。目前AI的关键弱点在于缺乏“数学嗅觉”,即判断某个证明策略是否可行或何时走错了方向的能力。他提到AI生成的错误通常很隐秘,但一旦发现又显得很愚蠢,不像人类的低质量证明那样有“代码异味”。他设想未来的AI是像神谕或协作伙伴,能评估想法、进行计算、生成证明草稿或新的问题表示。这种与“胜任但不完全可靠”的系统协作是一种新模式。他认为数学工作流程将发生阶段性转变,就像当年LaTeX的普及一样,当形式化证明的门槛显著降低时,数学家可能会优先使用AI/Lean进行工作,甚至期刊也会鼓励。
对于AI多久能成为菲尔兹奖级别证明的合作者(或独立贡献者),Tao认为目前AI已能在某些方面(如自动补全、文献搜索)辅助数学家写作,但贡献度不足以获奖。他预测在本十年内,AI可能提出一个有意义且有很高概率正确的数学猜想。他也提到AI在文献回顾方面有潜力(尽管目前有幻觉问题),能够帮助数学家发现未知关联。总的来说,AI目前缺乏人类数学发现过程中的“负空间”数据(失败尝试、被放弃的猜想),这限制了其自主发现能力。
Tao谈论了解决庞加莱猜想的Grigori Perelman。他解释了庞加莱猜想的内容(简单连接的闭三维空间是否一定拓扑等价于三维球面)及其在高维度相对容易但在三维困难的原因。他详细描述了Hamilton提出的Ricci流方法(通过流动使空间变“圆”),以及该方法在三维面临的奇点问题。他强调Perelman的关键突破是引入“Perelman缩减体积”和“Perelman熵”等新量,将超临界问题转化为临界问题,并对可能的奇点进行了完整分类和处理(“手术”)。这展示了Perelman非凡的远见和毅力。对于Perelman拒绝菲尔兹奖和百万美元奖金,Tao认为他是一个特例,具有强烈的个人原则,可能对数学界感到失望。他也提到菲尔兹奖给自己带来的影响——成为“建制派”的一部分,需要花费更多时间在非纯数学事务上,尽管他仍努力保持探索的自由。
Tao将素数比作数学的原子,通过加法(简单)或乘法(简单)生成,但两者结合(如素数的分布)非常复杂。他解释了孪生素数猜想(存在无限多相差为2的素数对)。他将孪生素数猜想的困难与他证明的Green-Tao定理(素数包含任意长度的算术级数)进行对比。他认为孪生素数对在素数集合中相对“脆弱”,可以通过对素数进行微小修改就消除所有孪生素数对,而这种修改不会破坏其他统计性质,从而绕过许多标准分析工具。相比之下,算术级数更“顽强”,在许多类型的集合中都存在。他提到了自己关于有界差素数对(如相差小于246的素数对有无限多)的工作,这依赖于对“几乎素数”(因子很少的数)的研究和鸽巢原理。他指出了阻止证明孪生素数猜想的主要障碍——“奇偶性障碍”(parity barrier),这限制了当前方法能证明的素数密度阈值,并表示希望能找到突破这个障碍的方法,这将对许多其他数论问题(如哥德巴赫猜想)有影响。尽管统计模型强烈支持孪生素数猜想为真,但证明100%确定性则异常困难。
Tao解释了Collatz猜想(对任何自然数应用“偶数除以2,奇数乘以3加1”的迭代过程最终都会回到1)。他形象地描述了迭代序列的“冰雹序列”性质和其类似布朗运动的随机行走特征,统计上倾向于下降。他提到自己的进展是证明了统计意义上(99%的输入)数字会显著变小。但他指出,概率论的结论无法排除极少数异常值,就像Navier-Stokes方程的吹爆一样,可能存在一个数字的序列永远不会回到1。他提到了Collatz猜想与元胞自动机及Conway推广研究(证明了更复杂版本的不可判定性)的联系,暗示存在编码复杂机器的数字,这些数字可能会永远“飞升”。
Tao将P=NP问题列为当今数学中最难(也最具元性质)的问题之一,认为它一旦被正面解决将产生巨大的连锁效应。他简要说明了P=NP问题与黎曼猜想对密码学的影响之间的类比。他认为现有证据略微倾向于P不等于NP,并且存在大量“障碍”或“否定定理”,排除了许多可能的证明方法。他甚至提到了P=NP问题可能是不可判定的可能性。
Tao分享了获得菲尔兹奖后有人询问他“现在要做什么”的趣闻,他谦逊地回答“一枚闪亮的奖章并不能解决我正在攻克的问题”。他再次提到了Perelman拒绝奖项的行为,认为他是一个坚持原则的特例。他指出菲尔兹奖使他成为“建制派”一员,需要承担更多非学术责任,但这也是积极的,让他能够指导领域方向。他认为奖项有其必要性,能够激励年轻人,但也需警惕过度追求奖项而忽视其他重要工作。
Tao谈到自己的高产来自适应性和能够快速转换研究主题,这对他而言是一种有效的工作方式。他批评了数学教育中“一刀切”的方法,并提出人类使用大脑不同区域(视觉、语言、游戏等)进行数学思维,导致学习风格各异,而教育系统难以满足多样化需求。数学提供了一种共同语言,允许不同思维方式的人合作。
Tao给年轻人的建议是保持适应性和灵活性,培养可迁移的技能(如抽象推理、问题解决)。他鼓励他们在课堂之外寻找数学的乐趣和资源(如在线平台、与兴趣相关的数学应用)。他认为Lean等工具可能促进公民科学,让更多公众参与数学研究。他对比了编程和数学的入门难度,认为编程的即时反馈和可执行性使其感觉更易近人。
他以自己学习Lean的经历为例,说明了即使是资深数学家也需要不断学习新工具,愿意在某些方面成为“初学者”。他认为这是因为现代数学过于庞大,无人能掌握一切,而且数学迫使人们承认错误。
对于“史上最伟大的数学家”这个“荒谬”的问题,Tao认为是时间依赖的,不同时代有不同标准。他提到了几位候选人(欧几里得、牛顿、高斯、欧拉、拉马努金、希尔伯特),并特别强调了希尔伯特的持续影响力和他提出的问题列表的重要性——它们像灯塔一样指引研究方向。他讨论了提出开放问题的重要性,它克服了研究中的“旁观者效应”和“瘫痪”状态,鼓励人们去尝试。他提到了“结构化拖延法”作为一种心理技巧。他认为人类智能是集体性的,增强工具(包括语言)极大地拓展了我们的理解能力。他将数学界比作一个比个体更智能的集体实体,并以MathOverflow社区为例。最后,他对年轻一代的创造力和热情表示希望,认为科学进步表明今天看似不可逾越的问题将来可能变得微不足道。
2025-06-06 02:08:20
节目亮点部分突显了桑达尔·皮查伊(Sundar Pichai)童年时期在印度目睹技术对生活带来的巨大改变,例如电话从漫长的等待清单到普及使用,以及自来水和热水设施的出现。这些经历使他深刻体会到技术改变人类生活并带来机遇的力量。他特别提到,对于“末日概率(p(doom))”等风险,他持乐观态度,认为如果风险足够高,全人类将因此而团结一致,共同努力确保其不会发生,这是一种自我调节机制。他相信人类集体努力能够解决任何问题,并对人类能够迎接挑战抱有信心。
Lex Fridman 介绍了本期播客的嘉宾是 Google 和 Alphabet 的首席执行官桑达尔·皮查伊。
皮查伊回顾了他在印度金奈(Chennai)谦逊的成长经历。他一家人居住在简朴的两居室公寓里,很少或几乎没有接触过技术。他回忆了童年时在街上打板球的简单快乐时光,以及当时主要通过报纸和书籍获取外界信息。他祖父对他的影响很大,祖父是一位文字功底深厚、热爱阅读并善于表达的人,将他带入了书籍的世界。
皮查伊强调,童年时期对技术接入的渴望以及技术给他生活带来的具体改变(如电话从五年等待缩短就医记录获取时间,以及从没有自来水到拥有热水器)是他后来选择进入科技行业并对 Google 使命深感共鸣的深层原因。他亲身感受并观察到技术如何驱动生活的“阶梯式变化”。他提到直到读十二年级家中才拥有VCR,虽然是走私购得,但极大地丰富了娱乐生活(如录制世界杯比赛、观看录像带电影)。这些离散的记忆都强化了他对技术改变生活的认知。他与Lex Fridman都感叹现代人对技术进步习以为常,忘记了历史上取得的巨大飞跃。
皮查伊向全球的年轻人提供建议。他认为成功的道路上固然需要运气和明智的选择,但更重要的是“倾听你的内心”,找到真正热爱的事情,因为热爱能让你发挥出最好的自己。其次,要努力与那些你认为比你更优秀、能“拓展你能力”的人一起工作,将自己置于不适但有助于成长的情境中。保持开放的心态去迎接这些挑战。
关于领导风格,皮查伊承认自己也会有愤怒和沮丧的情绪,但随着时间推移,他学会了如何最大限度地发挥员工的潜力。他倾向于激励那些有使命感、追求卓越、内心充满干劲的人。他发现发脾气通常效率不高,人们只是为了反应而做事,而非真正解决问题。他以足球中的“球员管理(man management)”为例,强调如何让团队成员发挥最佳水平。他指出,对于那些自我要求很高、犯错后比你更自责的人,需要区别对待。有时候,“不言而喻”的沉默也能传达信息,少即是多。
当被问及史上最伟大的足球运动员时,皮查伊明确表示是梅西(Messi),尽管他也非常钦佩克里斯蒂亚诺·罗纳尔多(CR7)的奉献精神。他将梅西的足球天赋比作一种难以言喻的天才和艺术性,认为这种 greatness 在体育中能被直观看到,是目前人工智能难以匹敌的。
皮查伊重申了他在多年前(大约2017或2018年)提出的观点:AI是人类有史以来最深刻的技术,其影响力将超过火、电等。他承认可能存在近因偏差(recency bias),但从第一性原理出发,AI的进步速度、潜力上限未知以及其递归自我改进的能力,使其与众不同。AI将极大地加速创造过程本身,能够独立改进和实现事物,这将对人类社会产生深远影响。
他讨论了人工智能可能带来的“AI包(AI package)”,类似于新石器时代农业革命带来的“新石器包”(包括陶器、社会等级、政府、贸易等一系列次生效应)。虽然大部分影响目前未知,但一个 tangible 的早期迹象是它将极大地促进创造力。通过AI,将头脑中的想法转化为现实(如编程、内容、游戏)将变得异常容易。这将“解锁”全球80亿人的认知能力,使数百万人、甚至数十亿人能够以更深入的方式进行创造和表达,远超互联网和博客时代的影响。
AI对传统创意产业和媒体(如播客、新闻)带来冲击,引发不安,但也驱动变革和进化。皮查伊认为,在人工智能生成内容充斥的世界中,人类特质(struggle, emotion, consciousness)的价值可能会更加凸显,就像人们更愿意看人类棋手下棋而不是Stockfish对AlphaGo。AI可能接管信息收集等效率性任务,而人类则专注于信息的内化、情感结合以及更深层次的探索。他预测AI将助力更多人成为创作者(如电影制作人),这是一种被低估的“扩张性”影响。
至于未来多少比例的“好内容”会由AI生成,皮查伊认为取决于具体内容类型。AI将成为像Google Docs一样的工具,被创作者广泛使用。
皮查伊谈到了Google与电影界 visionary 人物(如Darren Aronofsky)合作开发Veo等视频生成工具。这些艺术家能够看到AI的未来潜力,并探索如何用它来表达创意。他认为,捍卫艺术自由表达是社会的重要价值之一,艺术家总是走在推动边界的前沿。Google的角色是提供工具和基础设施(就像提供电一样),让艺术家去使用和创造。虽然需要对内容负责并遵守社会规范,但在艺术表达方面应努力捍卫自由。
他赞赏了Gemini 2.5 Pro在处理历史暴力等敏感话题时表现出的客观、细致和深度,认为随着模型能力的提升,它们能够更好地理解并处理这些复杂问题,而不是依赖硬编码的规则。他强调,从科学第一性原理出发,让模型本身具备推理能力是正确方向,应允许用户更多地访问和定制原始模型。
他分享了Gemini生成的一个有趣问题:“杰米尼每个月能处理480万亿个token,隐藏在这巨大信息堆中的,最具改变人生意义的五个单词的句子是什么?”这体现了AI的潜力以及人类对知识的渴望,也让他想起Google Search过去带来的无数“顿悟时刻”。他提到Gemini处理的token量在过去12个月增长了50倍,达到480万亿,这印证了人类无穷无尽的好奇心。
皮查伊和Google的研究者们(包括Demis, Koray, Jeff, Norm, Sergey)经常讨论扩展定律(scaling laws)。他认为目前仍有巨大的发展空间,Google在预训练、后训练、测试时计算、工具使用、Agentic能力等方面都在取得显著进展,模型正朝着更通用的世界模型方向发展(如Veo 3对物理世界的理解大幅提升)。他信任Google世界级的研究团队,认为未来一年仍将充满进步。
目前的限制主要在于计算资源(compute limited)。为了平衡模型能力和可用性(速度、成本),Google推出了Flash、Nano和Pro型号,Pro型号能达到Ultra型号80-90%的能力,但更快速且服务成本更低。下一代的Pro有望赶上前一代的Ultra。他指出,衡量模型“性能”越来越困难,因为实际影响(如延迟低带来的可用性)可能比纯粹的智能得分更重要,基准测试越来越难以捕捉模型的真实世界效用。
关于通用人工智能(AGI)和超人工智能(ASI)的时间表,皮查伊引入了“锯齿形人工智能”(AJI - Artificial Jagged Intelligence)的概念来描述当前状态——进步显著但仍存在明显的不足(如简单的计算错误)。他认为,无论如何定义AGI,到2030年,AI都将取得巨大的进步,我们将面临其带来的巨大积极和消极影响。虽然他认为离真正意义上的AGI(AI自认为达到AGI)可能还需要稍微长一些的时间,但届时AI的能力将令人震惊(如AI生成视频,需要社会建立规范区分现实)。
他回顾了Google Brain和DeepMind早期的工作(如识别猫的图片),当时人们预测需要几十年才能达到AGI。他强调,工具(TensorFlow)、代码共享(GitHub)、新思想(Transformer, Diffusion)以及推理阶段的创新都在加速这一进程。用户界面(UI)至关重要(引用shadcn的推文),模型如何呈现自己和与世界互动是关键。他甚至认为未来AI本身可能能够设计和改进自己的用户界面,因为它们具备编码能力并能更好地理解用户偏好。
皮查伊认真对待AI可能导致人类文明毁灭的“末日概率”(p(doom))。他认为,管理大型组织时,只要目标一致,几乎可以实现任何事情。虽然组织全人类的步调一致很难,但他相信如果“末日概率”真的很高,人类将空前团结,共同努力避免灾难。这是一种内在的自我调节机制。他对此持乐观态度,相信人类有能力应对这一时刻,尽管他认为潜在风险确实很高。Lex Fridman补充说,也需要考虑“没有AI的末日概率”,AI或许能帮助人类更聪明、更友善、更有效率,从而应对其他威胁(如战争、资源冲突),AI可能是拯救人类文明的关键。皮查伊对此表示赞同,认为AI将有助于解决一些最棘手的问题。
皮查伊回应了去年外界对Google在AI竞赛中落后、质疑其领导力的文章。他指出,作为CEO,他最重要的赌注就是让公司全面转向“AI优先”,负责任地开发AGI并推出对人们有用的产品。尽管外界有质疑,他内心清楚公司正在构建什么(合并Brain和DeepMind,早期投资TPU)。他善于区分“噪音”和“信号”,会倾听外部有价值的反馈,但在关键时刻必须做出有远见和影响力的决策。
合并Brain和DeepMind是其中一个重大决策,这就像将顶尖大学院系合并一样困难,涉及到团队文化和个人愿望的协调(如Jeff Dean希望回归研究)。他感谢团队的共同努力,克服了挑战,整合了双方的优势。这个过程虽然伴随压力和不眠之夜,但他通过耐心和明确的方向引导团队。他强调,在会议中倾听所有人的意见非常重要,但这并不影响在必要时做出明确的、坚定的决定,并要求团队“不同意但承诺执行(disagree and commit)”。他认为这种清晰的决策风格能赢得尊重。
他提到除了Brain/DeepMind合并,成立AI基础设施团队也是重要决策,旨在扩大计算能力。他还强调了文化整合的重要性,鼓励团队在物理空间上聚集(如他经常去Gradient Canopy大楼看望研究人员),这种共同奋斗的能量在关键时刻发挥了作用。
皮查伊谈论了在Google Search中引入AI模式和AI Overviews的决策。他认为这是Search产品不断演进的一部分,就像过去适应移动端一样。AI模式利用底层强大的技术,为用户提供更多的上下文和总结,并允许对话式互动。Google的核心设计原则是继续将用户引导至网络上的原创内容,AI层是提供额外价值。AI模式将提供最前沿的体验,而效果好的功能会逐步迁移到主搜索页面。
AI模式的一大亮点是其语言能力和“查询扇出(query fan-out)”功能。它能同时执行多项搜索并整合信息,特别是对非英语用户,它能够让母语网络内容有限的用户更容易访问和理解全球(主要是英语)网页内容,极大地扩展了他们的信息获取范围,释放了巨大的认知潜力。他提到AI Overviews已经显著改善用户体验,驱动了产品增长,AI模式的早期用户指标也非常积极。
关于广告,皮查伊表示早期AI模式将专注于有机体验。他认为广告的根本价值在于支持免费服务并提供商业信息,Google将广告视为信息的一部分并保持高质量标准。未来AI本身可能帮助优化广告形式,使其更符合新的交互模式。他提到Google也在探索订阅模式(如YouTube),未来产品的优化点可能发生变化。他认为AI模式不会完全取代传统搜索,而是会作为一种持续演进的体验,继续与用户驱动的网页内容相结合。
皮查伊被Lex Fridman赞誉为Chrome的奠基人之一,认为Chrome是他心中最重要的软件产品之一。皮查伊回忆了Chrome诞生的时代背景(2004-2005年),当时AJAX等技术使网页变得高度动态(Flickr, Gmail, Google Maps的出现),但现有浏览器性能(特别是JavaScript执行)和架构(安全性、稳定性)已无法满足需求。Google看到了构建一个为“富动态网络”设计的浏览器的机会。
Chrome的核心愿景是将操作系统(Core OS)原则引入浏览器,实现更高的安全性(沙箱)、稳定性(独立标签页进程)和性能(快速JavaScript VM)。他提到丹麦奥胡斯团队开发的JavaScript VM比当时其他VM快25倍。将Chromium开源也是重要一步。皮查伊认为,Chrome项目是他经历过的最有趣的从零开始构建产品的过程,拥有非凡的团队。
他从Chrome的成功中得到的启发是“月球计划(moonshots)”的价值:瞄准非常宏大的目标会吸引最优秀的人才,因为很少有人敢于尝试,竞争较少,即使未能完全实现目标(达到60-80%),也能取得巨大成功。他认为人们并未完全理解这种高风险高回报策略的优势。
Waymo是Google的另一个“疯狂月球计划”的例子,皮查伊对此深感自豪。他认为Waymo是机器人学的未来象征,早期就让他看到了未来图景。他赞扬了Waymo团队的毅力和坚持,在面临质疑时反而加大投入,专注于解决自动驾驶中最困难的“最后的20%”问题。尽管进程缓慢,但他坚信技术差距存在且Waymo正在不断进步。
他祝贺Waymo达成了1000万次付费Robotaxi出行,并强调Google作为一家深科技公司,热衷于解决这类问题。Waymo Driver是一种通用技术(L4/L5自动驾驶),可在多种场景应用。他不直接将Waymo与特斯拉竞争,认为两者都将在庞大的交通运输领域取得成功。他将自动驾驶汽车视为未来“AI包”中改变一切的重要组成部分,其影响将超越经济,触及社会文化层面。Waymo作为一个轮式机器人,其技术积累也将推动更广泛的机器人学发展(包括Google DeepMind正在推进的Gemini Robotics)。他表示机器人学领域因软件挑战受阻已久,AI的通用模型正在推动这一前沿。
皮查伊谈到AI在编程方面的显著进步(如Gemini的编码能力),以及程序员因此感到的担忧。他提供了Google内部的数据:目前30%的代码使用AI建议,更重要的指标是AI使整个公司的工程效率提高了10%。尽管如此,Google仍计划招聘更多工程师,因为新的AI能力拓展了可以完成的工作范围。
他认为AI工具将使编程中重复性的“ grunt work ”减少,让工程师能将更多时间花在设计、架构、解决复杂问题、与同事协作等更有趣和有价值的方面,从而提升工作满意度。AI也将降低编程门槛,吸引更多人参与创造,就像现在更多人下棋一样。他认为程序员应拥抱这些工具,成为更好的“增强型程序员”。尽管他承认某些个体的生产力提升可能远超10%,但他强调10%是整个大型组织的平均提升,意义巨大。未来Agentic能力的提升将带来下一波生产力飞跃。AI还能帮助标准化代码库、简化重构(refactoring),提升协作效率。他建议有志于编程的年轻人在大学学习计算机科学,因为CS远不止编程,基础原理思考至关重要,AI将影响每个领域。
皮查伊将AR(增强现实)视为继GUI、多点触控、语音之后计算领域的下一个重要交互范式变革。他认为AR的普及依赖于AI的支持,以实现自然流畅的交互(Project Astra在Android XR中的作用)。他认为Android在XR领域拥有巨大机会,同时也在思考如何用AI重塑移动操作系统本身,使其更具Agentic能力,能够理解用户意图并主动提供帮助,而不仅仅是当前的应用程序和快捷方式模式。
他体验了Google的XR眼镜原型,赞赏其时尚、轻便的设计以及流畅的交互(如地图导航时低头看脚下和抬头看远方的平滑过渡,信息显示简洁不干扰现实)。眼镜内置Gemini AI,支持多模态对话和实时翻译(就像现实世界的字幕)。他还体验了Google Beam,一种革命性的全息远程临场技术,通过多个摄像头和AI模型生成3D视频,配合光场显示屏,提供令人惊叹的临场感和空间音频,能实现自然的眼神交流和肢体互动,极大地提升了远程会议和个人连接的质量。这些“月球计划”项目(Beam、XR眼镜)正日益接近现实,Google计划在未来几年内将XR眼镜提供给开发者和消费者。
皮查伊承认Google历史上曾取消一些有前景的项目(如Google Voice幸存让他很高兴),但他列举了Google多年来构建的众多革命性产品(Search、Chrome、Gmail、Maps、Android、YouTube、AdSense、Translate、Scholar、DeepMind、Waymo、Quantum Computing),这些产品都改变了世界。
Lex Fridman向皮查伊提出了一个假设性问题:如果Google成功构建了AGI,你会向它问什么问题?皮查伊认为AGI可能会主动告诉我们一些重要的事情。如果主动提问,他认为AGI将以令人惊讶的方式帮助我们更深刻地理解我们自己(个人层面)。此外,它也可能帮助我们更好地理解宇宙,拓展人类知识的疆界。Lex Fridman则表示他的第一个问题会是关于外星文明的数量及其性质,希望能得到费米悖论的答案。
皮查伊和Lex Fridman都认为,Google Search和AI模式(Gemini)等技术通过使知识更容易获取,极大地激发了人类的好奇心,让人类能够探索更多未知,从而使生活更加精彩。虽然难以量化,但这种知识的解锁和好奇心的满足提升了生活质量。
面对AI日益强大的未来,皮查伊思考了人类的独特性。他认为,人类的意识、同情心、善良等特质构成了“人类的本质(essence of humanity)”,尽管未来界限可能模糊。他希望AI能使资源更加丰富,减少零和博弈的环境,从而让人类独有的价值更好地显现。他相信,AI将放大同情心、好奇心以及对事物意义的探讨。科学探索也将继续,人类将与AI一起发现新的问题并寻求答案。
皮查伊对人类文明的未来充满希望,他认为人类历史的进程是不断使世界变得更好的过程。他反问,如果选择出生的时代,他几乎总是会选择当下。人类文明取得了非凡的成就,并不断推动前沿。他相信,未来也不会例外,人类将集体迎接挑战。他与Lex Fridman都对当下充满感激,并对未来感到兴奋,认为Google及其团队的工作是这种兴奋的重要来源之一。
最后,Lex Fridman引用了法国哲学家Jean de La Bruyère的话:“困难中蕴藏着奇迹(Out of difficulties, grow miracles)”。