MoreRSS

site iconLex 播客单集综述修改

用 Gemini 2.5 Pro 把每个播客单集的逐字稿,生成为综述稿。by Jonathan
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

Lex 播客单集综述的 RSS 预览

20250615 - #472 – Terence Tao Hardest Problems in Mathematics, Physics & the Future of AI

2025-06-15 08:52:55

以下是对Lex Fridman播客#472中Terence Tao逐字稿的专业综述:

Introduction

本期播客的主题是与被广泛认为是史上最伟大数学家之一、常被称为“数学界的莫扎特”的Terence Tao的对话。Tao曾获得菲尔兹奖和数学突破奖,并在数学和物理学的广泛领域做出了开创性的贡献。Lex Fridman表达了此次对话的荣幸。

First hard problem

Terence Tao回顾了他职业生涯中遇到的第一个真正困难的研究级数学问题——Kakeya问题(Kakeya Needle Problem)。该问题起源于数学家Soichi Kakeya在1918年提出的一个谜题:如何在二维平面上用尽可能小的面积将一条长度固定的“针”(线段)旋转180度(掉头)。他解释说,虽然简单的中心旋转或三点掉头会占用一定的面积(分别为π/4和π/8),但数学家Besicovitch证明了实际上可以用无限小的面积来完成旋转。Tao表示二维情况已完全理解。接着他提出了更高维度的Kakeya问题:在一个三维空间中,如何用最小的体积旋转一个具有微小厚度(delta)的“针”(例如哈勃望远镜),使其能够指向所有方向。猜测是所需的最小体积随厚度delta下降得非常缓慢,大约是对数关系,这一点经过大量工作已被证明。Tao指出,这个看似简单的谜题与偏微分方程、数论、几何学和组合学中的许多问题有着令人惊讶的联系。例如,在波传播中,能量的集中(聚焦)现象与Kakeya问题几何地相关,潜在的“吹爆”(blowup)可能导致物理定律失效。

Navier–Stokes singularity

讨论进一步聚焦于数学物理中的一个著名未解难题——Navier–Stokes正则性问题。该方程描述了不可压缩流体(如水)的运动。问题的核心是:如果流体的初始速度场是光滑的,速度是否可能在有限时间内在某个点变得无限大(形成奇点),而这在现实中似乎并未观察到。这是克莱数学研究所悬赏一百万美元的七个千禧年大奖问题之一,目前只有庞加莱猜想被解决。Tao提到他2016年发表的一篇论文,研究了一个“平均化”的三维Navier–Stokes方程的有限时间吹爆。他解释了数学家与常人的区别:关心是否在所有100%的情况下都成立,而不仅仅是99.99%。流体动力学模型的复杂性使得证明其普遍规律变得困难,他借用“麦克斯韦妖”的概念来比喻数学中难以排除的“异常”或“阴谋”配置(如圆周率数字的无模式性)。在Navier–Stokes方程中,存在两种竞争的力量:粘性(耗散)趋于平息运动,而非线性输运项趋于集中能量。如果能量以某种方式持续集中到越来越小的尺度,且速度足够快以抵抗粘性效应,就可能发生有限时间吹爆。他指出,过去试图通过能量守恒等技术证明Navier–Stokes的整体正则性(即速度始终保持光滑)都失败了。他的“平均化”方程工作旨在解释为何难以反驳有限时间吹爆——通过精心设计关闭某些相互作用,他成功地构造了一个吹爆的例子。这提供了一个“障碍”,表明任何试图证明实际Navier-Stokes方程正则性的方法必须利用他的模型中被关闭的某些特征。他将此与物理学中的“超临界性”概念联系起来:在三维Navier-Stokes方程中,非线性输运项在小尺度上比粘性项强得多,这是其困难之处;而在二维中是“临界”的,已证明没有吹爆。超临界性是区分方程是否“可预测”的关键特征。

Game of life

Terence Tao将流体动力学的复杂性与元胞自动机(cellular automata)联系起来,尤其是康威的生命游戏(Conway's Game of Life)。生命游戏在一个离散网格上通过简单的局部规则演化,可以产生令人惊叹的复杂涌现结构,如“滑翔机”(glider)和“滑翔机枪”(glider gun),甚至自我复制机器。他认为,生命游戏的这些发现为Navier-Stokes方程中可能通过精心设计的初始条件构造奇点(类似流体图灵机)提供了先例,尽管一个离散系统与连续系统的数学形式不同,但在涌现复杂行为方面有相似之处。他也强调,生命游戏中复杂结构通常需要精心准备的初始条件,随机初始条件通常只会导致混乱或死亡。这引出了数学中的一个反复出现的挑战:结构与随机性之间的二分法。大多数数学对象看起来是随机的,但一小部分具有模式。证明一个特定对象(如圆周率的数字)没有某种奇怪的模式是很困难的。他提到自己在此领域的工作,即“结构定理”或“逆定理”,这些定理提供了判断何时一个对象具有结构性的检验,并表明如果一个函数表现出某种近似结构(如几乎可加),那是因为它与某个完全结构化的对象相关。

Infinity

作为结构与随机性讨论的例子,Tao提到了Szemerédi’s定理,该定理证明了任何具有正密度的整数集合都包含任意长度的算术级数(等差数列)。这个定理适用于高度结构化的集合(如奇数)以及看似随机的集合(如通过抛硬币从奇数中随机挑选的子集)。这再次体现了结构与随机性的二分法。他引用了“无限猴子定理”(Infinite Monkey Theorem)来进一步说明,在一个足够长的随机序列中,任意有限模式最终都会出现(例如莎士比亚的《哈姆雷特》剧本,或任意长度的算术级数),并指出“无限”可以吸收很多复杂性。对于人类如何理解无限,他认为可以将其视为对一个“无上界”的有限数的抽象和理想化。尽管现实世界中没有真正的无限,但在数学模型中,将事物理想化为无限或零常常能使数学变得更简洁。他也提到在处理无限时需要注意陷阱(如无穷级数的重新排列),并指出近年来人们开始将无穷极限下的结果进行“有限化”,即给出“何时”发生的具体速率,这使得问题更具体、更直观,尽管有限化后的证明常常更复杂。

Math vs Physics

Tao阐述了数学与物理学作为学科、理解世界方式的区别。他认为科学总体上是现实、观察和心智模型之间的相互作用。数学专注于模型本身,从公理出发探索其推论和预测。物理学则收集观察数据,并提出模型来解释数据并进行预测。数学的独特之处在于它可以从假设(公理)出发进行推测,而其他学科通常是结论驱动的。他讨论了物理学中理论与实验的张力,认为两者相互促进:模型预测异常指导实验寻找新数据,实验结果反过来指导模型修正。数学内部也存在理论与实验成分,但直到最近,理论一直占据主导。他提到计算机兴起后才有了更多实验数学(如研究素数分布)。但他指出,某些数学问题因“组合爆炸”难以通过直接计算研究(如1000个数的子集数量)。他认为AI可能在未来助推数学实验,例如使用AI分析国际象棋引擎数据来改进棋类理论。

Nature of reality

Lex Fridman提到柏拉图的洞穴寓言,问数学家和人类是否都在观察现实的影子。Tao回应说,现实、观察和模型是不同的本体论概念,但它们可以随着时间推移互相靠近,这常常需要抛弃最初的直觉(如从平地球到圆地球的模型转变)。他指出,当今我们有符合大量观测数据的模型,如解释宇宙膨胀和加速的暗物质/暗能量模型。他认为一个好的物理/数学理论是对宇宙的一种“数据压缩”,用少量参数解释大量观测数据。这引出了“数学的不合理有效性”(unreasonable effectiveness of mathematics)——宇宙竟然是可压缩的。Tao提出“普适性”(universality)作为部分解释:宏观复杂系统往往从微观简单相互作用中涌现,宏观规律常常仅依赖于少量参数(如气体的宏观属性)。中心极限定理(高斯分布的普适性)是基本例子。但他警告普适性可能失效(如系统性风险),强调数学有助于理解模型局限性,而科学则验证模型是否符合现实。他进一步讨论了自己的广博研究风格(狐狸型),喜欢在不同领域之间寻找联系,将一个领域的技巧移植到另一个领域。

Theory of everything

Terence Tao表示他相信存在一个“万物理论”,能够统一广义相对论和量子力学。他引用了物理学历史上统一的趋势(如麦克斯韦统一电磁学,牛顿统一天体和地面运动)。他认为,当前的挑战在于广义相对论和量子力学各自非常成功,覆盖了绝大多数可观测现象(99.9%),仅在极端条件下(如超高能粒子、早期宇宙)才会出现偏差,而这些条件下的实验非常困难。他指出,数学家常会先于物理学家发展出所需的数学工具(如黎曼几何之于爱因斯坦的广义相对论),他相信解释宇宙的理论往往涉及那些在解决数学问题时也有效的数学对象,因为它们都是组织数据的有效方式。统一理论可能需要找到新的“语言”或基本概念来取代空间和时间等传统观念,类似能量(哈密顿量)在经典力学和量子力学中的核心地位。他认为找到能组织一切的“哈密顿量类比物”是关键。简要提及弦理论是过去的主要候选理论,但因与实验不符而渐失宠。

General relativity

Tao谈到了他在广义相对论相关领域的贡献,特别是对“波映射方程”(wave maps equation)的研究。这个方程描述了时空上的某些场,而非时空本身,是爱因斯坦场方程层级中相对较低但仍具挑战性的非线性方程。他研究了其全局正则性问题,证明了在特定情况下能量不会集中导致奇点。他解释了方程的非线性(源于流形曲率)以及他如何使用“规范变换”(gauge transformation)来降低非线性效应,使方程更易于处理。他形象地描述了这一过程,就像通过附加摄像机来稳定麦田波动,以及他在头脑中想象向量场运动来寻找变换的灵感。

Solving difficult problems

Terence Tao分享了他解决难题的方法,他称之为“战略性作弊”(cheating strategically)。这意味着不是以最大难度去硬解,而是通过简化问题来逐个攻克难点。例如,如果有10个因素导致问题困难,先构造一个只保留其中一个因素的版本来解决,从中学习处理该特定困难的方法,然后依次处理其他困难。他将这比作香港武打片中英雄总是逐个击败敌人,而不是同时被围攻。他主要使用纸笔(特别是黑板)进行思考和演算,辅以绘图和只有自己能懂的涂鸦。他开始越来越多地使用计算机,特别是AI工具(如GitHub Copilot),来辅助简单的编码和探索性计算,这大大降低了技术门槛。

AI-assisted theorem proving

讨论转向AI辅助定理证明,首先介绍了形式化证明语言Lean。Lean不仅执行代码,还能生成证明的“证书”,保证推理的100%正确性(如果信任编译器)。他解释了用Lean写证明与手写证明的区别:Lean非常严格和冗长,需要明确每个数学对象的“类型”,但数学家们已努力使其语法接近数学论证。Lean拥有庞大的形式化数学库Mathlib。AI(特别是大型语言模型LLMs)正被用于Lean的辅助工具,例如帮助搜索Mathlib中的引理,作为一种“花哨的自动补全”,尽管目前仍有幻觉问题。他估计将一个证明形式化比手写耗时10倍,但巨大的优势在于修改证明时能迅速定位错误,尤其是在参数变化时,这大大提高了效率和可靠性。Lean也使得原子尺度的证明协作和“无需信任的数学”(trustless mathematics)成为可能。

Lean programming language

Tao进一步阐述了Lean如何促进数学协作。它允许将大型证明分解为更小的、可独立解决的子问题,形成一个“蓝图”。这种模块化使得分布式协作成为可能,理论上可以有成千上万的贡献者。他认为Lean和其他软件工具(如GitHub)将极大地推动“实验数学”的发展,不仅是数据实验,更是证明的实验。他介绍了他的“等式理论项目”(Equational Theories Project),旨在系统研究抽象代数中2200万对代数定律之间的蕴含关系。这个项目需要大规模众包(涉及50位作者)和计算机验证,在Lean出现之前是不可行的。项目已接近完成,仅剩少数问题。他探讨了基于协作数据的指标化和游戏化潜力(如ELO评级),但对学术界可能的使用方式表示谨慎,更倾向于非正式的贡献分类。他提到了先前的Polymath项目(无Lean的众包),受限于人工验证的瓶颈,以及署名问题的经验教训。

DeepMind’s AlphaProof

Terence Tao评论了DeepMind的AlphaProof项目,该项目使用强化学习在形式化的IMO(国际数学奥林匹克)问题上训练证明系统。他指出,证明难度随步骤呈指数增长,AI在长证明中容易走错。他也提到将自然语言数学描述映射到形式语言的困难。他认可AlphaProof在解决高中奥数级别问题上取得了令人印象深刻的成就(相当于银牌水平,但需要协助和额外时间),但指出目前其扩展性受限(单个问题需要大量计算资源),且AI生成的证明看似流畅但常含“愚蠢”的错误,缺乏“数学嗅觉”。他希望未来能有AI数学奥赛,让AI在规定时间内用自然语言解决问题。

Human mathematicians vs AI

Tao探讨了人类数学家相对于AI的独特之处。他认为,例行计算和标准方法的应用将越来越被自动化取代。目前AI的关键弱点在于缺乏“数学嗅觉”,即判断某个证明策略是否可行或何时走错了方向的能力。他提到AI生成的错误通常很隐秘,但一旦发现又显得很愚蠢,不像人类的低质量证明那样有“代码异味”。他设想未来的AI是像神谕或协作伙伴,能评估想法、进行计算、生成证明草稿或新的问题表示。这种与“胜任但不完全可靠”的系统协作是一种新模式。他认为数学工作流程将发生阶段性转变,就像当年LaTeX的普及一样,当形式化证明的门槛显著降低时,数学家可能会优先使用AI/Lean进行工作,甚至期刊也会鼓励。

AI winning the Fields Medal

对于AI多久能成为菲尔兹奖级别证明的合作者(或独立贡献者),Tao认为目前AI已能在某些方面(如自动补全、文献搜索)辅助数学家写作,但贡献度不足以获奖。他预测在本十年内,AI可能提出一个有意义且有很高概率正确的数学猜想。他也提到AI在文献回顾方面有潜力(尽管目前有幻觉问题),能够帮助数学家发现未知关联。总的来说,AI目前缺乏人类数学发现过程中的“负空间”数据(失败尝试、被放弃的猜想),这限制了其自主发现能力。

Grigori Perelman

Tao谈论了解决庞加莱猜想的Grigori Perelman。他解释了庞加莱猜想的内容(简单连接的闭三维空间是否一定拓扑等价于三维球面)及其在高维度相对容易但在三维困难的原因。他详细描述了Hamilton提出的Ricci流方法(通过流动使空间变“圆”),以及该方法在三维面临的奇点问题。他强调Perelman的关键突破是引入“Perelman缩减体积”和“Perelman熵”等新量,将超临界问题转化为临界问题,并对可能的奇点进行了完整分类和处理(“手术”)。这展示了Perelman非凡的远见和毅力。对于Perelman拒绝菲尔兹奖和百万美元奖金,Tao认为他是一个特例,具有强烈的个人原则,可能对数学界感到失望。他也提到菲尔兹奖给自己带来的影响——成为“建制派”的一部分,需要花费更多时间在非纯数学事务上,尽管他仍努力保持探索的自由。

Twin Prime Conjecture

Tao将素数比作数学的原子,通过加法(简单)或乘法(简单)生成,但两者结合(如素数的分布)非常复杂。他解释了孪生素数猜想(存在无限多相差为2的素数对)。他将孪生素数猜想的困难与他证明的Green-Tao定理(素数包含任意长度的算术级数)进行对比。他认为孪生素数对在素数集合中相对“脆弱”,可以通过对素数进行微小修改就消除所有孪生素数对,而这种修改不会破坏其他统计性质,从而绕过许多标准分析工具。相比之下,算术级数更“顽强”,在许多类型的集合中都存在。他提到了自己关于有界差素数对(如相差小于246的素数对有无限多)的工作,这依赖于对“几乎素数”(因子很少的数)的研究和鸽巢原理。他指出了阻止证明孪生素数猜想的主要障碍——“奇偶性障碍”(parity barrier),这限制了当前方法能证明的素数密度阈值,并表示希望能找到突破这个障碍的方法,这将对许多其他数论问题(如哥德巴赫猜想)有影响。尽管统计模型强烈支持孪生素数猜想为真,但证明100%确定性则异常困难。

Collatz conjecture

Tao解释了Collatz猜想(对任何自然数应用“偶数除以2,奇数乘以3加1”的迭代过程最终都会回到1)。他形象地描述了迭代序列的“冰雹序列”性质和其类似布朗运动的随机行走特征,统计上倾向于下降。他提到自己的进展是证明了统计意义上(99%的输入)数字会显著变小。但他指出,概率论的结论无法排除极少数异常值,就像Navier-Stokes方程的吹爆一样,可能存在一个数字的序列永远不会回到1。他提到了Collatz猜想与元胞自动机及Conway推广研究(证明了更复杂版本的不可判定性)的联系,暗示存在编码复杂机器的数字,这些数字可能会永远“飞升”。

P = NP

Tao将P=NP问题列为当今数学中最难(也最具元性质)的问题之一,认为它一旦被正面解决将产生巨大的连锁效应。他简要说明了P=NP问题与黎曼猜想对密码学的影响之间的类比。他认为现有证据略微倾向于P不等于NP,并且存在大量“障碍”或“否定定理”,排除了许多可能的证明方法。他甚至提到了P=NP问题可能是不可判定的可能性。

Fields Medal

Tao分享了获得菲尔兹奖后有人询问他“现在要做什么”的趣闻,他谦逊地回答“一枚闪亮的奖章并不能解决我正在攻克的问题”。他再次提到了Perelman拒绝奖项的行为,认为他是一个坚持原则的特例。他指出菲尔兹奖使他成为“建制派”一员,需要承担更多非学术责任,但这也是积极的,让他能够指导领域方向。他认为奖项有其必要性,能够激励年轻人,但也需警惕过度追求奖项而忽视其他重要工作。

Productivity

Tao谈到自己的高产来自适应性和能够快速转换研究主题,这对他而言是一种有效的工作方式。他批评了数学教育中“一刀切”的方法,并提出人类使用大脑不同区域(视觉、语言、游戏等)进行数学思维,导致学习风格各异,而教育系统难以满足多样化需求。数学提供了一种共同语言,允许不同思维方式的人合作。

Advice for young people

Tao给年轻人的建议是保持适应性和灵活性,培养可迁移的技能(如抽象推理、问题解决)。他鼓励他们在课堂之外寻找数学的乐趣和资源(如在线平台、与兴趣相关的数学应用)。他认为Lean等工具可能促进公民科学,让更多公众参与数学研究。他对比了编程和数学的入门难度,认为编程的即时反馈和可执行性使其感觉更易近人。

Advice for young people (cont.)

他以自己学习Lean的经历为例,说明了即使是资深数学家也需要不断学习新工具,愿意在某些方面成为“初学者”。他认为这是因为现代数学过于庞大,无人能掌握一切,而且数学迫使人们承认错误。

The greatest mathematician of all time

对于“史上最伟大的数学家”这个“荒谬”的问题,Tao认为是时间依赖的,不同时代有不同标准。他提到了几位候选人(欧几里得、牛顿、高斯、欧拉、拉马努金、希尔伯特),并特别强调了希尔伯特的持续影响力和他提出的问题列表的重要性——它们像灯塔一样指引研究方向。他讨论了提出开放问题的重要性,它克服了研究中的“旁观者效应”和“瘫痪”状态,鼓励人们去尝试。他提到了“结构化拖延法”作为一种心理技巧。他认为人类智能是集体性的,增强工具(包括语言)极大地拓展了我们的理解能力。他将数学界比作一个比个体更智能的集体实体,并以MathOverflow社区为例。最后,他对年轻一代的创造力和热情表示希望,认为科学进步表明今天看似不可逾越的问题将来可能变得微不足道。

20250605 - #471 – Sundar Pichai CEO of Google and Alphabet

2025-06-06 02:08:20

471 期 Lex Fridman 播客节目与 Google 和 Alphabet 首席执行官 Sundar Pichai 对话综述

Episode highlight

节目亮点部分突显了桑达尔·皮查伊(Sundar Pichai)童年时期在印度目睹技术对生活带来的巨大改变,例如电话从漫长的等待清单到普及使用,以及自来水和热水设施的出现。这些经历使他深刻体会到技术改变人类生活并带来机遇的力量。他特别提到,对于“末日概率(p(doom))”等风险,他持乐观态度,认为如果风险足够高,全人类将因此而团结一致,共同努力确保其不会发生,这是一种自我调节机制。他相信人类集体努力能够解决任何问题,并对人类能够迎接挑战抱有信心。

Introduction

Lex Fridman 介绍了本期播客的嘉宾是 Google 和 Alphabet 的首席执行官桑达尔·皮查伊。

Growing up in India

皮查伊回顾了他在印度金奈(Chennai)谦逊的成长经历。他一家人居住在简朴的两居室公寓里,很少或几乎没有接触过技术。他回忆了童年时在街上打板球的简单快乐时光,以及当时主要通过报纸和书籍获取外界信息。他祖父对他的影响很大,祖父是一位文字功底深厚、热爱阅读并善于表达的人,将他带入了书籍的世界。

皮查伊强调,童年时期对技术接入的渴望以及技术给他生活带来的具体改变(如电话从五年等待缩短就医记录获取时间,以及从没有自来水到拥有热水器)是他后来选择进入科技行业并对 Google 使命深感共鸣的深层原因。他亲身感受并观察到技术如何驱动生活的“阶梯式变化”。他提到直到读十二年级家中才拥有VCR,虽然是走私购得,但极大地丰富了娱乐生活(如录制世界杯比赛、观看录像带电影)。这些离散的记忆都强化了他对技术改变生活的认知。他与Lex Fridman都感叹现代人对技术进步习以为常,忘记了历史上取得的巨大飞跃。

Advice for young people

皮查伊向全球的年轻人提供建议。他认为成功的道路上固然需要运气和明智的选择,但更重要的是“倾听你的内心”,找到真正热爱的事情,因为热爱能让你发挥出最好的自己。其次,要努力与那些你认为比你更优秀、能“拓展你能力”的人一起工作,将自己置于不适但有助于成长的情境中。保持开放的心态去迎接这些挑战。

Styles of leadership

关于领导风格,皮查伊承认自己也会有愤怒和沮丧的情绪,但随着时间推移,他学会了如何最大限度地发挥员工的潜力。他倾向于激励那些有使命感、追求卓越、内心充满干劲的人。他发现发脾气通常效率不高,人们只是为了反应而做事,而非真正解决问题。他以足球中的“球员管理(man management)”为例,强调如何让团队成员发挥最佳水平。他指出,对于那些自我要求很高、犯错后比你更自责的人,需要区别对待。有时候,“不言而喻”的沉默也能传达信息,少即是多。

当被问及史上最伟大的足球运动员时,皮查伊明确表示是梅西(Messi),尽管他也非常钦佩克里斯蒂亚诺·罗纳尔多(CR7)的奉献精神。他将梅西的足球天赋比作一种难以言喻的天才和艺术性,认为这种 greatness 在体育中能被直观看到,是目前人工智能难以匹敌的。

Impact of AI in human history

皮查伊重申了他在多年前(大约2017或2018年)提出的观点:AI是人类有史以来最深刻的技术,其影响力将超过火、电等。他承认可能存在近因偏差(recency bias),但从第一性原理出发,AI的进步速度、潜力上限未知以及其递归自我改进的能力,使其与众不同。AI将极大地加速创造过程本身,能够独立改进和实现事物,这将对人类社会产生深远影响。

他讨论了人工智能可能带来的“AI包(AI package)”,类似于新石器时代农业革命带来的“新石器包”(包括陶器、社会等级、政府、贸易等一系列次生效应)。虽然大部分影响目前未知,但一个 tangible 的早期迹象是它将极大地促进创造力。通过AI,将头脑中的想法转化为现实(如编程、内容、游戏)将变得异常容易。这将“解锁”全球80亿人的认知能力,使数百万人、甚至数十亿人能够以更深入的方式进行创造和表达,远超互联网和博客时代的影响。

AI对传统创意产业和媒体(如播客、新闻)带来冲击,引发不安,但也驱动变革和进化。皮查伊认为,在人工智能生成内容充斥的世界中,人类特质(struggle, emotion, consciousness)的价值可能会更加凸显,就像人们更愿意看人类棋手下棋而不是Stockfish对AlphaGo。AI可能接管信息收集等效率性任务,而人类则专注于信息的内化、情感结合以及更深层次的探索。他预测AI将助力更多人成为创作者(如电影制作人),这是一种被低估的“扩张性”影响。

至于未来多少比例的“好内容”会由AI生成,皮查伊认为取决于具体内容类型。AI将成为像Google Docs一样的工具,被创作者广泛使用。

Veo 3 and future of video

皮查伊谈到了Google与电影界 visionary 人物(如Darren Aronofsky)合作开发Veo等视频生成工具。这些艺术家能够看到AI的未来潜力,并探索如何用它来表达创意。他认为,捍卫艺术自由表达是社会的重要价值之一,艺术家总是走在推动边界的前沿。Google的角色是提供工具和基础设施(就像提供电一样),让艺术家去使用和创造。虽然需要对内容负责并遵守社会规范,但在艺术表达方面应努力捍卫自由。

他赞赏了Gemini 2.5 Pro在处理历史暴力等敏感话题时表现出的客观、细致和深度,认为随着模型能力的提升,它们能够更好地理解并处理这些复杂问题,而不是依赖硬编码的规则。他强调,从科学第一性原理出发,让模型本身具备推理能力是正确方向,应允许用户更多地访问和定制原始模型。

他分享了Gemini生成的一个有趣问题:“杰米尼每个月能处理480万亿个token,隐藏在这巨大信息堆中的,最具改变人生意义的五个单词的句子是什么?”这体现了AI的潜力以及人类对知识的渴望,也让他想起Google Search过去带来的无数“顿悟时刻”。他提到Gemini处理的token量在过去12个月增长了50倍,达到480万亿,这印证了人类无穷无尽的好奇心。

Scaling laws

皮查伊和Google的研究者们(包括Demis, Koray, Jeff, Norm, Sergey)经常讨论扩展定律(scaling laws)。他认为目前仍有巨大的发展空间,Google在预训练、后训练、测试时计算、工具使用、Agentic能力等方面都在取得显著进展,模型正朝着更通用的世界模型方向发展(如Veo 3对物理世界的理解大幅提升)。他信任Google世界级的研究团队,认为未来一年仍将充满进步。

目前的限制主要在于计算资源(compute limited)。为了平衡模型能力和可用性(速度、成本),Google推出了Flash、Nano和Pro型号,Pro型号能达到Ultra型号80-90%的能力,但更快速且服务成本更低。下一代的Pro有望赶上前一代的Ultra。他指出,衡量模型“性能”越来越困难,因为实际影响(如延迟低带来的可用性)可能比纯粹的智能得分更重要,基准测试越来越难以捕捉模型的真实世界效用。

AGI and ASI

关于通用人工智能(AGI)和超人工智能(ASI)的时间表,皮查伊引入了“锯齿形人工智能”(AJI - Artificial Jagged Intelligence)的概念来描述当前状态——进步显著但仍存在明显的不足(如简单的计算错误)。他认为,无论如何定义AGI,到2030年,AI都将取得巨大的进步,我们将面临其带来的巨大积极和消极影响。虽然他认为离真正意义上的AGI(AI自认为达到AGI)可能还需要稍微长一些的时间,但届时AI的能力将令人震惊(如AI生成视频,需要社会建立规范区分现实)。

他回顾了Google Brain和DeepMind早期的工作(如识别猫的图片),当时人们预测需要几十年才能达到AGI。他强调,工具(TensorFlow)、代码共享(GitHub)、新思想(Transformer, Diffusion)以及推理阶段的创新都在加速这一进程。用户界面(UI)至关重要(引用shadcn的推文),模型如何呈现自己和与世界互动是关键。他甚至认为未来AI本身可能能够设计和改进自己的用户界面,因为它们具备编码能力并能更好地理解用户偏好。

P(doom)

皮查伊认真对待AI可能导致人类文明毁灭的“末日概率”(p(doom))。他认为,管理大型组织时,只要目标一致,几乎可以实现任何事情。虽然组织全人类的步调一致很难,但他相信如果“末日概率”真的很高,人类将空前团结,共同努力避免灾难。这是一种内在的自我调节机制。他对此持乐观态度,相信人类有能力应对这一时刻,尽管他认为潜在风险确实很高。Lex Fridman补充说,也需要考虑“没有AI的末日概率”,AI或许能帮助人类更聪明、更友善、更有效率,从而应对其他威胁(如战争、资源冲突),AI可能是拯救人类文明的关键。皮查伊对此表示赞同,认为AI将有助于解决一些最棘手的问题。

Toughest leadership decisions

皮查伊回应了去年外界对Google在AI竞赛中落后、质疑其领导力的文章。他指出,作为CEO,他最重要的赌注就是让公司全面转向“AI优先”,负责任地开发AGI并推出对人们有用的产品。尽管外界有质疑,他内心清楚公司正在构建什么(合并Brain和DeepMind,早期投资TPU)。他善于区分“噪音”和“信号”,会倾听外部有价值的反馈,但在关键时刻必须做出有远见和影响力的决策。

合并Brain和DeepMind是其中一个重大决策,这就像将顶尖大学院系合并一样困难,涉及到团队文化和个人愿望的协调(如Jeff Dean希望回归研究)。他感谢团队的共同努力,克服了挑战,整合了双方的优势。这个过程虽然伴随压力和不眠之夜,但他通过耐心和明确的方向引导团队。他强调,在会议中倾听所有人的意见非常重要,但这并不影响在必要时做出明确的、坚定的决定,并要求团队“不同意但承诺执行(disagree and commit)”。他认为这种清晰的决策风格能赢得尊重。

他提到除了Brain/DeepMind合并,成立AI基础设施团队也是重要决策,旨在扩大计算能力。他还强调了文化整合的重要性,鼓励团队在物理空间上聚集(如他经常去Gradient Canopy大楼看望研究人员),这种共同奋斗的能量在关键时刻发挥了作用。

AI mode vs Google Search

皮查伊谈论了在Google Search中引入AI模式和AI Overviews的决策。他认为这是Search产品不断演进的一部分,就像过去适应移动端一样。AI模式利用底层强大的技术,为用户提供更多的上下文和总结,并允许对话式互动。Google的核心设计原则是继续将用户引导至网络上的原创内容,AI层是提供额外价值。AI模式将提供最前沿的体验,而效果好的功能会逐步迁移到主搜索页面。

AI模式的一大亮点是其语言能力和“查询扇出(query fan-out)”功能。它能同时执行多项搜索并整合信息,特别是对非英语用户,它能够让母语网络内容有限的用户更容易访问和理解全球(主要是英语)网页内容,极大地扩展了他们的信息获取范围,释放了巨大的认知潜力。他提到AI Overviews已经显著改善用户体验,驱动了产品增长,AI模式的早期用户指标也非常积极。

关于广告,皮查伊表示早期AI模式将专注于有机体验。他认为广告的根本价值在于支持免费服务并提供商业信息,Google将广告视为信息的一部分并保持高质量标准。未来AI本身可能帮助优化广告形式,使其更符合新的交互模式。他提到Google也在探索订阅模式(如YouTube),未来产品的优化点可能发生变化。他认为AI模式不会完全取代传统搜索,而是会作为一种持续演进的体验,继续与用户驱动的网页内容相结合。

Google Chrome

皮查伊被Lex Fridman赞誉为Chrome的奠基人之一,认为Chrome是他心中最重要的软件产品之一。皮查伊回忆了Chrome诞生的时代背景(2004-2005年),当时AJAX等技术使网页变得高度动态(Flickr, Gmail, Google Maps的出现),但现有浏览器性能(特别是JavaScript执行)和架构(安全性、稳定性)已无法满足需求。Google看到了构建一个为“富动态网络”设计的浏览器的机会。

Chrome的核心愿景是将操作系统(Core OS)原则引入浏览器,实现更高的安全性(沙箱)、稳定性(独立标签页进程)和性能(快速JavaScript VM)。他提到丹麦奥胡斯团队开发的JavaScript VM比当时其他VM快25倍。将Chromium开源也是重要一步。皮查伊认为,Chrome项目是他经历过的最有趣的从零开始构建产品的过程,拥有非凡的团队。

他从Chrome的成功中得到的启发是“月球计划(moonshots)”的价值:瞄准非常宏大的目标会吸引最优秀的人才,因为很少有人敢于尝试,竞争较少,即使未能完全实现目标(达到60-80%),也能取得巨大成功。他认为人们并未完全理解这种高风险高回报策略的优势。

Waymo

Waymo是Google的另一个“疯狂月球计划”的例子,皮查伊对此深感自豪。他认为Waymo是机器人学的未来象征,早期就让他看到了未来图景。他赞扬了Waymo团队的毅力和坚持,在面临质疑时反而加大投入,专注于解决自动驾驶中最困难的“最后的20%”问题。尽管进程缓慢,但他坚信技术差距存在且Waymo正在不断进步。

他祝贺Waymo达成了1000万次付费Robotaxi出行,并强调Google作为一家深科技公司,热衷于解决这类问题。Waymo Driver是一种通用技术(L4/L5自动驾驶),可在多种场景应用。他不直接将Waymo与特斯拉竞争,认为两者都将在庞大的交通运输领域取得成功。他将自动驾驶汽车视为未来“AI包”中改变一切的重要组成部分,其影响将超越经济,触及社会文化层面。Waymo作为一个轮式机器人,其技术积累也将推动更广泛的机器人学发展(包括Google DeepMind正在推进的Gemini Robotics)。他表示机器人学领域因软件挑战受阻已久,AI的通用模型正在推动这一前沿。

Programming

皮查伊谈到AI在编程方面的显著进步(如Gemini的编码能力),以及程序员因此感到的担忧。他提供了Google内部的数据:目前30%的代码使用AI建议,更重要的指标是AI使整个公司的工程效率提高了10%。尽管如此,Google仍计划招聘更多工程师,因为新的AI能力拓展了可以完成的工作范围。

他认为AI工具将使编程中重复性的“ grunt work ”减少,让工程师能将更多时间花在设计、架构、解决复杂问题、与同事协作等更有趣和有价值的方面,从而提升工作满意度。AI也将降低编程门槛,吸引更多人参与创造,就像现在更多人下棋一样。他认为程序员应拥抱这些工具,成为更好的“增强型程序员”。尽管他承认某些个体的生产力提升可能远超10%,但他强调10%是整个大型组织的平均提升,意义巨大。未来Agentic能力的提升将带来下一波生产力飞跃。AI还能帮助标准化代码库、简化重构(refactoring),提升协作效率。他建议有志于编程的年轻人在大学学习计算机科学,因为CS远不止编程,基础原理思考至关重要,AI将影响每个领域。

Android

皮查伊将AR(增强现实)视为继GUI、多点触控、语音之后计算领域的下一个重要交互范式变革。他认为AR的普及依赖于AI的支持,以实现自然流畅的交互(Project Astra在Android XR中的作用)。他认为Android在XR领域拥有巨大机会,同时也在思考如何用AI重塑移动操作系统本身,使其更具Agentic能力,能够理解用户意图并主动提供帮助,而不仅仅是当前的应用程序和快捷方式模式。

他体验了Google的XR眼镜原型,赞赏其时尚、轻便的设计以及流畅的交互(如地图导航时低头看脚下和抬头看远方的平滑过渡,信息显示简洁不干扰现实)。眼镜内置Gemini AI,支持多模态对话和实时翻译(就像现实世界的字幕)。他还体验了Google Beam,一种革命性的全息远程临场技术,通过多个摄像头和AI模型生成3D视频,配合光场显示屏,提供令人惊叹的临场感和空间音频,能实现自然的眼神交流和肢体互动,极大地提升了远程会议和个人连接的质量。这些“月球计划”项目(Beam、XR眼镜)正日益接近现实,Google计划在未来几年内将XR眼镜提供给开发者和消费者。

皮查伊承认Google历史上曾取消一些有前景的项目(如Google Voice幸存让他很高兴),但他列举了Google多年来构建的众多革命性产品(Search、Chrome、Gmail、Maps、Android、YouTube、AdSense、Translate、Scholar、DeepMind、Waymo、Quantum Computing),这些产品都改变了世界。

Questions for AGI

Lex Fridman向皮查伊提出了一个假设性问题:如果Google成功构建了AGI,你会向它问什么问题?皮查伊认为AGI可能会主动告诉我们一些重要的事情。如果主动提问,他认为AGI将以令人惊讶的方式帮助我们更深刻地理解我们自己(个人层面)。此外,它也可能帮助我们更好地理解宇宙,拓展人类知识的疆界。Lex Fridman则表示他的第一个问题会是关于外星文明的数量及其性质,希望能得到费米悖论的答案。

皮查伊和Lex Fridman都认为,Google Search和AI模式(Gemini)等技术通过使知识更容易获取,极大地激发了人类的好奇心,让人类能够探索更多未知,从而使生活更加精彩。虽然难以量化,但这种知识的解锁和好奇心的满足提升了生活质量。

Future of humanity

面对AI日益强大的未来,皮查伊思考了人类的独特性。他认为,人类的意识、同情心、善良等特质构成了“人类的本质(essence of humanity)”,尽管未来界限可能模糊。他希望AI能使资源更加丰富,减少零和博弈的环境,从而让人类独有的价值更好地显现。他相信,AI将放大同情心、好奇心以及对事物意义的探讨。科学探索也将继续,人类将与AI一起发现新的问题并寻求答案。

皮查伊对人类文明的未来充满希望,他认为人类历史的进程是不断使世界变得更好的过程。他反问,如果选择出生的时代,他几乎总是会选择当下。人类文明取得了非凡的成就,并不断推动前沿。他相信,未来也不会例外,人类将集体迎接挑战。他与Lex Fridman都对当下充满感激,并对未来感到兴奋,认为Google及其团队的工作是这种兴奋的重要来源之一。

最后,Lex Fridman引用了法国哲学家Jean de La Bruyère的话:“困难中蕴藏着奇迹(Out of difficulties, grow miracles)”。

20250524 - #470 – James Holland World War II, Hitler, Churchill, Stalin & Biggest Battles

2025-05-26 03:50:43

好的,这是一份对 Lex Fridman 播客 #470 James Holland 对二战历史的逐字稿脚本进行的专业综述:

Lex Fridman 播客 #470 James Holland:第二次世界大战、希特勒、丘吉尔、斯大林与最惨烈的战役 综述

0:00 – Episode highlight

本集播客的亮点摘录中,历史学家 James Holland 以一组令人印象深刻的数字描述了诺曼底登陆日的巨大规模:共有 6939 艘舰船,其中包括 1213 艘军舰和 4127 艘登陆艇,另有 12500 架飞机参与行动。在 24 小时内,共有 155000 名士兵通过海路和空降登陆。Holland 称赞这一壮举“现象级”。

0:26 – Introduction

本集播客邀请了专注于第二次世界大战的历史学家 James Holland。他撰写了多部关于二战的杰出著作,尤其深入研究了西线战场,并提供了跨越战略、战役、战术、技术以及人类层面(包括个人经历)的细致分析。Holland 还与他人共同主持了一档关于二战的播客《We Have Ways of Making You Talk》。

1:13 – World War II

James Holland 在其著作《War in the West》第一卷中指出,第二次世界大战是现代历史上最大规模的灾难,导致超过 60 个国家的 6000 多万人丧生,城市被摧毁,国界重划,数百万人流离失所。尽管近年一些地区也经历动荡,但二战在全球范围内的影响和人类悲剧层面是无与伦比的。Holland 认为二战的独特性在于其真正的“全球性”,战火遍及沙漠、北极、海洋、空中、丛林、山区、海滩以及广阔的俄国草原和乌克兰。作为历史学家,他被战争中的“人类戏剧”深深吸引,常常思考如果自己身处其中会如何应对。他分享了采访老兵 Sam Bradshaw 的经历,这位老兵在战争中两次负伤,回家后发现一切都变了,感觉与家乡格格不入,最终选择再次入伍,并成为最早进入贝尔森集中营的士兵之一,这让他深刻认识到推翻纳粹主义的必要性。Holland 强调长时间访谈的重要性,认为这样才能触及核心,而非仅停留在表面。他指出,二战中绝大多数是普通人完成了非凡之事。Lex 和 James 讨论了为民族而战,尤其是面对纳粹德国明确提出的通过“饥饿计划”饿死数千万苏联民众,并以日耳曼人重新定居东方土地(生存空间 Lebensraum)的生存威胁时。

11:11 – Lebensraum and Hitler ideology

Holland 阐述了“生存空间”(Lebensraum)和“饥饿计划”对纳粹意识形态的极端重要性。他指出,纳粹党自始至终都深信存在一个全球性的“犹太布尔什维克阴谋”,认为他们是掌握世界命运的雅利安“主宰民族”,在第一次世界大战结束时被“背后捅刀”,因此必须进行一场生存之战来克服这一威胁,否则就没有未来。希特勒的世界观是绝对的非黑即白,“千年帝国”或“世界末日”,没有中间地带。他的信息的清晰简洁(“我们被背后捅刀,存在全球阴谋,我们是主宰民族,必须打败犹太和布尔什维克,否则没有未来,但胜利后世界将无比美好”)在当时对部分民众极具吸引力。扩张 Lebensraum 是这一思想的核心部分,目标是击垮布尔什维克和全球犹太势力,然后向东扩张,夺取欧洲大陆乃至亚洲的土地,特别是乌克兰的“欧洲粮仓”,用以富裕德国并安置雅利安人。Holland 强调,“巴巴罗萨计划”(对苏联的入侵)完全是纳粹意识形态的体现。试图将纳粹德国描绘成可以为了实用主义(如利用乌克兰民族主义者或犹太科学家)而背离其核心思想的观点,是完全忽视了这是一场意识形态战争的事实。

18:23 – Operation Barbarossa

播客深入探讨了 1941 年 6 月纳粹德国入侵苏联的“巴巴罗萨计划”,这是当时历史上最大规模的入侵行动,分为北、中、南三路大军。Holland 着重强调了“战役”(Operational)层面——连接战略和战术的中间层,包括工厂、经济、航运、供应链等后勤保障——对于这项宏大军事行动的生死攸关性。他指出,传统的二战史往往过度关注战略和战术,忽视了战役层面。不同国家根据自身特点(地理位置、规模)有不同的作战方法,例如岛国英国优先发展皇家海军(1939 年拥有世界最大海军),而美国则拥有两大洋,陆军规模很小(1939 年居世界第 19 位,夹在葡萄牙和乌拉圭之间),但拥有世界第二大海军。英美更倾向于使用技术、机械化和全球资源(“钢铁而非血肉”)来完成大部分任务,例如战略空袭。德国战争机器的致命弱点在于其机械化程度远不如表面所示,只有矛头部队(如党卫军师)实现了高度机械化,而绝大部分部队仍依赖马匹和步兵。他们在巴巴罗萨行动中使用了 2000 多种不同型号的车辆,后勤互操作性极差。尽管初期进展迅速,攻势很快就因补给线拉长、机械故障、苏联军队的焦土政策以及铁路轨距不同等问题而放缓。Holland 认为德军在 1941 年夏天的巨大成功很大程度上源于红军和苏联领导层的无能(斯大林无视警告,大清洗削弱指挥层)。他认为巴巴罗萨行动本不应如此接近胜利。斯大林在基辅战役中拒绝撤退导致数十万士兵被俘是灾难性的错误,但他随后很快吸取了教训。Holland 认为,即使德军集中兵力突破,也可能因后勤不济而失败。希特勒未能及时战胜英国,被迫提前在 1941 年进攻苏联,这改变了他的战略部署(原计划 1943 或 1944 年),也反映了他因之前胜利而产生的自负和对自身“天才”的过度自信。

34:36 – Hitler vs Europe

针对希特勒是否具备军事天才的问题,Holland 坚决否定。他指出,即使是入侵法国和低地国家的计划,其概念源于曼施坦因,执行者是古德里安,并非希特勒原创。荷兰认为法国在 1940 年的迅速崩溃,一半归因于德军的战役艺术的卓越,另一半则在于法国自身的失败和无能——指挥层老化保守、政治分裂导致缺乏行动意愿、对现代战争的准备不足(如总部缺乏无线电)。他强调法国尽管是欧洲最汽车化的社会,军事机器却异常迟钝,未能利用其技术优势。法国未能抓住德国入侵波兰后其西部边境空虚的巨大机会,发动有效的萨尔进攻,反映了其对一战创伤的规避风险心态和严重的军事自满情绪。相比之下,德国的成功很大程度上得益于其有效的宣传机器(特别是广播)和信息传播,由戈培尔主导,不断向民众灌输纳粹优越论和希特勒天才论,营造出德军不可战胜的心理威慑。这种心理战术,通过宣传制造的强大假象,削弱了敌方的抵抗意志。Holland 将这种利用新技术(当时的广播)进行重复洗脑式宣传的方式与当今社交媒体和 AI 驱动的信息战相类比,认为这种利用简单信息抓住民众心理的模式仍在重演,尤其是在经济危机和政治动荡时期。

56:22 – Joseph Goebbels

Holland 再次强调了约瑟夫·戈培尔在纳粹宣传中的天才作用。他描述了戈培尔如何从一个失意记者,受希特勒的拉拢和影响,成为纳粹意识形态的狂热追随者和党的宣传机器核心。戈培尔利用德国当时全球最发达的广播网络(1939 年 70% 家庭拥有收音机,公共场所也遍布),不间断地传播简单、煽动性的信息(“我们最好”、“犹太-布尔什维克是敌人”、“希特勒是天才”),并巧妙地融入娱乐节目,实现潜移默化的洗脑。这种重复和强化是纳粹获得民众支持的关键,尤其是在《凡尔赛条约》带来的耻辱和经济危机后,希特勒的愿景提供了希望。荷兰提到纳粹党在 1920 年代末一度陷入低谷,但 1929 年大萧条挽救了他们。他引用自己的观点,认为《凡尔赛条约》催生了希特勒,而华尔街股灾和大萧条将他推上权力巅峰。他指出,希特勒以少数票(1932 年 37%,1933 年 33%)上台,通过《授权法》迅速建立了极权统治,粉碎了政敌以为可以控制他的幻想。Holland 分析了希特勒简单、非黑即白的极端信息为何具有吸引力,因为它利用了德国民众对“共同体”(Gemeinschaft)和“前线共同体”(Frontgemeinschaft)、“民族共同体”(Volksgemeinschaft)的渴望,将人民团结起来,对抗设定的敌人(犹太人和布尔什维克)。他指出,希特勒在其著作《我的奋斗》中已明确表达了对战争的渴望和对弱势民族的蔑视(如对斯拉夫民族),这预示了未来的侵略和暴行。希特勒认为战争是自然状态,渴望通过战争证明雅利安民族的优越性,并对 1930 年代相对和平的领土扩张感到失望,认为这未能充分考验和展现德国的力量。

1:06:17 – Hitler before WW2

Holland 详细描述了德国在希特勒上台后如何暗中违反《凡尔赛条约》进行重新武装。包括在国外(如荷兰)生产军备部件,在苏联进行坦克训练,并在 1935 年正式宣布重建空军(尽管早在此前已在开发)。希特勒不断试探盟友的底线,而英法等国由于大萧条的影响,缺乏干预的意愿和能力,且认为《凡尔赛条约》条款可能过于苛刻,采取了姑息态度。这种软弱助长了希特勒的胆识,促使他在 1936 年大胆重占莱茵兰非军事区,此举本可以引发战争,但盟友再次退让。Holland 提到德军可能通过精心安排的空军展示(让少量飞机在不同机场重复出现)误导法国空军司令,夸大了其实力,从而增强了心理震慑。纳粹通过大规模的军事阅兵和宣传影片(如《意志的胜利》)向世界展现其力量和纪律性,给其他国家留下了深刻印象,使其在面对潜在冲突时犹豫不决。

1:11:12 – Hitler vs Chamberlain

播客重点讨论了 1938 年 9 月张伯伦与希特勒的三次会面以及最终促成《慕尼黑协定》的慕尼黑会议。Holland 认为对张伯伦的批评带有事后诸葛亮的色彩。他指出,英国与捷克斯洛伐克没有条约义务,法国才有。在 1938 年,高达 92% 的英国民众反对参战,作为民选首相,张伯伦面临巨大的国内压力。尽管如此,他自 1935 年起就积极推动英国的重新武装,特别是海军和空军的发展,并建立了世界上第一个完全协调的防空系统(雷达链)。荷兰强调了 1930 年代后期英国的全球地位——拥有庞大的帝国、世界第一的海军和商船队,以及战略物资储备。张伯伦是在这种强大背景下进行谈判的,他可能对希特勒抱有疑虑,但选择给予机会。他与希特勒签订的“和平在我们时代”协议被历史证明是天真的。然而,Holland 认为,当希特勒在 1939 年 3 月吞并整个捷克斯洛伐克时,张伯伦认清了现实,划定了底线,并与波兰签订了互助条约,这标志着外交政策的重大转变,也令戈林等德国高级将领深感忧虑。他认为,在 1938 年英国军事准备不足(战斗机数量有限,防空系统未完善)的情况下参战,很可能无法拯救捷克斯洛伐克,也无力进攻德国本土,因此张伯伦的选择虽然有争议,但在当时的历史背景下是可以理解的。他也提到,像丘吉尔这样后被视为强硬派的人物,在其他时期也曾对斯大林采取过绥靖政策。

1:33:18 – Invasion of Poland

Holland 重申,德国入侵波兰(1939 年 9 月 1 日)是可怕的行径,但法国未能趁德军主力在东方作战时,利用其强大的军队进攻德国西部边境,是一个“令人震惊”的失败。他认为,如果法军(也许有少量英军支援)当时全力进攻,极有可能迫使德国军事领导层反对希特勒,甚至可能推翻他。然而,法国的政治和军事领导层受一战创伤影响,行动迟缓犹豫。

1:37:55 – Molotov–Ribbentrop Pact

播客详细叙述了 1939 年夏天的《莫洛托夫-里宾特洛甫条约》。Holland 认为英法在 1939 年夏天未能认真与苏联谈判结盟,是比慕尼黑协定更严重的错误。英法对苏联的共产主义意识形态抱有敌意和不信任,担心苏联可能利用结盟机会染指波兰。他们派出了级别较低、缺乏授权的代表团进行谈判,态度傲慢,最终谈判破裂。这给了希特勒机会,他与斯大林达成了分占波兰的秘密协议,解除了德国在东方腹背受敌的担忧,使他可以放心进攻波兰。尽管这一协议是极度犬儒主义的,双方领导人可能都不完全信任对方,但它在短期内对双方都具有战略便利性。斯大林借此收回部分旧俄国领土并争取时间进行军事改革(应对大清洗造成的指挥层真空),而希特勒则得以放手对波兰发动攻击,并错误地认为英法不会为波兰开战。条约签订后,尽管英法宣战,但初期几乎没有军事行动,这让希特勒暂时得逞。Holland 认为,自 1933 年希特勒上台以来,纳粹德国与苏联之间的冲突是意识形态驱动的必然,只是时间问题。

1:45:56 – Winston Churchill

Holland 介绍了温斯顿·丘吉尔的政治生涯,他曾是英国政坛的杰出人物,但在 1930 年代因对政府政策的批评而处于边缘地位(“在野”),但他持续警告独裁者的威胁并呼吁加强武装。战争爆发后,丘吉尔重返内阁,担任海军大臣。张伯伦政府因在挪威战役中的表现受到质疑而下台。由于其他主要政治人物(如哈利法克斯勋爵)不愿承担重任,丘吉尔在 1940 年 5 月 10 日(德军入侵法国和低地国家同一天)临危受命,成为跨党派民族联合政府的首相。Holland 指出,丘吉尔当时并非众望所归,因其过去决策争议(如加利波利战役失败)和被视为“好斗者”而受到质疑,民众对他能否胜任战时领袖并无绝对信心。Holland 坚决驳斥了关于丘吉尔是“二战主要恶棍”或导致战争升级的说法,强调希特勒的侵略和种族灭绝计划是纳粹意识形态固有的,与丘吉尔无关。英国对波兰的承诺是基于维护国际秩序和抵抗独裁侵略的原则。他认为盟军的总体目标(打败纳粹和日本军国主义,实现罗斯福提出的“免于匮乏和恐惧的世界”)具有道德正义性,尽管战争手段(如战略轰炸造成的平民伤亡)存在复杂的伦理困境。他解释盟军“钢铁而非血肉”的原则,即大量使用火力、技术和后勤优势来减少己方士兵的伤亡,这解释了为何步兵在盟军总兵力中占比较低(14-15%)。他承认盟军在战争中犯过错误,但总体而言,他们更明智地运用了资源,并最终取得了胜利。他对过度简化历史人物(如片面神化丘吉尔)的现象表示担忧,认为这可能被用于合理化未来的军事干预。

2:09:56 – Most powerful military in WW2

讨论转向 1939 年世界主要军事力量的状况。海军方面,英国和美国位居前两位,法国、日本和意大利也有相当规模的海军。但意大利海军虽现代化,却缺乏航空母舰和雷达等关键技术,显示其整体准备不足。Holland 认为墨索里尼并不真正渴望全面战争,他更希望建立一个地中海和非洲的新罗马帝国,且其统治并未像希特勒那样完全掌握权力(意大利仍有国王)。墨索里尼选择与德国结盟是出于便利和对德国可能觊觎意大利的担忧,但他低估了战争的残酷性和自身实力,最终在 1940 年 6 月选择参战被证明是灾难性的,意军在北非遭到惨败。空军方面,1939 年德国空军(Luftwaffe)规模最大,日本空军(陆海军各有)则以飞行员素质高著称(训练时间远超英德飞行员)。法国空军纸面规模不小,但组织混乱、分散,导致无法集中兵力。荷兰详细赞扬了英国皇家空军(RAF)在 1930 年代建立的世界上第一个完全协调的防空系统(雷达链、观察员、控制中心、敌我识别系统 IFF)。这一系统使其在 1940 年不列颠空战中能有效预警和引导战斗机拦截德军,避免了机场被摧毁。尽管德军被宣传为不可战胜,但其战斗机航程有限,需为轰炸机提供护航,且机场易受攻击。英国在飞机生产上迅速超越德国(1940 年夏季单引擎战斗机产量比例达 2:1),并在战争后期通过与美国的合作和更优越的飞行员训练体系(更多飞行小时、更少中断)形成了压倒性优势。德国空军由于缺乏资源、训练不足和指挥混乱,在战争后期遭受巨大损失(例如 1944 年初大量飞机因事故坠毁),其传奇地位很大程度上源于闪电战初期的宣传和心理威慑。

2:32:18 – Tanks

Holland 提出二战在某种意义上是“工厂的战争”,生产能力至关重要。他对比了德国的虎式坦克(令人畏惧的强大武器,88 毫米火炮,重装甲)和盟军的主力谢尔曼坦克(M4 Sherman)。他认为谢尔曼坦克被低估了。尽管虎式坦克在火力防护上有优势,但其主要问题在于德国缺乏大规模生产能力(仅生产 1347 辆虎式,492 辆虎王),而谢尔曼坦克产量惊人(49000 辆)。更重要的是,谢尔曼坦克在实用性、可靠性和易维护性方面远超虎式。虎式坦克复杂、庞大、难以运输和维修,燃油消耗巨大,且需要大量训练有素的乘员。相比之下,谢尔曼坦克设计相对简单,盟军(尤其是美国)拥有大量会开车、懂机械的民众基础,使其更容易培训坦克兵。他分享了诺曼底一辆谢尔曼坦克通过速射高爆弹击中虎式炮盾导致内部崩裂,乘员受伤后投降的故事,说明不一定需要击穿装甲也能使敌方坦克失效。德国的设计虽然有时天才,但也存在不符合人体工程学的缺陷(如装填手位置)。战争后期,盟军在坦克数量和乘员素质上都对德军形成了压倒性优势。

2:42:17 – Battle of Stalingrad

Holland 认为斯大林格勒战役是二战东线战场的关键转折点,尽管他认为德国的失败早在 1941 年底美苏参战后已不可避免。1942 年夏天的“蓝色方案”(Case Blue)中,希特勒犯了战略性错误,将兵力分散,既要夺取高加索油田(后勤上几乎不可能实现),又要强攻斯大林格勒。对斯大林格勒的围攻将德军第六集团军拖入了残酷的巷战。Holland 强调,真正导致德军失败的是苏军由朱可夫策划、并由美国通过租借法案提供的卡车部队赋能的侧翼大纵深包围圈(“天王星行动”),而非巷战本身。第六集团军最终被围困并于 1943 年 2 月投降,对德国是巨大的心理打击。几乎同时,德军在北非(突尼斯)也遭受惨败(1943 年 5 月投降),损失的飞机甚至超过同期东线(包括库尔斯克战役期间)的损失。Holland 提醒,虽然德军在东线损失兵力最多,但西线和南线(地中海)同样具有重要的战略意义,不能因为伤亡数字的巨大而忽视其他战场的贡献。斯大林格勒的失败促使戈培尔发表“总体战”演说,但也反映了德国民众对战争前景的悲观,因为他们通过各种渠道(士兵来信、照片)对东方战线的残酷有所了解。

2:55:09 – Concentration camps

Holland 强调了二战东线与西线在暴行方面的差异,许多纳粹的种族灭绝行动(包括枪决和灭绝营)主要发生在占领的波兰和苏联领土,但奥斯威辛等营地也被纳入“大德意志帝国”的一部分。他提到自己制作的关于奥斯威辛演变史的播客系列,以及推荐了详细描述集中营体系的著作《KL》。Holland 讨论了理解大屠杀的两种视角:弗兰克尔《活出生命的意义》所展现的个体在极端邪恶环境中的精神挣扎,以及对“最终解决方案”实施细节的探究——邪恶是如何在日常 mundane 中实现的。他揭示了大屠杀的骇人细节:最初的大规模枪决因给执行者带来心理创伤,而转向使用毒气(如 Zyklon B),但这并非“人道”,而是对刽子手的“人道”,受害者在毒气室中经历极度痛苦和恐惧。他描述了抵达集中营的受害者遭受的羞辱和残酷分离,以及毒气室里的恐怖场景。Holland 深刻反思,德国作为一个拥有伟大艺术、文化、科学传统的国家,如何在短短十年内迅速滑向了令人发指的反人类暴行(大屠杀和东线的残酷行径),这警示人们和平与自由的脆弱性,必须警惕并珍惜。

3:04:40 – Battle of Normandy

Holland 详细讲述了诺曼底登陆(D-Day,1944 年 6 月 6 日)的准备与执行。盟军在 1941 年底决定开辟跨海峡第二战场,但由于初期准备不足(美军规模小且缺乏经验)和转向北非/地中海作战,登陆计划推迟到 1944 年 5 月(三叉戟会议 Trident Conference 确定)。诺曼底登陆的关键前提是盟军必须完全掌握西北欧的制空权,以阻止德军向滩头阵地增援。这依赖于摧毁德军机场和交通枢纽(桥梁、铁路),而这需要远程战斗机护航战略轰炸机深入德国腹地。P-51 野马战斗机(搭载梅林发动机后)具备了这一能力,到 1944 年 4 月盟军基本清除了德军空中力量,并在 5 月底将德军飞机推离滩头数百英里外。盟军在情报战中也占据优势,整合了多种信息来源(包括布莱切利园的密码破译成果)。Holland 称诺曼底登陆是“联合战争的顶峰”,多个盟国克服文化差异,为共同目标协同作战。他强调了登陆行动的巨大规模和复杂性(近 7000 艘舰船、上万架飞机、15.5 万人登陆),并指出其成功得益于细致的规划和后勤保障,包括大规模的扫雷行动(无一艘船触雷沉没)。尽管天气恶劣导致登陆部队遭受损失(加拿大部队按比例伤亡更重),诺曼底登陆仍是“毋庸置疑的成功”,建立了稳固的滩头阵地,标志着希特勒在西线失败的开始,加上东线同时进行的苏军“巴格拉季昂行动”,德国已陷入三线作战的绝境,盟军压倒性的兵力物资优势使得德国的失败不可避免。

3:18:32 – Lessons from WW2

播客以柏林战役、希特勒之死和德国投降结束。Holland 认为电影《帝国的毁灭》准确描绘了希特勒末日的情景。他指出大量资料(希特勒的言论、会议记录)使人们能清晰了解他在最后时刻的心态——在彻底失败面前仍带有对未来的幻想和自我辩护。Holland 总结了二战留给人类的主要教训:必须警惕个人掌握巨大权力可能带来的灾难性后果,必须及早识别和应对危机(如经济危机引发政治动荡),绝不能自满,要珍惜自由与和平的脆弱性,并认识到文明可能迅速滑向非人道的深渊(以德国为例)。他将乌克兰战争的场景与二战战场作比,强调战争的残酷性并未改变。尽管他认为不会再发生二战规模的全球大战,但他提醒人们不要理所当然地认为核武器不会被使用。最后,Holland 表达了对人类未来的希望,源于绝大多数人的善良以及人类解决问题的无限创造力。

20250520 - #469 – Oliver Anthony Country Music, Blue-Collar America, Fame, Money, and Pain

2025-05-20 23:41:04

以下是Lex Fridman播客第469集“Oliver Anthony: Country Music, Blue-Collar America, Fame, Money, and Pain”的专业综述:

Introduction

播客开场介绍了乡村音乐歌手兼词曲作者 Oliver Anthony(真名 Christopher Anthony Lunsford)。他的歌曲特别是热门单曲《Rich Men North of Richmond》让他全球闻名,成为许多无声者的代言人,表达了现代美国工人阶级的困境。Oliver Anthony 是他祖父的名字,他以此名致敬祖父以及祖父成长所在的20世纪30年代阿巴拉契亚地区的艰苦生活(“泥土地板,七个孩子,艰难岁月”)。Lex Fridman 强调 Oliver 是一个脚踏实地、谦逊且富有同情心的人。

Open mics

Lex 和 Oliver 谈论了在开放麦克风表演的经历。Lex 描述了在开放麦现场看到表演者全身心投入但观众寥寥的情景,赞扬了那种纯粹的艺术热情,无论是否渴望成名。Oliver 分享了自己在“破旧酒吧”参加开放麦的尴尬经历,包括因紧张而忘词、甚至中途离场。他提到西弗吉尼亚州的曼陀林演奏家 Johnny Staats,尽管获奖无数,仍全职在 UPS 工作,保持着内心的快乐,这与商业成功可能带来的改变形成对比。Oliver 回忆了自己早期的表演曲目,多是能引起观众共鸣和合唱的老乡村歌曲,如 Nitty Gritty Dirt Band 的《Fishing in the Dark》、John Denver 的《Take Me Home, Country Roads》和《Thank God I'm A Country Boy》等。他欣赏 John Denver 和 Roy Clark 的音乐中那种有趣、不把自己看得太重的精神。

Mainstream country music

讨论转向了主流乡村音乐。Oliver 认为,商业化的乡村音乐往往为了迎合市场而牺牲了深刻的内容,导致许多传统乡村音乐听众不再收听乡村广播。Lex 提出,大型音乐产业就像一个“机器”,过度包装和“打磨”艺术,反而抹杀了艺术家的灵魂和独特性。Oliver 表示赞同,认为将企业策略应用于艺术会带来负面结果。他们探讨了企业文化中的去人性化现象,员工为了保住工作(出于恐惧)而不得不压抑个性,变成“机器人”(提到“躺平”现象)。Oliver 认为这种企业思维甚至渗透到整个社会结构中,影响着食品、医疗、社交媒体等各个领域,导致社会问题,仿佛整个社会都在努力“不惹恼人力资源部女士”。Lex 提到了像 Jim Keller 或 Elon Musk 这样需要“混蛋”(用“龙卷风”作比喻)来推动创新和效率,打破官僚主义的僵化,尽管需要其他团队成员来弥补“龙卷风”造成的破坏。Oliver 认为波音公司(缺乏这种“龙卷风”)与 SpaceX 的对比印证了这一点。他们一致认为官僚主义会打击一线工作者的积极性,因为它缺乏真正的领导力和目标感。Oliver 发现这种功能障碍不仅存在于企业界,也蔓延到音乐产业的“机器”中。

Fame

对话进入了名声带来的影响和压力。Oliver Anthony 感到突然拥有影响数百万人的能力是一种重负,尽管他觉得自己是个“白痴”。Lex Fridman 也分享了成名带来的迷失感和孤独,面对来自不同角度的攻击、误解和谎言,这与他喜爱人群和对人性持有的乐观态度形成冲突。他提到了 Jocko Willink、Andrew Huberman 和 Joe Rogan 等朋友的支持。Oliver 认为名声改变了人际关系,即使他自己没有改变,他人与他互动的方式也发生了变化,这使得维护旧友谊和建立新关系变得复杂。Lex 表示赞同,提到他的朋友们对待他的方式变得不同,开玩笑少了(他认为这是男性表达爱意的方式)。与像 Joe Rogan 这样的名人朋友相处反而更容易,因为他们仍然会“损”他。Oliver 补充说,即使是去旧货店这样简单的外出活动,现在也与以前不同了。

Music vs politics

对话进入了音乐与政治的关系。Oliver Anthony 承认他的音乐(尽管他无意如此)被认为是政治性的。他认为许多在网上争论政治的人并非没有初衷,但他们常常陷入信息茧房,争论的是问题的表象而非根源。他希望政治领域能刮起一阵“龙卷风”,清除杂音,专注于真正影响人们生活质量的问题。Lex 和 Oliver 提到了 Jordan Peterson 的观点以及克尔凯郭尔关于“人群即非真相”的理念。根据克尔凯郭尔,人群倾向于从众和形成叙事,而忽略了个体的人性和诚实。Peterson 应用此理论建议表演者应面向个体而非群体。Oliver 将此联系到《Rich Men North of Richmond》的巨大成功,他对此感到“震惊”,认为人群来看他的表演不仅仅因为音乐,更是为了寻求一种更大的东西——一种团结或革命的情绪。他指出这首歌能够跨越政治分歧产生共鸣,这对于那些靠分裂人群获利的人来说是“可怕的”。他们都感到,无论左右,很多人都觉得自己失控,被困在去人性化的企业权力结构中(比如左翼认为掌权者欺压工人阶级,右翼认为“深层政府”欺压美国中部)。Lex 将过度的礼貌和官僚主义(以苏联和切尔诺贝利为例)视为危险,认为它们可能掩盖暴行,因此需要一定程度的“毒药”(引用 Tom Waits 的歌词),即粗鲁、不礼貌或强烈的真实情感来撼动系统。Oliver 认为这种虚假的、表演性的礼貌尤其令人恐惧,因为它模仿了真正的尊重但缺乏实质。

Rich Men North of Richmond

本节深入探讨了热门歌曲《Rich Men North of Richmond》的创作过程。Oliver 向 Lex 展示了他在 TikTok 上发布的一段早期视频(发布于2023年7月),视频中他只唱了几句后来成为这首歌核心的部分,当时的评论就预见到了它的潜力(例如“你应该把这首歌写完,可能会很流行”)。他解释说,这首歌的灵感源于他八年工业领域工作的经历,每天与蓝领工人交流,倾听他们的故事和困境。这首歌捕捉到了他以及许多其他人共同感受到的“真相”。他的创作方式主要是通过手机录制视频,反复修改和完善歌词和想法,而非传统的纸笔书写。他展示了其他早期歌曲的视频,如《I've Got To Get Sober》(发布于 TikTok,音频后来被用于 Spotify 等平台),这些都是他第一次完整演唱时的随性记录,后来也进入了排行榜。他提到 Radio WV 的 Draven Riffe 看到了他早期视频并主动联系他进行专业录制,尽管当时歌曲并未完全写好,Draven 却坚持要录这首歌。Oliver 形容 Draven 现在是他最好的朋友,赞扬了他创作流行歌曲的天赋以及发掘和呈现原始才能的眼光,Draven 做这一切源于热爱而非遵循常规模式。

Popularity, money, and integrity

讨论围绕歌曲爆火后的名声、金钱和个人操守。《Rich Men North of Richmond》于2023年8月8日发布后迅速走红,登上排行榜首位,获得数百万次观看和收听。Lex 引用了 Oliver 在8月17日发表的备受关注的帖子,其中 Oliver 提到收到了超过五万条关于痛苦(包括自杀、成瘾、失业、抑郁等)的信息,并 famously 拒绝了数百万美元(提到800万美元)的唱片合约。Oliver 在帖子中 stated 他不想要大型巡演、聚光灯或被“机器”控制,他的歌曲源于自身的痛苦,正是这种未经修饰的真诚触动了数百万人。Lex 高度赞扬了 Oliver 拒绝巨额财富的举动,认为这展现了非凡的正直和品格(“太史诗级了”)。Oliver 回应说,这个决定是受到了那些受苦信息的影响,他感觉与“大机器”签约会是一种“背叛”那些支持他的人(“那些人把这首歌放在那儿,不是别人”),他“憎恨大机器”并希望看到它崩溃。他也提到在成名前没有太多可失去,更关心的是帮助他人而不是金钱或名声。他依靠内心的“小声音”或良知来指导决定,视之为一种精神指引。Lex 强调 Oliver 是那些遭受痛苦的人的灵感来源,也是其他艺术家和普通人学习正直的榜样,他指出名声和财富是对个人品格的巨大考验,许多人会因此“出卖灵魂”。Oliver 认为失去正直就失去了一切,并强调保持内心稳定的重要性。他回忆起告诉 Jocko Willink “有目的的事都伴随风险”,自己发布歌曲时因预见到审查而感到恐惧。他从演唱会现场的团结中找到了希望,重申“我们(人性)总是比他们(权力结构)多”。他设想创建一个平行于腐败结构的系统,比如在非垄断场地演出,或通过利用闲置农田解决食品不安全问题(提到“食物不安全”一词是“饥饿”的委婉说法)。他强调美国的革命精神允许人们无需“油头油脑的公司混蛋”的许可就能解决问题,鼓励大家“只管去做”,并对垄断音乐产业的实体表示不满。他谈到了美国开国元勋多元的背景以及他们逃离暴政的共同愿望,这使得“人人生而平等”这样的理念得以诞生,认为现代美国人已经忘记了这一点。他将公司和国家权力结构联系起来,强调权力存在是因为人民允许它存在(无论是自愿还是疏忽所致)。

Blue-collar people

Lex Fridman 表达了希望通过在美国各地旅行与蓝领工人交流的愿望,这受到了 Oliver Anthony 过去工作经历的启发。Oliver 分享说,他收到的许多信息都以“嗨,我是一个无名小卒”开头。他对此感到沮丧,认为那些真正建设和维护社会结构的人(如水下焊工、工厂工人)常常被忽视,而一些“愚蠢、无关紧要、糟糕的人”却被奉为偶像。他强调了蓝领工作的艰辛和所需的技能,以及他们复杂多样的生活, arguing they are far more interesting and relatable than most celebrities who are “pretty boring and airheaded”。他分享了在一家名为 Perfect Air(现已关闭)的工厂与有犯罪记录或缺乏教育背景的同事共事的经历(提到一位名叫 Denise 的女士曾参与制造冰毒),描述了他们故事的丰富性。他渴望弥合文化隔阂,让这些人群被更多人看见和欣赏,并指出现代乡村音乐常模仿他们。他感叹农业、管道、电工等传统技艺的衰落,并相信通过展现这些行业可以改变其在文化中的地位,使其变得“酷”。他致力于在那些鲜有音乐演出的偏远小镇举办演出,创造一个不受公司势力腐蚀的“避难所”(sanctuary),提供负担得起的门票价格(去年通常是25美元,并因此被业内人士嘲笑),以确保工薪家庭能够负担,他注意到许多穿着旧衣服的孩子因此能够前来观看演出。他的愿景是每年建立约20个这样的场地,为服务不足的地区提供持续的音乐和社区构建机会。他还提到希望有机会去监狱和戒毒所演出,并与刑满释放人员交流,认为他们也有着重要的故事。

Depression

Oliver Anthony 分享了他人生最低谷的经历,主要集中在成名前的抑郁和酗酒时期。他解释说,这种状态不完全取决于外部环境,更多是源于他对自身处境的认知和缺乏目标感。他讲述了自己17岁辍学离家、少年得子、从事艰苦工作以及感觉没有活出最好的自己,这些经历导致了长期的消沉。他将抑郁描述为一种“压倒性的麻木感”,让人对曾热爱的事物失去意义。他认为自杀,尤其是男性自杀,往往是长期负面自我评价和逃避责任累积的结果,形成一座难以攀登的“大山”,而自杀似乎是唯一的“捷径”,尤其当感知被扭曲,爱和希望变得“隐形”时。他指出男性常善于伪装痛苦,以及蓝领工人自杀率高的现象。他 connect his recovery to finding faith (“something bigger than me that loved me”) and quitting drinking, which allowed for honest self-reflection. He emphasizes the beauty of seeing people recover and finding hope, even amidst financial and personal struggles。他 stresses the importance of support structures and real-life connections, noting that digital communication (social media) only shows the “best of people,” hiding common struggles and loneliness。他谈到失业或失去伴侣会摧毁许多人的支持系统,使生活难以为继,以及将自我价值感完全寄托在他人身上的危险。他 concludes that while human connection is vital and makes life worth living, there’s a base layer of being alone, requiring inner strength and potentially faith in something larger (like God) for resilience。Hardship and betrayal, while painful, can also lead to valuable life lessons and creative output (heartbreak songs)。他提到很多人(包括他自己)在服用药物方面对自己不如对宠物尽责,反映了低自尊。他认为,当一个人连基本的自我照顾都无法做到时,很容易认为自己毫无价值,更难以面对生活中的挑战,而到达这个地步是一个漫长而悲惨的过程。

Nature

Oliver Anthony 建议,对于有自杀倾向的人来说,走进大自然可能会有所帮助。他分享了自己卖掉房子、购买地产、住在露营车里过半自给自足生活的经历(2019年以每英亩约1100美元的价格购买了92英亩土地),将其视为一种逃离现代数字生活“反乌托邦噩梦”的“逃避形式”。他感到一种回归简单生活的召唤,灵感来自祖父那一代的生活方式。他在耕种、饲养动物获取肉食(鸡、猪、羊、山羊,计划养牛)、种植作物和植物中找到了乐趣和目标感,强调其中的滋味和成就感。他最近购买了一个永续农业农场,梦想建立一个“疗愈中心”,让人们通过与大自然重新连接来疗愈心灵,并可能与 Robert Kennedy Jr. 合作推出这个项目。他描述了与动物相处(尤其是大型动物,用于心理健康治疗)以及观察自然界有序、确定的系统所带来的治愈效果,这与文明世界的混乱形成对比。这种观察帮助他重新树立了对某个更大存在的信心(“总有比我更大的系统存在”)。他在树林中的静谧、溪流声中找到了宁静。Lex 分享了他在亚马逊丛林独自度过的经历,将其描述为一种强烈、混乱但有结构的生命“管弦乐”,并指出电锯声象征着人类对自然的破坏。Oliver 对城市扩张侵占自然感到痛心,认为这“不好”。他 recounts the challenging process of acquiring and developing his property (a mile off the road, had to clear an old logging road), which strained his marriage but ultimately felt like the beginning of his “restoration。” He believes many people miss out by living solely in urban/suburban areas without experiencing nature。他对比了技术日益沉浸和上瘾(“刷屏”,算法最大化参与度,视频游戏)与现实世界(城市衰败)的退化, arguing technology is becoming more fun while real life becomes less so。他认为当前处于一个短暂的窗口期(2025年这个“呼吸般的时间”),人类仍需要技术多于技术需要人类,这为整合提供了可能,但他 fears losing touch with reality permanently, leading to a world where “All there’s going to be is Girls on Instagram。” He suggests identifying online interests related to manual skills (wood splitting, plumbing, blacksmithing) and creating real-life opportunities for people to experience them。Lex agrees on the danger of Silicon Valley “bubbles” and the need to bridge the gap between tech builders and those in the “real world” to ensure technology preserves humanity and promotes flourishing, not just engagement。

Three-legged cat

Lex Fridman 询问 Oliver Anthony 在 Instagram 上提到的那只三条腿的猫。Oliver 确认此事并讲述了故事:他一位养猫的邻居发现一只小猫被卷入引擎盖下,前腿几乎完全被扯断,缠在水泵皮带轮里。Oliver 和做兽医技术员的妻子用一把刀切断了仅剩的组织救出了小猫。他们花费了一千多美元为小猫治疗,确保它能康复。Oliver 给它取名“Hop”。他解释说,他无法眼睁睁看着这只小生命死去,他总是倾向于看到生命中的美好并施以援手。Lex 评论说,在有那么多动物遭受痛苦时,花费巨资救助一只猫似乎不理性,但这恰恰展现了人类的特别之处——愿意为眼前具体的个体付出巨大努力。Oliver 表示赞同,并将其与人类如何能在彼此的缺点和分歧面前展现无条件的爱和同情进行类比,尽管这种情感对动物更容易流露,因为它们看起来无辜且没有政治立场。Lex 随后朗读了 Charles Bukowski 的诗歌《一个硬汉母亲的史诗》(The History of One Tough Motherfucker),讲述了作者救助一只伤痕累累流浪猫的故事,将诗歌内容与 Oliver 的经历及其音乐/人生旅程联系起来,认为二者都展现了生命的坚韧,以及从苦难中汲取力量和意义。

I Want to Go Home (live performance)

Oliver Anthony 准备弹唱他的歌曲《I Want to Go Home》。他解释选择这首歌是因为它与之前讨论的主题(对现代世界的不适、寻求回归、信仰、失去传统生活方式等)相关。随后他进行了现场表演。歌词表达了对现代世界的困惑、对旧日生活的怀念、对战争和缺乏信仰的担忧,以及对上帝和狗狗的依靠。

Guitar backstory

Oliver Anthony 讲述了他使用的吉他——由马里兰州的 Paul Beard 手工制作的共鸣器吉他 (Beard Guitar)。他解释说,在《Rich Men North of Richmond》走红后,他之前视频中使用的300美元 Gretsch 共鸣器吉他的拾音器出了故障,导致一根弦无法拾音。为了应对大型演出(高达1万人),他不得不临时采用外接麦克风方案,但这不可持续。Paul Beard 联系了他,不仅修好了旧吉他,还赠送了他这把定制的手工吉他。他描述这把吉他坚固耐用。他提到这把吉他比普通吉他重,并且音调调低了一个全音阶。他解释说,这种调弦方式加上共鸣器琴体,营造出一种他喜欢的老派音色,类似于20世纪30年代弗吉尼亚的蓝草和民间音乐(受到他家族 Ingle 姓氏的影响,他们来自接近 Carter Family 故乡的地区)以及老蓝调音乐。他偏爱略微失准、音色醇厚的琴弦,认为这能唤起那个时代的感觉,这与他使用祖父的名字“Oliver Anthony Music”来代表这种音乐风格和情怀是相符的。

Playing live this year

Oliver Anthony 谈论了他本年度的现场演出计划。他的主要目标是避开由垄断公司(如 Ticketmaster 和 Live Nation)控制的大型场馆,转而在传统场所之外寻找新的演出地点,例如大城市郊区的农场或主要街道。他计划与当地组织者合作,以专业方式建立这些非常规场地(包括出入口、安保等),使其成为可以被其他艺术家租用、不受商业机构影响的独立空间或社区中心,可能由城镇或农场主通过非营利组织管理。他强调会提供负担得起的门票价格(去年通常是25美元),以确保工薪家庭能够参加,并分享了去年低价门票对观众产生的积极影响。他的愿景是每年建立约20个这样的场地,为服务不足的地区提供持续的音乐和社区构建机会。他询问 Lex 今年有何计划,Lex 表示期待出国旅行(包括印度),通过了解不同文化和人群来满足他对人类的热爱。Oliver 邀请 Lex 前往他在弗吉尼亚/西弗吉尼亚的地产,体验大自然和宁静,他提到了最近尝试使用裸盖菇素来缓解舞台焦虑和改善心理健康,并分享了在大自然中结合信仰寻求平静的体验。他们深入探讨了观察自然界复杂有序的系统所带来的深刻感受和安宁,这与人类世界的混乱形成对比(Lex 提及亚马逊丛林中生命原始的暴力与喜剧)。他们反思人类本性与动物的相似性(引用 Jordan Peterson 的“龙虾”类比),并讨论孤独感是当前社会的一个主要问题,数字连接并不能取代现实生活中的人际连接。他们一致认为,尽管网络制造了分裂的假象,但人们之间有更多共通之处,需要面对面的交流来解决问题和理解彼此。他们也谈到了美国政治中的两极分化,以及对掌权者的不信任,认为权力来自人民的允许,而“我们(无名小卒)总是比他们(掌权者)多”。

20250505 - #468 – Janna Levin Black Holes, Wormholes, Aliens, Paradoxes & Extra Dimensions

2025-05-06 09:10:48

(0:00) – Episode highlight

Janna Levin 描述了双黑洞系统如何通过环绕运动扭曲周围时空。当黑洞运动时,时空的曲率必须跟随它们,但这种影响的传播速度不能超过光速,从而产生了时空本身的波动,即引力波。这两个黑洞最终会合并,尽管存在时间膨胀效应,但由于它们质量巨大,对时空的扭曲非常显著,合并过程并非无限长。合并过程中,两个事件视界会发生扰动并融合成一个更大的黑洞。合并后的黑洞会通过引力波辐射掉其“不完美”之处(如形状的不规则性),最终稳定为一个旋转的、宁静且完美的黑洞。根据质能方程 E=mc²,合并后最终黑洞的质量会小于初始两个黑洞质量之和,损失的质量以引力波能量的形式辐射出去,表现为时空的“振铃”。Levin 强调,引力波并非我们通常所理解的光(如X射线、伽马射线、可见光等电磁波),而是时空形态本身的涟漪,这个过程是完全黑暗的。她进一步指出,引力波有时被类比为声音,理论上,如果距离两个碰撞的黑洞足够近,它们产生的时空振荡频率可能落在人类的听觉范围内,即使在真空中,这种时空波动也可能挤压和拉伸耳膜,使人“听”到引力波。

(2:03) – Introduction

Lex Fridman 介绍了本期嘉宾 Janna Levin,一位专注于黑洞、额外维度宇宙学、宇宙拓扑结构以及时空引力波的理论物理学家和宇宙学家。他还提及了她撰写的几本著作,包括探讨宇宙形状和大小的《宇宙如何获得斑点》(How the Universe Got Its Spots),讨论天才、疯狂与知识极限的《疯子梦见图灵机》(A Madman Dreams of Turing Machines),讲述LIGO探测引力波故事的《黑洞蓝调及来自外太空的其他歌曲》(Black Hole Blues and Other Songs From Outer Space),以及关于黑洞的《黑洞生存指南》(Black Hole Survival Guide)。Fridman 预告这将是一次有趣且引人入胜的对话。

(3:03) – Black holes

对话开篇,Levin 引用了物理学家 Sidney Coleman 关于早上 9 点会议的俏皮话,暗示了理论物理学家(及 Lex 本人)偏爱深夜工作的习惯。Levin 认为深夜是“偷来的时间”,宁静且无干扰,适合深度思考。随后,话题转向黑洞。Levin 指出,人们常将黑洞的形成方式(大质量恒星死亡)与黑洞的概念本身混淆。实际上,黑洞的概念比恒星死亡状态更普遍、更基础。她追溯了黑洞概念的起源:1915-1916年,爱因斯坦刚完善广义相对论,身处一战东线战壕的天文学家卡尔·史瓦西 (Karl Schwarzschild) 解出了爱因斯坦方程的第一个精确解。史瓦西的解是一个思想实验,设想将恒星所有质量压缩到一个点(并未考虑如何实现),然后推导时空会如何响应。这个解预言了一个边界——事件视界 (event horizon),即连光也无法逃脱的区域。Levin 强调,事件视界才是黑洞的本质,它并非一个物质实体,而是一个时空中的区域或表面,标志着内外事件的因果分离:内部事件无法影响外部,而外部可以影响内部。事件视界本身是空无一物的时空区域,更像一个“地方”而非“物体”。爱因斯坦对此解很感兴趣但认为自然界不会形成这种东西,史瓦西可能也持相同看法,他们当时更像在解决理论数学问题,而非描述后来被证明是引力坍缩终点的天体现象。Lex Fridman 补充说,这类思想实验的目的可能是探索理论的极限和适用范围,而此例恰好预言了极端天体的存在。Levin 赞同,指出史瓦西解在远距离也很好地描述了太阳(虽然牛顿理论足够),同时确实预言了黑洞现象,并且其中心奇点的存在也暗示了理论自身的局限性。她提到罗杰·彭罗斯 (Roger Penrose) 证明了引力坍缩形成黑洞后奇点的不可避免性,但彭罗斯也认为这可能只是忽略了量子力学的结果,引入量子力学后奇点问题或将得到不同理解。普遍观点认为,越接近奇点,量子力学效应越重要,经典理论失效,奇点本身可能并不存在,而是被某种量子结构取代。

(10:37) – Formation of black holes

Levin 重申她倾向于将黑洞描述为“无物”(no thing),而非通常认为的超高密度物质。她认为这种“空无”是黑洞更深刻的方面。即使是通过混乱的天体物理过程形成,最终留下的黑洞本质上也是“无物”。她回顾了奥本海默 (Oppenheimer) 的重要理论工作,他在思考核物理和量子力学(最初是关于恒星为何发光等“乌托邦式”问题)时,提出了恒星坍缩形成黑洞的可能性。大质量恒星(如大于太阳质量20-30倍)耗尽核燃料(氢、氦等聚变至铁核后停止)后,无法抵抗自身引力而快速坍缩。坍缩引发冲击波,导致超新星爆发,将重元素(如碳、氧)抛洒到太空(构成生命的基础)。核心残骸若质量不够大,可能形成中子星(一种真实、超密但比同等质量黑洞体积大的物体)。若核心质量超过约两倍太阳质量,则会进一步坍缩形成黑洞。奥本海默及其学生在1939年发表论文,预言黑洞是引力坍缩的终点,这是一个极具远见的结论。然而,论文发表当天恰逢纳粹入侵波兰,因而未获广泛关注。Levin 感叹科学的“不可知论”性质,研究恒星核物理的初衷并非制造武器,但最终与原子弹技术相关(Lise Meitner 发现核裂变证实 E=mc²)。她提到1939年时,“黑洞”一词尚未出现,人们用冗长术语描述引力坍缩的终点。她描述了恒星坍缩过程:一个比太阳大得多的恒星,其核心(可能仍有10倍太阳质量)坍缩到约60公里直径时,时空曲率变得极其巨大,光无法逃脱,事件视界形成。但恒星物质本身并不能停留在视界上,而是继续向内坠落,穿过视界,“消失”在黑洞内部(去向未知)。事件视界作为一种时空印记被留了下来。约翰·惠勒 (John Wheeler) 有句名言比喻此过程:“恒星如同柴郡猫,消失不见,只留下它的引力(如同猫的微笑)。” 据传,1967年惠勒在一次演讲中反复使用冗长的描述后,听众中有人建议“黑洞”一词,惠勒随后推广了这个术语。Lex Fridman 赞赏“黑洞”、“大爆炸”这类直观深刻的术语,并指出奥本海默1939年的论文仅有两三页,简洁而震撼。Levin 补充道,惠勒最初曾长期反对奥本海默关于黑洞形成的结论,认为其模型过于简化,后来通过计算机模拟才承认奥本海默是对的。据说当惠勒公开宣布黑洞确实是大质量恒星引力坍缩的可能终点时,奥本海默表示自己已转向其他研究领域。

(21:28) – Oppenheimer and the Atomic Bomb

Lex Fridman 询问 Levin 作为研究科学背后人物的物理学家,如何看待物理学家集体创造原子弹这一人类历史时刻。Levin 认为这是科学史上一个极其痛苦的时刻。她提到关于海森堡(留在纳粹德国研究核武器)可能故意拖延的说法已被证伪。她强调当时科学家面临的巨大压力,以及做出参与或不参与武器研发的艰难抉择(引用玻尔的话)。她指出,如今绝大多数理论物理学家反对核武器扩散。Lex Fridman 提出一个反事实思考:如果纳粹德国或苏联先造出原子弹,世界将截然不同,美国的成功可能是“最不坏”的结果。Levin 同意,但认为不存在“无核弹”的博弈结果。她进一步分析,美国成功的概率可能高于三分之一,因为大量科学家为逃离欧洲的压迫而来到美国,他们带着对自由的向往和对欧洲威胁的深刻理解,这为美国的科研环境注入了强大动力。她强调维护思想自由和活跃辩论对保持美国科学领先地位至关重要,许多诺贝尔奖得主(尤其来自纽约布朗克斯区的粒子物理学家)都是欧洲移民。对话回到科学由复杂、有优点缺点的人类完成这一主题。

(27:50) – Inside the black hole

Lex Fridman 请求 Levin 再次阐释恒星坍缩成黑洞时,“超密物质”如何转变为“无物”。Levin 解释,如果你正在坠入黑洞,当你穿过事件视界时,局部感觉不到任何异常,因为那里没有标记。但可以做一个思想实验:在恰好穿越视界时向外发射一道光脉冲,这束光会“卡”在事件视界上,相对于你以光速离去,但对于外部观察者,它悬停在那里,如同逆流游泳的鱼停在瀑布边缘。由于物质本身无法以光速运动,恒星物质会继续向内坠落,越过事件视界。一旦越过,其内部发生什么(如物质与反物质湮灭成光子)对外部观察者来说是不可知的。 关于黑洞内部的物理模型,Levin 表示虽然无法直接观测,但可以探讨数学理论的预测。一个核心概念是,在黑洞内部,空间和时间的角色在某种意义上互换了。从外部看,奇点是空间中的一个点(球心);但对于坠入者来说,奇点变成了时间上的一个点——未来。坠入者无法避免撞向奇点,就像无法避免时间流逝一样,任何规避动作(如试图环绕、反向加速)都无效。对于恒星级黑洞,从穿越视界到撞击奇点大约只需几微秒。 从外部观察者的视角看,当朋友坠入黑洞时,由于时空相对旋转效应,朋友的时间相对于观察者会显著膨胀(变慢)。越接近事件视界,这种效应越强,最终在视界上,朋友的时钟在观察者看来似乎完全停止了。观察者可能会看到朋友的身影在视界附近悬停了极长时间(甚至几千年),而朋友自身经历的时间可能只有几分钟。虽然理论上无限红移导致朋友的身影永远停留在视界,但由于朋友本身有质量,会对时空产生微扰,导致事件视界发生“抖动”并最终在有限时间内将其“吸收”。 对于坠入者自身而言,穿越过程可能非常平稳,尤其对于超大质量黑洞。黑洞越大,事件视界处的时空曲率越平缓(类似站在地球上感觉不到曲率,而站在篮球上则明显),坠入者可能根本意识不到自己已经越过了不归点。进入黑洞内部后,体验可能并非黑暗,因为来自外部宇宙的光线会被引力聚焦并一同向内坠落,最终在接近奇点时汇聚成一道极其明亮的闪光,坠入者可能会在瞬间看到整个星系乃至宇宙的演化历史,但这之后必然是毁灭。坠入过程的时间长短取决于黑洞大小,对于超大质量黑洞,坠入者可能在内部存活数月才到达奇点。

(40:53) – Supermassive black holes

Levin 澄清,并非所有黑洞都由恒星坍缩形成,这更说明黑洞是宇宙中一种更基本的现象。超大质量黑洞 (SMBHs) 的质量可达太阳的数十亿甚至数百亿倍。它们的形成机制尚不完全清楚,但现有理论认为宇宙年龄不足以通过恒星级黑洞不断合并来形成如此巨大的SMBHs。更可能的解释是,它们形成于宇宙极早期(大爆炸后约数亿年),由原始物质云直接引力坍缩而成,而非经过恒星阶段。几乎每个星系的中心都存在一个SMBH,它们并非罕见,且与星系的早期形成过程紧密相关,存在着深刻的相互影响(例如黑洞驱动的喷流可能塑造星系形态、调节其生长)。关于是星系先形成还是SMBH先形成(鸡生蛋还是蛋生鸡的问题),目前仍在研究中,可能涉及早期大质量恒星(仅由氢氦构成)的形成、黑洞的增长以及周围气体云演化为星系盘等复杂过程。

(44:22) – Physics of spacetime

Lex Fridman 询问如何理解和想象时空,特别是将时间视为第四维度。Levin 解释,虽然我们无法在三维空间中真正可视化四维时空(3个空间维度+1个时间维度),但可以通过数学方法处理。例如,可以抑制一个空间维度,在二维纸面上绘制时空图。然而,需要注意的是,真实的物理时空并非简单的欧几里得空间(所有维度等价且正交),而是闵可夫斯基时空。这意味着时间维度的性质与其他空间维度不同。我们在纸上绘制时空图时,就像在平面地图上绘制球形的地球一样,是一种投影和变形。只要我们理解并使用正确的规则(闵可夫斯基度规)来计算距离和时间间隔(时空长度),就能准确描述相对论效应(如时间膨胀、长度收缩),尽管视觉呈现上存在扭曲。

(47:25) – General relativity

Levin 阐述广义相对论 (GR) 的核心思想:物质和能量(方程右侧)决定了时空的几何形态(弯曲程度,方程左侧),而时空的几何形态则指导物质和能量如何运动(沿着测地线“下落”)。爱因斯坦的贡献在于提出了这个普适的框架(范式),而非仅仅找到个别解(如史瓦西解)。史瓦西在爱因斯坦发表最终方程一个月内就找到了黑洞解,这本身就非常了不起。GR 框架极其强大,能推导出各种惊人的现象,如宇宙膨胀(最初让爱因斯坦本人都感到意外)、引力透镜效应等。她再次提到,爱因斯坦最初抗拒宇宙膨胀等理论推论,部分原因在于当时(1915-16年)人们甚至不知道银河系之外还存在其他星系(直到哈勃在1920年代末确认)。这凸显了爱因斯坦在信息极其有限的情况下,通过坚守基本原理(如光速不变)做出理论突破的非凡之处。

(52:56) – Gravity

Levin 探讨爱因斯坦如何构想出弯曲时空的概念。她认为关键在于爱因斯坦对一些基本原理的坚持,例如光速不变原理。实验表明光速不依赖于观测者或光源的运动状态,这与日常经验(如相对速度叠加)相悖。爱因斯坦没有试图修改光速不变,而是大胆假设:如果速度(距离/时间)是恒定的,那么距离(空间)和时间本身必须是相对的、可变的。另一个关键是等效原理(爱因斯坦“最快乐的思想”):在局部区域内,引力效应与加速效应无法区分。例如,在自由下落的电梯中,人会体验到失重,这与在无引力的太空中漂浮无异。Levin 强调,这种自由下落(失重)状态才是引力最纯粹的表现形式。我们平时感受到的“重量”是由于地面、椅子等物体通过电磁力阻止我们自由下落。因此,物体的自然运动是沿着时空中的弯曲路径(测地线)自由下落。地球绕太阳公转、国际空间站绕地球运行(关闭引擎后)都是自由下落的例子。是地球(或太阳)的质量弯曲了周围的时空,物体只是沿着这些预设的弯曲路径运动。这解决了牛顿引力中“超距作用”的困惑:苹果并非被地球“隔空吸引”,而是当树枝不再支撑它时,它开始沿着地球质量所造成的时空弯曲路径自然下落。Levin 赞赏牛顿和爱因斯坦等科学家保持孩童般的好奇心,敢于质疑看似理所当然的现象(如牛顿对超距作用的不解),这种不满足和追问是推动科学进步的动力。对话中还讨论了科学前沿的未解之谜(如生命起源、意识),认为这些领域可能也需要类似广义相对论那样的范式转换才能突破。

(1:09:29) – Information paradox

Levin 指出,黑洞具有“无毛定理”(no-hair theorem) 所描述的完美特性:其外部性质仅由质量、电荷和自旋三个参数决定,就像基本粒子一样,无法区分两个具有相同参数的黑洞。这种基本粒子般的特性使得黑洞成为探索基础物理(特别是量子引力)的理想“实验室”。信息悖论正是源于将量子力学初步应用于黑洞视界附近时出现的矛盾。霍金 (Stephen Hawking) 的计算表明,由于视界附近的量子真空涨落(虚粒子对的产生与湮灭),事件视界会拆散粒子对,其中一个粒子落入黑洞(携带负能量,导致黑洞质量减少),另一个逃逸(成为霍किंग辐射)。这个过程导致黑洞缓慢蒸发。关键问题在于,霍金辐射被认为是完全热辐射,不携带任何关于落入黑洞物质的特殊信息(除了总质量等宏观参数)。这意味着当黑洞最终蒸发殆尽时,所有落入其中的信息(量子态)似乎都随之消失了,这严重违反了量子力学的一个基本原则——幺正性(要求信息守恒)。这个悖论引发了所谓的“黑洞战争”,争论的核心在于:是广义相对论关于视界的描述不完整,还是量子力学的基本原理在强引力场下失效?这个悖论被认为是通向量子引力理论的重要线索,任何成功的量子引力理论都必须能够自洽地解释黑洞的熵、温度以及信息问题。

(1:17:59) – Fuzzballs & soft hair

Levin 讨论了信息悖论的几种可能解决方案。 1. Fuzzballs (毛球模型): 源于弦理论,认为黑洞并非经典描述的奇点加事件视界,而是一个没有真正视界、没有内部的、由弦和膜构成的复杂、模糊的量子“毛球”,其大小约等于经典视界的大小。信息从未真正落入一个经典意义上的内部区域,因此也就没有信息丢失的问题。Levin 对此持保留态度,认为这否定了平滑穿越视界的可能性。 2. Soft hair (软毛): 对经典“无毛定理”的修正,认为黑洞可能携带极其微弱的量子“毛发”,这些“毛发”是视界附近的低能量子激发(如软引力子或软光子),它们可以编码落入物质的信息。这种方案试图在现有量子场论框架内解决问题。Levin 同样对此表示怀疑,认为这种“毛发”是否足以携带并释放所有信息仍是问题。

(1:21:10) – ER = EPR

Levin 认为 ER=EPR 可能是解决信息悖论最有前景的方向。这个猜想由 Maldacena 和 Susskind 等人提出,核心思想是量子纠缠 (EPR, Einstein-Podolsky-Rosen) 与时空几何中的虫洞 (ER, Einstein-Rosen bridge) 之间存在深刻联系。 在讨论 ER=EPR 之前,需要理解全息原理 (Holography)。该原理(由 't Hooft 提出,Susskind 和 Bekenstein 等发展)认为,一个区域(如黑洞内部)所能包含的最大信息量(熵)正比于该区域边界的面积,而非体积。这暗示着三维空间的信息可能完全编码在一个二维表面上,如同全息图。Maldacena 的 AdS/CFT 对偶(迄今物理学史上引用次数最多的论文之一)为全息原理提供了一个具体的数学实例:一个包含引力理论的反德西特 (AdS) 空间(一个假想的“盒子宇宙”)与其边界上的一个不含引力的共形场论 (CFT) 是完全等价的。由于边界上的 CFT 是幺正的(信息守恒),那么 AdS 空间内部的引力理论(包括黑洞)也必须是信息守恒的,即使我们尚不清楚具体机制。 ER=EPR 猜想进一步提出,两个纠缠的量子粒子实际上通过一个(通常是不可穿越的、微观的)虫洞连接。应用于黑洞信息悖论,这意味着落入黑洞内部的粒子与逃逸的霍金辐射粒子之间可能存在纠缠,而这种纠缠对应着连接黑洞内部和外部的微小虫洞。事件视界本身可能就是由这些大量纠缠对(及其对应的虫洞)“编织”而成的。这样,信息可以通过这种非局域的量子连接(虫洞)从内部传递到外部,而无需经典地穿越视界。Levin 认为这个想法非常深刻,尽管目前还主要停留在猜想和特定模型阶段。

(1:27:49) – Firewall

Levin 讨论了由 Almheiri, Marolf, Polchinski, and Sully (AMPS) 提出的“火墙”(Firewall) 假说。他们论证,如果要求霍金辐射与黑洞内部保持某种特定的纠缠结构以确保信息守恒(幺正性),那么根据量子力学,一个刚落入黑洞的粒子必须同时与早先逃逸的霍金辐射和黑洞内部的其他粒子高度纠缠,这违反了量子纠缠的单配性原则(一个量子比特不能同时与两个独立的系统最大程度地纠缠)。为了解决这个矛盾,AMPS 提出,事件视界并非广义相对论所预言的光滑、无特殊之处的区域(满足等效原理),而是一个充满高能粒子的“火墙”,任何试图穿越它的物体都会瞬间被焚毁。这相当于牺牲了广义相对论的等效原理来保全量子力学的幺正性。Levin 认为,火墙论文极具启发性,暴露了之前一些解决方案(如互补性原理)的不足,推动了领域发展,但她(以及可能包括 AMPS 作者本人)并不认为火墙是物理真实的,它更像是一个揭示问题的尖锐思想实验。它促使人们更深入地思考,并催生了如 ER=EPR 等更复杂的想法。Levin 倾向于保留光滑的事件视界,但接受非局域性(如虫洞连接)。

(1:36:41) – Extra dimensions

Levin 讨论了额外存在的空间维度的可能性。我们熟知三维空间,加上时间构成四维时空,但为何恰好是三维空间?弦理论等理论为了自洽性需要额外维度,这些维度可能极其微小并被“卷曲”起来(紧致化)。但也存在模型认为额外维度可能很大,只是我们被限制在一个三维“膜”(brane) 上运动,无法感知到膜外的维度(膜宇宙模型)。额外维度的存在可能与暗能量(如卷曲维度的大小或能量)或暗物质(如额外维度中的量子激发态)有关。一个有趣的问题是,宇宙诞生时可能有很多维度,为何只有三个维度膨胀变大,而其他维度保持微小?存在一些理论试图解释这种维度的“自然选择”,例如弦或膜在额外维度中的缠绕方式可能阻止了其他维度的扩张。

(1:39:06) – Aliens

Lex Fridman 询问外星智慧生命是否存在于其他“膜”上的可能性。Levin 认为,在数学上构建包含多个膜的高维宇宙是可能的,而如果数学上可能,自然界或许会尝试实现它(类似多重宇宙的想法,源于理论物理难以找到唯一解释我们宇宙的理论,反而得到大量可能性)。如果存在其他膜宇宙,上面也可能演化出生命和文明,但我们与它们之间的交流将极其困难,因为标准模型粒子(构成我们和我们所用技术的物质)被束缚在各自的膜上。只有引力等少数相互作用能穿越“体”(bulk) 空间。原则上可以用引力波进行通信,但这在技术上极为困难且能量需求巨大。 回到我们熟悉的宇宙,Levin 认为随着系外行星的大量发现(数量可能超过恒星),生命在银河系其他地方(甚至近邻)存在的可能性变得非常高。对于费米悖论(“他们都在哪儿?”),Levin 提出几种可能性:1. 技术文明可能容易自我毁灭(以人类自身面临的风险为例);2. 生命形式可能极其多样,许多可能并不发展技术,也不寻求扩张或交流(如地球上的水母等长寿但意识形态迥异的生物);3. 生命的定义可能需要更宽泛,可能基于不同的化学基础或信息处理方式。她强调,在地球上,只有人类以如此极端的方式改造环境。生命的核心或许与能量流动(如电子转移)和熵减有关,能实现这些功能的物理形态可能千差万别。简单地寻找类人文明可能过于狭隘。

(1:54:42) – Wormholes

Levin 讨论了虫洞(爱因斯坦-罗森桥)作为一种时空连接的可能性。虫洞在拓扑上是允许的,因为广义相对论主要描述局部时空曲率,并未完全限定宇宙的整体连接方式(例如宇宙可能是有限无边的)。然而,要构造一个可供宏观物体(如人)穿越且稳定的虫洞,理论计算(如 Kip Thorne 的工作)表明需要一种具有负能量密度或负压强的“奇异物质”(exotic matter) 来支撑虫洞的“喉咙”使其不至于坍缩。虽然量子效应(如卡西米尔效应)可以产生局部负能量区域,但要维持宏观虫洞所需的奇异物质数量巨大且性质特殊,目前远超工程能力。Levin 认为虫洞在物理学上是“合理”的(plausible),但距离成为工程问题还很遥远。微观虫洞则可能与 ER=EPR 猜想中连接纠缠粒子的机制有关,但这些通常是不可穿越的。目前关于人工建造虫洞的设想(如利用量子泡沫、操控量子引力效应)都还停留在高度理论化的阶段,主要是通过“逆向工程”——先设定想要的虫洞几何结构,再反推需要什么样的物质能量分布来实现它。

(2:05:40) – Dark matter and dark energy

Levin 讨论了暗物质和暗能量这两个宇宙学中的重大谜团。 暗物质 (Dark Matter): 其存在有强有力的观测证据,如星系旋转曲线、星系团中的引力透镜效应(著名的“子弹星系团”案例显示引力中心与可见物质中心分离)、宇宙微波背景辐射的功率谱等。暗物质是成团分布的(例如形成包裹星系的晕),表现得像一种不与电磁波相互作用(因此“暗”)但有引力的粒子。中微子是一种已知的暗物质形式,但其质量太小、数量不足以解释观测到的全部暗物质效应。寻找构成大部分暗物质的新粒子是当前粒子物理和天体物理的重要目标。 暗能量 (Dark Energy): 其存在主要由宇宙加速膨胀的观测(通过超新星、宇宙微波背景辐射等)所证实。暗能量似乎是均匀分布在整个空间中的,具有负压强性质(类似拉伸的橡皮筋),导致时空本身排斥性地膨胀。其能量密度非常小,但由于遍布整个宇宙,在宇宙总能量构成中占主导地位(约70%)。真空能(量子场论中的零点能)或某种标量场(如希格斯场或类似场)是可能的候选者,但理论计算出的真空能数值与观测值存在巨大差异(宇宙学常数问题),希格斯场的能量标度也与暗能量不符。解释暗能量的精确数值和性质是现代物理学最大的挑战之一。 Levin 强调,暗物质和暗能量并非物理学家凭空捏造,而是基于极其精确的宇宙学观测与现有物理理论(主要是广义相对论和标准模型)之间的显著不符而提出的概念。它们代表了我们对宇宙组成和演化的“已知未知”,正是现代精密宇宙学的巨大成就才使得我们能够如此清晰地认识到这些未知成分的存在及其占比(普通物质仅占约5%)。她希望能发现暗物质与暗能量之间存在某种联系,或者它们与额外维度等更深层物理有关。

(2:15:43) – Gravitational waves

Levin 解释引力波是由大质量物体(如中子星、黑洞)发生剧烈加速运动(如并合)时产生的时空本身的涟漪。它不同于光等电磁波,而是时空几何的动态变化。引力波以光速传播,携带能量(如双黑洞并合时会损失一部分质量转化为引力波能量,符合 E=mc²),且与物质的相互作用非常微弱,因此能几乎不受阻碍地穿越广袤宇宙。Levin 将引力波比作“时空鼓面的震动”,其性质更接近声音而非图像。 LIGO(激光干涉引力波天文台)是探测引力波的精密仪器。它利用迈克尔逊干涉仪原理,在两个互相垂直的长达4公里的真空管道中发射激光,精确测量激光在两臂之间往返的时间差。当引力波通过时,会拉伸一个臂同时压缩另一个臂,导致激光光程发生极其微小的变化(小于质子直径的万分之一),从而在干涉条纹中产生可探测的信号。LIGO 项目历时约50年,克服了难以想象的技术挑战和噪声干扰,才达到所需灵敏度。Levin 描述了她写作《黑洞蓝调》期间与 LIGO 团队成员(如 Ray Weiss, Kip Thorne, Barry Barish 等诺奖得主)的交流,感受到他们长期的坚持和在首次探测前的巨大压力。2015年9月14日,LIGO 在刚完成升级、尚未正式开始科学运行期间,意外地首次直接探测到了来自13亿光年外双黑洞并合产生的引力波信号 (GW150914),这一历史性事件恰逢广义相对论发表一百周年,开启了引力波天文学的新纪元。Levin 认为 LIGO 的建成和成功探测是人类工程学和科学探索精神的惊人壮举。

(2:27:51) – Alan Turing and Kurt Godel

Levin 谈及她撰写的《疯子梦见图灵机》一书,该书围绕两位20世纪的杰出思想家——阿兰·图灵 (Alan Turing) 和库尔特·哥德尔 (Kurt Gödel)。他们的联系始于哥德尔的不完备性定理,该定理揭示了数学系统中存在无法被证明或证伪的真命题,打破了数学完备性的信念。图灵深受哥德尔工作启发,研究了不可计算数(无法通过有限算法生成的数字),并构想出“图灵机”这一通用计算模型,奠定了现代计算机科学的基础。图灵的工作路径与哥德尔截然不同:哥德尔是一位柏拉图主义者,相信数学对象的实在性,对物理现实持怀疑态度;而图灵则走向了机械唯物主义,认为思维可以被机械化,甚至人类本身也可能是某种“生物机器”。图灵的理论思想在二战期间应用于破解德军的恩尼格玛密码,为盟军胜利做出了关键贡献。然而,两位天才的人生都充满了磨难与悲剧。哥德尔患有严重的偏执型精神分裂症,最终因恐惧被毒害而绝食身亡。图灵则因其同性恋身份在当时的英国受到法律迫害,被判化学阉割,最终可能以模仿《白雪公主》中毒苹果的方式自杀身亡。Levin 认为,他们的伟大成就与个人悲剧(“悲剧性缺陷”)紧密相连,他们选择了非传统的、追求极致智力探索的人生道路,这使他们既取得了非凡成就,也更容易受到社会规范之外的伤害和自身的心理困扰。书中试图探讨这种天才与疯狂、可知与不可知(对应数学上的不完备性与不可计算性)之间的张力。

(2:40:05) – Grigori Perelman, Andrew Wiles, and Terence Tao

对话延伸讨论了不同顶尖数学家面对难题时的不同风格和心理状态。 * 陶哲轩 (Terence Tao): 以其惊人的广度和效率著称,非常善于判断何时该暂时搁置一个过于困难的问题(“周末问题”),避免陷入无果的困境。 * 安德鲁·怀尔斯 (Andrew Wiles): 花费七年时间在阁楼上独自秘密工作,最终证明了费马大定理。期间经历了宣布证明后被发现错误、再修正的巨大压力和考验,展现了惊人的毅力和专注。 * 格里戈里·佩雷尔曼 (Grigori Perelman): 独自解决了庞加莱猜想这一世纪难题,但随后拒绝了菲尔兹奖和千禧年大奖,选择隐居,与外界隔绝。 Levin 强调这些例子说明了追求科学真理的道路充满个人选择和巨大风险,成功并非必然。她也分享了作为理论物理学家,自己需要能够“杀死”大部分自己的想法,即承认它们行不通并放弃,尽管有时做出这个判断需要时间。怀尔斯的故事尤其说明,即使走在正确的道路上,最终能否抵达终点也存在不确定性。佩雷尔曼则代表了另一种极端,对外部认可(名誉、金钱)完全不感兴趣,其心理状态与常人迥异。

(2:46:40) – Art and science

Levin 介绍了她在布鲁克林的艺术与科学中心 Pioneer Works 担任首席科学官的角色。该中心由艺术家 Dustin Yellin 创立,旨在将艺术家和科学家聚集在一起,进行跨学科交流与创作,将科学视为文化的一部分,而非仅仅是“科普”或“教育”。Pioneer Works 举办各种活动(讲座、展览、表演)、出版杂志《Broadcast》,内容涵盖科学、艺术、音乐等多个领域。Levin 认为这种跨界合作和“创造事物”的体验对她个人而言非常重要,是对她主要从事的理论物理研究(常为独立思考)的一种补充和平衡。她还提到了个人对时尚的兴趣,并感谢为她设计活动服装的设计师 Andrea Lauer。在谈到文学时,Levin 表示自己主要阅读小说,尤其欣赏那些融入了科学思想或元素的文学作品,如石黑一雄的《别让我走》、马丁·艾米斯的《时间箭》以及科马克·麦卡锡的《路》。她认为优秀的文学作品能以深刻且富有艺术性的语言探讨抽象主题和人性。

(2:56:19) – The biggest mystery

当被问及如果能从一个无所不知的“神谕”那里得到一个问题的最终答案,她会问什么时,Levin 表示,作为物理学家,最“明显”的问题应该是关于量子引力或引力是否是涌现现象。然而,她对此有所保留,认为完全知晓一切可能并非好事,科学的魅力部分在于未知和探索过程。她相信,即使得到了某个终极问题的答案,也可能会引出更多、更深层次的新问题,就像广义相对论引出了黑洞、信息悖论、宇宙起源等一系列问题一样。她接受宇宙中所有知识和成就最终可能被时间抹去(宇宙热寂或大撕裂等终极命运)的现实,认为这提醒我们更应关注当下的体验、人际关系以及我们短期和长期能留下的积极贡献。她认为,在知识和历史最终消逝之前,“在沙滩上画出美丽的东西”本身就很有意义。

20250430 - #467 – Tim Sweeney Fortnite, Unreal Engine, and the Future of Gaming

2025-05-01 13:36:00

## 引言

本次访谈邀请了传奇视频游戏程序员、Epic Games 的创始人兼 CEO Tim Sweeney。Epic Games 创造了包括虚幻引擎(Unreal Engine)和《堡垒之夜》(Fortnite)在内的众多革命性游戏和技术,深刻改变了视频游戏产业以及玩家和创作者的体验。

## 一万小时编程

Tim Sweeney 在 11 岁左右,通过他哥哥的一台早期 IBM PC 接触到了计算机,并在几天内学会了 BASIC 编程,从此被计算机的潜力深深吸引。他回忆起早期的编程经历,强调每一次挑战和学习障碍都带来了深刻的教训,有些是个人学习曲线,有些则揭示了编程语言设计的缺陷,这些早期经验对他后来设计编程语言(如 Verse)产生了持续影响。

在青少年时期,Sweeney 编写了各种程序,包括: * 一个基于文本的、捕捉屏幕上移动星号的简单游戏(Apple II)。 * 数据库程序。 * 一个类似 Pascal 的语言编译器(因为他不知道去哪里购买)。 * 一个公告板系统(BBS)程序,从中学习了数据库管理、用户界面和并发处理。

Sweeney 估计,在 10 岁到 20 岁之间,他在正式发布任何商业程序之前,投入了大约 10,000 到 15,000 小时进行编程实践。

## 给年轻程序员的建议

Sweeney 强调,编程学习不仅仅是投入时间,更重要的是**持续学习、认识知识差距并通过项目和实验来扩展知识**。他个人的学习过程并非结构化,而是通过追求有趣和酷的项目,在实践中学习数据管理、高级数据结构和复杂程序设计,这些积累为他后来在 1991 年发布首款游戏乃至开发第一代虚幻引擎奠定了基础。

他将此过程比作电影《小子难缠》(Karate Kid)中的训练——高中和大学学习的数学(向量微积分、矩阵)、物理(应力应变)等知识,最初不确定实际用途,但在开发 3D 引擎时突然融会贯通。这体现了**积累知识的重要性,即使当时不知道其未来应用**。

Sweeney 认为,反复学习困难事物并成功克服,能培养**面对未知挑战的勇气和学习能力**。他鼓励年轻程序员不断编写代码,持续学习新事物,寻找不同领域知识(如线性代数、工程学)之间的联系和应用(以 Google 搜索引擎利用特征值/向量为例)。对于艺术家,也应不断练习各种风格,拓展技能。

他认为大学教育的真正价值在于学习本身,而非仅仅获得文凭或证书。**掌握知识和技能,尤其对于创业者而言,远比证书重要**。

Sweeney 回忆起自己成长的年代,孩子们拥有大量自由时间进行探索、玩耍和进行各种项目(如搭建卡丁车、自制“太空船控制面板”)。这种**有机的学习和早期创业经历**(如割草、耙树叶赚钱)培养了创造力和解决问题的能力。他担忧现代社会过度保护和结构化的童年生活,可能会剥夺孩子们获得这些宝贵经历的机会。

## 80、90年代的电子游戏

Sweeney 对游戏的热爱源于早期两款游戏:雅达利 2600 上的《冒险》(Adventure),一款简单的、用点代表角色进行探索的游戏;以及纯文本冒险游戏《Zork》。这两款游戏激发了他的想象力,并驱使他去学习如何编程实现其中的机制,如角色移动、关卡编辑器(让他认识到工具的重要性)、文本解析等。

他坦言,在《堡垒之夜》之前,他玩游戏主要是为了学习其技术实现。例如,在《德军总部》(Wolfenstein)和《毁灭战士》(Doom)问世时,他会逐像素分析,仔细移动鼠标观察画面变化,试图理解其背后的技术,将此过程视为大规模的解谜。

## Epic Games 创立故事

Sweeney 的第一款商业游戏 ZZT 的起源颇具戏剧性:他最初是为了给自己刚买的 IBM PC 写一个**文本编辑器**。完成后觉得无聊,便将光标变成笑脸,并赋予文档中不同字符游戏功能(墙壁、敌人、移动物体),文本编辑器由此演变成了游戏编辑器。他用这个编辑器创建了一系列关卡(Board),玩家可以在这些通过路径连接的关卡中移动。

ZZT 最终成型为一个游戏世界。Sweeney 通过邀请邻居(成人和孩子)试玩进行“用户体验测试”,观察他们的卡点、乐趣点和厌倦点,并据此迭代优化游戏,确保玩家能自行探索和理解。

游戏完成后,Sweeney 将其上传到本地的**公告板系统 (BBS)**。他采用了**共享软件 (Shareware)** 模式:发布包含三部曲中第一部的免费版本,并附上父母的邮寄地址,鼓励玩家支付 30 美元购买后两部续作。几天内,他开始收到支票,每天大约能赚 100 美元,这对于一个 20 岁的年轻人来说是巨大的成功。

金钱本身对 Sweeney 而言只是实现目标的工具,但看到自己的游戏在全球传播,被世界各地的玩家喜爱,这种感觉是“魔法般的”。这让他意识到软件(尤其是数字分发)的潜力没有上限,任何人只要做出足够好的数字产品,都有可能触达全球,建立像微软、Meta、苹果、谷歌或 Epic Games 这样的公司。

ZZT 的一个关键特点是,Sweeney **同时发布了游戏编辑器**,允许玩家创造自己的关卡。这不仅让 ZZT 社区充满活力(30 年后仍有人记得用 ZZT 编辑器创作),也确立了 Epic 的核心原则:**既创造优秀娱乐内容,也创造优秀工具,并与社区分享,赋能他人创作**。这种游戏与工具、服务玩家与服务创作者并行的策略,是 Epic 长期成功和生存的关键,使其能够抵御游戏行业的波动。

Sweeney 进一步解释了 90 年代的 BBS:用户通过调制解调器拨号连接到本地由个人运营的计算机,形成小型社区(通常几百人争抢一个电话线路),主题各异(编程、新闻、盗版游戏分享等)。随后,原本局限于大学和研究机构的**互联网**向公众开放,极大地加速了全球信息的传播。

Epic Games 最初通过数字方式(共享软件)分发游戏,但在 3D 游戏(如 id Software 的《德军总部》、《毁灭战士》以及 Epic 的《虚幻》)兴起并需要触达数百万用户时,不得不转向零售渠道(与发行商合作,制作实体光盘)。之后,随着互联网发展,游戏行业又逐渐回归数字分发。这个过程初期伴随着严重的盗版问题(如游戏销量 10 万,用户却有 200 万)。**Steam** 的出现,通过提供便捷的合法数字分发服务,成功将大量玩家从盗版转向正版,塑造了早期数字游戏产业的格局。

## 独立游戏开发

Sweeney 给独立开发者的建议,源于 Epic 早期的经验: 1. **差异化与利基市场**:创造与众不同的东西,满足特定小众群体,而非直接与行业巨头在成熟领域竞争。Epic 早期的成功依赖于共享软件这一独特的发行模式。 2. **降低门槛与社区建设**:采用免费模式(如共享软件、Free-to-Play)吸引用户,利用口碑传播建立社区。让游戏易于上手且有趣。 3. **赋能创造者**:提供工具让玩家参与创造(如 ZZT 编辑器、Minecraft、Roblox、Fortnite Creative)。游戏作为平台,让用户生成内容,是重要的成功模式。 4. **独特性优先**:当前各大游戏类型竞争激烈,独立开发者在现有类型中胜算渺茫。成功的关键在于推出前所未有的、独特的游戏,即使目标受众规模不大,也要先站稳脚跟,再逐步扩展。 5. **迭代成长**:一次性从想法到大规模商业成功不太现实,更可能的是通过多步骤、持续改进产品,逐步走向卓越。

回顾早期经历,Sweeney 认为并不孤独,因为看到邻居孩子玩 ZZT 时发自内心的快乐,以及后来收到世界各地玩家表达喜爱的信件,都让他感到与玩家紧密相连。早期创业风险较低(主要投入是几千美元的电脑),一旦游戏受欢迎,就坚定了他全力以赴建立公司的决心。

## 虚幻引擎 (Unreal Engine)

**起源背景**:90 年代初,Epic Games 通过发掘和匹配全球各地的年轻开发者(如 Cliff Bleszinski、Arjan Brussee)和艺术家,制作了多款成功的 2D 共享软件游戏(如《爵士兔》Jazz Jackrabbit、《Epic弹球》Epic Pinball)。然而,《德军总部 3D》和特别是《毁灭战士》(Doom) 的出现,展示了 3D 游戏沉浸式的潜力,让 Epic 意识到 3D 是未来方向。

**早期挑战与团队组建**:《毁灭战士》的技术高度曾让 Sweeney 一度感到沮丧,甚至放弃编程半年。但 Michael Abrash 关于 3D 图形和纹理映射技术的文章让他重拾信心。Epic 内部多人开始尝试 3D 编程。公司决定全力投入 3D,将最优秀的 2D 团队成员(包括 Sweeney、Cliff Bleszinski、James Schmalz 等)整合起来开发《虚幻》(Unreal)。团队缺乏 3D 经验,边学边做。Sweeney 原本负责编辑器,但最终接手了引擎开发(最初使用 C,后转向 C++),Schmalz 转向 3D 模型制作,Bleszinski 负责关卡设计。

**开发过程**:《虚幻》的开发历时三年半,团队规模最终达到约 20 人(当时算大团队)。开发过程极其艰苦,每周工作 70-80 小时,且项目始终感觉“还有六个月就能完成”。团队面临持续的技术探索和财务压力,多次濒临破产。

**关键转折:引擎授权**:在开发过程中,其他公司(如 MicroProse、GT Interactive)联系 Epic,希望授权使用其正在开发的 3D 引擎。这成为了 Epic 的重要收入来源,支撑了《虚幻》的漫长开发。引擎授权业务的确立,让 Epic 从一开始就非常重视技术支持,形成了服务开发者和玩家的双重基因。

## 虚幻引擎的技术细节

**定义**:虚幻引擎是一个庞大的软件开发包,提供构建各类 3D 图形应用所需的功能,广泛应用于游戏开发、影视制作(实时背景、预演)、汽车设计、建筑可视化、工业设计等领域。它支持从写实到风格化的各种视觉效果,并包含物理模拟、交互等功能。

**早期优化焦点 (UE1)**:在 GPU 普及之前,UE1 主要针对**软件渲染**进行优化。核心瓶颈在于渲染单个像素的成本。Sweeney 团队致力于减少每个像素所需的 CPU 周期数,例如将纹理映射优化到 Pentium 90 上的 6 个 CPU 周期(包含 11 条指令)。这需要对 CPU 底层运作有深刻理解并编写精确的汇编代码,这种对硬件的精细控制在现代 CPU 中已很大程度上失传。

**现代优化 (Nanite - UE5)**:虽然底层优化方式改变,但对硬件的深刻理解仍然重要。以 UE5 的 Nanite 系统为例,它是一个虚拟化微多边形几何体系统,由 Brian Karis 开发。其目标是高效渲染包含数十亿多边形的场景。 * **核心理念**:根据物体远近和屏幕覆盖率,动态调整渲染的多边形数量,达到视觉上与最高细节无异,但避免渲染不必要的几何体(遵循奈奎斯特采样定理思想,理想状态下每像素渲染约两个三角形即可)。 * **技术突破**:传统 GPU 的三角形光栅化器对极小的三角形(如单像素大小)效率低下。Nanite 设计了一条绕过 GPU 光栅化硬件的管线,直接在像素着色器中计算光线追踪和几何相交,从而更高效地处理超高细节几何体。 * **挑战**:解决 Lvl of Detail (LOD) 切换时产生的“跳变”伪影,通过算法使其在视觉上难以察觉。

**人类渲染**:渲染逼真的人类是计算机图形学中最难的部分,因为人类大脑对人脸极其敏感(进化原因),极易察觉瑕疵(落入“恐怖谷”)。这需要综合处理: * **数据采集**:使用专用设备(如光球)捕捉演员高分辨率、高帧率的多种表情和动作。 * **模型与运动**:不仅要捕捉面部形状,还要捕捉肌肉、脂肪等协同产生的细微表情和完整运动范围。MetaHuman 项目旨在通过捕捉大量不同人种、年龄、面部特征的数据,来合成任意人脸。 * **渲染技术**:涉及毛发渲染(需要近似算法)、皮肤的次表面散射(光线穿透皮肤产生的效果,普通模型无法模拟)、皮肤油光产生的复杂反射、肌肉运动驱动的细微表情变化等数十个系统的协同工作。任何一个环节出错都会导致不真实感。 * **工具**:MetaHuman Creator 用于创建数字人脸,MetaHuman Animator 用于基于面部捕捉(甚至可用 iPhone 完成)驱动数字人表情,并能智能适配不同脸型的角色。

**光照 (Lumen - UE5)**:Lumen 是 UE5 的全局光照 (Global Illumination, GI) 系统,旨在模拟光线在整个场景中复杂反弹的真实效果。 * **挑战**:真实世界中光线会多次反弹(如红墙反射红光到白地板上),直接模拟(如光子追踪)极其耗时。早期引擎只处理直接光照。 * **Lumen 方案**:由 Daniel Wright 开发,基于多年研究,通过在不同尺度(从宏观到微观)上进行光照计算,并无缝集成,实现全局光照效果。目标是让艺术家只需放置光源,系统就能自动计算出逼真的光照结果,包括间接光照、软阴影、颜色溢出等。

**其他技术亮点 (UE5 演示)**: * **场景细节 (泥土/雪地)**:通过 Lumen 的多尺度光照、屏幕空间阴影计算(基于屏幕像素信息近似计算遮挡)、材质分层系统(如雪覆盖泥土)、反射技术(纹理反射、光线追踪反射)等多种技术结合艺术家的高超技艺实现。 * **动态效果 (烟雾)**:利用强大的粒子系统 (Niagara)、物理引擎,结合艺术家创作,实现逼真的体积烟雾效果,包括烟雾对光线的遮挡和光照在烟雾上的变化。

Sweeney 强调,实现顶级效果是技术与艺术紧密结合的成果,引擎提供能力,但最终呈现依赖于艺术家的创造力和技巧。同时,引擎的目标是不断简化创作流程,让高质量效果更易于实现。

## 建设性实体几何 (Constructive Solid Geometry - CSG)

这是 UE1 中的一项重要创新,允许关卡设计师不仅通过添加几何体,还可以通过**减去**几何体来构建场景(例如,从墙体中减去一个门洞,而不是用多个小块拼凑)。这极大地提高了关卡编辑效率。

Sweeney 回忆自己花了大约 30 个小时的连续编码攻克了 CSG 实现中的各种边缘情况(如共面多边形处理),基于 Bruce Naylor 发明的 BSP(二叉空间分割)树数据结构(Doom 也使用了该技术)。当他向 James Schmalz 展示这个功能时,Schmalz 通过简单的几个操作(添加两个相交的环状体,再减去一个圆柱体)就创建出极其复杂的形状,效果惊人。这可能是实时 CSG 的早期实现之一,并立即受到美术师的欢迎。

## 动态光照 (Dynamic Lighting)

在 UE1 时代,CPU 性能有限,无法实时计算每个像素受所有光源的影响。 * **光照贴图 (Lightmapping)**:借鉴并扩展了《雷神之锤》(Quake) 的技术,预先计算并存储场景静态部分的**光照信息到纹理(光照贴图)上**,运行时只需采样贴图,大大降低计算量。UE1 在此基础上增加了**彩色光源**。 * **复杂光照效果**:由于光照贴图是预计算或低频计算的,允许加入更昂贵的效果,如火炬闪烁、水面焦散、脉冲/闪烁光等,并创建了一个系统来组合任意数量的光源效果。 * **实时阴影与预计算结合**:Sweeney 实现了实时阴影算法,但速度太慢(半帧每秒)。于是改为**预计算阴影信息**,但仍允许**动态应用光照效果**(只要光源本身不移动),实现了带阴影的动态光照(如带阴影的火炬闪烁)。 * **艺术家驱动创新**:Sweeney 强调,他实现这些功能后,艺术家们总能以意想不到的方式组合使用,创造出远超他预期的效果。

## 体积雾 (Volumetric Fog)

灵感来源于一家芬兰 GPU 公司展示的截图(后来发现是预渲染的)。Sweeney 再次投入约 30 小时编码攻关。 * **物理原理与数学解法**:他意识到雾的效果涉及计算视线穿过雾时累积的光量,这本质上是一个**线积分**问题。光照强度随距离平方反比衰减(1/R²),他查阅积分表发现该函数的特定积分形式可以用**反正切函数 (arctan)** 解析求解。 * **优化**:由于逐像素计算该积分仍然太慢,最终实现方式是在类似光照贴图的网格上(如每平方米)计算体积雾效果,从而达到实时性能。艺术家们利用这一功能创造了充满氛围感的关卡。

## 约翰·卡马克 (John Carmack)

Sweeney 对 John Carmack 表达了高度敬佩,尤其欣赏他**对代码结果的极致追求**以及**毫不犹豫地迭代和重写代码**以找到最佳解决方案的精神。Carmack 的许多突破性成果并非一蹴而就,而是经过多次尝试和重构。Sweeney 认为这对所有程序员都是一个重要启示:对于关键功能(性能、质量、能力),要不断迭代直至完美,不满足于初步或次优解。

## 虚幻引擎的演进

Sweeney 感叹过去 30 年硬件性能的惊人增长(CPU 约 10 万倍,GPU 约 1000 万倍),并回顾了虚幻引擎如何随之进化: * **UE1**: 始于软件渲染,后期支持早期 GPU (3dfx Voodoo 1)。 * **UE2**: 全面拥抱早期 GPU 硬件加速,增加载具等新功能。 * **UE3**: 关键突破在于利用**可编程着色器 (DirectX 9)**,实现了实时像素着色、动态光照和阴影,并开始支持多核 CPU。由 Andrew Scheidecker 负责核心渲染管线。 * **UE4**: 持续改进,增加更多光照和几何体选项,提升真实感。 * **UE5**: 实现了重大飞跃,凭借 **Nanite**(微多边形几何体)和 **Lumen**(全局光照)技术,在追求照片级真实感方面取得了突破。

**持续存在的挑战与 UE6 展望**: * **渲染代码的持续重写**:每一代引擎的核心渲染代码几乎都被重写,以适应最新的硬件和图形技术。 * **部分核心系统的稳定性与局限性**:文件管理、网络系统(客户端-服务器状态同步)等虽有优化,但仍是早期设计的演进,存在局限性(如《堡垒之夜》中的观战同步 Bug)。 * **核心瓶颈:单线程游戏模拟**:为了简化编程复杂性(对 Epic 自身及合作伙伴),游戏逻辑模拟长期运行在单线程上。随着 CPU 核心数增加,这成为越来越大的性能瓶颈。 * **UE6 的目标**:将是下一代技术的核心,旨在解决长期存在的限制,特别是实现**多线程游戏模拟**,为现代硬件和未来需求奠定更坚实的基础。这将是一个极其困难的工程挑战。

## 虚幻引擎 5 (Unreal Engine 5)

以 GDC 2024 展示的《漫威 1943:九头蛇崛起》Demo 为例,重点介绍了 UE5 的关键技术如何协同工作以创造超写实场景: * **逼真的“泥土”场景**:强调这是艺术家和技术美术师高超技艺的体现,超越了 Epic 最初的预期。实现依赖于多种技术的 interplay(相互作用): * **Lumen 全局光照**:在不同尺度上计算光照反弹,实现从宏观(建筑阴影)到微观(泥土细节)的无缝、准确光照。 * **屏幕空间阴影**:基于屏幕像素深度信息快速计算精细阴影,对细节表现至关重要。 * **材质分层系统**:允许艺术家叠加不同材质(如泥土上覆盖冰雪),引擎处理过渡。 * **反射**:支持多种反射技术。 * **艺术家决策**:强调达到顶级效果需要高技能人才进行大量的技术美术决策和调整,目前并非完全自动化。 * **动态控制**:展示了场景是实时渲染的,可以动态改变光照(如开关车灯)、天气效果(如下雪量)。 * **逼真的雪景**:通过材质分层系统,艺术家可以精确控制物体被雪覆盖的程度。 * **逼真的烟雾**:结合强大的粒子系统 (Niagara)、物理引擎和艺术家创作,实现了具有真实光照交互(遮挡光线、受光照影响)的体积烟雾效果,达到了超越传统游戏表现的真实感。

Sweeney 再次强调了技术与艺术的结合,以及硬件性能(Nvidia 的 20 TFLOPS GPU)的支撑作用。最终的目标是让观众沉浸其中,忘记现实世界。

## 创造逼真的人类

如前所述,这是图形学中最难的挑战之一。Sweeney 详细阐述了 MetaHuman 技术流程和挑战: * **高精度捕捉**:在专用设备(光球,含数十个摄像头)中捕捉演员的几何形态、纹理以及各种表情下的肌肉、脂肪运动细节。 * **数据处理与泛化**:捕捉一个演员需要数小时,后续处理生成实时可用模型则需数千小时。MetaHuman 的目标是捕捉成千上万不同人类的数据,构建覆盖全人类面部特征的数据库,从而能基于少量信息(如 iPhone 照片)高精度重建任意人脸。 * **渲染挑战**: * **毛发**:渲染每根头发计算量过大,需用近似算法模拟整体效果。 * **次表面散射 (Subsurface Scattering, SSS)**:光线穿透皮肤并散射,是人看起来真实的关键,普通材质无法模拟。 * **皮肤细节**:油光产生的复杂反射、微小纹理等。 * **表情**:肌肉驱动的细微表情变化,传达情感和意图(如真笑与假笑的区别、悲伤中勉强的微笑等)。 * **工具链**: * **MetaHuman Creator**:用于调整参数创建独特数字人脸的工具。 * **MetaHuman Animator**:将面部捕捉数据(可用 iPhone 等设备采集)应用到数字人角色上,并能智能地处理演员与角色脸型差异的映射问题。 * **与 Unreal Engine 集成**:创建或导入的 MetaHuman 可以在引擎中进一步调整(如添加衣物、毛发),并使用引擎的布料模拟、动画工具等。 * **现状与未来**:Sweeney 认为,尽管 MetaHuman 提供了巨大的生产力与质量提升,但距离完全解决数字人问题(达到绝对逼真和完全可控)还有很长的路要走(估计是总共 50 年工程中的 30 年)。

Sweeney 还提到了将语音(无论是录制、生成还是程序化的)自动转换为不仅是口型,还包括相应面部表情和情感表达的技术的重要性。

## Lumen 全局光照

Lumen 是 UE5 的动态全局光照和反射系统。 * **核心目标**:模拟光线在场景中与所有物体交互并多次反弹的真实物理过程,克服早期引擎仅处理直接光照(导致无光区域全黑)的局限性。 * **原理**:基于 Daniel Wright 多年的研究,Lumen 采用多尺度方法,计算从宏观(公里级)到微观(毫米级)的光照传递,并将各层次结果无缝融合。 * **优势**:旨在简化艺术家工作流程,理想状态下只需放置光源,系统即可自动计算出包含间接光照、柔和阴影、颜色溢出、复杂反射等效果的逼真光照结果。 * **效果展示**:通过室内外光照过渡、洞穴内复杂光线散射、光滑表面精细反射等示例,展示了 Lumen 带来的视觉真实感提升。这些微妙的光照效果对场景的真实感至关重要,缺失时人眼虽不一定能明确指出问题,但会感觉“不对劲”。

Sweeney 强调,最终呈现的不仅仅是算法,更是艺术家利用这些工具进行创作,表达情感和氛围(如电影感的光影)。

## 电影

虚幻引擎在电影电视行业的应用日益广泛。 * **奥斯卡获奖**:提及使用 UE 制作的短片《战争结束了!受列侬和洋子音乐的启发》(War is Over! Inspired by the Music of John & Yoko) 获得奥斯卡奖。 * **虚拟制片 (LED Wall)**:强调从传统绿幕转向大型 LED 屏幕结合 UE 实时渲染背景的革命性变化。这不仅解决了绿幕拍摄中演员身上光照不匹配的问题,还能让演员沉浸在真实(虚拟)环境中,提升表演质量,最终提高成片效果。 * **AI 与影视制作**:Sweeney 对 AI 完全取代人类创意持谨慎态度,尤其是在需要高度一致性和复杂叙事的视频领域。他认为 AI 目前更适合作为**人类创作者的效率放大器**,而非替代品。 * **结合方式**:可能的形式包括 AI 对 UE 输出进行后期图像增强(类似 Meta 的 VR 头像演示)、利用 AI 基于现有高质量扫描数据(如 Quixel Megascans)生成新的定制化内容(如特定树木)。 * **挑战**:当前 AI 生成内容的“模糊性”和缺乏精确控制,难以进行艺术指导。未来需要更好地融合引擎的精确场景图表示与 AI 的模式识别能力,实现可控、稳定的 AI 辅助创作。 * **对创作者未来的看法**:Sweeney 对 AI 带来的机遇持乐观态度,认为它会像过去的数字音乐、Photoshop 等技术一样,最终成为艺术家工具箱中的一部分,增强而非取代人类创造力。他鼓励人们尝试使用 AI 工具,但也指出 AI 在处理全新、复杂问题上仍有局限性。他反思“样板代码”的存在本身是编程语言和模块化设计的失败,认为更好的模块化会减少对 AI 生成重复代码的需求,让程序员更专注于解决独特的、困难的问题。

## 模拟现实

* **逼真度进展**:Sweeney 预测,在未来不到 20 年内,计算机图形将能**极其接近地模拟现实**。非人类场景(如丛林、城市)的视觉真实感已非常接近,可能几年内就能达到。**最大的挑战仍然是模拟逼真的人类**,包括外观、行为、对话和意图,这需要满足人类大脑极高的期望值。 * **人类模拟与 AI**:十年前,Sweeney 认为即使有无限算力也无法模拟真实人类,因为缺乏算法。但现在,生成式 AI(尤其是文本)的发展,使得模拟人类对话(至少在文本层面)变得可行。他预计未来五年内可能出现非常有说服力的人类模拟技术,尽管对其伦理影响持保留态度。 * **我们是否生活在模拟中?**:Sweeney 认为这个问题值得科学探究,宇宙的物理定律和生命的存在本身就很“酷”。他质疑“模拟嵌套模拟”的逻辑终点,提及“现实即数学定律的体现”的哲学观点。他认为随着 AI 发展和对物理定律理解加深,这些问题会更引人入胜。 * **现实不可模拟之处?**:Lex 提出意识(主观感受)可能是无法模拟的,可能与宇宙的根本机制有关。Sweeney 提到量子力学的波函数坍缩和随机性,认为这为外部影响(如“灵魂”或“上帝”)留下了理论空间,但承认在这些根本问题上,现代人相比古人并无更多答案。 * **虚拟世界的沉浸感与伦理**:关于创造让人类愿意永久停留的虚拟世界,Sweeney 表示技术上可能实现,但 Epic 的目标是制作**有趣的、供人消遣的游戏**,而非替代现实。他强调随着模拟逼真度提高,需要严肃思考人类应如何在虚拟空间中活动,以及应设定哪些界限。Lex 补充了对**创造能够感受痛苦的模拟人类**的伦理担忧,认为应有法律禁止跨越这条界线,以防模拟生物遭受虐待。Sweeney 同意,并强调游戏开发者应致力于通过娱乐改善人们生活,保持积极向上的精神。

## Metaverse (元宇宙)

* **Sweeney 的定义**:核心是**多人社交游戏体验**——你和朋友们在 3D 世界里一起玩乐。例如《堡垒之夜》大逃杀模式,特别是实现跨平台互联后,它不仅是多人游戏,更是真实的社交体验。《Rec Room》等 VR 社交游戏也是例子。 * **现状与未来**:认为目前仍处于元宇宙的早期阶段(类比 90 年代初的互联网)。《堡垒之夜》大逃杀的成功让 Epic 认识到这一趋势,并促使他们通过 Fortnite Creative 和 UEFN(Unreal Editor for Fortnite)开放工具,让更多创作者加入,丰富游戏体验和类型。

## Fortnite (堡垒之夜)

* **起源**:源于 2011 年 Epic 内部的一次 Game Jam(游戏创作营)。最初的概念是“白天建造堡垒,晚上抵御僵尸”。 * **漫长的开发与演变**:游戏经历了长时间开发,核心建造玩法一直很有趣,但经历了多次方向调整: * **美术风格**:从写实转向更为主流、轻松的卡通/皮克斯风格。 * **游戏模式**:曾尝试类似《命运》的轻度 MMO(含复杂 RPG 系统),后演变为类似 MMO 塔防的模式,最终形成了 PVE(玩家对环境)模式**《堡垒之夜:守护家园》(Save the World)**,于 2017 年初上线,取得了适度成功。 * **大逃杀模式的诞生**:受当时流行的《绝地求生》(PUBG) 启发,Epic 内部很多人觉得结合《堡垒之夜》的建造系统会很酷。于是组建了一个约 30 人的团队,在**四周内**利用《守护家园》积累的大量美术资源,**紧急开发并上线了《堡垒之夜》大逃杀 (Battle Royale) 模式**。 * **指数级增长**:大逃杀模式的推出使 Epic 经历了爆炸式增长,员工从 300 人增至数千人,年收入从约 1 亿美元增至数十亿美元,一度成为全球游戏界的中心。

## 扩展性 (Scaling)

* **技术挑战**:支持《堡垒之夜》大逃杀模式的爆发式增长(从 4 万并发用户扩展到 1500 万并发用户)是巨大的技术挑战。 * **关键因素**: * **可扩展的后端系统**:Epic 自 2012 年起就在构建可扩展的在线服务(账户、登录等),其稳定性是成功扩展的基础。 * **微服务架构**:系统由数百个微服务组成(游戏服务器、账户服务器等),易于针对性地扩展瓶颈。 * **云服务 (AWS)**:完全依赖 AWS 云服务,无需自建服务器硬件。Sweeney 提及 AWS 曾为满足 Fortnite 需求紧急在巴西等地部署大量服务器。 * **用户体验**:低延迟和稳定性对于大规模在线游戏的体验至关重要,是留住用户的关键。

## 游戏经济 (Game Economies)

* **《堡垒之夜》的收入**:《堡垒之夜》每年产生数十亿美元收入,是 Epic 的主要收入来源。 * **Epic 的投资策略**:Epic 将这些收入大量再投资于技术研发(特别是虚幻引擎和未来 3D 模拟技术),目标是成为未来的技术巨头。公司目前每年投入超出收入数亿美元进行研发,这得益于早期的利润积累和外部投资。 * **长期视角**:Epic 习惯于进行需要 3-5 年甚至更长时间才能看到回报的长期项目投资。

## 标准化元宇宙 (Standardizing the Metaverse)

* **当前问题:碎片化**:Sweeney 批评当前游戏生态的“围墙花园”现状——不同平台(主机、PC)、不同游戏(Fortnite、Roblox、COD 等)之间账户、好友列表、虚拟物品完全隔离,用户无法无缝迁移社交关系和资产。 * **解决方案:联邦化与互操作性** * **统一社交图谱**:实现跨平台好友系统互通,让玩家在不同游戏和平台都能连接到同一群朋友。Epic Online Services (EOS) 免费提供跨平台社交功能,正是为此目标。 * **统一经济体系**:核心是实现**虚拟物品(特别是外观类,Cosmetics)的跨游戏互操作性**。 * **设想**:通过行业标准组织(如 Khronos Group、Metaverse Standards Forum)定义可移植物品的标准(如服装的尺寸、能力限制等)。玩家购买一件符合标准的物品,可以在所有支持该标准的游戏中使用。 * **经济模型**:借鉴《堡垒之夜》的**收益分享模型**。玩家在 Item Shop 消费产生的利润,根据玩家在不同游戏/内容(包括第三方创作的内容)中的参与时间/互动进行分配。这个模型可以扩展到跨公司、跨游戏生态,实现物品互通和收益共享。 * **价值与实现方式**:强调这种互操作性带来的价值(玩家拥有真正的数字资产所有权、更连贯的社交体验),并指出实现互操作性需要的是**行业标准和协议**,而非必须依赖特定技术如区块链或 NFT。他认为现有技术(数据库、标准组织)足以实现,就像历史上铁路轨距标准化一样。 * **对 NFT/Crypto 的看法**:认为将加密货币或 NFT 与元宇宙强行绑定是炒作,它们只是价值表示和交换的一种方式,元宇宙的核心在于互操作性。 * **缺失的关键:编程语言**:类比 Web(HTML 定义结构,JavaScript 定义行为),元宇宙需要一个更强大、安全、可扩展的编程语言来定义 3D 世界中的动态行为和交互逻辑,尤其是要支持由数百万创作者构建的、可组合、可演化的内容。

## Verse 编程语言

Verse 是 Epic 正在开发的、旨在解决元宇宙编程挑战的新语言。 * **核心目标**:为大规模模拟编程设计,易于初学者学习,功能强大到足以支持复杂应用,能让数百万开发者协作构建和扩展共享虚拟世界,并支持超大规模并发(如千万玩家同场景互动)。 * **设计哲学**:遵循 Niklaus Wirth 的原则——通过少量正交、可组合的基础特性实现强大功能。Verse 旨在修正早期编程语言(如 ALGOL 及 C 家族继承的一些设计)的不足。 * **关键特性:函数式逻辑 (Functional Logic)** * **核心概念**:表达式可以产生零个(失败)、一个(成功)或多个值(集合)。 * **改进 `if` 语句**:条件表达式成功时不仅执行 `then` 分支,还能绑定计算结果(变量),供 `then` 分支使用;失败则执行 `else` 分支。这比传统的布尔条件判断更强大、安全。 * **改进 `for` 循环**:循环体可以自然地产生多个值进行迭代,支持类似 SQL 查询的复杂逻辑(绑定变量、测试条件、生成结果序列),比传统命令式循环更简洁、强大。 * **统一性**:将条件判断、循环、查询等统一在“表达式可能成功/失败并返回值”的框架下。 * **类型系统与正确性 (Types as Theorems)** * **目标**:利用先进的类型系统在**编译时捕捉尽可能多的错误**,提高代码可靠性,这对于持续演进、多人协作的元宇宙至关重要(修复线上 Bug 成本远高于编译时)。 * **理论基础**:借鉴**类型论**和 **Curry-Howard 同构**(程序与证明之间的对应关系)。目标是让类型不仅表示数据种类(如 `integer`),还能表达**逻辑属性或定理**(如“函数返回一个已排序的数组”)。 * **逐步增强**:并非要求所有代码都进行形式化证明,而是提供逐步增强类型信息的能力。即使是简单的类型声明(`var X: int = 5`)也在“证明”5 是整数。未来,开发者(或 AI)可以为关键模块(如加密、数据压缩)编写更强的类型规范(带证明),确保其正确性(如内存安全)。 * **对 AI 的意义**:未来 AI 生成代码时,若能同时生成符合类型系统要求的证明,将极大提高代码的可信度。 * **并发性 (Concurrency)**:见下一节。 * **其他设计目标**:简单易学、通用性、高生产力(团队协作、迭代)、静态验证、高性能(实时开放世界多人游戏)、完备性(语言特性可被抽象)、永恒性(面向未来需求)、多范式(融合函数式、面向对象、命令式优点)、确定性、失败表达式、推测执行等。

Sweeney 提到,Verse 的学习曲线对于习惯了 C++ 等传统语言的程序员可能需要适应,但对于编程初学者,其逻辑可能更直观。

## 并发性 (Concurrency)

这是 Verse 旨在解决的核心技术难题之一,目标是让普通程序员能轻松编写可大规模并发的代码。 * **传统并发的困难**:手动管理多线程/多节点间的数据访问和同步极其复杂、易错,导致 Unreal Engine 前五代都避免在游戏逻辑层面大规模使用多线程。微服务架构是一种规避方式,但不适合元宇宙的开放协作环境。 * **Verse 的方案:可组合内存事务 (Composable Memory Transactions)** * **理论基础**:基于 1980 年代的研究和 Haskell 并发相关论文。 * **核心思想**:将程序划分为**事务 (transactions)**——一系列对内存的操作(读、写、条件判断等),这些操作逻辑上需要原子性执行。 * **推测执行 (Speculative Execution)**:程序员编写看似普通的、直接读写变量的代码。系统在后台**并发地、推测性地**执行大量事务。 * **本地缓冲与冲突检测**:每个事务的写操作先缓冲在**本地**,不立即写入全局内存。系统跟踪每个事务的读写集。 * **提交与回滚**:系统检查并发执行的事务间是否存在**读写冲突**。没有冲突的事务(意味着它们的执行顺序不影响结果)的写操作被**提交**到全局内存。存在冲突的事务则被**回滚**(抛弃其计算结果),并在稍后**重试**。 * **目标**:将并发控制的复杂性从应用程序员转移到**语言运行时系统**,从而使大规模并发对开发者透明、易于管理,最终支持如千万玩家同场景互动的超大规模模拟。

## 虚幻引擎 6 (Unreal Engine 6)

* **定位**:UE6 将是整合当前 UE5(面向传统游戏开发者)和 Verse/UEFN(面向 Fortnite 创作者和元宇宙)两条发展线成果的下一代引擎。 * **核心目标**: * **简化编程**:为所有开发者提供更易用的游戏逻辑编程方式(基于 Verse)。 * **提升可扩展性**:原生支持大规模并发模拟。 * **易用性与人才库**:使引擎更易上手,扩大熟悉技术的开发者群体。 * **全平台部署**:让开发者能一次构建,随处部署——无论是作为 Fortnite 岛屿、独立游戏,还是两者兼具。 * **开放经济集成**:让独立游戏也能接入开放的物品经济体系(如 Fortnite Item Shop),实现物品互通和收益共享。 * **时间表**:仍在开发中,预计预览版可能在 **2-3 年后**出现。Verse 语言本身则在 UEFN 中持续迭代更新。

## 独立游戏开发者 (Indie Game Developers)

* **成功的关键**:对于独立开发者,**生产力**至关重要,即在有限时间内创造出足够好、足够独特的游戏。 * **Epic 的支持方式**: * **工具**:提供功能强大且高效的 Unreal Engine。提及像《Choo-Choo Charles》的开发者 Gavin Eisenbeisz 甚至主要使用蓝图(可视化脚本)就成功开发了游戏。 * **内容市场 (Fab Marketplace)**:提供大量现成素材(免费或付费),让小团队能专注于核心玩法和独特内容创作,不必从零构建所有美术资源。 * **专业化分工**:内容市场的存在也让一些开发者能通过制作和销售素材为生。随着行业发展,专业分工越来越细,引擎和市场旨在让开发者能更容易地获取和整合不同专业领域的成果。

## 苹果 (Apple)

Sweeney 激烈批评苹果的 App Store 政策: * **核心原则冲突**:对比早期开放的个人电脑(Apple II, IBM PC),任何人都可以自由开发、分发、销售软件,无需平台方许可。而苹果 iOS 平台是封闭的。 * **具体批评点**: * **强制应用商店**:阻止用户从第三方渠道安装应用或运行自制应用。 * **强制应用内支付 (IAP)**:阻止开发者使用自己的支付系统,与用户直接交易。 * **30% "苹果税"**:认为这是对所有数字交易征收的“垃圾费”,远超平台提供的实际价值(估计运营成本约 6%),抬高了数字商品价格,挤压了开发者利润空间。这对那些不依赖剥削性 F2P 模式的游戏尤其不利。 * **选择性收费**:费用并非统一应用于所有类型的数字商品。 * **广告污染**:App Store 搜索结果优先展示广告,开发者为获得曝光需支付额外费用(可能高达 45%),进一步推高成本。 * **扼杀竞争**:阻止其他应用商店(如 Epic Games Store, Steam)在 iOS 上运行;限制 Web 应用的功能(如存储、3D 图形 API),使其无法与原生应用竞争,从而维护 App Store 的垄断地位。 * **滥用权力**:利用“软实力”(如故意拖延应用更新审批)打压不顺从的开发者。 * **阻碍元宇宙**:担心苹果会利用其平台控制力,限制元宇宙的发展,强制使用苹果的技术或征收高额费用。 * **Epic 抗争的原因**: * **自身地位**:Fortnite 的巨大成功和跨平台特性(大部分收入来自 PC/主机)使 Epic 有能力承受失去 iOS 平台的风险。 * **为未来铺路**:坚信开放、互联的元宇宙只有在打破苹果和谷歌的平台垄断后才能实现。 * **对苹果的期望**:希望苹果能回归开放精神,拥抱竞争,认为这最终对苹果自身、开发者和消费者都有利。他以索尼在跨平台游戏政策上的转变为例,说明开放带来的共赢。

## Epic Games Store (EGS)

* **创立初衷与 12% 分成**:EGS 的推出旨在通过提供远低于 Steam(30%)的 12% 收入分成,向行业惯例发起挑战,为开发者提供更公平的交易,从而促进市场竞争。 * **对批评的回应**: * **启动器“笨重”/功能缺失**:承认 EGS 启动器在用户体验和功能丰富度上落后于有 15 年积累的 Steam,表示 Epic 需要在“生活质量”特性上投入更多。解释了开发优先级(商业功能 vs 用户体验)的权衡,以及用户体验因网络环境和游戏库大小而异。强调 EGS 不会完全复制 Steam 的所有功能(如内置论坛),因为开发者和玩家已有偏好的社区渠道(如 Reddit、社交媒体)。 * **独占游戏**: * **性质**:强调 EGS 的独占是**开发者自愿选择**的结果,Epic 通过提供资金、营销支持等**激励措施**换取独占,而非强制。开发者有权决定其游戏的分销策略。 * **必要性**:认为对于一个**挑战者/后发平台**,独占是吸引用户、与占绝对优势的 incumbent (Steam) 竞争的**必要手段**。如果新平台只提供与老平台完全相同的游戏和价格,用户没有动力切换。 * **背景**:最初希望通过更低价格竞争,但发现开发者因担心受到 Steam 等平台报复而不敢降价,于是转向通过独占协议来竞争**供应**。 * **效果**:承认独占对不同游戏效果不一,大 IP(如《无主之地》)影响不大,小游戏可能因失去 Steam 曝光而用户减少。但认为这是打破市场僵局、促进长期竞争的必要过程。 * **与平台强制政策的区别**:再次对比苹果强制开发者使用其支付系统(扼杀竞争)与 Epic 提供激励换取开发者自愿独占(属于市场竞争行为)。 * **长期愿景**:EGS 是 Epic 长期战略的一部分,将持续投入。未来方向是**跨平台**,通过 Epic Online Services (EOS) 推动所有游戏实现跨平台社交和互联,利用**梅特卡夫定律**(网络价值与用户数平方成正比)提升游戏价值。批评 Steam 将其 Steamworks 局限于 PC 平台,阻碍了更广泛的互联。

## 游戏未来 (Future of Gaming)

* **核心驱动力:乐趣 (Fun)**:强调游戏产业的根本是为玩家提供乐趣。近期一些大作失败的原因往往是未能提供足够有趣或有竞争力的体验。 * **趋势:社交化与整合**:玩家越来越倾向于**和现实中的朋友一起玩**多人社交游戏。这导致了**梅特卡夫定律**效应的增强——能连接更多朋友的游戏吸引力更大,玩家群体向少数大型、长线运营的社交游戏**整合**(如 Fortnite, Roblox)。 * **游戏类型的分化**: * **大型长青游戏**:拥有庞大用户基础和持续投入,能够提供小型游戏无法比拟的规模和更新速度,形成“赢家通吃”的局面。 * **“度假”型游戏**:高质量的单人游戏或小型多人游戏,玩家会暂时离开主玩的大型游戏去体验,然后回归。这类游戏需要**高效开发**(控制预算),才能盈利。 * **对中型单人游戏的影响**:认为这种趋势对那些预算较高但无法形成长期社交粘性的传统单人游戏前景构成挑战。

## 史上最佳游戏 (Greatest Games Ever Made)

Sweeney 最欣赏那些能创造出**“栩栩如生、让你感觉置身其中、似乎无所不能”的开放世界**的游戏。他列举了: * 《塞尔达传说:旷野之息》(Zelda: Breath of the Wild) * 《上古卷轴 V:天际》(Skyrim) * 《荒野大镖客:救赎》(Red Dead Redemption) - 特别赞扬其环境细节和生态模拟的真实感。 * 《文明》(Civilization) 系列 - 赞叹其深度和对玩家行为的响应能力。

他强调自己并非游戏设计师,对游戏类型的未来持开放态度,认为最好的游戏类型尚未被发明,并将随着技术进步和工具赋能而涌现。他认为“世界模拟器”是一个有趣的方向。他欣赏那些**有“灵魂”**的游戏,认为好的游戏设计能塑造积极的玩家互动和社区氛围(以 Fortnite 的神秘感、轻松氛围和玩家间的积极互动为例,对比 COD 的“锐利”风格)。

## GTA 6 与 Rockstar Games

* **长开发周期的原因**:对于像 GTA 这样追求前所未有的真实感和细节深度的游戏,开发过程充满未知。解决一个问题可能会暴露更多新问题,不断推高品质标准。无法准确预测完成时间。 * **品质优先**:赞扬 Rockstar Games 宁愿花费大量时间也要确保最终产品质量卓越。“一个糟糕的游戏永远是糟糕的,一个迟到的好游戏最终会被发布并且是好的。” * **交付压力**:承认 Epic 也面临巨大的交付高质量产品的压力,尤其是在快速迭代的实时服务游戏(如 Fortnite 新赛季)中,很多问题只有在开发后期甚至上线后才能完全暴露和解决,需要接受持续改进的过程。

## 对未来的希望 (Hope for the Future)

Sweeney 对比了两种数字时代的人类互动模式: * **负面:文本社交媒体**:充斥着负面情绪、政治争吵、引流/炒作,往往通过激发对立来获取参与度,他认为这对社会根基造成了一定程度的动摇。 * **正面:实时社交游戏**:在游戏中(如 Fortnite)与真人(即使是陌生人)通过语音等方式实时互动,往往能自然产生**共情和积极联系**。他分享了自己玩 Fortnite 随机组队(Fill Squads)的经历,观察到不同背景玩家间普遍存在的积极互动。

他从中得出的结论是:**人类在共享空间(无论是现实还是足够沉浸的虚拟空间)中的实时互动,本质上是促进共情和积极关系的**,远优于异步、匿名的文本交流。他对游戏社区中展现出的积极社交动态感到鼓舞,并以此对人类未来保持希望。