MoreRSS

site iconDavid Mao | 木遥修改

数学奥赛保送北大数学系、UCLA 应用数学博士、明尼苏达大学博士后、Google 员工。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

David Mao | 木遥的 RSS 预览

AI 明白圆是圆的吗?

2025-08-12 18:32:04

遇到了一个有趣的问题,正好落在 AI 模型的能力边界处:试证明不可能把平面分成无穷个圆的无交并。

在我尝试的所有模型里,只有 GPT 5 thinking model 成功做了出来(虽然花了点时间)。

有趣的不是这个结论,而是观察它们的思路。所有失败的模型都有个共同点:它们的思考基本上是从文字到文字的。它们会调用自己脑海中各种已有的定理和知识,然后漫无目的地试图拼凑出一个证明,但所有这些定理,不管是拓扑的还是几何的还是测度的,对它们来说都是纯粹字面意义上的陈述。Qwen 的思考过程最典型:它滔滔不绝想了很久,但很显然从头到尾它都并不真的理解它在说什么。圆也罢,开集闭集也罢,Baire 纲定理也罢,对它来说都是纯粹的概念,给人的感觉是它甚至并不真的知道「圆是圆的」。

微妙之处在于,这种「没有几何直觉的几何思考」在某些时候其实未必是一种劣势。现代数学早已挣脱了对三维现实想象的依赖,大部份数学思考本来也确实是在纯粹的概念思辨空间中进行(特别是当问题进入代数乃至范畴论的领域的时候,这时从概念到概念的思考就变成了一种必然)。有的时候,几何直觉甚至反而会成为一种束缚,特别是当思考高维空间的时候,基于低维现实的直观常常是有误导性的。在这些问题上,AI 的「盲目」反而带来了自由,使得它不必受困于视觉直觉。——当然,人类的视觉直觉可能会渗透进人类的文本语料里,在某种程度上「污染」AI,但这是另一个问题。

然而对原问题来说,因为这是一个低维问题,几何直觉在这里不但有用,而且能大大缩短思考搜索的难度。在这一点上,一个把圆只作为抽象概念来理解的 AI 就会有巨大的劣势,因为它无法享受到几何直觉带来的跳步。这种直觉使得人可以一眼「看出」关键的构造,而这种构造在文本层面被搜索出来是困难的。

考虑到 AI 的应用毕竟大多数情况下还是为了解决世界现实问题而不是思考高维几何,有几何直觉的 AI 会在大多数问题上显得聪明得多。于是一个现实问题是,这种直觉是只有依赖多模态的训练才能获取,还是可以通过精巧的文本训练就能实现?这有点像是 AI 领域的玛丽房间问题。这是一个经典的知识论思想实验:一个从出生就生活在黑白房间里、精通颜色物理与神经机制的科学家玛丽,当她第一次走出房间看到红色时,她是否获得了新的知识?

今天大多数 AI 领域的困难都可以归结于此。人类是自己感官的奴隶,我们听到、看到、闻到,我们体会身体激素的涨落,我们想象、困惑、愤怒,然后试图把这一切投射在文字空间里。AI 则正好相反,它们在文字里理解这一切,但最终需要努力地——有时候是徒劳地——明白,一个圆在什么意义上是圆的。

坐照

2025-08-11 00:07:01

GPT 5 推出之后大家照例让它算 10.9 和 10.11 的差。它照例失败了,成了新一轮笑柄。倒是真的实现了传说中的 Ph.D level,因为博士生一般来说算术都不好。

当然这不是它一家的问题,别家 AI 也在这个简单的题目上纷纷翻车,包括我很喜欢用的 Gemini Pro 2.5。但 Gemini 翻车的姿势还要更炫酷一点:作为一款思维链模型,它知道这种时候应该调用 Python 来算。但当 Python 返回了正确结果之后,它的反应居然是:「我觉得 Python 算的不对,还是我自己来心算好了。」然后算错了。

这个错误虽然好笑,但暴露的是这一整轮 agentic AI 发展的致命弱点。Agentic AI 作为一个框架要能运行,前提条件是 AI 知道什么时候该使用并依赖外部工具。当然,这里的分界是模糊的:一个小孩子如果在算三位数乘法的时候掏出计算器,你不会批评。如果这个小孩算一位数乘法也要用计算器,你会怀疑是不是智力有点问题——当然无论如何至少结果是对的,但你会心想一个高级一点的大脑是不是应该合理判断这个问题不值当用外部工具。而现在的问题是这个小孩算一位数乘法,掏出计算器算了个结果,然后觉得不对扔掉了,自己心算了一个错误的答案出来。这是人类有可能犯的错误吗?

其实也是。而且如果你细想,这恰恰是非常「人类」的错误。人类的思维之所以不可靠,就是因为我们常常把直觉凌驾于客观证据之上。不是因为我们缺乏证据,而是因为我们不信任证据(例如曼德拉效应)。对人类来说,仅仅因为看到了和自己内心信念不一致的信息就放弃旧有信念不仅是困难的,而且是痛苦的。

但我们发明 AI 本意不就是避免这个缺陷?

于是我们面临着一个尚未有定论的问题,就是以大语言模型为基座的 AI 是不是先天继承了人类的心理偏见机制。我们对 AI 的期待是它能尽量不偏不倚。当然,在社会政治文化领域这是困难的,没有人能指望 AGI 在巴以冲突问题上能做到只看事实没有立场。但在别的更数字更技术的领域呢?给 AI 一份几万字的报表,AI 能够忠实灵敏地查阅所有细节,然后在回答问题的时候精确合理地引用某个细节吗?这不仅仅是我们对 AGI 的期望,这还是要撑起它所联动的万亿市值市场的前提条件。

今天的 AI 尚不能实现这一点,是因为这里有个内在的技术困难:思维链条不是数据库,而是把数据以自然语言的形式有损压缩在中间状态。这种压缩本质上就类似于人类以印象代替现实的思考模式,也是诞生偏见和误解的根源所在。要从根源上铲除它的土壤,就是要让这种压缩在事实上变成无损的。

于是我们面临两种可能的技术前景:

要么下一代思维链条(或者思维树,思维网络,或者不管什么别的数据结构)真的能实现对数据不依赖印象的理解和综摄。这在实践上已有尝试,比如程序化中间表示(JSON-graph、逻辑项、SQL、符号代数),或者对数字、日期、单位、表格索引做硬约束解码。简而言之,找到绕过以文字为思维载体的办法,把图像、数据和表格原生嵌入 AI 思考流程。

要么我们撞上了自然语言的先天限制。AI 将和人类一样,无论再怎么用力检查、对比、参考、判断,也只是不断用一层又一层的新的印象覆盖旧的印象,新的记忆调和旧的记忆,直到自己迷失在真实和幻觉之间的缝隙里。

前者是一种达芬奇式的前景,后者是一种博尔赫斯式的前景。或者用东方哲学的话说,前者意味着更强大的语言模型能够实现「坐照」之境,而后者意味着除非在底层重写技术框架,否则我们将不可避免的撞进文字障。

目前还没有证据证明哪个前景更有可能。前者如果成真,则立足于 AGI 的人类社会工业再数字化不但可行,而且指日可待。后者如果成真,则 AGI 不过是大号的人类,会在分裂和偏见之上引入新的分裂和偏见,不知伊于胡底。

大多数人对 AGI 的期待似乎是前者,并且这种期待如此底层,以至于甚至不需要宣诸纸面而是视为理所应当。然而如果人类运气不佳(一向不佳),我们很可能正在走向后者。

苦涩的教训的边界

2025-03-28 15:01:41

前几天在群里和朋友聊用 AI 写代码的痛点,我说我最大的抱怨是它在完成某些看似很平凡的任务的时候异常吃力,比如最常见的操作:把一个代码库里的某个变量全局统一改名。这个事显然开发环境有现成的接口,但 AI 只会逐个文件编辑,又慢又浪费还容易出错。这件事之所以荒谬,在于 cursor 自己就是个开发环境。换句话说,它在这件事上表现的像是那种两个部门老死不相往来的大公司,明明一个部门已经把某件事做到了近乎完美,另一个部门却对此不闻不问,非要用自己的笨办法重来一遍。

这听起来像是一个简单的可以修复的 bug,但它背后反映的是 AI 现状里一个巨大的鸿沟,这个鸿沟时时处处在各种 AI 应用里会以不同面貌展现出来。你试试看给一个业外人士(比如你的父母)解释为什么 AI 算不清楚两个数字谁大谁小,你会发现这种解释惊人地困难,因为人民群众的直觉在这里是合乎情理的:再怎么说,它自己就是个电脑,它为什么不直接算一下呢?另一个例子是我在玩 GPT 4o 生成图像的时候发现虽然模型虽然强大,但它仍然完成不好诸如「把一张风景照主体内容不动,把上面的天空再往上延伸一些」这样的 outpainting 任务,而这即使在十年前对传统图像处理来说就不是什么特别困难的问题了。

在这里,我们谈论的实际上仍然是自人工智能这个概念于1956年在达特茅斯诞生之日起就阴魂不散的「符号主义 vs. 联接主义」之争。在基于统计神经网络的大语言模型走上主流地位之前,人们一直认为基于符号计算的专家系统是通向智能最有希望的道路,几十年来的软件工程实践在这条路上已经走了足够远,常用的工具(比如传统的软件开发环境)基本打磨到了极致。直到上世纪末联接主义这个烧了几十年的冷灶咸鱼翻生,基于神经网络的大语言模型从零开始试图重写从轮子到火箭发动机的一切已有的软件工程成就。它遵循的是完全不同的生长逻辑,因此对习惯了旧世界的我们来说,它的表现常常好得莫名其妙也差得莫名其妙,有些技能近乎魔法,有些方面又笨拙得宛如一个弱智。前面所说的变量改名就是个有代表性的例子,事实上,这里的难点甚至都不在于语法解析,而在于更底层的文本替换——对旧世界来说,哪怕在亿兆级别的文本里要把所有的 A 都替换成 B 也不费吹灰之力,以至于你根本都不觉得这还是一个「任务」。但对大语言模型来说这件事天生困难,并且难度随着文本大小急剧上升。绘画也是这样,你想直接让今天的生图模型「对图片按照某些明确到像素级别的规则做某些明确定义好的操作」极其困难,它觉得整体重画一遍比较省事。对用户来说这种体验常常令人抓狂。

打一个不精确的比喻。这两种模式可以粗略对应于大脑的左右半脑。基于符号主义的左脑在过去几十年里得到了充分的发育,基于联接主义的右脑在过去十年里急起直追,并且仍然在极速进化。问题在于这两个半脑之间沟通——对应于人脑胼胝体的功能——极其孱弱,才会出现 cursor 的编程助手不知道如何调用 cursor 的编译功能这种奇葩问题。

于是人们开始引入中间层。

在现实中这个中间层会被人们冠以各种不同的称呼,有人认为自己做的叫垂直 AI,有人认为自己做的是 agent,也有人认为自己做的就只是单纯的 wrapper。但在这个上下文里,它实质上起到的总是类似于胼胝体的作用,让神经网络模型这个右脑可以调用已经高度成熟的传统软件左脑的功能来完成更复杂精细的任务。事实上,这一部分的历史欠账已经如此严峻,以至于哪怕接下来一两年里大模型本身的思考能力停止提高(并不是完全不可能),单单改善这个左右脑的对齐问题也能解锁许多前所未有的能力。在今天,如果一个人说自己在搞 AI 创业但又没有直接训练大模型,那他们的工作多半就实际上可以归属于这一类。

这当然在整体概念上是个充满机遇和潜在回报的领域。毕竟,现有的软件工程领域的应用如此繁荣,切入社会的所有方面。但值得改进和革新的方向又俯拾皆是。把现有的专业知识和大语言模型的智能结合起来,再造一次信息化革命,听起来是成千上万现成的创业机会。

但困难(以及有趣之处)在于,虽然这种泛泛而论听起来很难反驳,但你会发现对每一个具体例子而言,人们对它的价值都充满怀疑。问题的根源是这两个半脑中传统的那一个相对静止,而新的那一个每天都在变化。因此任何工作都像是在和历史(确切来说大模型的进化史)赛跑。一个近乎讽刺的事实是,如果两个人都在前年开始投身 AI 图像生成领域,一个花大量时间和金钱投入 ComfyUI 和工作流的研究,另一个两年都在游山玩水,本周 GPT 4o 发布更新之后他们仍然基本上站在同一起跑线上。换句话说,你很难说服自己(和投资人)相信,你不只是在一架上升中的电梯里做俯卧撑。

于是你会看到 Richard Sutton 的 The bitter lesson 被人一遍又一遍提起——我想不出除了 Shannon 等人的早期作品外还有哪篇短文在人工智能历史上有这么大影响力——简单地说,它概括了这样一种原则或者说是哲学:

AI 研究者总想把人类已有的专业知识经验塞进 AI。
它短期确实管用,还带来成就感。
但这么做迟早会遇到瓶颈,甚至阻碍 AI 的进步。

而真正的突破往往来自更多算力和更大的模型。

换句话说,大力出奇迹。除非你的专业应用有某些不同寻常的护城河,比如只有你自己掌握的独家数据,否则长远来看,通用模型总是能赢过专业方法。

回到上面那个左右脑的模型,这基本上就是在说右脑的成长如此势不可挡,以至于终将吞噬和取代左脑。因此任何立足于胼胝体的商业模型早晚都是失效的。或者用很多人很喜欢的一个说法:基于大模型的产品只是一个幻觉,模型本身才是产品。

当然,现实世界总是更为复杂。即使你认同 The bitter lesson 所阐述的原则,你也未必会接受这个极端的一刀切的判断。真正重要的问题在于边界何在,或者说,是否存在一些问题,即使对大模型的发展做最乐观的估计,用传统的(基于左脑的)软件工程解决方案也还是更为经济?如果这样的问题存在,围绕着它们所建立的接口就总是有价值的。

在我看来,这样的问题事实上大量存在。这篇文章开头所写的文本替换就是一个简单但有代表性的例子。你当然可能设想有一天大语言模型的 token 如此便宜,上下文窗口如此之大,以至于它真的能胜任亿兆级别的文本的文本字符替换。但它在这个问题上的效率上限也不过就是做到和传统工具一样好,换句话说,在这个问题上,左脑事实上已经掌握了 ground truth,右脑能做的只是逼近它而已。作为对照,上面举的另一个例子 image outpainting 则不然。虽然今天人们可以通过 Photoshop 一类工具做到这件事,但对它的实现几乎总是伴随着复杂的规则和需要考虑各种现实条件的工作流程,你完全可以想象有一天通用模型能够一鼓作气吃掉它。

现实中的问题几乎总是上面这两个简单例子的复杂混合。它们可能在各种层面纠缠在一起,并且由于历史的惯性并不被分别对待(因为在从前无此必要),但最终它们还是会被小心翼翼的解耦,然后分而治之。在我看来,这里才是所谓 agentic AI 领域的真正挑战:在日新月异一日千里的模型能力进化中辨认出仍然存在长远经济价值的「旧世界」的孑遗,进而围绕着它们构建人工智能接口。即使是为 AI 做带路党,也要做一名有长期利用价值的带路党。

目睹这场洪流之中新旧两个世界之间大规模的技能迁移,以及在洪流冲刷之后新的边界的浮现,可能是当下这个时刻最有意思的体验。

差不多两年前的这时候我写过一段话,后来被很多人转引过:

当你抱怨 ChatGPT 鬼话连篇满嘴跑火车的时候,这可能有点像你看到一只猴子在沙滩上用石头写下1+1=3。它确实算错了,但这不是重点。它有一天会算对的。

两年后你再访这片沙滩,那只猴子还在,但已经非复吴下阿蒙。此刻它正在充满困惑地摆弄一台袖珍电子计算器。电子计算器太小巧,显然是另一条文明路线下千锤百炼的产品,它的手指太粗太笨拙,还驾驭不了这么精致的工具。于是你充满信心——但也不无恐惧地——等待着它找到开关看懂按钮的那一刻的到来。

vibe coding

2025-03-14 14:54:00

如果你是程序员但还没听说过 vibe coding,那你已经落伍了。

这个词是上个月 Andrej Karpathy 在一篇半自嘲的推文里创造的,现在已经成了标准用语。没有人能精确定义它,但所有熟悉 AI 辅助编程体验的人都多少知道它大概在说什么。一些人对此嗤之以鼻,一些人认为这就是未来,还有更多人勉强让自己适应它。

Vibe coding 创造了一种模糊的实践。用 Andrej Karpathy 自己的话说:「对 AI 的建议我总是接受,不再审阅差异。当我收到错误消息时,我只是复制粘贴它们而不加评论,通常这样就可以解决问题。代码超出了我通常的理解范围。有时它无法修复错误,所以我只是绕过它或要求随机更改,直到它自行消失。」一方面它犹如神助,让你有一种第一次挥舞魔杖的幻觉。另一方面它写了新的忘了旧的,不断重构又原地打转,好像永远在解决问题但永远创造出更多新的问题,并且面对 bug 采取一种振振有词地姿态对你 gaslighting。你面对着层出不穷的工具甚至不知道自己该认真考虑哪个,心知肚明可能下个月就又有了新的「最佳实践」,养成任何肌肉记忆都是一种浪费,而所谓新的最佳实践只不过是用更快的速度产出更隐蔽的 bug 而已。

从技术上来说你可能觉得困难主要在于今天的大语言模型的上下文窗口还不够大,分层长期记忆机制还不够健全,或者别的什么理论上会在未来半年到一年里得到解决的瓶颈。但实际上,vibe coding 打破的是你作为一个程序员的自我认知:你一开始以为自己只是在为了效率做妥协,渐渐地你发现自己陷入在一重又一重建立在浮沙之上的迷宫里精疲力尽,最后你已经忘了效率是什么。

从某种意义上说,今天的 vibe coding 有点像一两年前的 AI 绘画,第一眼很对,放大后细节都是可疑的,到处是六根手指的手。问题在于,绘画远比编程更宽容——毕竟真的存在印象派这种绘画风格——编程难道不理应是非黑即白的吗?

但并不是,正是在这一点上现实开始扭曲起来。你很快就注意到 vibe coding 的「正确性」就像薛定谔的猫一样无法精确观察,你可能每天抱怨 LLM 的注意力窗口太小,而事实是你自己的注意力窗口更小,面对它不费吹灰之力生成的海量代码的冲刷很快就头晕目眩,放弃了审查和控制的执念。你试图借助类似于 .cursorrules 这样的规范来指导 AI,但这就像是野马辔头上的一根想象中的缰绳,你既不确定这些规则是否完备,也无从知道它们是否会被真的遵守。你以为这些原则相当于法律,其实它们只是孔子家语,而社会的运转既依赖于它们的尊崇神圣,也依赖于它们的晦涩模糊。你渐渐不再 care 你的代码是否正确,反正随时在改。Dario Amodei 说未来 3 到 6 个月内,90% 的代码将由 AI 编写,12 个月内几乎所有代码都可能由 AI 生成。在这个即将到来的世界里,六根手指的手应接不暇地出现,然后消失,你开始接受暂时 work 就是一切,变动不居才是事物的恒常。

某种意义上说这是这个时代的本质。当国际新闻和洋葱新闻开始无法分辨,当你发现所有号称追求真实的人最终追求的只不过是逃避认知失调,你所创造(或者你自以为你所创造)的一切也不会摆脱同样的命运。八年前我写过这样一段话:

躲在一个气泡里的个体可以假定岁月静好,一切宛如昨日幻乐,但这往往是悲剧的起源。他看到的只是一个复杂屈折的世界在更低维度上的投影,一个对狂飙突进的历史湍流的简笔画般的描摹,一个更容易被媒体所采纳和记忆的粗糙叙事,一座层移倒悬重重折射下的海市蜃楼。而真实——如果真实仍然有意义的话——则掉落在幽暗深邃的维度的缝隙里。在那里,一幅粗粝斑驳扭曲异质的图景,会让一个在不经意的一瞥之间扭过头去的观察者惊骇和战栗不已。

那时我以为世界刚刚开始崩塌。后来我理解了崩塌的不是世界,而是我自己的天真想象。 Vibe 不是真实的某种投射,而是它的实质。一开始你以为世界是一张完美的幕布,然后你在幕布上发现了一两条恼人的裂痕,接着你发现裂痕越来越多,无处不在,直到最后你意识到不断蔓延和生长的裂痕才是你真正生活的地方。It’s not just vibe coding, it’s vibe living.

小写的牧歌

2023-07-13 14:43:00

我无法忘记我第一次读昆德拉的文艺论集《被背叛的遗嘱》的时候的感受。

在第三章里,好像是莫名其妙的,他忽然开始为斯特拉文斯基辩护:

音乐无能力表达无论任何什么东西:一种感情,一种态度,一种心理状态,斯特拉文斯基在《我的生活纪事》(1935年)中说。这种断言(肯定是过分夸张,因为怎么能否认音乐可以激起感情?)在后面几行里说得更为准确和细致:音乐的存在理由,斯特拉文斯基说,不在于它表达感情的能力。

有趣的是,看一下这种态度引起什么样的恼怒。

……

安塞迈特批评:斯特拉文斯基“不曾,也没有试图把他的音乐变成表现他自己的一个行为,这并不是出于一个自由的选择,而是由于他的天性的某种局限,由于缺乏对他自己的情感活动的自主(最好不说是由于他的心灵的贫乏,心灵只有当它有什么可以去爱的时候,才不会贫乏)”。见鬼!安塞迈特,他知道什么是斯特拉文斯基的心灵的贫乏?他知道什么是斯特拉文斯基的爱的能力?他从哪里拿来这种断言:心灵在伦理上高于大脑?那些卑下之举,有和没有心灵的参与,不是也一样做得出来吗?狂热分子们,手上沾满鲜血,他们不会吹嘘伟大的情感行为吗?我们能不能终有一天结束这个愚蠢的情感调查?

这是什么意思呢?昆德拉把斯特拉文斯基视为自己的导师和同道。昆德拉无法容忍的是对斯特拉文斯基的这样一种评论:没有情感(在浪漫派的意义上),只有形式(在巴赫的意义上)和兴奋(在斯特拉文斯基自己的意义上)。

斯特拉文斯基的对立面还有阿多诺。在这一整章里,阿多诺都像是一个教导主任一般面目可憎:

我在想阿多诺听斯特拉文斯基的音乐的时候,有没有过哪怕一点儿的快乐?快乐?在他看来,斯特拉文斯基的音乐只经历唯一的一个邪恶的、剥夺的快乐;因为它所做的仅仅是给自己剥夺一切:表现性,管弦乐的音色:展开的技巧;它用恶毒的眼光去看古老的形式,歪曲了它们;它做出一副鬼脸,并无能力去发明;它仅仅是讥讽,做些夸张讽刺画,滑稽的摹仿;只不过是否定十九世纪的音乐,并且不仅仅如此,还根本否定音乐(斯特拉文斯基的音乐是音乐被从中驱逐的音乐,阿多诺说)。

奇怪,奇怪。那末从音乐中焕发的幸福呢?

阿多诺令我气愤的,是他的短路的方法,用一种可怕的简易法把艺术作品与某些原因、某些结果或某些政治的(社会学的)意义联系起来;所有十分细微的思考(阿多诺的音乐学知识是值得欣赏的)都因此导致了一些极为贫乏的结论。事实上,由于一个时代的政治倾向总是被缩减为仅仅两个对立的倾向,人们最终注定把一部艺术品分类为或属于进步方面或属于反动方面;又因为反动即是邪恶,审判所便可开始它的审判。

在这段论述里你可以看到许多你熟悉的影子,阿多诺活像是《不能承受的生命之轻》里托马斯的一名审判者。这是昆德拉花了一辈子描绘的主题:兴奋——不是崇高的兴奋,而是私人的兴奋——和贫乏的对抗。

有趣的是,这一整章的落脚点是昆德拉指出斯特拉文斯基的艺术生命和他作为一个移民的颠沛生涯本质地纠缠在一起。

一个移民的艺术问题:在数量上相等的生活块面,在年纪轻时或在成年时不具有相等的重量。如果说,成年时期对于生活和对于创作活动更加丰富和更加重要,潜意识、记忆、语言,所有的创作基础则很早就已形成;对于一位医生,这并不构成问题,但对于一位小说家,一位作曲家,远离他的想象,他的困扰,也就是说他的基本主题所联系的地方,会引发一种断裂。他必须动用他的全部力量,他的艺术家的全部狡猾去把这种境况中的不利变为他的王牌。

从纯粹个人角度来看,移民也是困难的:人们总是想到乡愁的痛苦;但可为糟糕的,是异化的痛苦;德文词DIEENTFREMDUNG(异化)更好地表达了我所要说明的一个过程,其中对于我们曾是亲近的变成为异外。

毫无疑问,斯特拉文斯基心中带着他的移民的伤痕;和所有人一样,毫无疑问,他在艺术上的演变,如果他仍留在他出生的地方,会是一条不同的道路。事实上,他穿越音乐历史的旅程之始恰好与他的故乡对于他来说已不存在那一刻相吻合;深知任何其他地方不能取而代之,他在音乐中找到了自己唯一的祖国;这不是来自我自己的一个美丽的抒情说法,我所想的再具体不过:他的唯一的祖国,他的唯一的自己的地方,是音乐,是所有的音乐家的全部音乐,是音乐的历史;在这里,他决定安顿下来,扎根、居住;在这里,他终于找到他的唯一的同胞,他的唯一的亲友,他的唯一的邻居。

他的攻击者,捍卫音乐是为表达感情而作的人们,认为他对自己的情感活动隐而不露令人不能忍受,并为此而愤怒,指责他心灵枯燥;是他们自己没有足够的心灵去理解他在音乐历史中游荡的背后是什么样的感情伤痕。

没有人比中欧的作家更明白移民意味着什么。昆德拉自己一生都挣扎在捷克和法国这两个精神上的母国之间。他当然不是唯一的一位,他自己在这一章里提到了贡布洛维茨和纳博科夫。和昆德拉一样,这些冷战移民作家在以各自的方式提出每个离开故国的人都无法不面对的问题——不是寻求答案,而是寻求问题本身,并且问题本身可能比答案更令人痛苦。

里卡尔在著名的《大写的牧歌和小写的牧歌》里这样评价昆德拉的旅程:

昆德拉对大写的牧歌的批评还有另一条途径,也许是最富有意义的途径,这正是我们在此想要探寻的。那就是通过作品构成另一个图景系统,构成另一个范式,但这一次,是建立在我们可称之为悖论式的“反牧歌之牧歌”的东西之上。

这一牧歌不可能上升到或进入到另一种生活。它在根本上就是另一种生活的反面,其本质就是自愿背离另一种生活。换言之,在这里,牧歌的条件不是超越,而是后退;不是对禁忌的侵犯,而是更为彻底的侵犯:对侵犯之侵犯。正因为如此,托马斯和特蕾莎在村子里时,并非处于边界的另一端,在那里,生活变成了命运,一切都有着意义且完满,历史在前进。而他们俩的安宁恰恰相反,是一种逃逸,是隐身于边界的这一端,隐身于非命运、非完满、重复且意义不完全的世界。

……美并非人们所向往的,而是人们所回望的东西,人们为之而重新堕落的东西——一旦与大写的牧歌决裂。大写的牧歌在兆示超越的同时,把我们领入到界限之外,领向一个比人们先前置身的地方更为美好的世界。在这里,昆德拉的美——与当代美形成最为强烈的对立——并非产生于侵犯,而是产生于我们称之为侵犯之侵犯的东西。它就是被大写的牧歌所侵犯的东西本身,也就是被大写的牧歌所遗忘、鄙视、抛弃的东西本身。

大写的牧歌的世界是「刽子手与诗人共治」的世界,然而:

正是在刽子手的追杀处,即在那个残余的世界中才有着牧歌和美。如暮色般衰微的、经受着威胁的美。

在这里昆德拉和斯特拉文斯基合二为一。「在这里,他(斯特拉文斯基)决定安顿下来,扎根、居住。」「在大写的牧歌的极点,在我们早就知道一定会双双死去的托马斯和特蕾莎的呵护下,在其困苦和脆弱之中,最终闪现出也已被死亡所裹挟的卡列宁温柔而平静的微笑。」

也正是在这里,昆德拉庇荫着每一个走在自己旅途上的你和我。

我们从未现代过

2022-10-10 23:25:45

周日 Latour 去世了。

对每个接触过 Latour 的著作的人来说,第一次阅读他都是一次洗礼。不管你是不是服膺他的理论——我在一开始非常不服气,后来也始终带着疑虑——你都不能不承认他在根本上动摇了你以为你已经作为不言自明的真理所接受下来的那些关于科学研究的观念。

简单地说,Latour 以一种全新的方式提醒人们:科学研究是一种人类实践。并且,像一切别的人类实践一样,它可以被从社会学和人类学的视角来审视。科学研究是科学家的事,但关于科学研究的实践本身的研究则可以也应当成为社会学田野调查的对象。

Latour 最著名的早期工作之一是他在美国著名的 Salk 研究所的田野调查。Salk 研究所是美国生物医学研究重镇,里面的研究人员高居科研殿堂的顶峰,宛如古罗马身着白袍的元老。而 Latour 对这里的科研活动的描述则完全是一部民族志,把科学工作者在视角中降到了巴布亚新几内亚丛林里的土著的地位。他一遍遍地问:在什么意义上,「科学研究」——或者它具体而微的版本:移液、培养、记录、整理数据、发表选择性的报告、说服同行、申请基金、获取声誉——是「科学」的?它和别的人类活动甚至别的灵长类动物的活动的区别在哪里?一个西方的人类学家在非洲可以津津乐道地研究部落中的巫术,但当他们回到纽约后,却只会研究地铁隧道墙上的涂鸦。Latour 精辟地问:你为什么不去研究地铁的调度室?是不是仅仅因为它在技术上更高级,就获得了审视上的某种豁免?

最终,他做出了著名的断言:实验室里的科学研究,和别的所有人类文化现象一样,只不过是一个社会建构的产物。

你很容易想到科学界对此的愤怒和不屑。在一场著名的论战里,同时是数学家和物理学家的 Alan Sokal 阴阳怪气地说:如果 Latour 觉得物理学只是一种「社会习俗」,他咋不从21层楼的窗户上跳出去试试呢?

事实上 Latour 并不是一个反科学主义者。恰恰相反,他后半生始终在不懈地回答如何让社会更好地接纳科学理论的问题。他不断试图解释:你只有把科学研究祛魅,把科学实践还原到人类朴素的知识建构体系之中,把科学家的工作方式透明化,你才能更有力地说服大众。——问题在于,这是两面不讨好的事。大部分科学家并不关心如此 meta 的问题,他们有自己研究中的日常困难需要全力以赴去对付。而那些真正相信地球是平的或者从21层的窗户上跳下去也没事的人也不会觉得阅读 Latour 对自己有任何帮助。你告诉他们科学是神圣完美的,他们固然不会信服,你告诉他们科学研究的背后充满着争议、妥协和政治,他们只会更加觉得自己是对的。

但 Latour 的工作,或者说他开辟的道路,仍然是有意义的,而且在今天尤其如此。

我不止一次在读到 Latour 的时候想,针对科学研究的民族志调查不是太过分了,而是太匮乏了。科学共同体诚然是小众的象牙塔,但内部纷繁复杂壁垒森严,生化环材和数学物理之间的隔绝犹如天堑,更不用说一日千里的现代计算领域。一旦你接受了「科学研究本身是一种人类社会活动」这个认知,你就会立刻意识到,所有这些万花筒一般的科学实践是多大的一个宝藏。数学里范畴论和构造主义的兴起,物理学中最小作用量原理的诞生,人工智能领域里符号计算学派和神经网络学派的争斗,它们都不是简单的仿佛吹去尘土露出珍珠一般的「新的科学发现」,它们是最好的例子,说明科学进程中人的视角,或者用 Latour 的话说,作为信仰、口头传统和文化的实践的重要性。

遗憾在于,这里面有些故事在学术界以外被讲述过,大部分并没有。一个人类学家可以饶有兴味地观察灵长类如何生火,但理解为什么哈密尔顿作用量如此重要并不是一个社会学家可以轻而易举完成的任务。

三十年前,Latour 断言说:我们从来都不是现代的。他的意思是说:人们自以为进入现代,其标志是人们把社会与自然分开,就像把文科和理科分开一样。但两者从未真正分离过。

三十年后,一方面,社会议题和技术问题的彼此交织更深刻了,在两者之间的任何人为划分都显得更加徒劳。另一方面,这两个世界之间的知识壁垒不是缩小了而是扩大了。人人都知道芯片在社会层面有多重要(并且人人都忍不住就此发言),但即使受过良好高等教育的群体中也没有多少人真的理解芯片究竟如何工作,芯片工业又如何运转,它远远超出了人类日常理性的理解能力。在此基础上的公共讨论就算不是虚伪的,也通常是浮光掠影隔靴搔痒。别的正在每个层面上深刻影响世界的领域——气候变化、疫苗、人工智能、自媒体和基于隐私的数据挖掘——也是如此。

Latour 生前写的最后一本书的主题是关于疫情中的 lockdown。仿佛是命运有意的安排,让他在临终前看到了关乎他一生学术视野的如此切题的一个案例。

他逝世了,但他提出的问题恰逢其时。