2024-11-19 08:00:00
提起 Richard Dawkins, 大部分人想起的是他的第一本书《自私的基因》(the Selfish Gene)。他后来写的 the Blind Watchmaker 从另一个角度探讨了和进化论相关的一些问题,我最近看了后觉得同样有趣和重要。和自私的基因一样,这本书比较老,第一版出版于 1987 年,但是内容一点都没有过时。现在能买到的大部分是 2016 年出的 30 周年纪念版,作者在前言里说他几乎没找到需要修改的地方,看完之后我不得不同意。
这本书的书名来自于一个叫 the watchmaker argument 的支持造物主存在的论证。大致的内容是:如果你在路边捡到一块奇特的石头,尽管它的纹理或者形状很精妙,你也能相信它是通过一个自然的过程偶然形成的。毕竟天下有那么多石头,总有一些会具备看来奇特的性状。但是如果你在路边捡到一块表,你无论如何都不会相信这样精密的物件是一个自然过程的偶然结果,而不是来自于一个制表匠的刻意设计。自然界和生命的复杂度远远高于一块表,所以更不可能是偶然形成的,有意识有目的的造物主一定存在。这个论证最早出现在英国人 William Paley 的书里,但在他之前的牛顿、笛卡尔等人也都认为宇宙的运转和钟表类似,上帝就是钟表匠,科学家发现的只是上帝设计的规则。看这本书让我想起正好 20 年前的冬季我和导师到 Rutgers 开会,回 New Haven 的路上下着大雪,所以他只能慢慢开车。路上的几个小时里我们在聊为什么宗教吸引了那么多人,大概就是因为人类很难理解几百万年到几亿年这个区间里自然的演化过程能产生的结果,于是必须求助于造物主来解释生命的存在。
我初到美国的时候,最让我惊讶的事之一是在科技发展最前沿的国家竟然有一些州在争论是否应该在中小学教进化论,或者是否应该同时教神创论。直到现在其实也没有多少改变,现在美国大选最主要的议题之一是女性的堕胎权,而且反对者的依据来源是宗教而不是科学和伦理。我一直认为宗教对教育和社会的影响是美国的 bear case 里排前面的。在中国宗教离大部分人的生活很远,对教育更是没有影响力,总的来说是正向的事。但是因为少有争议和质疑,在大众文化中也就缺乏有意义的讨论。大部分人把进化论作为事实简单接受,从没考虑过其中的细节,比如像眼睛这样精密而脆弱的器官,是如何通过进化过程形成的。另外物种的边界在于同一物种个体间可以通过交配产生后代,不同物种的个体间无法产生健康的后代,那么如果不同物种是从共同祖先进化而来,那新的物种刚分化出来时岂不是无法繁衍?
这本书耐心并有说服力地回答了上述这些细节问题,一一拆解了进化论反对者的各种质疑。可以说在看过 the Selfish Gene 和 the Blind Watchmaker 之后我才算真正理解了进化和自然选择,对自己在这方面的知识有一种踏实和完整的感觉。
2024-06-26 08:00:00
最近我偶然看到了王垠 Substack 上的《不要去医院验光》,当然因为没付费订阅我只能看到开头几段1。然后点上面的链接到了他博客上的「自然视力恢复法」。考虑到这两篇文章的危害,我觉得值得写一点东西给看我博客的人做一些参考。
王垠这个名字很多人都不陌生了,他从清华退学的时候我还在读博,当时还写了一篇文章来评论这件事,~不过现在已经找不到了~2。我那时看他写的宣布退学的文章留下的印象是他是个很聪明但视野有些片面、想法有些偏激的年轻人,没想到他后来变得越来越极端和愤世嫉俗,成了阴谋论的传播者。他的聪明和在计算机方面的一些天分让他成为了一个 influencer,颇有一些追随他意见的人。而当他推广的看法超出计算机领域,有可能实际影响别人的生活时,就危险了。
首先验光之所以要散瞳,就是为了测量在肌肉彻底放松的状态下眼睛的度数,这样才能让眼睛在戴眼镜后也能尽量放松,不存在他说的「度数会验得比实际需要的度数大」。而且医生也往往会透过放大的瞳孔检查其他眼科疾病。散瞳并不像他说的一样是「故意的欺骗行为」。他在文章里说:
而且散瞳用的阿托品会麻痹肌肉,这种药物应该也是有毒物质。偶尔一次可能还好,经常往眼睛里滴这种东西,不知道是什么后果。
如果不知道的话,恐怕不应该凭想象说某种药物「应该」也是有毒物质。
他在自然视力恢复法一文中提倡的基本观点是,近视是由于眼球外部肌肉长期紧张导致眼球变形造成的,近视的人应该戴度数浅一些的眼镜或者不戴眼镜,这样可以逐步让眼睛恢复正常。他说:
近视产生的根本原因,是长时间紧张地看近距离的物体,而跟光线,遗传什么的都没有直接的关系。
现代医学广泛接受的结论是:遗传是近视最主要的风险因素。
王垠在文章里引用的主要依据是 William Bates 写的 Prefect Sight Without Glasses。这本书是 1920 年由作者自出版的,里面说的近视治疗方法被称为 Bates method。而 1929 年 FTC 就发出对他的投诉,指控他进行虚假或误导性的宣传。在这一百年里相关的临床试验都表明他在书里说的那些练习对治疗近视是无效的。确实有一些近视的人在不戴眼镜一段时间后报告说视力比原来有所提高,但这个现象有很合理的与主流医学相洽的解释。不戴眼镜一段时间后,因为看到的东西是模糊的,大脑会在处理视觉信号时进行补偿来适应光学上的失焦。这就好像你可以用 Photoshop 来提高照片的锐度,或者用计算机视觉模型来让原本有些模糊的图像变得看起来更清晰。但这种提升是有限的,也不是对近视的治疗,更不是提倡不戴眼镜或者降低度数的合理原因。
Bates 的书篇幅很长,我以其中一章为例来说明它有多边缘、荒谬和危险。第 17 章是 Vision Under Adverse Conditions a Benefit to the Eye,可以翻译为「不利条件下的视力:对眼睛的益处」。在这一章里,他说包括阳光在内的强光对眼睛都是无害的,所有的不适感都是暂时的,直视太阳不但不会对眼睛造成永久伤害,还能帮助恢复视力。
他甚至还说有一部分患者如果是把阳光直接聚焦在眼睛上效果会更好。
Bates 所在的年代抗生素还没发明,可以说现代医学还没开始,他的书和观点在后来广受主流医学界否定。引用他写的内容来给别人提供医学建议实在是非常不负责任。
总结一下,术业有专攻,健康相关的问题还是要听医生的,如果对一个医生有疑问就多问几个医生,不要受互联网上非专业人士(包括我在内)写的东西影响。也不要相信某个行业在全世界范围内联合起来秘密牟利这样的阴谋论。
伪科学竟然还要钱 🤷 ↩︎
后来意外从 Wayback Machine 找到了。 ↩︎
2024-06-25 08:00:00
读博士的时候我们系每年春季都会有一两天让在读的博士生留出特定时段待在自己的办公室,因为一些接到耶鲁的 offer 但还没有做决定的学生会到学校参观,他们可以到系里走访在读的学生,通过提问交谈更全面地了解学校和院系来帮助他们做决定。有一次走进来一个头发已经有点白的人,我还以为是本校其他系的教授,而他告诉我他拿到了我们系的 offer,所以来看一看。他多年前毕业于一所知名法学院,在纽约已经是一位成功的律师,但是他后来对计算机更感兴趣,所以决定不再做律师而从头开始学计算机。和我面谈时他已经完成计算机科学的本科学业,并被几个学校的博士项目录取。我问他是不是希望做计算机犯罪之类与法学相关的领域,他说不是,就是想完全转行。我对这件事印象深刻,一直记得。在我学生时代的认知里,高考时的选择基本上决定了一生的方向,而这个人在人生到了一半的时候不是只改变了方向,而是回到一个新的起点重新开始。
今年我一位侄女高考,所以问了我一些关于学校和专业选择的问题。我的基本建议是优先考虑报一所好的学校,专业是其次,尽量和兴趣接近就行。因为学校决定了未来四年的学习环境,这是很难再改变的因素。而大学里通常所有课都是可以选的,想在另一个专业再拿个学位也不是不行。这是我在走过这条路后回过头来按理性的思维给的建议,但是我自己高考的时候却是反其道而行,所有志愿填的都是计算机相关专业,并且不服从调配。当时我们还是先提交志愿后参加高考,不确定性更高。那时自己的概念里大学专业就决定了未来的从业领域,所以即使被录取到差一些的学校也不想在专业方面做妥协。所幸没有考得太离谱,还是被按第一志愿录取了。
我曾经觉得自己在这方面很幸运,在中国的同龄人里较早开始接触计算机,从小就知道未来想做什么,所以在别人纠结专业的时候我完全不需要选择,而自己的兴趣也正好是发展很快、机会很多的领域。但是随着年龄和经历的增长,我越来越觉得因为过早地在某方面产生强烈兴趣而排除了其他可能性未必是一件好事。Nike 创始人 Phil Knight 在他的自传 Shoe Dog 里说:
I feel sorry for the people that know exactly what they’re going to do from the time they are sophomores in high school. I think the process really needs to go through a time period before you really find what it is.
他所同情的大概就是我这类人。我在中学之后偏科是比较严重的,注意力都在计算机和英语上,到了最近这些年反倒因为对其他领域的好奇心而看了很多书来填补知识的欠缺。我比较后悔的一件事是在有时间有条件的学生时代没有更多地向广度扩展知识体系。
如果你关注 Charlie Munger 的文章或演讲,会知道他在很多场合强调过多学科思维的重要性。他认为具备多学科的基础知识和思维模式对于做正确的决策是至关重要的。只精于一门的人,一方面容易管中窥豹,拿着锤子就觉得什么都是钉子1,另一方面在某方面的资历越高,就越容易自信、越看不到自己的盲区、越可能在自己的称职范围之外做错误的决定。Liberal arts 教育对本科的定位是有所侧重的通识教育,所以很多美国大学都是先进入学校学习一段时间后再选专业。耶鲁的很多本科生到最后一年才选定专业,并且本专业的学分只需要占到毕业所需总学分的三分之一,所以拿双学位是很常见的事。在我们系即使是博士,前两年也要上各方面的课程,必须通过所有四个领域的综合考试2才能选择导师和具体的研究方向。我的导师在计算机科学的多个方向都有很高的成就,所以无论我选择在哪个方向深入下去,他都可以指导我。有一次我告诉他我对很多东西都挺感兴趣的,苦恼于如何决定博士论文的主题。他对我说「不用担心,大部分人的问题是专业化得太早,那并不是一件好事」。
很多父母都会努力让孩子「不要输在起跑线」上,就好像人生是一场赛跑。如果这么看的话,人生的轨迹就应该是线性的,每个阶段做的事情都应该是以上一个阶段为基础,不断积累,这样才能把到达终点时的某个指标最大化(可能是金钱、名望、或其他用来衡量人生的标尺)。以这样的人生观,本文开头的那个律师就不应该放弃已经有丰厚回报的事业到另一个领域从零开始。但是人生并不是一个比赛,往回看的时候充实感来自于在有限的人生里对多种可能性的探索,对大千世界的体验,以及对自己好奇心的满足。我很尊敬那些追随内心,不介意成为另类,在任何年龄都有勇气再次成为新手的人。
2024-06-13 08:00:00
过去一两年有多位投资人朋友和我讨论过 AI 相关的创业机会。我的观点一直都是:大的机会基本上是巨头的,小公司没有特别好的机会。
当技术上的突破让小公司有机会颠覆大公司时,新技术最初的应用都在巨头看不上的新兴细分市场。随着这些市场快速扩大,小公司在成长起来后迅速地进入主流市场抢占原主导者的份额。随着原本不存在的个人电脑市场兴起的 Intel、Microsoft 等是最好的例子。近年来 AI 的发展在技术上有很大突破,但商业上的局面却没有给创业公司颠覆性的机会。一方面这是巨头们从一开始就重视的领域,投入很大;另一方面机器学习本身就需要大量的资源和数据,所以大公司或者他们投资的企业往往更有能力持续产出最好的成果。
另一个原因是新 AI 技术的应用往往是对现有场景和过程的改进或补充,没有创造出以前不存在的全新场景,所以对于已经掌握了用户关系的产品来说,后来者无法形成威胁。我喜欢举的例子是 Adobe 能在 Photoshop 中增加 AI 功能,Stable Diffusion 和 Midjourney 却不可能做出替代 Photoshop 的产品。在这种情况下,谁掌握了与消费者的直接关系,谁就掌握了市场。没有什么是比随身携带的手机和消费者关系更密切的,在可见的未来仍然如此。手机不仅仅是设备,还是包括应用和开发者在内的整个生态。Humane 和 Rabbit 之类的公司错误就在于试图做一个完全独立于手机但是又无法让用户不用手机的产品。Apple 的产品与消费者之间的密切关系决定了短期在技术上有没有走在最前面不是特别重要。OpenAI 做不出 iPhone 的替代品,更别说 iOS 的整个生态。但 Apple 可以把 OpenAI 的能力整合进自己的产品。如果 OpenAI 不愿意合作,还有 Claude 等众多选项,虽然不一定是最好,但差别也不大。
Apple 的设备会把一部分非个性化的请求发送给 ChatGPT。有一些媒体说与 Apple 的合作对 OpenAI 是利好,但是我认为 OpenAI 的收益是非常短期的。第一,Apple 与 OpenAI 的协议规定他们不能存储用户数据1;第二,Apple 在技术上也有措施避免 OpenAI 把同一用户的多次请求关联到一起。所以 OpenAI 得到的基本上仅限于财务收益,和用户之间建立不起有意义的关系。Apple 之所以在使用 ChatGPT 的时候明确告诉用户,一方面是为了透明,让用户知道信息发送到了哪里;另一方面恐怕也是要避免为 ChatGPT 引起的问题背锅。考虑到 Apple 走的从芯片到整机、到软件、到服务的垂直集成路线,以及 OpenAI 与 Microsoft 的密切关系,Apple 一定会在尽可能短的时间内用自己的方案替代 ChatGPT。可以说在战略上 OpenAI 是比较被动的,这是个他们无法拒绝的 offer。无论接不接受,他们自己的独立 C 端产品在 Apple 的平台上都不再有存在的意义,但自己赚这笔钱总比让竞争对手赚好。而且无论如何 Tim Cook 都会说「我们找了市面上最好的 partner 合作」,OpenAI 可不愿把这个背书给别人。
现在的 OpenAI 让我想起以前的 Nuance. Nuance 曾经是语音识别做得最好的公司。据说 Google Voice Search 最早是用 Nuance,但同时 Google 也用 Nuance 返回的结果训练了自己的语音识别系统,最后向第三方推出了语音识别服务,成了 Nuance 的竞争对手。过程是否真是这样我没能找到实证。很多知名汽车品牌的车机系统和 Siri 的早期版本都使用过 Nuance 做语音识别,但这家公司后来一直没发展到很大,最后被 Microsoft 收购了。即使是现在股价已经上天的 Nvidia,从长期来看在整个生态中的地位也并不是坚不可摧。芯片设计生产和相关的底层技术门槛当然很高,但是往后绝大部分面向消费者的 AI 应用的集成点会是 Apple、Google、Microsoft 在操作系统层面提供的 API,而不是 CUDA.
Apple Intelligence 是目前为止最让我兴奋的 AI 产品。之前的各种 chatbot 都仅限于给用户提供答案,实际根据这些答案执行动作还要靠用户,而 Apple 则有条件让 AI 代替人完整执行一些任务。当然这样让 AI 的决策直接造成现实中的结果是有风险的,如何尽量把人工操作在流程中减少,同时又让风险可控,这是个需要仔细平衡的问题。Apple 的另一个独特优势是可以访问用户的大量私有数据,从而能帮助用户完成高度个性化的任务。说到这个,Google 曾经有个叫 Desktop Search 的产品,是帮助用户检索 Windows 和 Mac 上的本地文件的,后来被关闭了,如果留到现在会很有价值。
Apple Intelligence 带来的可能是类似 2007 年 iPhone 一代发布所引起的从功能机到智能机那样的重要变化。Apple 的商业模式不依赖于所谓 user engagement2,在隐私保护方面也有比较好的 track record,在几大巨头里或许是最适合推动这个历史进程的公司,结果应该会更符合大众利益。
虽然以 OpenAI 的 ethical standard,我很怀疑这一条能执行得有多严格。 ↩︎
比如 Apple 还有 Screen Time 这样的功能来帮助用户避免过度使用他们的产品。这方面的讨论详见我写的关于搜索和广告的文章。 ↩︎
2024-06-03 08:00:00
我 2007 年至 2010 年在 Google 工作的时候,中国的同事们都说百度无良,欺骗用户,把广告显示得和原生搜索結果几乎一样、难以区分。Google 的搜索广告在 2013 年之前一直是通过背景色与原生结果明确区分的。
后来背景变得和原生结果一样,改为用彩色的标签来标识广告。无论在用背景色的时代,还是用标签的时代,Google 都做过很多试验来通过调整颜色提高转化率。从 2020 年起,Google 的广告变成这样了:
不但视觉上和原生广告完全融合,而且首屏已经被广告占满。这个结果可以说是必然的,不做任何试验就能知道广告样式越接近于原生结果,点击率必然越高。之前做的种种实验无非是 Google 创立之初的价值观和与之矛盾的商业模式相纠结的漫长而耗资巨大的过程。
很多人都读过 Google 的两位创始人在创立公司之前写的 PageRank 论文,但很少人会看附录。这篇论文的附录 A 是 Advertising and Mixed Motives:
… The goals of the advertising business model do not always correspond to providing quality search to users. … It is clear that a search engine which was taking money for showing cellular phone ads would have difficulty justifying the page that our system returned to its paying advertisers. … we expect that advertising funded search engines will be inherently biased towards the advertisers and away from the needs of the consumers.
Since it is very difficult even for experts to evaluate search engines, search engine bias is particularly insidious. … Furthermore, advertising income often provides an incentive to provide poor quality search results. … This of course erodes the advertising supported business model of the existing search engines. … But we believe the issue of advertising causes enough mixed incentives that it is crucial to have a competitive search engine that is transparent and in the academic realm.
不难看出在刚有 Google 的时候两位创始人认为基于广告的商业模式与用户的利益和高质量的搜索结果是有根本冲突的。只是当时 Google 还不是一家公司,所以他们可以义正辞严地批评其他搜索引擎并说明 Google 做为一个无广告的、学术界的搜索引擎的重要性。他们似乎认为靠广告盈利和作为学术性的、非盈利的服务是一个搜索引擎的唯二选择。
广告成为互联网的主要或者说默认的商业模式对用户和行业生态是个悲剧。这个话题值得单独写一篇文章来探讨,但简单地说:靠广告得到收入让用户因为不用支付钱这种容易衡量价值的资源而有一种「免费」的错觉。但同时用户往往在付出更加宝贵的资源,比如时间和隐私。这些资源虽然价值更高,但因为难以衡量,所以大部分人在付出时并不像对金钱一样敏感。向用户直接收费的产品往往会通过使用频次、时长等信息来了解用户习惯,从而在产品设计上进行取舍,但不会为提高这些指标而做对用户没价值的改动。对于以广告盈利的产品来说,因为提高广告收益是终极目标,优化的是与此相关的用户行为指标,而不是对用户的价值。这种利益的错位在基于推荐的产品中比搜索引擎更加严重。为了引导利于广告收益的行为模式,无论是设计产品的人还是推荐内容的算法往往会让用户更多接触到符合自己已有观点的信息,形成信息茧房,限制用户的视野,加剧社会的极化。所有公司都会宣称把用户价值放在第一位,对有的公司来说是产品为用户提供的价值,对更多的公司来说实际是用户给广告主提供的价值,取决于哪一种含义是和商业模式对齐的。
因为以上的原因,我很愿意支持那些有简单和健康的商业模式又为用户提供高价值的优秀产品。所以去年试用 Kagi 之后我开始付费,到现在已经用了半年多,累计省了很多时间,感觉再也回不到 Google。Kagi 是一个订阅制的无广告的搜索引擎。它和过去出现的 DuckDuckGo、StartPage 等 Google 的替代产品有两个显著差异:
我就偷懒借 Vlad 博客里的两个例子来说明。
当你搜索一个技术问题时,你想看到的是官方文档或者同行的技术博客,而不是一些工具和云服务的广告。
当你在购物前做研究时,你希望看到的是论坛上真实用户的评价和评测网站上的对比,而不是一堆电商平台的下单链接。
除了总体上更好的搜索体验以外,Kagi 对我来说有三个比较特别的优势。
第一是强大的个性化功能。每个用户可以按自己的需要把个别网站在搜索结果中置顶、提权、降权或屏蔽。比如如果你经常查找编程相关的内容,可能会想把 Stack Overflow 或者 MDN 提权或置顶。
第二是完善的家长监护功能。我小孩会花过多的时间看 YouTube 上的 Minecraft 视频,虽然我可以在 Screen Time 把 YouTube 禁用,他还是会用 Google 结果里的内嵌视频看。我买了 Kagi 的 family plan,设置好他的儿童账号,在 Kagi 把 YouTube 禁掉,再在 Screen Time 把 Google 禁掉就完美解决了这个问题。
第三是如果订阅 Kagi Ultimate,除了搜索外还可以使用 OpenAI、Anthropic、Google、Mistral AI 的所有语言模型,价格只相当于其中一个的订阅费用,是很划算的。
自从有搜索引擎以来,主流的搜索引擎都是免费的,所以大部分人也都已经习惯,为搜索付费听起来是件不可思议的事。就连英文媒体介绍 Kagi 也用 premium search engine 来描述,暗示并不针对大众用户。但是有足够多的人愿意订阅在线流媒体服务,Netflix 能成为市值近三千亿美元的公司。相较而言,与学习、工作、生活息息相关的搜索价值要大得多。Kagi 在五月份宣布已经实现盈利,商业上的可持续性得到了初步验证。如果你也觉得 Google 的体验越来越差,也希望给你提供信息的服务动机和你的利益而不是广告主的利益一致,可以考虑用钱包投票支持一下 Kagi 这样的产品。如果这样的商业模式成为主流,用户在真正意义上成为各种网络服务的客户,互联网生态可能会变得很不一样。