Platform Thinking的 RSS 预览

探索继续，2026 夏季再见

2025-09-06 23:57:20

暂时收起“作品”的执念，把精力放在观察、学习和连接上。

代码的 YouTube 时刻

2025-05-28 07:52:24

虽然周一才宣布 newsletter 暂停更新一段时间，两天内就破戒了——不过这是一篇未发表的旧文。

本文写作于 2024 年 9 月 26 日，也就是 8 个月前。

当时，我们还没有看到 o3、Claude 4 和 Gemini 2.5，Vibe Coding 这个词还没有出现，但 Cursor 已经非常好用了。在自己独立完成了几个小工具的开发后，我意识到，代码生成不仅限于现有的使用场景，而可能成为更多人新的表达方式。隐约觉得，这可能是一个类似 YouTube 和 UGC 的机会，于是写了这篇文章。写完放了几天，又觉得太多不确定，于是没有发。

今早读完了晚点对 YouWare 创始人明超平的一个访谈，再一次让我想起了这篇旧文。他的很多思考又比我当时更深刻了，而且做出了实际的产品。

给我最大启发的有以下几个点：

对技术带来的变化要乐观。比如他讲道：“举个例子——未来生成代码的时间，可能和你打开一个网页加载内容的时间差不多，200 毫秒、300 毫秒。网页不再是写好的，而是访问时实时生成的，coding 不是写出来的，是生成后选出来的。”——这就是一个对技术进步做合理乐观预判的例子。
把 AI 看成人，以此来思考人与 AI 关系：“在我脑海里，未来可能会形成一个 Agents 网络，这里有三重网络效应：人和人之间、人和 Agent 之间、Agent 和 Agent 之间。我也理解了为什么 Google 要推 A2A（Agent to Agent 协议），因为未来可能每个人有一个自己的 Agent，它帮你跟几百万 Agent 通讯。”——我在去年 9 月份的《无面之网》这篇文章中也提到了类似的看法。
平台的机会来自于人性底层交流欲望和交易需求：“这不仅是直觉，我已看到了迹象。为什么 3 月初那天我要手搓 YouWare 第一版？因为我看到不少人在 Twitter 上录屏分享用 Grok 3 写的游戏。但录屏是一种对创作者和消费者双输的分享方式，它不能交互，无法完整传达 coding 作品的创意和效果。”——我最近因为做了 Podmark，就特别有分享的欲望，但现有的社交 / 内容平台限制太多，容器已经不适合了，新平台呼之欲出。

AI 变化太快，几个月前写的东西，今天看可能有些地方很可笑，权当抛砖引玉，仅供各位参考。

25 岁的产品设计师 Yash Bhardwaj 抛出一个观点：写代码可能即将迎来它的「YouTube 时刻」。YouTube 的联合创始人 Chad Hurley 也转发了这条推文，并打上了一个意味深长的表情符号：🧐，含义是：深思熟虑或仔细观察，暗含一点不确定。

谈谈 YouTube

Bhardwaj 认为，YouTube 的爆发源于三个关键因素：

视频托管成本趋近免费
视频编辑成本降低，且移动化
手机摄像头质量大幅提升

和这个「创作门槛降低」叙事相符合的一个很流行的版本是：YouTube 的爆发是因为数码相机的普及让很多普通人也有了不少的视频存货。这个说法其实并不准确，让我们来回顾一下 YouTube 发展的历史。

YouTube 是一个诞生过早的产品。2005 年发布时，世界并没有准备好 Bhardwaj 所说的三个条件（AWS 要到 2006 年才正式发布），虽然互联网大大降低了视频创作的门槛，但这并不意味着内容供给就会自动发生。在竞争、烧钱和版权纠纷的压力下，仅仅过了一年多，创始人们就同意把公司出售给 Google 了。

广告业务老兵 Susan Wojcicki 在 2014 年接手 YouTube 业务后，为 YouTube 带来了强劲的商业化能力，并把这种能力赋予了平台上的视频创作者。另一大贡献用 ContentID 算法彻底解决了令人头疼的版权问题，YouTube 很快和各大唱片、电影公司达成平台级的合作。YouTube 在 2019 年达到了每分钟上传 500 小时视频的惊人内容供给量。Covid-19 在视频消费规模上再次加码，YouTube 一度消耗了全球互联网带宽的 15%。

商业化和版权内容的加入使得 YouTube 的创作者生态发生了微妙的变化，从单纯「为爱发电」逐渐转变为考量收入和盈利能力。

今天 YouTube 上最成功的创作者 MrBeast 就是在这段时间爆发的。2017 年，他发布了一段长达数十个小时的挑战视频，内容是从 1 数数到 100,000，这个视频大获成功，订阅者超过 100 万，一年后超过 1000 万，2022 年超过 1 亿，目前已经超过 4 亿。

MrBeast 摸索出流量增长的黄金共识：不可思议的挑战 + 巨额奖金。在一份长达 36 页的 PDF 中，MrBeast 分享了秘诀：每个视频创意都是从一张抓人眼球的封面图开始的，要求每个视频中都有一个 wow factor，每一分钱都要花在视频中肉眼可见的地方。

他在 2021 年制作的模拟 Netflix 剧集《鱿鱼游戏》的真人秀就是这一模式的典范：在这个 25 分钟的视频里，有 456 人争夺 456,000 美元的现金奖励，总制作成本超过 3 百万美元，MrBeast 甚至给它增加了 16 种不同语言的音轨。付出巨大，但回报也是惊人的：这个视频一周内被观看了 1.3 亿次，累积观看次数现在已经超过 6.5 亿，这一年，MrBeast 以 5400 万美元的收入登上了 Forbes 百大名人榜。

MrBeast 只有一个，但 YouTube 有无数个想要成为 MrBeast 的创作者。虽然 Broadcast Yourself 的品牌口号已经悄然不见，但 YouTube 拥有上亿个活跃的频道，其中 2840 万个频道拥有至少 100 个订阅者，而只有 5 个频道有超过 1 亿订阅者。

深谙内容行业的投资人 Blake Robbins 分析了这些成功的创作者是如何根据平台算法来优化自己的内容制作：

人们普遍猜测 YouTube 的算法会根据总观看时间对视频进行优先排序和奖励。这意味着从头到尾观看的视频将通过 YouTube 的「推荐」面板在算法上向其他人推荐。MrBeast 已经精通了这一点。他几乎所有的视频概念都围绕着观看视频结束 ... 随着观看时长的增加，视频的赌注会不断增加。这种格式鼓励观众观看整个视频，从而在「推荐」中排名更高。

YouTube 围绕争夺用户的时长份额而设计推荐算法的，这改变了消费者发现新内容的方式，也就影响了创作者如何设计自己的内容。这是一场平台与创作者之间的「猫鼠游戏」，它饱受争议，但简单有效，催生了蓬勃涌现而独具一格的创作生态。

YouTube 比 Netflix 或 NBC 更伟大的地方在于：它让 James Stephen Donaldson 成为了 MrBeast。YouTube 时刻是由成千上万个 MrBeast 时刻共同构成的。YouTube 让一些普通人成为了本来无法成为的自己。

AIGC 没有新平台

科技行业已经很久没有出现一个新平台了。

ChatGPT 出现之后，人们普遍预期 AI 会带来一个新的内容平台，但两年时间过去了，它还只是一个拥有 2 亿周活用户的产品，和上一代消费互联网中的超级应用相差甚远。对新平台的普遍预期来自于 AIGC 再一次大幅降低了创作门槛，从而可能促使内容消费也随之迁移，但现在来看，这可能很难实现。

首先，AIGC 需要面对现有内容平台的挑战。人类已经拥有了足够强大的内容平台，AI 生成内容虽然降低了成本，但在内容形态上没有实现突破性的创新，这和生成式 AI 的模仿本质有关。唯一有所突破的地方就是 AI 搜索，但 Google 这样的在位者并没有放松警惕，快速查漏补缺，进行防御。相比之下，诸如 MrBeast 这样的 YouTube 创作者带来的内容创新是传统影视工业未能有效提供的。

其次，AIGC 在现有的推理成本水平下，仍然难以支撑大规模的消费者应用。最近的一篇文章《万字探讨：国内 AI 应用创业陷入恶性循环，问题在哪里，出路是什么？》就从成本角度分析了 AI 应用的 PMF 选择问题，其中的关键观点就是：普通用户和生产力/行业场景用户在潜在的「单次推理用户价值」上有着一个数量级以上的差异，因此大模型应用想要扩展普通用户这个行为本身在这个时间点就是不成立的，也是不合理的。

另外，AI 生成的内容存在机械、幻觉和伦理等问题，这些问题随着应用规模的扩大而被放大，可能产生的社会后果难以预计。直到今天，各大内容平台仍然对 AIGC 有单独的管理流程，控制这些内容对平台和公众带来的冲击。同时，消费者仍对内容背后的人性存有期待，特别是对于头部 IP 而言，AI 能否满足这种预期，还有待验证。

考虑到这几点原因，我们很可能会看到 AIGC 成为现有内容平台的一个互补品而非替代品，它在经过一段时间的质量上升和成本下降之后，越来越多的融入到 UGC 和 PGC 生态中，成为一种补充。其中可能出现生长出新 IP，但很可能难以脱离现有平台存在。

编写全世界的软件

Cursor + Claude 是近来最令人兴奋的 AI 应用。

它并不是最早的代码生成产品，但它最先找到了自己的神奇时刻。Cloudflare 的开发者关系 VP 上传了一条他的 8 岁女儿用 Cursor 编程的视频：她开发了一个和 Harry Potter 聊天的网页应用，孩子会为网页中增加了一个可以旋转的⚡️图标而兴奋不已。这条十分钟的视频在 Twittter 被观看了 260 万次。

社交媒体上类似的例子还有很多。很多独立开发博主通过直播的方式演示自己如何用 Cursor 快速完成新产品的开发，从几分钟到数天不等，开发出来的应用有些只是一个天气预报，有的则功能完整可以直接上线部署。

Cursor 在 2024 年 8 月公布了成功融资 6000 万美元的消息，除了一大串声名显赫的投资人之外，还公布了客户数量已经超过 40000 家。在新闻稿的副标题中，他们写道：

Our goal is to create a magical tool with the aim of writing the world's software.
我们的目标是创造一个神奇的工具，旨在编写全世界的软件。

这是一个热闹非凡的赛道。在大量开源代码库和不断提升的推理能力上，LLM 越来越擅长编写代码。共识粉碎机的一篇专家访谈纪要认为，目前的代码补全能力大概可以提升工程师 20%-30% 的代码效率。而 Greylock 在 5 月份发表的文章中，把赛道进一步细分，覆盖了从代码编写、测试、审阅、维护等多个流程。

如果要估算代码生成的市场规模，一般会引用的数据会是软件工程师的数量，然后再估算他们的产出、年薪等，然后计算每年的总体规模。在这个计算口径下，代码生成所对应的基础人群是软件工程师，这个群体虽然增速很快，但基数只能占到知识工作者总数的很小一部分——当然，他们薪水颇高，这就让这个赛道成为 AI 应用中「最容易收到钱」的方向之一。

但代码不仅为工程师而生。

如果按照 Bhardwaj 所设想的「YouTube 时刻」来看，这些定义方式都太过保守了：YouTube 的愿景是让每个人都可以通过视频来进行自我表达，而代码生成则应该让每个人都可以写代码，让自己的想法变成现实。

Cursor 所言的「全世界的软件」应该就是指每个人的软件。

正如 YouTube 所说的：广播你自己（Broadcast Yourself）。

新工具和新平台

1993 年，美国演员工会（Screen Actors Guild）的注册会员为 7.5 万。1999 年，美国广播电视行业的总就业人口为 44.8 万人。这就是 YouTube 出现之前，电影电视行业的就业情况。在 YouTube 出现之后的不到二十年间，参与视频创作的人数至少有数亿人之多。好莱坞是无数年轻才俊向往的神圣之地，但现在，这个圣地已经转到了 YouTube 和 TikTok 那里。

和拍电影一样，写代码曾经是一项有些神秘的工作。它需要多年的理论学习和实践经验，根据 2024 年的估计，全球的软件开发者数量不到 3000 万，占全球人口只有千分之几。

代码生成对于普通人而言，或许最大的价值在于「祛魅」，也就是降低对编写程序的畏难心理，从而减少了从想象到实现之间的摩擦。这种门槛的降低将鼓励更多人尝试将自己的想法付诸实践，而不是让这些创意胎死腹中。因而，代码生成可能重新定义「开发者」的概念和规模。如果代码生成能够像 YouTube 那样降低创作门槛，「开发者」的数量将会快速增加。

写代码，做软件，真正成为每个人手中的新工具。

我毫不怀疑，但问题也很多：

现有的工具设计仍然是主要围绕现有的软件工程师而来的。黑漆漆的编辑窗口，复杂的流程图，都可能吓退普通用户。从自然语言表达意图，到代码的运行时间，中间还有很多步骤需要简化，进一步降低使用门槛。

代码生成也面临在位者的挑战。这个世界还需要更多的软件吗？电脑和手机上已经很难再塞进新的应用，Meta 等大厂推动等新一代的 AI + AR 的计算平台可能带来机会——智能眼镜比手机更加沉浸式的侵入用户的个人生活，视觉和听觉随时打开，更加个人化的计算场景将让带来一大批对新应用的需求。

一些必要的基础设施还有待建设。AI 应用的传播还需要借助于现有分发平台，而没有对齐 AI 用户和商业价值的分发机制。AI 对于用户的边际价值在于推理，因而，基于 token 消耗而非时长消耗更适合作为分发的主要考量指标。

与内容创作相比，代码有它的局限：工具属性过强使得它难以产生内容所具有的粉丝粘性；软件的功能更新比内容更新更容易枯竭，而陷入 bug 修复的维护状态；内容 IP 更有可能呈现出独特个性，而软件则很难做出差异化。

代码生成能力将会改变软件开发经济学的很大一部分：代码迭代的成本会降低，开发者将会花更多时间在打造具有独特性的界面和功能上；软件更新有可能会像游戏的 DLC 那样推出连续性的内容，一方面不挑战用户既有习惯，另一方面也降低了开发成本——这些更新也很大程度上可以通过 AI 生成；软件定价将与它带给用户的实际价值更贴近，从而能够激励长尾开发者的加入。

这种能力的提升和生态系统的演变将会带来一系列深远的变化。随着代码生成技术的不断发展和普及，我们可以预见软件开发和应用领域将会发生一些显著的转变。

总结与预测

以下是一些「不负责任」的总结与预测：

AI 生成代码可能比 AI 生成内容更有机会出现平台机会。内容平台已经过于强势，AI 生成内容更可能成为这些平台的互补品而不是替代品，但 AI 生成代码则有可能赢得与在位者的竞争。
「代码生成」将逐渐转变为「软件生成」。会出现脚手架类的过渡态产品，解决部署、运行、安全等基础设施问题，之后，用户体验层得到大幅简化，通过自然语言对话加上草图演示即可完成原本需要代码生成才能解决的问题。
伴随下一代计算平台，出现新的「发现」机制。很可能与多模态的场景感知相关，比现有的分发基础设施更适用于 token 份额而非时长份额的优化目标。这需要围绕 token 的消耗和实际使用效果来训练一套新的分发算法，从而让消费者能够优选出最有价值的应用。
出现新的商业模式。相比于普遍的按月订阅收费模式，更鼓励 token 份额贡献更高的开发者，以及让规模较小的长尾开发者能在早期规模较小就获得收入。现有的订阅模式定价并没有体现模型推理的边际成本曲线，也和用户实际感受到的价值不相符，对于越来越去中心化的开发者生态而言，商业模式需要以「激励竞争」为目标进行设计。
工具软件将增加服务性内容更新以增强用户粘性，比如增添新的设计模板，或接入新的服务 API。这些更新帮助开发者用更低的成本来维系长期客户关系，延长软件的生命周期。在 AI 生成代码能力出现之前，这样的做法就已经可以让一款软件的寿命长达十年以上。
游戏或互动内容更加重要，AI 生成能力会让此类软件的开发成本下降更快。从 8 岁女孩的开发案例可以看到，游戏和互动内容是代码与内容的交汇点，AI 提供的辅助创作能力能够大大减轻此类内容的开发工作量。此类内容也更容易让多人同时参与，提高社交参与感和可玩度。
出现面向细分市场的「奢侈」软件。它们是普通软件的高端替代品，在特定场景下，为消费者创造额外的社交资本，或只是单纯满足个人审美偏好。Adobe 的 CPO Scott Belsky 最先提出了这个观点，他认为 Perplexity、Notion 和 Superhuman 都是这类软件的代表。在 AI 生成能力来临之后，设计开发此类软件的成本会大大降低，人们也会更愿意为这些定制化的产品付费。
与知识产权、安全、隐私等问题相关的平台治理能力更加重要。代码可以直接运行，可能会造成远高于内容的破坏性后果，随着供给数量的增加，代码生成的软件需要强有力的机制来维护平台的正常秩序。

Ben Thompson 在 2018 年的文章中首次提出技术的两种哲学，他引用 Microsoft CEO Satya Nadella 的演讲说：

这一机遇和责任让我们坚定地履行使命，即赋能地球上的每个人和每个组织，实现更大成就。我们专注于开发技术，以便赋能他人开发更多技术。

与之相对的另一种哲学，则引用了 Google CEO Sundar Pichai 的演讲：

我们对助手的愿景是帮助您完成任务。

这两种哲学的根本区别是：技术到底是要为人类创造新的可能性，还是帮助人类把现有的工作做得更好。

技术一直在重塑人类的社会分工。每当一项技术走向大众，就有一项专业被消解。当我们为效率的边际改善着迷的时候，它也会迎来临界突破的时刻。

在 YouTube 出现之前，很少有人会想象自己可以通过内容创作来建立个人影响力甚至积累财富。技术让一切关于平台的预言都得到了兑现，这一次，或许是代码和软件的机会。

SPECIAL ISSUE: 暂停与重启

2025-05-26 12:30:09

这是一期 SPECIAL ISSUE。

它是一次回顾和整理，直接原因是我自己接下来会有个变化：我即将重返校园，去 Stanford 读书一年。由于学生签证不允许从事盈利性工作，加上投入在写作上的时间会减少，我决定暂停这个 newsletter 的更新三个月。

✉️

付费订阅将自动延长 3 个月，免费订阅保持不变。

停下来的时候，通常会多一些思考。这让我想到了 Platform Thinking 是怎么开始的。

开端

Platform Thinking 从 2020 年 4 月起，以邮件周刊的形式发布（我在知乎上开设过一个同题专栏，但更新并不连续）。

彼时，正值 Covid-19 在全球爆发的时期，大流行病为世界按下了暂停键，但很快人类社会就以新的方式重启了。远程工作和在线协作成了默认范式，Zoom 的股价飞涨，数据、计算和连接的价值更加彰显。那段时间，Marc Andreessen 喊出 “It's time to build”，今天回想，可以认为是美国科技界开始转向的一个标志。

技术驱动的平台（Platform）是互联网时代崛起的范式。从搜索、社交、内容，到零售、金融、出行，每一个都对人类社会带来了翻天覆地的变化。围绕平台，有非常多的话题可以讨论，无论是它们之间的竞合关系，还是在它们内部的生态演变。最让人痴迷的就是在其中观察到涌现，以至于让我在 newsletter 中反复流连，差点把当时写作中的书用“涌现”命名，现在想来，真是狂妄。

今年年初在申请学校时，我试图把这些思考和过去的经历连起来，形成一个自内而外的叙事。一个想法慢慢清楚了：平台（Platform）的底层逻辑是通过鼓励多样性而促进繁荣和进步。这个发现是在撰写申请文书的时候想到的。多样性也变成我的底层信仰：未来的事业应该围绕这个价值展开。

现在，又到了一个需要“暂停”和“重启”的时候。AI 发展太快，超出了很多人的预期。在我离开一段时间，回到校园之前，回顾一下过去半年关于 AI 的观察与思考，就显得比较有必要。

这也算是一次对核心想法的检查，看看哪些观点在快速变化中站住了脚，哪些因为理解不够而需要调整。就像我年初时写到的：“游移不定的心总要落在一些实在的、具体的事情上。只要付出足量的心意，事情总能开花结果，变成作品。”

在日常的商业和技术讨论之外，还有一些更宏大的变化在发生。

另一个在 newsletter 中讨论比较少的变化是：全球政经格局的变化。没有人在这个问题上是专家，但所有人的命运都可能在这场变化中被深刻的改变。我相信，全球化不会简单结束，它更可能会重新分布。就像 Covid-19 带来的影响一样，重启就是重构，重构实际上是对既有价值结构的破坏，重启则带来多样性的再次繁荣。破坏和重构，最终可能会催生新的多样性。

半年回望

回顾过去半年的这些思考，我最大的感受还是 AI 变化之快。年初，我们还在感叹 Deepseek 时刻的降临，现在，我们已经有强大的推理模型，出现了大量可以胜任实际工作的 Agents。这种速度，不仅体现在模型能力的提升上，也体现在整个行业生态的快速演进中。

下面这些，是过去半年里，我在 AI 浪潮中一些主要的观察和思考。

平台演进的持续追问——从“流量”到“时刻”，洞察价值的真实落点

超越套壳：互联网天然靠近需求侧，但仅仅停留在需求界面是不够的。回顾 Web 1.0 时代，那些超越简单“套壳”的公司，比如 Amazon、Ticketmaster、Expedia，它们的共同点是深入了价值链的纵深，并且高效地重构了供给侧。Expedia 成功的例子说明，解决酒店业的“履约”挑战至关重要。
新颖与秩序：小红书的成长路径值得关注。它从海淘宝典和精致生活社区，通过赞助选秀吸引用户增长，再到疫情期间拓展为“生活指南”，实现了亿级 DAU 的两次重要转折。国产平台在推荐算法上更注重实时指标的高敏捷分发，这解决了弱关系内容发现的问题。跨文化社区现象可能是它潜在的第三次转折点。
时刻份额：我们习惯讨论平台的“流量份额”或“时长份额”，但我后来意识到，用户大部分时间是被动消费，真正产生主动意图的“时刻”其实很少。商业转化的关键，在于捕捉并服务好这些“时刻”。这是理解京东与美团外卖之争需要跨越的用户心智鸿沟。AI 捕捉用户“消失的念头”，服务这些稍纵即逝的需求、意图、情感和思考瞬间，是一个重要的方向。

AI 浪潮下的“折叠”与“展开”——在喧嚣中寻找真正的价值锚点

被折叠的组织：AI 可能会“折叠”现有的组织结构和人才栈。知识工作的流程因为人的能力不同和难以标准化，导致很多低效环节，比如各种检查点和评审。AI 代理（比如 Manus 这样的概念）有可能打通整个链路，包揽以前需要团队协作的任务，消除分工边界和沟通环节。这意味着未来对人才的要求，会更偏向在更高抽象层级进行判断和行动。企业本质在于更低的交易成本，因此组织规模的坍缩、人才折叠、分工模糊可能是必然趋势。
规模的形状与智能的分岔：OpenAI 这类模型公司的竞争，是“大”的竞赛，由规模驱动。但“大”也会催生更多的“小”。AI 降低了原型产出和早期试错的门槛，可能会带来多样性的爆炸。多样性是走向繁荣的必经之路，而平台的价值就在于支持多样性。在 AI 模型“规模优先”和“智能优先”的两个极端策略中，“两个都要”很可能，但规模更是必然，智能则具有偶然性。
AI 的边界与“补丁”：AI 有它的局限性。Meta 工程师通过修改一个“&”符号就节省了大量服务器的故事说明，找到问题本身的价值，有时远超解决问题本身。而识别问题恰恰是当前 AI 的弱项。强化学习（RL）在解决这类问题时面临状态空间庞大、奖励稀疏延迟和安全边界等挑战。模型永远不会完美，“套壳”和“打补丁”都有其价值，都是与模型共舞的机会。

一次关键的“校准”放大——Chat 界面、“闪念”捕捉与 AI 的“伙伴”角色

Chat 界面的再认识：过去我可能认为 Chat 只是 AI 应用的早期或过渡形态，更贴合具体场景的交互方式终将出现。但在最近的文章，特别是 05.19 日的《ChatGPT 是个好名字》中，我明确提出：“chat 实际上是一个绝佳的界面，并非权宜之计”。这个看法的转变，是基于观察（如 Cursor、Lovart 即使有其他主界面，chat 窗口仍是主要互动场域）和个人使用体验（如用 Raycast iOS 版捕捉“闪念”和辅助写作）。它确实改变了我的日常信息处理习惯，成为重要的“思考的伙伴”。
从“读心”到“织网”：用户渴望 AI 能主动发起对话，服务于那些稍纵即逝的需求和意图。将 AI 捕捉到的这些个体“时刻”，转化为具有网络效应的“社交时刻”，是一个日益清晰的战略方向。纯粹的模型能力竞赛面临瓶颈，真正的护城河在于应用层，特别是能沉淀用户关系和内容的社交场景。OpenAI（由内向外，理解个体重塑连接）和 Meta（由外向内，嫁接 AI 到关系图谱）采取了不同的战略路径。
文化触媒与“出圈”：大众对技术突破的理解，常常会简化为某种“滤镜”。“滤镜”能在日常平庸上施加魔法，营造氛围。技术创新和文化共鸣缺一不可，技术触达理性，文化唤起情感，两者结合才能让技术深度发展并跨越鸿沟。像“吉卜力滤镜”这种低门槛、高兼容性的文化包装，能帮助技术“出圈”，抵达更广泛的大众。

对系统与人性的敬畏——人与 AI、历史与泡沫

智能无法改写历史：通过自己写代码的经历，我体会到系统混乱的必然性：改一个 bug 可能会引入新问题，人的大脑难以处理这种复杂性。时间不站在复杂系统这边，微小的缺陷会滋长成致命错误。业务没有“从头再来”的奢侈，系统总是在持续熵增。所以，我的结论是，智能再强大，也无法改写历史，对抗时间的流逝。
让人更像人：AI 原生公司代表一种新的组织实验。但同时，人类最伟大的创造往往来自于绕路、对抗、摩擦、冒险和不确定性。这些看似“低效”的时刻，塑造了人类文明中珍贵的部分。所以我认为，真正的突破不在于让 AI 更像人，而在于让人更像人。我们需要在效率与创新、确定与未知、理性与直觉之间寻找新的平衡。
科技史即泡沫史：回顾科技发展，很多时候就像一部泡沫史。AI 的巨大投入，如何才能避免成为又一个“有技术、无社会价值”的泡沫？关键可能在于，AI 能否找到足够广阔、深入日常生活的应用场景（特别是社交），成为亿万人可感、可用、赖以互动的基础设施，从而证明其巨大投入的合理性。能否将 AI 智能注入日常连接与沟通，是决定这场技术革命能留下什么遗产的关键。

暂停与重启

所以，如开篇所言，Platform Thinking newsletter 将从下周起暂停更新三个月。这并非结束，更像一次必要的“中场休息”。过去五年，两百多期的 newsletter，记录了我思考的轨迹，也连接了许多素未谋面的朋友。这本身就是一件值得感恩的事情。

这次选择重返校园，对我而言，是一次从“观察者”到“学习者”再到未来可能的“建造者”的角色切换。过去半年对 AI 的密集追踪和思考，让我意识到，“纸上得来终觉浅”，有些理解，必须深入到实践和更前沿的环境中去打磨和验证。

这一年的学习，希望能让我在 AI 与平台的交叉领域，在技术与人文的碰撞中，获得更鲜活的体悟和更系统的认知。这也算是一种特殊形式的“建造”——构建更坚固的知识体系，打磨更锐利的认知框架。

感谢各位读者一直以来的陪伴与支持。在暂停更新的 3 个月中：

已有的付费订阅暂停，所有付费订阅的朋友的订阅都会延长 3 个月（至 2025 年 9 月 1 日恢复）。
不再接受新的付费订阅（至 2025 年 9 月 1 日恢复）。
免费订阅保持不变。

我会偶尔发布一些更新，也可以在 X / 即刻上关注日常更新。

你也可以订阅一个完全免费的邮件通讯 Podmark——它精选了数十个科技和商业领域的英文播客，以访谈类为主。播客列表将持续更新。它会自动抓取更新、转录，并提取高光片段。每周一，您将收到一封包含过去一周最优质内容的邮件。目前仅提供英文内容。

希望我们都能在变化的时代里，找到自己的节奏，持续学习，不断建造。

我们秋季再见。

2024 年度回顾

2024-12-31 11:09:41

2024 年是一道分水岭。

智能的度量：o3 与 AI 的分水岭

2024-12-23 12:25:36

“当我看到这些分数的时候，我意识到我需要改变我的世界观了。”

在 OpenAI 的发布会现场，ARC Prize Foundation 的负责人 Greg Kamradt 有些不安。作为全球最严苛的 AI 测试基准之一，ARC-AGI 每年都会举办奖金不菲的竞赛。无数模型在这个测试面前折戟沉沙，以至于业内开玩笑说这个基准“感觉已经存在了几个世纪”。

但就在 2024 年的最后几天，情况发生了变化。

OpenAI 的最新模型 o3 不仅打破了记录，更令人震惊的是：在高算力测试中，它达到了 88% 的得分，超越了人类平均水平的 85%。

“我需要重新校准我对 AI 能力的认知，特别是在这个被 o3 开启的新世界里。”Greg 继续说道。

超人的 o3

在 OpenAI 连续 12 天的发布马拉松中，o3 是最后一棒。这个时间节点的选择颇具戏剧性：此前的几天里，OpenAI 和 Google 仿佛陷入了一场隐形的竞速：Sora 对阵 Veo 2，GPT-4 对阵 Gemini Flash 2.0 Experimental，o1 对阵 Gemini Flash 2.0 Thinking Mode。当 800-CHATGPT 这样的功能发布出现时，不少观察者认为这是一招缓兵之计，为最后的王牌 o3 争取时间。

发布前夕的情况也颇为微妙。关键人物的离职消息传出，让业内开始担心：o3 会不会重蹈 Sora 的覆辙，只是一个仓促的“占坑”发布？

但 o3 的发布过程打破了这些猜测。虽然 Sam Altman 在开场时将 "launch" 改口为 "announce"，但随后的展示却令人印象深刻。OpenAI 的研究主管 Mark Chen 没有用华丽的演示，而是直接展示了 o3 在编码和数学能力上相对于 o1 的巨大飞跃。

最引人注目的是 ARC-AGI 测试的结果。这个基准测试的重要性，通过 Greg Kamradt 的介绍得到了充分展现：

它在人工智能领域已经 5 年无人能敌，感觉就像几个世纪以来一直如此。击败 ARC-AGI 的系统将成为迈向通用智能的重要里程碑。

而 o3 正是这个里程碑的缔造者：在 high compute 和 low compute 两种场景下，o3 分别达到了 88% 和 76% 的惊人成绩。更具历史意义的是，它在高算力场景中超越了人类水平线（85%）。

在整个发布过程中，有一个有趣的细节：Sam Altman 和 Greg 不断拿研究主管 Mark Chen 作为参照物。作为美国信息学奥赛（IOI）的国家队教练，Mark Chen 的数学和编程能力远超常人。这种看似调侃的比较背后，实际上暗示了一个更深层的信息：AI 已经可以在某些特定领域与最优秀的人类专家较量。

ARC Prize Foundation 的官方文章这样写道：

OpenAI 的新 o3 模型代表了 AI 适应新任务的能力的重大飞跃。这不仅仅是渐进式的改进，而是一个真正的突破，标志着 AI 能力与 LLM 先前的局限性相比发生了质的转变。o3 是一个能够适应从未遇到过的任务的系统，可以说在 ARC-AGI 领域接近人类水平的表现。

这不仅仅是一场普通的产品发布会，而是一个重要的信号：AI 正在从模仿人类迈向真正的智能。要理解这一跨越的意义，我们需要深入探讨智能的本质。

于是，我去读了一下为 ARC-AGI 奠基的论文：On the Measure of Intelligence。

无面之网：重新想象 Agent 网络

2024-12-16 12:30:34

Agent 不是标准化产品；Agent 的主要交互对象不是人类；Agent 不是“预制菜”。

Platform Thinking修改