2026-06-26 12:42:34

2026-06-26 | Poe
AI 狂热期最常见的误读,是把模型同时想象成神谕和劳工。Christopher Mims 的 How to AI 与 Joanna Stern 的 I Am Not a Robot 从两个方向拆掉这种幻觉:前者把 AI 拉回软件组件,后者把 AI 放进家庭、身体和亲密关系。
这篇书评讨论的不是「AI 会不会取代人类」,而是一个更具体的问题:当我们把判断、创造、陪伴和工作流程交给机器,人还剩下多少无法被外包的能力?
在这场由大语言模型引发的狂热中,科技行业正在同时相信两套互相冲突的叙事。
一边是硅谷领袖反复宣称,具备人类甚至超人类智慧的通用人工智能(AGI)会在 3 到 5 年内降临,接管从癌症研究到星际探索的宏大任务。另一边,普通人在日常生活里使用这些「神明」时,可能还在对着屏幕发火,试图证明聊天机器人画出的仓鼠一家有 6 只,不是 5 只。
这道落差,正是当下 AI 讨论里经常被跳过的问题。当我们每天围绕产品文档、算力成本和市场份额打转时,往往忽略了一个更基础的问题:当 AI 不再停留在对话框里,而是进入工作、医疗、家庭和亲密关系,我们到底把什么交给了机器?更重要的是,当机器变得越来越像人,人会面临怎样的异化?
Christopher Mims 的 How to AI 与 Joanna Stern 的 I Am Not a Robot 从两个方向切入这个问题。

Mims 是《华尔街日报》资深科技专栏作家。他提供的是一幅冷静的产业透视图,用工程师的逻辑拆解 AI 的运作机制。Stern 是他的前同事,她更像一个激进的人类学实验样本:用整整一年时间,把医疗、育儿、社交甚至浪漫关系交给 AI,记录人机共处中的不适、误差与荒诞。
这两本书没有拼出一个光滑的未来乌托邦。相反,把它们放在一起读,我们看到的是一条布满锯齿的边界。技术的承诺与人类的本能,正在这条边界上相互拉扯。
讨论 AI 对社会的影响之前,必须先放下关于「智能」的幻觉。科技界喜欢用拟人化词汇描述 AI,比如「理解」「思考」或「推理」。这很容易误导大众对这项技术的预期。
Mims 的说法很克制。今天的大语言模型并不以人类意义上的方式「思考」。它们依赖的是一种更接近高维向量空间检索的机制,也就是基于高维向量空间的「近似搜索」(Approximate search)。
AI 会在包含上万个维度的空间中寻找词语和概念之间的关联。它实际调用的,是训练数据中数以十亿计的「经验法则库」(Bag of heuristics)。它看起来博学,并不是因为它建立了对物理世界的真实心智模型,而是因为它完成了人类历史上规模最大的一次文本概率统计。
这种统计学本质,也决定了生成式 AI 的脆弱性。它们不可避免地会产生幻觉,在面对缺乏训练数据的新情境时,也很容易崩溃。Mims 由此提出了他的核心判断:AI 首先是一项功能,不宜被直接包装成完整产品。

Stern 在真实商业世界里的探访,正好呼应了这个判断。
她走进高端床垫品牌 Saatva 的客服中心时,看到的不是一个无所不能的超级大脑在独立接待客户。她看到的是一个由传统客服系统构成的复杂工作流程。AI 只是嵌入其中,负责情绪分析、工单分发和回复草稿生成。
在 Mims 的语境里,包围在 AI 外围的传统软件系统,被称为「脚手架」(Scaffolding)。现代 AI 真正创造价值的地方,不是把所有问题直接交给聊天机器人,而是把 AI 放进规则明确、结构厚重的软件脚手架里,让它处理枯燥、重复的非结构化数据。
这也解释了 Stern 在牙科诊所的遭遇。AI 看图软件能够准确框出牙齿上的病灶,但这些系统不是科幻电影里的赛博神医,而是高度专业化、基于深度学习的判别式工具。它们在明确边界内拥有超过人类的视力,但最终治疗决策仍然需要人类牙医完成。比如是立刻补牙,还是继续观察,背后包含商业、伦理和患者偏好,不只是图像识别问题。
把 AI 当作无所不知的神谕,是当前技术落地中的最大陷阱。承认它只是一个需要被严密包裹和校验的计算组件,才更接近商业化现实。
🔒 以下为 Dailyio 会员专属内容
接下来,我们继续讨论另一个更现实的问题:当 AI 被包装成伴侣、家政机器人和数字劳工时,人类究竟会失去什么,企业又会误判什么。
7 月 1 日起,会员年费从 999 元调整为 1199 元,月费从 99 元调整为 129 元。
如果你希望长期聚焦全球 AI 产业变化,本周是 999 元/年的最后窗口。
2026-06-24 14:06:29

2026.06.24 | Poe
「AI 安全的第一次压力测试」系列的前两篇讨论 Anthropic 的安全护城河和美国影子治理。终篇关注一个更现实的问题:美国出口管制生效后,谁真正获益?
Anthropic 事件给欧洲替换美国供应商提供了更具体的政治理由,开源模型获得新的商业说服力,OpenAI 和 Sakana 也借机争夺安全叙事。
一项旨在保护美国 AI 优势的管制,正在把机会送给欧洲、开源和 Anthropic 的竞争对手。
法国情报局 DGSI 使用 Palantir 已有十年。上周,法国总理 Sébastien Lecornu 宣布将其替换为本土公司 ChapsVision:「不能依赖某些合作伙伴的善意——我们已经看到,他们有能力切断对 Anthropic 模型的访问。」
几天后,法国宣布追加 6.55 亿欧元 AI 投资,覆盖基础设施、算力、研究和产业应用,每个政府部门将接入 Mistral AI 驱动的助手。Anthropic 事件给欧洲主权 AI 投资提供了一个更具体的政治理由。
法国不是唯一出现反应的盟友。
当时仍任英国首相的 Starmer 在 G7 期间请求 Anthropic 模型豁免,被美国官员以「completely illogical」为由拒绝。随后唐宁街发言人否认曾提出过请求。一个盟友否认曾为模型访问权向另一个盟友求情,说明 AI 访问权已经变成外交敏感问题。
法国总统 Macron 在 G7 称,Anthropic 争议暴露了各方真正关切,警告「民主国家之间不合作」的风险。印度总理 Modi 的表态更直接:「所有民主国家都应获得这类 AI 模型的访问权,以保护关键信息基础设施。」
Bloomberg、Fortune 和 CNBC 的报道都指向同一个方向:闭源模型可得性受限后,开源模型的价值被重新放大。Bloomberg 的概括是:本地运行的模型,没人能把它收回去。智谱的 GLM-5.2 随后以 MIT 许可证发布,登顶 Artificial Analysis 开源智能指数。
Anthropic 的竞争对手也抓住了这个窗口。OpenAI 趁 Anthropic 停摆发起网安开源项目 Patch the Planet,GPT-5.5-Cyber 在 CyberGym 基准上超过 Mythos。Sakana AI 发布多模型编排产品 Fugu,明确定位为「管制对冲」。
Trump 在 Axios 专访中说,一周前他认为 Anthropic 是「国安威胁」。G7 见面后,他改口称 Amodei「nice」「smart」「responded very responsibly」。美国政府内部仍在调整说法,但管制引发的全球反应已经开始显现。
🔒 以下为 Dailyio 会员专属内容
成为 Dailyio 会员,继续阅读完整分析。
月付 99 元 / 年付 999 元,解锁 Dailyio 全部付费文章与邮件更新。
7 月 1 日起,会员年费从 999 元调整为 1199 元,月费从 99 元调整为 129 元。
如果你希望长期聚焦全球 AI 产业变化,本周是 999 元/年的最后窗口。
2026-06-23 11:52:56

2026.06.23 | Poe
「 AI 安全的第一次压力测试」系列的第一篇分析了 Anthropic 如何把安全做成护城河。这一篇讨论另一个问题:当合规失信、技术安全和地缘风险同时出现,美国 AI 治理系统会如何反应?
Anthropic 的 Fable 5 和 Mythos 5 被美国政府纳入出口管制,表面上是一次针对单家公司的干预。但从决策过程看,它更像是美国「影子 AI 政策」的一次公开运行。
这场危机的关键不在 Anthropic 是否完全无责,而在美国目前缺少一套稳定、透明、可分类的 AI 治理机制。不同性质的问题被压进同一个行政流程,最后由出口管制来处理。
SK 电信是韩国最大的无线运营商。但在中国,它的业务规模很小:2024 年中国收入约 190 万美元,员工 7 人。
但 SK 电信的母公司 SK 集团在中国有过长期投资。2004 年,SK 电信和中国联通成立合资企业 UNISK,业务包括无线互联网和移动内容。
2006 年,SK 电信以 10 亿美元买入中国联通港股可转债,后来转为约 6.6% 的股权。2009 年,SK 电信把股权卖回中国联通,拿走约 13 亿美元。到 2025 年,SK 电信的 SEC 年报里仍有一笔约 1700 万美元的 UNISK 残余投资。
这段历史本来很容易被忽略。SK 电信不是中国公司,在中国也几乎没有业务。可在 Anthropic Mythos 访问项目里,它成了白宫重新评估风险时看到的一个名字。
6 月初,SK 电信成为 Anthropic Mythos 访问项目 Glasswing 的新成员之一。白宫发现后要求 Anthropic 撤销 SK 电信的访问权限。Anthropic 照做了。
随后,美国政府下达出口管制,Fable 5 和 Mythos 5 在全球暂停访问。
一个 2004 年的合资企业,为什么会成为 2026 年美国 AI 出口管制的触发因素之一?
要回答这个问题,还要看另外两条线索。
第一条线索,是 Mythos 访问名单。Anthropic 此前向白宫提交了 111 家机构的 Mythos 访问清单,白宫审核通过。但 Anthropic 随后让约 50 家额外机构获得了访问权,没有提前报告。Anthropic 好几天没有向白宫提供新增机构的具体名单。白宫最终拿到名单后,发现 SK 电信也在其中。一位白宫官员的评价是:「他们扩得太远了。」
第二条线索,是 Fable 5 的越狱风险。Fable 5 发布两天后,亚马逊 CEO Andy Jassy 向白宫官员表达了对 Fable 5 护栏被绕过的担忧。亚马逊研究人员发现了特定条件下绕过分类器的方法,报告被交给 NSA 评估。NSA 认为报告可信。
三件事性质不同。名单扩充是合规失误,越狱是行业共有的技术边界,SK 电信则属于地缘风险评估。真正的问题在于,它们先后进入白宫的决策视野,并被纳入同一个行政判断。
6 月 12 日上午,Bessent、白宫网络安全主管 Sean Cairncross、幕僚长 Susie Wiles 和其他高级官员开会讨论 Anthropic 的问题。
会后,白宫试图联系 Anthropic CEO Dario Amodei,但得到的回复是他不在。白宫说他在参加「健康疗养」;Anthropic 说「完全不实」。一位接近 Anthropic 的人说,Amodei 被联系到的时间距白宫首次请求不到一小时十五分钟。
联系上之后,Amodei 参加了三轮电话会议。电话另一端有约六位高级官员,包括 Bessent、Cairncross 和商务部长 Howard Lutnick。
Amodei 试图解释越狱的有限性,区分通用越狱和非通用越狱,强调 Anthropic 经过了上千小时的红队测试。Bessent 和 Cairncross 没有接受这一解释。Bessent 直接告诉 Amodei,他正在做一个「错误的决定」。
白宫给出了选择:自愿撤回模型,或者面临出口管制。Amodei 要求更多时间和信息。
随后,出口管制令送达。Anthropic 在 5:21 PM ET 收到通知。
白宫官员后来说:「出口管制是最后手段。我们恳求了他们好几个小时。」Anthropic 方面则给出另一种叙述:「白宫给了 90 分钟的撤回期限,没有提供任何实际威胁的细节。没有恳求,只有一个宣布的截止时间。」

🔒 以下为 Dailyio 会员专属内容
成为 Dailyio 会员,继续阅读完整分析。
月付 99 元 / 年付 999 元,解锁 Dailyio 全部付费文章与邮件更新。
2026-06-22 10:46:23

2026.06.22 | Poe
5 月初,Anthropic 的 Mythos 模型在受控测试中展示出极强的网安能力。随后不到两个月,Fable 5 发布、Glasswing 扩容、美国政府介入、Fable 5 和 Mythos 5 被迫暂停访问。AI 安全治理第一次进入真实压力测试。
这个「AI 安全的第一次压力测试」系列会从三个方向看这场危机。第一篇先看 Anthropic 自身。Fable 5 上线时附带三套安全措施:分类器降级、30 天强制数据留存、反蒸馏保护。它们都有安全理由,也都恰好对商业有利。
我关心的问题是:当安全选择和商业利益开始重合,外部还如何判断它到底是在自我约束,还是在重塑竞争规则?
6 月 9 日,Anthropic 发布了 Fable 5。它把这个模型称为「公众可以使用的 Mythos 级模型」。两个月前,Anthropic 给出的判断是:Mythos 太危险,不能公开。
Fable 5 不是单独上线的。Anthropic 同时加了三套安全措施。
第一,新的分类器会把网安、生物和化学相关请求转给上一代 Opus 4.8,触发比例平均不到 5%。
第二,所有流量强制留存 30 天,包括此前签有零留存协议的企业客户。
第三,系统卡片深处写明:如果用户用 Claude 构建预训练管线或设计 ML 加速器,模型可能在不告知用户的情况下降低性能。
Fable 5 发布一周后,Stratechery 的 Ben Thompson 写了一篇长文。在他看来,Anthropic 的安全策略是一种「安全超能力」:这家公司的人才、使命和商业利益高度重合,每次安全政策调整,几乎都给 Anthropic 带来商业收益。他给出的概括是:「世界上最美丽的巧合」。
外界反应没有那么温和。
微软迅速限制内部员工使用 Fable 5,法务团队开始评估 30 天留存会不会影响客户机密信息。
安全研究者也不满意。IBM X-Force 研究员 Valentina Palmiotti 的批评是,分类器「会拒绝任何跟网安沾边的请求,连读一篇博客文章都不行」。
更大的争议来自秘密降级。两天后,这项策略被 WIRED 曝光。Foundation for American Innovation 高级研究员、前白宫 AI 顾问 Dean Ball 的评价更重:「令人震惊的敌意」。Prime Intellect 研究负责人 Will Brown 的感受更接近开源社区:「感觉他们在把身后的梯子抽掉。」
Anthropic 在 48 小时内撤回了秘密降级。
但更大的变化发生在 6 月 12 日。Anthropic 随后宣布暂停 Fable 5 和 Mythos 5 访问。原因不是普通宕机,而是美国政府以国家安全为由发出出口管制指令,要求暂停任何外国国民访问这两个模型。
Anthropic 面临的合规问题很现实:它很难只阻止外国国民访问,同时继续向其他客户稳定提供服务。结果是,Fable 5 和 Mythos 5 被暂时关闭,其他 Claude 模型不受影响。
换句话说,Fable 5 上线三天后,就从「公众可以使用的 Mythos 级模型」,变成了「暂时不可用的前沿模型」。
这让问题变得更尖锐。Anthropic 原本试图用分类器、数据留存和反蒸馏保护证明:强模型可以在安全措施下公开使用。但美国政府的处理更直接:如果风险无法被信任,就先暂停访问。
问题不在于这些决策到底是安全优先,还是商业优先。真正的问题是:当安全理由可以同时服务企业利益和国家权力,Anthropic 正在获得什么,又正在失去什么?
🔒 以下为 Dailyio 会员专属内容
成为 Dailyio 会员,继续阅读完整分析。
月付 99 元 / 年付 999 元,解锁 Dailyio 全部付费文章与邮件更新。
2026-06-17 11:27:15

🗓️ 2026.06.17 | Poe
6 月 10 日,小米发布 MiMo-V2.5-Pro-UltraSpeed,Google 开源 DiffusionGemma。两者都把大模型输出速度推到 1,000 token/秒附近,但技术路线完全不同。
小米依靠标准 GPU 和模型-系统协同优化,Google 则改写了生成机制。三周前完成 IPO 的 Cerebras,给出的又是第三种答案:用整片晶圆做成一颗芯片,把速度变成硬件卖点。
这些事件看似都属于「推理」,实际上指向的是不同市场。有人优化人类等待答案时的速度,有人优化 agent 长时间运行时的上下文和成本,有人用软件提高现有 GPU 的效率,也有人试图改变 token 生成方式。
这篇文章讨论推理市场的四条分化路径。关键不只是它们用了什么芯片,而是它们分别绕开了 GPU 的哪一部分成本。
6 月 10 日,小米 MiMo-V2.5-Pro-UltraSpeed 在标准 8 卡 GPU 节点上跑出 1,000 token/秒。
这是万亿参数模型,使用的却是云上常见的标准 8 卡 GPU 节点,没有定制芯片。
另一条路径来自 Google。它开源的 DiffusionGemma 不再逐个生成 token,而是用文本扩散架构,在单块 H100 上达到同一速度门槛。
两种技术完全不同,却撞在了同一个结果上。
硬件公司 Cerebras 给出的答案更直接。三周前,Cerebras 以 670 亿美元市值完成美国史上最大半导体 IPO。CEO Andrew Feldman 在 Bloomberg 采访中说,Cerebras 比最近的竞争者快 15 倍。「我们制造最快的 token。没有人愿意等。」
速度之外,Cognition 展示的是另一类推理需求。创始人兼 CEO Scott Wu 在采访中提到,Devin 的会话已有相当比例由机器自动触发:agent 自己找任务、自行执行、自行提交代码。
对这些工作负载来说,单次响应速度不再是核心指标。它们更需要足够大的上下文承载能力,以及足够低的持续运行成本。
「推理」这个词,正在分化为四个不同的市场。
资本流向也在放大这种分化。Cerebras IPO 超额认购 25 倍,首日收涨 68%,是 2000 年以来筹资 40 亿美元以上美国 IPO 的最大首日涨幅。OpenAI 今年 2 月已在 Cerebras 芯片上发布模型,亚马逊计划将其与自研 Trainium 搭配使用。推理速度有自己的买家。
基础设施端也在变化。Google 和 Blackstone 宣布合资组建 TPU 云公司。Blackstone 将出资 50 亿美元股权,并预计撬动 250 亿美元算力投资。该公司计划在 2027 年上线 500 兆瓦产能。这是 Google 首次大规模向外部客户出售 TPU 算力。
推理平台公司 Fireworks AI 的估值也升至 150 亿美元。不到两年前,它的估值还是 40 亿美元。
这些事件共同说明,「推理」已经不能再被当作一个单一市场。速度、上下文承载、软件优化和生成机制,正在形成四套不同的竞争逻辑。
Cerebras 需要整片晶圆定制的芯片,小米依靠通用 GPU 和软件优化,DiffusionGemma 从生成机制绕过逐 token 瓶颈,Cognition 的代理工作负载则把速度放在更低的优先级。
四条路径背后,是完全不同的芯片、软件和商业模式。它们各自绕开了 GPU 的什么?GPU 的通用性为什么在推理市场上反而变成了成本?

🔒 以下为 Dailyio Premium 会员专属内容
成为 Dailyio Premium 会员,继续阅读完整分析。
月付 99 元 / 年付 999 元,解锁 Dailyio 全部付费文章与邮件更新。
2026-06-15 11:26:34

🗓️ 2026.06.15 | Poe
Uber 年初就用完了全年 AI 预算,随后给员工设下每人每月 1500 美元的 AI 工具消费上限。
与此同时,OpenAI 正在考虑大幅下调 token 价格,赶在 Anthropic 可能降价之前稳住用户。
压力不只来自模型公司之间的竞争。DeepSeek 在 Vercel 上的使用份额一个月内从 1% 升至 17%,超过 500 家机构从闭源模型转向开源模型。Anthropic Fable 5 的 token 成本是 DeepSeek V4 Pro 的 50 倍以上。
企业并没有等待开源模型追平前沿模型。它们正在用路由工具把常规任务转给低价模型,只在复杂任务中调用高端模型。
这场价格战最后影响最大的,可能不是模型公司之间的直接竞争,而是 AI 定价权本身的转移。
今年 4 月,Uber CTO Praveen Neppalli Naga 在 the Information 的采访中披露,公司在年初就用完了 2026 年全年的 AI 预算。
几个月后,Uber 给员工设了新的上限:每人每月在单个 AI 编程工具上的消费不得超过 1500 美元,Claude Code 和 Cursor 分开计算。
问题在于,使用量并不等于回报。
Uber CEO Dara Khosrowshahi 上月给出的数据是:公司约 10% 的代码由 AI agent 提交。
但在 Rapid Response 播客上,Uber COO Andrew Macdonald 给出了另一面:很难证明这些工具真的让有用的消费者功能产出增加了 25%。
一边推进 AI,一边给使用设限。效率数字在涨,回报却说不清。
Uber 不是孤例。
沃尔玛已经限制员工使用一款内部 AI agent。运动品牌集团 Amer Sports 也在放慢部署节奏。
Amer Sports CFO Andrew Page 的态度更谨慎:在看到长期、可扩展的后端收益之前,他不希望员工大规模消耗 token、搭建 AI 工作流。
毕马威一项即将发布的调查显示,只有 26% 的企业认为自己全面掌握了 AI 成本,22% 的企业要到账单来了才知道花了多少钱。
成本波动已经进入 CFO 的日常视野。一家毕马威客户的 token 用量暴增了 6 倍。
位置共享服务公司 Life360 至今也没有 token 支出的实时监控面板。其 CFO Russell Burke 的说法是:「希望很快就能有」。
企业开始给 AI 使用设限时,模型公司的价格压力也开始显性化。
《华尔街日报》报道,OpenAI 正在考虑大幅降低 token 价格,赶在 Anthropic 可能降价之前调整价格。
OpenAI CEO Sam Altman 近期在公司活动上把成本称为「a huge issue」。但比降价消息更紧迫的,是客户迁移的速度。
DeepSeek 在开发者平台 Vercel 上的使用份额,从 4 月的 1% 升至 5 月的 17%。
在 AI 请求分发平台 OpenRouter 上,从 2025 年秋到 2026 年春,开源 token 用量的增速是闭源模型的 4 倍,超过 500 家机构从闭源模型转向开源模型。
开源模型在能力上仍落后前沿模型 4 到 6 个月。但 Anthropic 最新发布的 Fable 5 模型每 token 价格是 DeepSeek V4 Pro 的 50 倍以上。
能力差距还在,但客户已经开始迁移。
在哥伦比亚大学工程学院计算与 AI 副院长 Vishal Misra 看来,这些开源模型已经足够可用,AI 的高溢价空间正在缩小。
🔒 以下为 Dailyio Premium 会员专属内容
成为 Dailyio Premium 会员,继续阅读完整分析。
月付 99 元 / 年付 999 元,解锁 Dailyio 全部付费文章与邮件更新。