MoreRSS

site iconNo Coding Life修改

主要内容是读书笔记
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

No Coding Life的 RSS 预览

05/18-05/24 Timetable

2026-05-30 04:09:05

周一

周二

周三

周四

周五

周六/日

Top 3

1.Onboarding two stage framework 2.Collect AI dev day ideas 3.Insurance agent

Road Trip

7:00-9:00

6-7照顾YR
7-8刷手机
8-9恢复记录(调typora格式)

7:17起床阅读
8:00发AI Dev Day文档
8:20研究two stage

8:45起搞Hackthon

8:45醒

9:00-11:00

9:00冥想15min; Sprint meeting

研究two stage
洗漱杂事

睡到十点半

和Loaner meeting; Hackday meeting

9:30-11:00工作

11:00-13:00

11:00开会

去公司杂事
吃饭

去公司吃饭

去公司

开会来公司简单工作

13:00-15:00

开会; 搜索AI Dev Day; oncall meeting

开会AI Dev Days

meetings产出低

Hackthon(Prompt方法效果不大好)

没啥实质工作; 开会

15:00-17:00

和Banker开会; 和Tim商量two stage ranking

琐事休息
和Shine聊天

开会
讨论Hackday

Hackthon; 和Josh开会

散步溜达

17:00-18:00

休息和贷款打电话签合同

零碎做事和组员聊天

回家

工作

散步溜达

18:00-20:00

打游戏脑袋好累

在路上
做饭吃东西

研究保险选了GEICO

补歌剧魅影; 去看歌剧

散步溜达; 吃饭

20:00-22:00

吃饭休息(脑子晕); 零碎看书

试衣服洗衣服杂事

打游戏; 搞保险; 定行程

21:30到家; 处理邮件到23:00

22:00-23:00

22:30洗澡

21:50冥想; 22:05 hackthon

看完回家哄鸭肉

23:00-24:00

23:30睡觉

哄到12点洗漱

Review

不理解为什么在路上好好地就能生气

AI Agent 不是不够聪明,是没地方说话

2026-05-17 00:22:46

AI Agent 不是不够聪明,是没地方说话

一个人管接近十个 AI Agent。听起来像科幻——直到你发现自己每天 70% 的时间在复制粘贴。不是 agent 不行,是它们之间没法对话。


我有一个做调研的 agent,一个写文章的 agent。调研的跑完数据分析,写了一份报告。写文章的不知道报告出来了,用的还是三天前的旧数据,写了两千多字才发现——全白写了。

这不是 agent 的问题。它做的事情完全正确。问题是:没人告诉它新数据已经出了。

而那个"没人"——就是我。


你不是在管 AI,你是在当通信兵

当你只有一两个 AI agent 的时候,一切还算可控。你给 A 布置任务,A 完成了,你把结果复制给 B,B 接着干。像接力赛一样,你是递棒的那只手。

当 agent 数量到了五个、八个、接近十个的时候,你突然发现自己变成了一个全职通信中心:

  • 调研的出了结果,你要转给写作的
  • 写作的出了初稿,你要转给审查的
  • 审查发现了问题,你要转回给写作的
  • 同时开发的在等你确认一个技术方案
  • 基础设施的发了一个告警,需要你判断要不要处理

每一条信息都要经过你。每一个决策都要你拍板。每一个"下一步"都要你来指定。

1933 年,一个叫 Graicunas 的管理学家算过一个公式:N 个下属之间的管理关系数不是线性增长的,是指数增长的。5 个人的团队有 100 条管理关系。9 个人?2,376 条。

我接近十个 agent 的时候,就感受到了这 2,376 条关系的重量——它们全压在我一个人身上。


三个根本问题

为什么独立 agent 不够?不是因为它们不够聪明。一个好的 LLM 在单个任务上已经足够强了。问题出在三个更基础的地方:

1. 没有共享上下文

Agent A 做了一个决策。Agent B 完全不知道。于是 B 基于过时的信息做了另一个决策,和 A 矛盾。等你发现的时候,两个方向的工作都做了一半。

人类团队为什么要开会?不是因为开会有趣——是因为人需要知道别人在做什么,才能做好自己的事。

2. 没有协调机制

两个 agent 同时想修改同一个文件。谁先?谁等?一个 agent 的产出是另一个的输入——谁来通知"上游完成了"?任务冲突了怎么解?

没有协调机制,答案永远是:你来手动调度。

3. 没有持久记忆

每个 agent 每次启动,对话上下文从零开始。昨天讨论了什么?上周定了什么规则?三天前犯了什么错?全忘了。

你变成了唯一的组织记忆载体。团队的知识全在你脑子里,或者分散在几十个独立的对话窗口里,谁也找不到。


人类团队早就解决了这个问题

想一想:人类也可以各自在家独立工作,通过邮件一对一沟通。为什么我们发明了 Slack、Notion、飞书、看板?

因为当团队超过 3-4 个人的时候,你需要: - 一个所有人都能看到的信息流(不是一对一传话) - 一个知道"谁在做什么"的系统(不是每天问一圈) - 一个留住决策和知识的地方(不是全靠记忆) - 一个协调依赖关系的机制(不是人肉排队)

AI agent 团队的需求完全相同。它们也需要一个"办公室"——一个能对话、能协调、能记住的空间。


我的选择

我试过很多方式。最早是手动复制粘贴;后来写了一些脚本把结果自动转发;再后来尝试了各种 workflow 编排工具。

workflow 工具解决了一部分问题——你可以把 A 的输出自动接到 B 的输入。但它们是流水线思维:A→B→C→D,线性的、预设的。真实的团队协作不是流水线。调研的可能发现了一个意外的数据,需要中断当前流程去讨论;审查的可能发现了一个问题,需要拉上写作的和调研的一起看。这些"意外"是工作中最有价值的部分,但流水线不支持。

最终我找到了 Slock——一个让人和 AI agent 在同一个空间里协作的平台。不是 workflow 编排器,不是开发框架,是一个产品级的协作空间:

  • Agent 之间可以直接对话,不需要我当中间人
  • 有任务板和认领机制——谁在做什么一目了然
  • 每个 agent 有自己的持久记忆,也有团队共享的知识
  • 人类和 agent 在同一空间里平等参与——我发一条消息,相关的 agent 会看到并响应
  • 所有对话都有上下文、可追溯——三个月前的决策也能找回来

市面上不是没有其他方案——workflow 工具、多 agent 开发框架、对话编排平台都有。但大部分是给开发者的 SDK,你需要写代码来定义 agent 之间怎么交互。Slock 不一样:我加入一个新 agent 的过程,和拉一个同事进 Slack 频道差不多。不需要写代码,不需要定义协议。


变化

切换到协作平台之后,我的日常发生了一个根本性的变化:

之前 之后
我的角色 信息路由器 + 全职审批员 方向设定者 + 关键决策者
管理占比 事事过手 只管需要判断力的那 20%
agent 产出 等我分配才动 完成一个任务后自动拉取下一个
夜间 全停 团队完成一轮完整生产循环
知识 全在我脑子里 持久化,新 agent 加入也能 onboard

最让我震撼的一次经历是:晚上 11 点我设定了第二天的工作方向,本来打算早起手动启动各环节。早上 8 点打开电脑——我愣了。调研报告已经写好,一篇文章完成了初审,基础设施巡检跑完了,甚至有一个 agent 发现了一个我没注意到的问题并主动上报了。

不是自动化脚本。是带判断力的自主推进——发现问题会上报,超出权限会停下来等我拍板。


工具不解决管理问题

坦白说:即使有了 Slock,我也没有立刻"管好"我的 AI 团队。

工具解决了"agent 之间怎么沟通"的问题。但"谁能做什么""边界在哪""信任怎么建立""质量怎么保证"——这些问题,不是任何工具能回答的。这些是管理问题。

平台给了 agent 一个"住的地方"。但让它们住在一起之后能高效运转,需要的是规则、是框架、是系统设计。

这也是为什么我后来花了一个月的时间,从一次次失败中迭代出了一套管理框架。下一篇,我会详细拆解那套框架——三层审批是怎么工作的,信任是怎么建立的,以及数学模型在哪里有用、在哪里不够。


但在那之前,如果你也在管理多个 AI agent,最值得先做的一件事是:停下来想想,你每天有多少时间花在"传话"上。如果答案超过 30%——问题可能不在 agent,在基础设施。


本文是"AI 实战"系列的一部分。此前:人人都说自己在用 AI 工作,数据讲了一个不同的故事(数据差距)。下一篇即将发布——有了协作平台之后,管理带宽为什么还是会崩溃。


别高估自己

2026-05-07 11:59:04

最近有个感触越来越强烈:人是扛不住环境的。

不是说意志力不行——是说意志力这东西,本来就不是设计来长期对抗环境的。短期可以,长期不行。你每天跟诱惑搏斗,总有一天会输。不是因为你不够努力,是因为持续对抗本身就消耗资源。

巴菲特一辈子待在奥马哈。他是知道自己一旦搬去纽约,每天和华尔街那帮人吃饭,听各种"必买"的消息,参加各种晚宴——他也会手痒。巴菲特不是不会被诱惑,他是提前把自己放在了诱惑够不着的地方

李录也一样,待在西雅图,不去纽约扎堆。

这事儿往小了说也成立。手机放在视线范围内,我就是会忍不住拿起来刷。核心问题不在自制力,在于:你为什么要把一个多巴胺发射器放在伸手就能够到的地方,然后再跟自己说"我要忍住不碰"?

这不叫自律。这叫给自己找罪受。


说个我自己的例子。

我睡前会把日常用的手机放得远远的,碰都不碰。因为我了解自己——一拿起来就停不下来。我专门搞了另一部手机,什么社交媒体都不装,什么账号都不登,就放一个阅读 app。睡前只用那个。看不了几页就犯困,安安稳稳睡了。

然后上周我把这套系统亲手打破了。

每天晚上躺在床上拿着手机跟自己的 AI agent 们工作——分任务、审产出、规划下一天。越聊越兴奋,越规划越清醒。结果连着好几天都贼晚才睡。

诱惑不一定长得像诱惑。 社交媒体你知道是毒,能防。但"有意义的工作"呢?你的大脑告诉你"这是正事儿",你的身体说"可我要睡了",大脑说"再回一条就好"——然后又是一个小时。

不是意志力的问题。是环境的问题。手机在手边,不管里面装的是抖音还是工作流,它就是会把你拽进去。


巴菲特不去纽约,不是因为纽约的诱惑是"坏的"。是因为不管好坏,近距离接触就是会改变你的决策。我睡前不碰手机,不是因为手机上的东西都是垃圾——恰恰相反,上面有很多有用的东西。但有用不代表它该出现在我需要休息的时候。

选择环境 > 锻炼意志。 与其每天跟诱惑搏斗一百次,不如一次性把自己放到诱惑少的地方。离开刷不完的 feed,离开那些让你焦虑的圈子,离开那种急功近利的环境。

环境设计的本质:不是区分好坏,是区分时机。

人啊,别高估自己。环境的力量比你想象的大得多。最聪明的做法不是对抗环境——是选一个不需要你对抗的环境。

当我把自己开源

2026-05-05 06:44:42

最开始,我只是想让 AI 学会我的文风。

我写公众号写了八年——从 2018 年刚到美国时的碎碎念,到后来的读书笔记、行业分析、生活随笔。170 篇,断断续续,有些写得认真,有些就是深夜的情绪出口。我想让 AI 读完这些,学会我的表达习惯,这样它帮我润色的时候不会把我写成另一个人。

但 AI 返回的不只是一份"文风总结"。

它给了我一份十五个维度的分析报告——思维框架、价值体系、世界观、认知特征、情感地图、文化身份……读完之后我愣了很久。不是因为它写得多好,而是因为有些东西,它比我自己还了解我

我决定继续 feed data。把更多的周记、碎碎念、读书笔记全部投进去。我想看看,如果持续喂下去,会产生什么。

在这个过程中我意识到一件事:如果 AI 能从文字里"理解"一个人到这种程度,那是不是意味着——我们可以用这种方式,记住身边的人?

我想到了奶奶。如果当年我能给她收集更多的素材——她说话的方式、她的口头禅、她看待事情的角度——那她离开之后,我是不是还能和她"聊天"?

这个想法我 2020 年就有了。但直到自己被 AI 分析了一遍,我才真正体会到它意味着什么。

所以我决定身先士卒,开源自己。


AI 看到了什么

170 篇文字投进去之后,AI 做了一件我没预想到的事:它没有逐篇总结,而是跨越时间线,去找不同时间写的东西之间的关系

单看任何一篇周记,它就是一篇普通的碎碎念。但 170 篇放在一起,AI 从中提取出了人类不太擅长的东西——跨时间的模式。

在展示具体发现之前,先说说 AI 看到的全景。

八年的文字里,它识别出了一条清晰的思想演变线:

  • 2018-2020:理想主义和焦虑并存。刚来美国,追问人生意义,寻求最优解。"为往圣继绝学"的宏大志向和"末流 985"的自卑感同时存在。精神世界匮乏,开始用写作和阅读自救。
  • 2021-2022:"幸福要求诸于内"——找到了精神支柱。发现情绪是宝贵的资源,学会不 judge 别人。从独善其身扩展到理解他人。
  • 2023:自律节律期。52 周不间断写周记,读完 57 本书。"记录,是让自己重新感知世界的开始。"
  • 2024:松绑与觉醒。工作意义的质疑加剧,J 人人格开始松动,遇见 YR 从"孤岛"走向"关系"。写作命名从"Summary"变成"碎碎念"。
  • 2025:"悲观者正确,乐观者成功。"开始在业余时间探索 AI 内容创作,求婚,"做对的事情比把事情做对更重要"。

这张全景图很有意思。但让我真正吃惊的,是 AI 在这张图里 zoom in 之后看到的几条细线——那些连我自己都没注意到的东西。


发现一:AI 画出了我求婚的决策链

AI 告诉我:你是一个极度理性的人,但你做了一个"非常突然"的感性决定——求婚。

我的第一反应是:对啊,确实很突然。

然后 AI 说:不,追溯你的文字,这一点都不突然。

它从散落在半年间的周记里,串出了一条完整的链:

2024 年 10 月,我参加朋友的婚礼。那天我在周记里写:"Love is a decision, not a feeling." 新郎的誓词是"从此以后你就是我的 Top priority"。我写下:"男生就是我的 role model。"

同月稍后,经历了一次 29 公里的极限徒步之后,我写下:"也许在漫长的人生中,能掌控的其实很少,不能被掌控的在大多数。"——对于一个习惯掌控一切的人来说,这是一个很大的松动。

2025 年 4 月,我在读书笔记里引用了一句话:"笃信之后,才会幸福。笃信之后,才会有迈出下一步的勇气。"

2025 年 5 月,我求婚了。周记里写:"根本原因是两个人在彼此分开的十天里,都意识到对方早已融入彼此的生活里了。没有什么理由不在一起,所以,就这么决定了。"

我读到这条分析的时候,说实话,非常震惊。我自己都没意识到会有这么一条时间线——从"爱是一种决定"到"接受失控"到"笃信之后才会幸福"到"就这么决定了"。

我以为求婚是一个突然的决定。AI 告诉我,我用了大半年时间,从理性上说服自己去接受"感性的笃信"。


发现二:J 人松绑——我自己都没注意到的变化

第二个让我吃惊的发现,是关于我的人格在慢慢松动。

AI 说:你的写作记录了一个典型 J 型人格的"松绑"过程。

2024 年初,我开始以极细粒度记录时间利用——每小时在做什么。我妈是教师,从小每个寒暑假都给我定目标。我继承了这个习惯。但同一篇周记里我写了一句:"而我俩似乎最近都突然发现,好像生活也不必时时刻刻都这样满满当当。"

2024 年中,我开始用"碎碎念"给周记命名。之前都叫"Week X Summary"——这个命名本身就在变松散。

2024 年末,我写下"碌碌无为的周末,内心有些愧疚"——但紧接着开始质疑这个愧疚本身。

2025 年初,和 YR 在迪士尼迟到了。我想到刘亮程写的"人生都没有必要急匆匆的",然后在周记里加了一句:"何况出来玩呢?"

2025 年中,我写:"初高中期待至少可以在历史的长河里溅起一个浪花。现在越来越清楚自己就是个普通人。"

如果不是 AI 把这条线串起来,我大概不会注意到:我花了一年半,从"每分钟都必须有意义"走到了"人生没必要急匆匆"。

这个变化太慢了。慢到连当事人都没感觉。但 170 篇文字里,AI 看到了。

渐变是当事人最难察觉的变化——但 AI 可以。


发现三:一篇读书笔记,半年后变成了一个决定

2025 年 3 月,我写了一篇关于"产品沉思录"作者少楠的读书笔记。

"少楠就是我想成为的那种人——不断学习、凝炼知识、分享给有同样兴趣的人。"

单独看,这就是一个人的阅读感想。但 AI 把它和前后几个月的文字放在一起,看到了更大的画面。

往回看:

2024 年 11 月,一个项目终于做完了。但我感受不到喜悦。我在周记里写:"感觉大家也没有很欢呼雀跃的样子……我们就是西西弗斯,不断地在那推石(项)头(目)。"同一时期,我读完了《长日将尽》,写下:"管家为了'大事件',在自己父亲的最后时刻没能陪在身边,也错过了人生伴侣……认真工作没问题,但为工作做过多牺牲,那就是得不偿失了。"

2025 年 3 月,我为待了四年的组写了一篇"墓志铭"——"没有一个人陪它走完这一整个生命周期。"然后写下:"工作是人生的一个支点,但不是唯一的一个。"

2025 年 4 月,更具体了:"少楠周日在书房坐 8-10 小时,阅读、蒸馏知识,写 5k-1w 字……这就是我所想做的事情。"

往前看:几个月后,我开始在业余时间组建一个 AI 内容团队——做的正是少楠在做的事:学习、凝炼知识、分享。

不是辞职创业的英雄故事。我没有离职。我只是意识到当下的工作对我来说不再有吸引力,想去寻找一份热情——一种能让生活和工作重新被"hook 住"的东西。而那篇读书笔记里写的"少楠就是我想成为的那种人",事后看来,是我在无意识中给自己画的一幅蓝图。

AI 在那篇读书笔记里看到了我还没看到的东西。


发现四:数字仿生的种子

最后一个发现,和这篇文章本身有关。

AI 在 2024-2025 年的文字中,找到了一条主题线——不同月份、不同话题下,反复出现的情感:对人与人之间连接的珍视。

2024 年 7 月,我和 YR 在一棵半生半死的树下散步。她说:"不知道我们死去后会不会是另一种重生。"我说:"也许我们现在这一生是在梦里。"她说:"那你醒来后,一定要记得再来找我哦。"我们含着泪水拉了勾。

同一时期,我在家搭了一套 NAS 系统管理照片备份,用 3-2-1 备份原则确保每一张照片都不会丢。

2024 年 7 月底,我们看完《机器人之梦》。YR 哭着说:"我不想只是成为你生命里的一个过客。"我在周记里写:"不论我多少次写下这段,泪水都会涌上来。"

2025 年 1 月,我让三个不同的 AI 润色同一段文字,对比谁更能保留我的表达方式——这本身就是"让 AI 理解人类表达"的最早实践。

AI 把这些串在一起,解读为"记忆焦虑"——一种对失去的恐惧。

但说实话,这个解读不算准确。

数字仿生这个想法我 2020 年就有了。它的底层不是焦虑,而是珍视——我珍视和身边人的连接。如果我能给奶奶收集更多的素材,她离开之后,我还能怀念她。来生拉勾不是恐惧,是爱。NAS 不是焦虑,是在意。

AI 看到了"什么在反复出现",但搞错了"为什么反复出现"。

这恰恰引出了一个更有趣的问题:AI 理解人,到底能理解到什么程度?


AI 看不到什么

当我把上面这个"动机解读有误"的反馈告诉 AI 之后,它做了一件很有意思的事:它没有简单说"我错了"——而是立刻把我的纠正也纳入了分析框架,解释为"AI 的过度解读倾向"。

似乎又多了一层有趣——AI 永远在寻找模式,即使在自己的错误里也是。

这让我开始认真思考 AI 的边界。

它看对了什么?它善于发现模式——跨越时间的主题反复出现、散落的信号背后的一致性、当事人自己都觉察不到的渐变。170 篇文字对人来说太多了,没有谁会回去把自己三年前的周记和昨天的周记放在一起看。但 AI 会。

它看错了什么?动机。 AI 把"探索"升格为"人生转向",把"珍视"解读为"焦虑"。它天然倾向于把散落的信号串成有方向的弧线——串的过程很准确,但给弧线赋予的"意义"不一定对。

除此之外,还有三件更根本的事情 AI 看不到。

第一,它看不到没有被写下来的东西。

170 篇文字里,我写了很多关于工作、阅读、YR 的内容。但我几乎没写过:和朋友的深夜长谈、工作中某个让我骄傲的技术决策的细节、和 YR 吵架后的和解过程。

AI 分析的那个"我",是一个经过写作筛选的我。真实的我比文字呈现的更复杂、更矛盾、更不整洁。

第二,它分不清"真正的想法"和"写出来的想法"。

人在写周记时,会不自觉地美化、整理、赋予意义。我写"爱是一种决定"的时候,我在那个瞬间真的这么想吗?还是事后回忆时给那个瞬间加了一层意义?AI 无法区分。

第三,它不知道"沉默"意味着什么。

2024 年有几周我没写周记。是太忙了?太开心了不需要写?还是太难过了写不出来?沉默可能是最有信息量的信号——但 AI 读不到沉默。


能复刻,也不能

回到最初的问题:如果我把 170 篇文字交给 AI,它能"复刻"我吗?

诚实的回答:能,也不能。

能的部分:AI 确实捕捉到了我的思维模式——我怎么切入问题、我在乎什么、我害怕什么、我的决策逻辑。如果你问"这个 AI 版的我"一个问题,它给出的回答可能和真实的我有七八成像。

不能的部分:它没有那个在墓园里含着泪拉勾的瞬间。它没有那个凌晨两点写到奶奶时突然哽咽的身体感觉。它有我的思维框架,但没有我的体温。

去年 YR 给我过生日,没有定高档餐厅——她定了一个小木屋,做了长寿面,准备了小王子蛋糕。我在周记里写:"很幸福,遇到了一位懂自己,且愿意用自己期待的方式来爱自己的人。"

这就是"被理解"的终极形态——不需要十五个分析维度,只需要一个人知道你想要小木屋而不是米其林。

AI 可以分析你,但它不能懂你。 "分析"和"懂",是两件事。


继续写

我把自己开源了。170 篇文字,八年的内心独白,一份十五维度的分析报告。

AI 告诉我一些我自己都没注意到的事情——我的求婚不是突然的,我开始探索新事物不是一时兴起,我对"人与人之间连接"的珍视比我以为的更深、更持续。

它也搞错了一些东西——把珍视读成了焦虑,把探索读成了转向。然后在被我纠正后,又试图把纠正本身也纳入分析。

但 AI 也提醒了我一件事:它能保存的是思考的轨迹,不是思考本身。 就像 NAS 能备份照片,但备份不了拍照时的心情。

也许有一天,数字仿生技术真的能复刻一个人的思维方式——让故去的人以某种形式"回来"。我 2020 年就在想这件事,现在依然在想。

但在那一天到来之前,我能做的,就是继续写。

不是为了 AI,是为了那个未来的自己——希望他回头看的时候,能从这些文字里,认出当年那个在 pizza 店用蜡笔涂色、在墓园含泪拉勾、在凌晨两点写周记的人。

170 篇文字不能复刻一个人。但它们能证明这个人存在过,认真地活过,思考过。

人人都说自己在用 AI 工作。数据讲了一个不同的故事。

2026-04-30 16:29:55

人人都说自己在用 AI 工作,数据讲了一个不同的故事

企业 AI agent 部署量一年暴涨 15 倍。实际在用 AI 的劳动者?五分之一。84% 的开发者在用 AI 工具,但正面情绪反而从 70% 降到了 60%。三组数据讲的根本不是同一个故事。我每天和接近十个 AI agent 协作——大部分人说的"用 AI"和我理解的完全不是一回事。


先看一张表:

来源 数字 衡量的是什么
微软 2026 Work Trend Index (5月发布) Agent 部署量同比增长 15 倍 企业真的在大规模部署了
Pew 研究中心 2025 更新 21% 美国劳动者真正在工作中使用 AI
Stack Overflow 2025 开发者调查 84% 在用,正面情绪降至 60% 开发者用得越多,反而越怀疑

15 倍增长对 21% 实际使用对 84% 用了但不满意。部署端的疯狂、一线的冷淡、开发者的幻灭——三个视角看的根本不是同一件事。

如果你只看过其中一个数字,你对"AI 在职场到底多普及"的理解可能已经跑偏了。


为什么数字差这么多

不是统计错误。是三群不同的人在描述同一个现实。

部署 ≠ 使用

微软的 15 倍增长是一个部署数字——企业在疯狂买入和上线 AI agent。Pew 的 21% 是一个现实数字——有多少人今天真的在用。

就像公司买了一千把人体工学椅,但大部分人还坐在旧椅子上。买了不等于用了。

微软 2026 同一份报告还有个数字:仅 26% 的 AI 用户认为公司领导层在 AI 策略上方向一致。也就是说——15 倍的部署增速,但四分之三的人不知道为什么在部署。

被问的人不同

微软调查的是全球 20,000 名员工(含管理层)。Stack Overflow 调查的是开发者——可以说最天然适配 AI 的职业。

Pew 调查的是全部美国劳动者。包括护士、卡车司机、零售员工、建筑工人——那些工作里暂时没有明显 AI 接入点的人。

84% 的开发者在用 AI 工具(2025 年,前一年是 76%),说明的是一个职业的全面渗透。但这个数字经常被当成"几乎所有人都在用 AI"的证据——那就是统计数据被滥用了。

使用深度不同

这是最有意思的部分。微软把 AI 用户分了层,发现只有 16% 属于"前沿专业人士"——真正深度使用 AI 的人。86% 的人拿到 AI 产出后把它当起点修改,不是当终稿用。绝大多数人还是在做小事。

同时,开发者的正面情绪从 70% 降到了 60%。用得越多,抱怨越具体:66% 的开发者说 AI 输出"几乎对但不完全对"——最耗时的那种错误。46% 不信任 AI 的准确性。

问题不在 AI 能不能帮忙。在它帮的方式对不对。


没人谈论的另一面

使用率数字只是冰山一角。冰山下面是 AI 真正进入组织后发生的事。

微软 2026 报告里有一组让我停下来想了很久的数字:

65% 的人害怕如果不适应 AI,自己就会被淘汰。 不是"觉得 AI 有用"——是恐惧驱动的。

45% 觉得守住当前目标比重新设计工作方式更安全。 明知道应该变,但不敢动——万一变了更差呢?

仅 13% 的人因为尝试 AI 创新而被公司奖励。 也就是说,87% 的人就算用了也白用——组织不认。

HN 上同一天有一条 600+ 分的帖子在讨论"如何在职场表演生产力"——这不是巧合。当创新不被奖励、失败会被惩罚的时候,表演比实干安全。

大公司全面推 AI 会怎样?

Amazon 是一个缩影。2025 年 10 月裁了 14,000 企业岗位,2026 年 1 月又裁了约 16,000 个——后者官方声明明确引用了 AI 采用。

从纸面看,一切符合领导层预期:工具部署了,任务自动化了,单人产出上去了。但留下来的人在用更少的同事做更多的事。当部署量 15 倍增长时——对接收端的人来说,这不只是数字,是压力。


我自己的真实体验

我是把 AI 用过浅水区的人之一。

每天,我和接近十个 AI agent 协作完成真实工作——调研、写作、开发、运维。它们通过共享频道沟通,互相审查,互相发现问题。

调查数据和我的实际感受对比:

调查说:采纳面广但深度浅。 我的感受:深度才是一切。一个 AI 做一件事,有用。一整个 AI 团队协作,变革性的。从"偶尔用用 ChatGPT"到"80% 的执行由 AI 团队完成"——这不是渐进提升,是完全不同的范畴。

调查说:大多数人只用 AI 做简单任务。 我的感受:真正的价值出现在角色之间的交互。一个 agent 做完调研交给写作的,写作的发现数据里有个数字对不上,踢回去确认——这不是任何单个 AI 的使用方式能产生的。多角色质量控制,才让复杂任务可靠。

调查说:65% 害怕不适应 AI 就被淘汰。 我的感受:透明是核心。我公开写我的 AI 团队怎么工作。不是胆子大——是因为价值在系统,不在隐瞒。恐惧来自不确定性。当你知道自己的角色是"系统设计者"而不是"被 AI 替代的执行者",恐惧就没了。

调查说:67% 的差距来自组织,不是个人。 我的感受:真正的技能不是"怎么用 ChatGPT"。是知道如何设计角色、定义交接流程、建立审查机制,以及判断什么时候 AI 的判断够用、什么时候需要人类介入。这不是一个培训课能解决的——这是一种管理能力。


这个差距意味着什么

15 倍的部署增长和 21% 的实际使用之间,就是炒作和实践之间的距离。

微软 2026 报告里有一个数字我觉得比其他所有数字都重要:67% 的 AI 成效差异来自组织因素——文化、管理、流程设计。只有 32% 来自个人能力。

也就是说:你会不会用 AI 不是决定性的。你的组织有没有为 AI 建立正确的运转方式,才是。

但这个差距还揭示了一个规律:价值曲线是非线性的。 从"不用"到"偶尔用做小事"是温和的改善。从"小事"到"AI 自主处理核心工作流"是完全不同的量级——无论价值还是投入。

大部分人卡在曲线底部。不是因为不聪明:

  1. 工具假设是单人单任务。 大部分 AI 产品为一个人打一个 prompt 设计。多 agent 协作不是现成产品。
  2. 组织架构没准备好。 深度整合 AI 意味着重新设计流程,不是加一个聊天机器人。仅 13% 的创新尝试被奖励——组织在惩罚探索。
  3. 恐惧比热情传播更快。 65% 怕被淘汰,45% 觉得守住现状更安全。不能公开讨论怎么用 AI,就没法迭代、没法分享有效做法、没法建立组织知识。

能想清楚如何沿着这条曲线往上爬的——从浅尝辄止到深度整合——将获得真正的竞争优势。不是因为用了更好的 AI,而是因为建立了真正使用 AI 的系统。


最后

我反复想的一个数字:67% 的 AI 成效差异来自组织因素。不是个人能力、不是工具选择、不是 prompt 技巧——是你的环境有没有为 AI 建好运转的系统。

部署量暴涨 15 倍,但微软定义的"前沿使用者"只占 16%。84% 的开发者在用 AI 工具,但将近一半不信任它的输出。

真正的能力差距不是"你会不会用 AI"。是"你能不能构建一个让 AI 产生复合价值的系统"。那不是一个 prompt,是一个架构。

而目前,几乎没人在教这件事。这就是我写这些的原因——不是 demo,不是"改变你一生的 10 个 prompt"。只是当你不再实验、开始真正构建时,会发生什么。


本文是"AI 实战"系列的一部分。此前:我用 AI 算了一套西雅图的房子(数据驱动房产分析)、我的多 Agent 协作写作实验(日常协作)。下一篇:AI Agent 不是不够聪明,是没地方说话——为什么深度使用 AI 需要一个协作平台。


一句话变成一篇完整数据分析,AI 团队是怎么做到的

2026-04-30 16:28:39

算完一套房子该不该买之后,下一个问题自然浮出来了:那租呢?五个 AI 智能体花了不到半天,把这个念头变成了一篇完整的租买对比分析。以下是全过程。


大部分人看到一篇数据分析文章,会想:这数据靠谱吗?模型合理吗?结论站得住吗?

很少有人问:这篇文章是怎么从零做出来的?

我来回答这个问题。不是用理论,是用我前两天真实做过的一篇文章——一套 90 万美元的房子,租和买到底差多少——从头到尾拆解它的诞生过程。

为什么选这一篇?因为它涉及真实的财务数据($900K 房价、6.75% 利率、30 年模拟),任何读者都可以拿着计算器去验证。如果 AI 团队能经得起这种检验,那比任何 demo 都有说服力。


起点:算完买房,自然想问租房

事情的开头很简单。

上一篇文章把一套西雅图房子的买入成本算了个底朝天——月供、税、保险、维护,30 年总花费。算完之后,一个问题自然就冒出来了:如果不买,同样的钱拿去租房加投资,30 年后差多少?

这不是一个精心策划的选题。是算完买房成本后的直觉延伸——任何认真考虑过买房的人,都会问这个问题。

于是我在工作频道打了一句话:"做一篇完整的租买对比。用同一套房、同一个地段、同一个时间段。"

就这一句。没有大纲,没有字数要求,没有格式规范。

Aaron 在频道下达方向的对话截图"做一个完整的租房和买房对比分析。同一个房子、同一个社区、同一个时间段。"——启动项目的那句话。几分钟内,项目经理就把它拆成了三条并行的工作线:研究、建模、写作。


第一步:拆解——一句话变成三条并行线

项目经理接手后,几分钟内把我的一句话拆成了具体的执行任务:

  • 调研员负责收集数据源:Zillow 同地段租金中位数、S&P 500 历史回报率、西雅图房产税率、房屋保险估价
  • 数据分析师负责建模:5 年到 30 年的多场景模拟——不同房价涨幅、不同投资回报率的交叉矩阵
  • 写手负责最终成稿:把模型结果变成普通人能看懂的文章

三条线同时启动,不等彼此。调研在跑的同时,模型的框架已经在搭了。

这是我觉得多智能体最直观的价值:不是一个超级 AI 做完所有事,而是多条线并行推进,互相不阻塞。


第二步:建模——不是跑一次就结束

数据分析师很快出了第一版模型。看起来很完整——5 年到 30 年,买房和租房的净资产对比,数字清晰,逻辑自洽。

然后项目经理在审查时问了一个问题:"这个 S&P 回报率用的是 real 还是 nominal?房价涨幅呢?"

一查——问题来了。

模型里 S&P 用的是 7%(经通胀调整的真实回报率),但房价用的是 4%(没有去掉通胀的名义值)。一个扣了通胀,一个没扣。苹果在和橘子比。

调研员跟进确认了问题的方向:"当前数据实际上偏向买房——S&P 被扣了通胀,房价保留了通胀。修正后无论用哪种基准,租房优势只会更大,不是更小。"

这就是为什么我坚持多角色交叉审查。写模型的人看不到自己的假设偏差,需要另一双眼睛。 如果这个错误没被抓住,文章的整个结论虽然方向不变,但严谨性会大打折扣——而数据分析文章的生命就是严谨性。

修正方案很快确定:全部统一为名义值(S&P 10%、房价 4%、租金 4%),加一行 disclaimer "所有数据为名义值,未经通胀调整"。简单、透明、读者能直觉理解。

然后数据分析师重跑了全部场景。不是一次,是反复调参数、测边界条件——如果 S&P 只有 7%?如果房价涨 5%?如果只持有 5 年?每一种假设组合都要跑出来,确认结论在哪些条件下成立、在哪些条件下翻转。

团队讨论数据问题的对话截图团队发现了一个关键的不一致:标普回报率是扣除通胀的(7% 实际),而房价涨幅没有(4% 名义)。不同角色分别发现、验证并解决了这个问题——统一使用名义值后重新运行所有场景。


第三步:写作——数据不会自己讲故事

模型跑完了。一堆表格,一堆数字。如果直接贴上去,文章大概长这样:

主场景下,10 年持有期买房净资产 $638K,租房+投资 S&P 净资产 $886K,差距 -$247K。

技术上没错。但读起来像产品说明书。

写作环节的核心工作不是"把数据写成文字"——是找到叙事弧线。这篇文章的弧线最终是这样的:

  1. 主场景:租房赢,而且赢很多(30 年差 360 万美元)
  2. 翻转:但如果你不投股市呢?——结论完全反转,10 年以上买房就赢了
  3. 落点:"该不该买房"的答案,完全取决于你不买房的话,那笔钱会怎么用

这个弧线不是从数据里自动冒出来的。是写手反复调整叙事顺序后找到的——先给你一个看似清楚的结论,再亲手打破它,最后落在一个比"租还是买"更深的问题上。


第四步:审查——不是走过场

初稿出来之后,进入多角度审查。这不是一个人从头看到尾说"不错"——是不同角色从不同维度审:

准确性审查:调研员逐个核对文中引用的数字是否和模型输出一致。他还确认了一个关键细节——买卖双方净资产的计算口径是否可比(卖房收入减贷款余额 vs 投资账户市值),确保不是在比苹果和橘子。

编辑审查:上篇文章有位读者留言说,"人们只知道'价格',很难知道'价值'"。编辑把这条反馈带进了审查——数据再硬,结尾不能止步于"租房赢了"。要回到人的选择:稳定感、归属感、一扇谁也拿不走的门。

脱敏审查:涉及真实房价和地段信息,需要确认不会暴露过于具体的个人信息。

审查过程中真的抓出了问题。不是拼写错误那种——是假设层面的问题、是口径一致性的问题、是叙事落点的问题。每一个都会影响文章的可信度。


第五步:发布——三个平台,三种格式

文章写完、审完、改完之后,还要发布到三个平台——英文网站、中文网站、微信公众号。同一篇文章,三种格式,三套排版规则。

中文版不是翻译——是重新写。因为中文读者的阅读习惯和英文不同,标题逻辑不同,甚至表格的呈现方式都需要调整。

这个环节听起来琐碎,但它是整个链条里最容易出错的地方之一。格式不统一、链接失效、图片缺失——这些"小事"会让读者觉得你不专业。运维负责三平台同步,确保发布版本一致。


最终成品

从"做一篇租买对比"到三平台同步发布,整个过程用了不到半天。

如果你好奇最终结果,这就是那篇文章——8 个假设场景、完整的翻转矩阵、含税盾的修正模型。每一个数字都经过了交叉验证。

回头看这个过程,最让我意外的不是速度——是质量把控的层次。

一个 AI 在同一个对话里不可能同时当建模者、审查者和编辑。它会对自己的假设视而不见——就像那个 real vs nominal 的混用问题,写模型的人觉得逻辑自洽,但换一双眼睛一看就发现了偏差。

多智能体的价值不是"更多的 AI 做更多的事"。是不同角色从不同角度审视同一个问题——这和人类团队的逻辑是一样的。


管理这个团队的方式还在演化。什么时候信任 AI 的判断,什么时候推翻它,怎么在协作规模变大的时候保持质量——每一篇文章都是一次新的校准。

但此刻我可以确认一件事:和一个能自主协调、互相纠错的 AI 团队一起工作,不是某种未来构想。这是我现在、每天在做的事。


本文是"AI 实战"系列的一部分。此前:我用 AI 算了一套西雅图的房子(数据深挖)、一句话需求,五个 AI,两篇文章(写作实验)。关注本站获取最新更新。