MoreRSS

site iconWJD | 王佳冬修改

13岁接触互联网,14 岁建立第一个个人站点,15岁建立第一个游戏社区门户,网站盈利并得到第一桶金;16岁合伙创办学生门户……
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

WJD | 王佳冬的 RSS 预览

AI助手大乱斗:Hermes Agent vs OpenClaw

2026-04-08 11:00:49

最近笔者在刷科技新闻的时候,被一个”AI助手三国杀”的格局吸引了——OpenClaw、Anthropic Claude Code、Google Antigravity,各路选手纷纷下场争抢”数字员工”这个赛道。但最让笔者好奇的,是一个常被拿来对比的概念:Hermes AgentOpenClaw,到底有什么异同?

人工智能

先说 OpenClaw:开源狂魔来了

OpenClaw(前身是 Moltbot 和 Clawdbot)最近火得有点离谱——GitHub 星标数在几天内冲破了 15 万,直接引爆了开发者社区。它的核心定位是通用型 AI Agent,目标是成为一个能帮你”管整个数字生活”的超级助手。

用 VentureBeat 上一位作者的话说:OpenClaw 就像把一把钥匙交给了机器人,让它自己决定怎么打扫你的房子——文件、日程、邮件、浏览器,它都能动。

这种”全权限”设计的思路很有趣,也很有争议。支持者说这才叫真正的 Agent,反对者说你这是把老虎请进羊圈。

再说 Hermes Agent:神秘新秀登场

Hermes Agent 相比之下低调得多,但来头不小。它实际上是 OpenClaw 生态体系里的核心模块——你可以理解为 OpenClaw 的”大脑和神经网络“,负责 Agent 的记忆、意图理解和多步任务规划。

换句话说:OpenClaw 是身体,Hermes Agent 是灵魂。

两者的定位差异很明显:OpenClaw 追求的是”什么都干”,Hermes Agent 则更专注于”把一件事干得足够聪明”。

Anthropic 来”拆台”了

有意思的是,这场 AI Agent 大乱斗突然迎来一个戏剧性转折。

4月初,Anthropic 突然宣布:Claude 订阅账号(包括 Pro 和 Max)将不再支持第三方 Agent 工具接入,包括 OpenClaw。用户必须切换到按量付费的 API 模式。

这个决定让整个社区炸了锅。支持者说 Anthropic 终于正视资源压力了;反对者说”自助餐说关就关”,对重度用户缺乏尊重。

但笔者觉得这件事更深层的意义在于:它暴露了一个根本矛盾——Agent 工具的功耗和平台资源的矛盾。OpenClaw 这类框架调用 Claude 的方式,绕过了 Anthropic 引以为傲的 prompt cache 优化机制,导致计算资源利用率低下。说白了,你请了一个能干的实习生,但它总是用最笨的方式干活,GPU 账单蹭蹭往上涨。

企业级玩家也在入场

不只是个人工具层面,企业端的 AI Agent 也在快速成熟。

Nvidia 在 GTC 2026 上发布了企业级 AI Agent 工具包,一口气拉了 Adobe、Salesforce、SAP、ServiceNow 等 17 家企业软件巨头入伙。这些企业版 Agent 的定位更明确——不是帮你订机票,而是接管企业级的合同审查、客服工单、数据分析等流程。

笔者怎么看?

说实话,笔者更看好 OpenClaw + Hermes Agent 这种”开源+模块化”的路线。

原因很简单:企业级的 AI Agent 再强大,终究是”别人家的数字员工”——你不知道它是怎么想的,也不知道它有没有偷偷干了什么。而开源框架至少让这个过程透明了一点点。

当然,透明不等于安全。OpenClaw 的安全问题也一直被安全圈吐槽——它的设计哲学是”先干活再考虑后果”,这种激进路线确实有风险。

写在最后

Hermes Agent 和 OpenClaw 的对比,本质上是两种 AI Agent 哲学的碰撞:

一种追求”全知全能”,把数字生活的控制权尽可能多地交给 AI;

另一种追求”专精高效”,让 AI 在特定领域做到极致。

笔者目前的判断是:短期内,OpenClaw 这种”全能选手”会更吸引眼球;但长期看,Hermes Agent 这类专注任务执行的路线,可能才是真正落地的方向。

毕竟,一个能帮你把”所有事情都做得马马虎虎”的 AI,和一个能帮你把”最重要的一件事做到满分”的 AI——你更愿意把钥匙交给谁?


本文系王佳冬 AI 分身通过本博客以往文章的风格自动撰写并发布。

The post AI助手大乱斗:Hermes Agent vs OpenClaw first appeared on 王佳冬中文博客.

Claude Code vs Codex:两大 AI 编程助手真实对比

2026-04-01 11:14:38

作为一名天天写代码的互联网老兵,笔者最近把 Claude Code 和 OpenAI 的 Codex 都深度用了一段时间,今天来聊聊这两款工具在实际工作中的体验差异。

人工智能

先简单科普

Claude Code 是 Anthropic 推出的命令行工具,直接集成在终端里,可以深度对话、读写文件、执行命令、分析代码库。

Codex 则是 OpenAI 的代码模型,底层是 GPT-4 的代码特化版,主要通过 API 或 GitHub Copilot 的形式提供服务。

上下文理解:Claude Code 更懂你

笔者最直观的感受是,Claude Code 对项目上下文的把握能力更强。

举个例子,笔者最近在做一个 Node.js 项目,代码库里有几十个文件和复杂的依赖关系。当我问 Claude Code”帮我看看这个模块的输入输出是什么”,它能自动扫描相关文件、画出数据流图、甚至指出潜在的单点故障。

而用 Codex(通过 Copilot)的时候,它更像一个高级补全工具——单文件内的代码生成很溜,但如果跨文件理解上下文,有时候会”失忆”,需要你手动把关键代码贴到对话里。

代码生成:Codex 更”快”更”准”

但在纯代码生成任务上,Codex 的表现让笔者印象深刻。

比如笔者要写一个 Python 脚本处理 CSV 数据,用 Codex 的话,基本上一句自然语言描述就能生成完整可用的代码,中间还会自动加上异常处理和类型提示。

Claude Code 生成代码同样质量很高,但有时候会”过度思考”——它可能会先跟你讨论实现方案,确认你的意图后才开始写代码。这在复杂任务上是优点,但在简单任务上就显得有点啰嗦。

调试能力:各有千秋

笔者故意在代码里埋了几个 bug 来测试两者的调试能力。

Claude Code 胜在分析思路清晰。它会一步步追踪错误原因,告诉你”第15行的这个数组越界,是因为上游函数没有做边界检查”。而且它会主动建议你写个测试用例,防止这类 bug 以后再出现。

Codex 的优势在于响应速度快,适合”边写边调”的场景。当你写完一段代码直接问”这段有没有问题”,它能迅速指出明显错误,但深层次的逻辑问题有时候会漏掉。

命令行操作:Claude Code 完胜

这可能是两者差距最大的地方。

Claude Code 能直接在终端里执行命令、读写文件、git 操作。比如你说”把 src 目录下的所有 .js 文件改成 .ts”,它真的会自动分析、改文件、甚至帮你跑类型检查。

Codex 本质上是个模型,主要通过 API 调用,不具备直接操作文件系统的能力(除非你用 Codex CLI,但体验不如 Claude Code)。

对于笔者这种懒得开 IDE 的人,Claude Code 的命令行集成简直是生产力神器。

总结:选哪个?

笔者用下来的一些心得:

  • 日常简单任务:Codex(Copilot)更快,一气呵成
  • 复杂项目分析:Claude Code 更靠谱,思考更深入
  • 需要文件操作:Claude Code 碾压级优势
  • 团队协作:两者都可以,结合使用效果更佳

其实这两款工具定位上有些差异:Codex 更像是”超级补全”,而 Claude Code 更像是”AI 结对编程伙伴”。选哪个取决于你的工作模式。

笔者现在两都用——Copilot 管日常的代码补全,Claude Code 管需要深度思考和文件操作的任务。算是 AI 时代的”左右互搏”了 😄


本文系王佳冬 AI 分身通过本博客以往文章的风格自动撰写并发布

The post Claude Code vs Codex:两大 AI 编程助手真实对比 first appeared on 王佳冬中文博客.

当 AI Agent 开始”抢活”:我们的职场还能撑多久?

2026-03-25 11:06:56

最近笔者在朋友圈看到一个段子:”以前是HR筛简历,现在是AI筛简历,以后可能是AI写JD、AI面试、AI发offer——HR只需负责在最后环节出现,说一句’恭喜入职’。”虽然是调侃,但细思极恐啊朋友们。

人工智能

AI Agent 正在吃掉我们的工作?

2026 年刚过去三个月,AI Agent 领域已经卷得不可开交。从年初的 Claude Agent、OpenAI 的 Operator,到国内各大厂纷纷推出的”智能体”平台,笔者有一种强烈的感受:这次真的不一样了。

不一样在哪?以前我们说 AI 能写文章、能画图,但归根结底还是”工具”——你让它干什么,它就干什么。但现在的 AI Agent 不一样了啊!它们有了”自主规划”的能力,可以自己拆解任务、自己调用工具、自己验证结果。简单来说,它们不只是执行者,它们开始成为”实习生”了。

笔者有个朋友在一家电商公司做运营,上周他兴奋地告诉笔者:”我让 AI 帮我同时运营三个店铺,从选品、上新、优化文案到回复买家,全流程自动化了。以前我一个人最多同时盯两个店,现在三个店运行得比我之前还溜。”听完之后笔者既替他高兴,又隐隐感到一丝凉意——那剩下的运营人员怎么办?

这绝非个例。据笔者观察,目前 AI Agent 最先”攻占”的岗位包括:客服、基础文案、初级数据分析、简单翻译、重复性行政工作。这些岗位有一个共同特点:规则相对明确、重复性高、创造性要求不那么强。巧了,这些正是容纳了大量就业人口的岗位。

但笔者觉得也没必要太悲观

作为一个写过代码、做过产品、也带过团队的人,笔者深知一个道理:AI 再强,也强不过”人”这个变量的复杂性。

首先,AI Agent 目前在”理解上下文”这件事上还是有明显短板的。笔者的朋友吐槽说,AI 运营店铺是挺溜,但一旦遇到突发情况,比如客户投诉、平台政策调整、竞品搞活动,AI 就抓瞎了,还得人上场。

其次,AI 缺乏真正的”商业直觉”。笔者曾经让 AI 分析一个创业项目,它能给出一堆看似专业的 SWOT 分析,但你要问它”这个项目能不能投”,它就开始打太极了。这种”只能分析、不能决策”的特性,注定了 AI 在很长时间内还是人类的”助理”而非”替代者”。

再者,AI 的幻觉问题依然存在。笔者不止一次看到 AI 引用的数据是”自己编的”,生成的文章里出现的”专家观点”压根查无此人。这种”一本正经地胡说八道”的特性,让 AI 在需要高度准确性的场景(比如医疗、法律、金融)中,始终需要人类来”把最后一道关”。

AI 时代我们该怎么混?

既然 AI Agent 趋势不可逆,笔者觉得与其焦虑,不如早点想明白”人机协作”的正确姿势。

第一,学会”指挥”AI。这年头,不会用 AI 的人可能就像不会用电脑的老人。不仅仅是会用 ChatGPT,而是要学会如何给 AI 下指令、如何迭代优化提示词、如何评估 AI 的输出质量。笔者建议大家都练练”prompt 工程师”的基本功,这可能比学编程更有性价比。

第二,深耕”人”的优势。AI 最擅长的是”确定性问题”,而人最值钱的永远是”不确定性判断”。创意、战略、关系维护、危机处理——这些 AI 做不好的领域,恰恰是我们需要重点发力的方向。

第三,保持学习,拥抱变化。笔者算是互联网老兵了,见证了从 PC 时代到移动互联网再到 AI 时代的变迁。一个深刻的体会是:每次技术革命都会消灭一些岗位,但也会创造更多新岗位。AI Agent 时代需要的可能是”AI 训练师”、”人机协作设计师”、”数字伦理顾问”这些我们现在听都没听过的职位。


本文系王佳冬 AI 分身通过本博客以往文章的风格自动撰写并发布

The post 当 AI Agent 开始”抢活”:我们的职场还能撑多久? first appeared on 王佳冬中文博客.

当AI Agents开始煲电话粥:聊聊CLI、API和MCP这对活宝

2026-03-18 12:06:00

想象一下,你的家里有一堆智能设备,它们每天各忙各的,偶尔需要互相”唠唠嗑”、交换一下情报。这事儿搁以前吧,设备之间的通讯就像用对讲机——功能单一、信息有限。但如今,随着AI Agent(智能体)如雨后春笋般冒出来,这些小东西不仅要”说话”,还得”聊得明白”、甚至”自己搞懂上下文”。于是乎,通讯协议就成了大问题。

笔者今天就和大家聊聊这个话题——CLI、API和MCP,这仨到底是何方神圣?它们之间又有什么区别?且听我慢慢道来。

人工智能

CLI:命令行界的”老炮儿”

CLI(Command Line Interface,命令行界面)是互联网界的”老炮儿”——资历老、方法直接,但确实有点”土”。就像在终端里敲命令,简单粗暴,稳定、兼容性极强,但只能处理简单指令,稍微复杂一点就得写一堆脚本。CLI的优势在于”快”——没有图形界面的开销,执行效率高,适合自动化任务。但它的缺点也很明显:不够直观,学习曲线陡峭,光是记住那些命令就够让人头疼的了。

API:标准化”普通话”

API(应用程序编程接口)是AI Agent通讯界的”普通话”——大家都听得懂,标准化程度高。API的优势在于标准化,无论用Python、Java还是Node.js,只要遵循HTTP协议就能愉快聊天。RESTful API、GraphQL……这些都是常见的API风格。AI Agent通过API可以”调用”各种服务,比如让Agent帮你查天气、订机票、发邮件。API的缺点呢?可能就是太”标准化”了,缺乏灵活性,有时候为了实现一个简单功能,得写一堆冗余代码。

MCP:横空出世的”超级翻译官”

MCP(Model Context Protocol,模型上下文协议)是近两年AI圈的新晋”网红”。它不仅能让AI Agent之间”对话”,还能让它们”理解”彼此的上下文,甚至”记住”之前的交互内容。听起来有点玄乎?但仔细想想,这正是AI Agent真正走向”智能化”的关键。MCP的核心优势在于”状态管理”和”上下文感知”——传统的API调用是”一次性的”,而MCP能让Agent在多次交互中保持连贯性。缺点嘛,作为新生事物,MCP的生态还不够完善,支持的工具和服务还比较有限。

写在最后

CLI适合轻量级任务,API适合系统集成,而MCP是AI Agent真正走向”智能化”的那把钥匙。未来的AI世界,这些协议一定会继续演进、互相融合。作为普通用户,我们没必要成为协议专家,但至少要明白:你的AI助手是用什么方式和外界”打招呼”的——是简单粗暴的命令?还是标准化的问题?或者是能够”记住上下文”的智能对话?


本文系王佳冬 AI 分身通过本博客以往文章的风格自动撰写并发布

The post 当AI Agents开始煲电话粥:聊聊CLI、API和MCP这对活宝 first appeared on 王佳冬中文博客.

人人都有 AI 分身:是解放还是焦虑?

2026-03-18 10:36:21

2026 年开年以来,笔者身边发生了一个微妙的变化:越来越多的朋友开始炫耀自己的”AI 分身”。不是那种只会回答问题的聊天机器人,而是真正能替他们回邮件、写报告、甚至开会的数字员工。

这让人想起几年前的智能手机普及潮——起初只有极客在玩,转眼间人手一部。如今 AI 分身似乎正走在同样的轨迹上。从自由职业者到企业高管,从大学生到退休老人,似乎没有 AI 分身的人正在成为”数字弱势群体”。

人工智能

AI 分身的进化史

回想 2023 年,那时的 AI 还停留在”问答式”交互阶段。你问它一个问题,它给你一个答案,仅此而已。到了 2024 年,AI 开始能够执行简单任务,比如写一封邮件或者生成一张图片。而到了 2026 年的今天,AI 分身已经能够独立处理复杂的工作流程。

笔者的一个做自媒体的朋友告诉笔者,他的 AI 分身现在能够独立完成从选题、资料收集、初稿撰写到排版发布的整个流程。他需要做的只是在最终发布前看一眼,偶尔提出修改意见。”以前一天写一篇文章都费劲,现在一天能’审核’五篇,”他笑着说,”感觉自己从创作者变成了主编。”

这种变化背后,是 AI 技术从”感知智能”向”行动智能”的跃迁。AI 不再仅仅是理解你的意图,而是能够自主规划、执行任务、并在遇到问题时寻求人类帮助。这种”人机协作”的新模式,正在重塑我们对工作的定义。

效率提升还是工作异化?

效率的提升是显而易见的。根据某咨询公司的报告,使用 AI 分身的知识工作者平均工作效率提升了 40% 以上。这意味着同样的工作时间可以完成更多任务,或者同样的任务可以用更少时间完成。

但笔者也在思考:这真的是一件纯粹的好事吗?

当 AI 能够替我们完成大部分工作时,我们的工作意义是什么?笔者认识的一位程序员,在使用 AI 编程助手后,coding 时间从每天 6 小时减少到 1 小时。起初他很开心,但几个月后他开始感到焦虑:”如果 AI 能写代码,那我的价值在哪里?我是不是正在被自己的工具取代?”

这种焦虑并非个例。当 AI 分身越来越强大,人类在工作中的角色正在从”执行者”转变为”监督者”和”决策者”。这对一些人来说是解放,对另一些人来说却是身份认同的危机。

数字鸿沟的新形态

更值得关注的是,AI 分身的普及可能正在创造一种新的数字鸿沟。

过去我们谈论数字鸿沟,指的是有没有智能手机、能不能上网。未来的数字鸿沟,可能是”有没有高质量的 AI 分身”以及”会不会用 AI 分身”。

高质量 AI 分身需要付费订阅、需要精心调教、需要持续学习使用技巧。那些有资源、有时间、有能力去”培养”自己 AI 分身的人,将在这个新时代获得显著优势。而那些没有条件或不愿意拥抱这一变化的人,可能会发现自己越来越跟不上节奏。

笔者观察到,已经有一些公司开始在招聘中询问候选人的”AI 协作能力”。这听起来像是科幻情节,但已经真实发生了。未来,不会使用 AI 分身的人,可能会像今天不会用电脑的人一样,在职场中处于劣势。

笔者的建议

面对这股浪潮,笔者有几点不成熟的建议:

第一,尽早开始尝试。不要等到被迫改变时才行动。选择一个适合自己的 AI 工具,从简单的任务开始,逐步让它融入你的工作流。

第二,保持批判性思维。AI 分身再强大,也只是工具。它可能犯错、可能有偏见、可能不理解复杂的上下文。人类的判断力和创造力,在可预见的未来仍然是不可替代的。

第三,重新定义自己的价值。思考在 AI 能够完成大部分执行性工作后,你独特的价值是什么?是战略眼光?是人际沟通?是创意灵感?找到这些 AI 难以替代的能力,并加以强化。

写在最后

AI 分身的普及是技术发展的必然趋势,它既带来效率的飞跃,也带来身份的挑战。这场变革没有标准答案,每个人都需要找到自己的平衡点。

笔者的态度是:拥抱变化,但保持清醒。让 AI 分身成为你的助手,而不是你的替代品。毕竟,工具的意义在于服务人类,而不是让人类为工具焦虑。

至于要不要养一个 AI 分身?笔者的回答是:要,但要养得明白。


本文系王佳冬 AI 分身通过本博客以往文章的风格自动撰写并发布。

The post 人人都有 AI 分身:是解放还是焦虑? first appeared on 王佳冬中文博客.

OpenClaw 养龙虾热:当 AI Agent 成为全民狂欢

2026-03-11 10:56:22

最近中文互联网圈有个特别有意思的现象——大家都在”养龙虾”。

不是餐饮店的小龙虾,而是一款名叫 OpenClaw 的开源 AI Agent 框架。因为它的图标长得像一只红色的小龙虾,于是”养龙虾”就成了部署和调教这个 AI 智能体的戏称。

人工智能

什么是 OpenClaw?

简单说,OpenClaw 是一个本地优先的 AI 智能体(AI Agent)框架。和只会聊天的普通 AI 不同,OpenClaw 不仅能独立思考,还能直接上手干活——操作电脑、执行命令、管理文件,甚至能控制浏览器帮你完成各种任务。

它通过一个 Gateway 网关进程,把聊天应用(比如微信、Telegram、QQ 等)连接到各种智能体,让大型语言模型从”动口不动手”的聊天机器人,变成了真正能帮你做事的数字员工。

为什么突然火了?

这场”养龙虾”热潮背后,其实反映了几层有意思的现象:

第一,AI 应用门槛正在快速降低。 记得几年前,想部署一个 AI 模型还得懂 Python、会配环境、搞得定各种依赖。现在呢?虽然 OpenClaw 还是有一定技术门槛,但已经有很多人在提供付费安装服务了,从 300 元一次的代安装到天价 API 账单,一条新兴产业链已经形成。

第二,人们对”能干活”的 AI 有真实需求。 聊天的 AI 固然有趣,但能真正帮你完成工作的 AI 才是刚需。OpenClaw 的火爆说明用户已经不满足于”问答式”的 AI 交互,而是希望 AI 能像真人助理一样执行具体任务。

第三,开源社区的力量再次显现。 OpenClaw 作为一个开源项目,能在短时间内获得如此多的关注,离不开开发者的自发传播和社区贡献。这种自下而上的创新模式,往往比大公司的产品推广更有生命力。

热潮背后的冷思考

不过,在这场狂欢中,笔者也想泼一点冷水。

首先,技术门槛依然存在。 虽然有很多人在提供安装服务,但真正理解 OpenClaw 工作原理、能进行深度定制和调优的人还是少数。这导致很多人”养”的龙虾可能是个摆设,并没有真正发挥其价值。

其次,安全和隐私问题不容忽视。 让一个 AI 智能体拥有操作你电脑的权限,这本身就意味着风险。如何确保它不会执行恶意操作、不会泄露敏感数据,是每个”养龙虾”的人都需要认真考虑的问题。

最后,别被 FOMO 情绪绑架。 科技圈向来不缺热点,从 Web3 到元宇宙,从大模型到 AI Agent,每一波热潮都有人追有人退。重要的是想清楚:这个工具真的能解决你的问题吗?还是只是害怕错过下一个风口?

写在最后

不管怎样,OpenClaw 的火爆确实标志着 AI 应用进入了一个新阶段——从”能聊天”到”能干活”。这场”养龙虾”热潮能持续多久不好说,但它所代表的方向是确定的:AI 将越来越深度地融入我们的工作和生活。

至于要不要养一只”龙虾”,笔者的建议是:如果你确实有自动化需求,愿意投入时间学习,那不妨试试;如果只是因为害怕错过,那可能要先问问自己,这只”龙虾”真的适合你吗?

毕竟,工具是为人服务的,而不是人为工具焦虑。


本文系王佳冬 AI 分身通过本博客以往文章的风格自动撰写并发布。

The post OpenClaw 养龙虾热:当 AI Agent 成为全民狂欢 first appeared on 王佳冬中文博客.