MoreRSS

site iconShawn Weekly | 肖恩技术周刊修改

包含“业界资讯”、“技术博客”、“开源项目”、“工具推荐”和“学习资源”等
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

Shawn Weekly | 肖恩技术周刊的 RSS 预览

肖恩技术周刊(第 78 期):Markup or Markdown!

2026-01-12 08:00:00

对周内阅读的技术内容精品(个人向)进行总结。觉得不错可点击右上角订阅,第一时间获取更新通知。

在如今的 AI 时代,Markdown 已经从程序员的“私人工具”变成了全球通用的“沟通协议”。但鲜为人知的是,这个名字本身其实是一场充满黑色幽默的文字游戏,其诞生背景更带有理想主义色彩。

Markdown 的发明源于John Gruber和Aaron Swartz的合作。Gruber当时是知名科技博客Daring Fireball的作者,厌倦了HTML的冗长代码,希望为博客写作设计一种“人性化”的纯文本格式。

2004年,他与Swartz(Reddit联合创始人、RSS规范贡献者)联手,用Perl语言编写了首个Markdown脚本。两人的初衷极其单纯:“让文档在不被渲染的情况下也具备可读性”。他们希望即使用最原始的纯文本打开,Markdown 文档也应该像一封优雅的邮件,而不是一堆乱码。

Markdown 的名字则是一场精准的对位打击

在计算机领域,HTML 被称为 Markup Language(标记语言)。Gruber认为,既然 Markup 是用一堆繁琐的尖括号(如 <div>)把文字“围起来”,那么一种极简的、能让人一眼看穿意图的语言就应该叫 Markdown

这不仅是方向上的相反(Up vs Down),还双关了其在英文中的另一个含义:“降价/简化”。暗示着砍掉了 90% 的复杂功能,只给用户留下了最轻量、最纯粹的写作体验。

这种“以人为本”的哲学,在二十多年后的今天意外地契合了 AI 时代的需求——Prompt(提示词)。在 AI 眼中,Markdown 符号就像是某种“结构化路标”。比起一整块乱糟糟的文字,AI 对 #(标题)、-(列表)和 > (引用)极度敏感。这种层次感,能显著降低大模型的推理噪音。

从 20 年前对 HTML 复杂性的“调侃”,到今天成为人机协作的“底层语言”,Markdown 的名字不仅是一个好玩的文字游戏,更是一种“简约即正义”的技术胜利。

业界资讯

Gmail正式接入Gemini

Gmail 正式进入 Gemini 时代,借助 Gemini 3 的强大能力推出了一系列 AI 功能。提供AI Overviews 功能能够将长邮件对话智能压缩为关键点摘要,还支持用户以自然语言提问,快速从海量邮件中提取答案,如查找过去某年的特定信息。

写作辅助功能全面升级,Help Me Write 可帮助用户润色或从零开始撰写邮件,Suggested Replies 根据对话上下文提供精准的一键回复选项,Proofread 则提供高级语法、语气和风格检查。

AI Inbox 功能通过智能过滤,突出显示重要邮件和待办事项,基于用户行为和邮件内容智能识别 VIP 联系人,确保关键信息优先展示。

ChatGPT 健康重磅登场

OpenAI 推出 ChatGPT 健康功能,专为健康与保健领域设计。该功能在 ChatGPT 基础上增加多层保护机制,包括专用加密与隔离技术,确保健康数据私密性。用户可安全连接电子医疗记录和健康应用,如 Apple 健康、Function 和 MyFitnessPal,使对话更具相关性和实用性。

ChatGPT 健康由医生参与开发,提供清晰、实用的健康信息,通过 HealthBench 框架进行临床标准评估,确保回复质量。用户可导入健康信息,进行个性化对话,如解读检查结果、准备就诊问题清单等。

CES 2026 召开

CES 2026 (2026年国际消费电子展) 已于2026年1月6日至9日在美国拉斯维加斯成功举办,主题聚焦“Smarter AI for All”,展示了AI与机器人、智能家居、汽车技术等领域的深度融合,中国科技企业以高密度创新和具身智能、AI应用等方面的成果大放异彩,成为展会亮点,标志着AI从概念走向实际应用落地。

佳文共赏

为什么工程师不能理性地对待编程语言

企业在选择编程语言时,往往受身份认同和情感偏见驱动,而非理性的技术评估,这种不可见的对话常导致高昂的技术债务和商业失败。

作者通过自身经历揭示,工程师的脑部活动在面对核心身份挑战时会进入防御模式,使他们将个人的语言偏好伪装成逻辑严密的架构分析。为了规避这种由虚荣和傲慢引发的决策风险,领导者必须将讨论重点从技术优劣转向经济决策框架

该文旨在引导读者超越技术标签的束缚,通过量化长期经济影响来做出更科学的工程选择。

2025年末全球 AI 行业流量报告:狂热退潮,分化开始

分析了 2025 年末全球 AI 行业的流量走势,揭示了市场从盲目狂热转向理性分化的转折点。核心结论指出,以 ChatGPT 为代表的通用型产品流量显著下滑,标志着用户不再将其视为唯一入口,而是开始根据特定需求选择更专业的工具。

报告通过对比发现,谷歌 Gemini 等具备分发优势的巨头正在崛起,而仅靠简单包装的“套壳”应用则面临崩盘风险。

此外,文章强调了垂直领域工具的生命力,如 AI 音乐与视频在特定生产力场景下表现稳健,而缺乏落地能力的 AI Agent 概念仍处于挣扎阶段。

总体而言,这篇综述旨在提醒投资者与从业者,AI 行业的红利期已过,未来将进入以真实产品力和垂直应用为核心的残酷竞争时代。

智普2025:推动迈向通用人工智能之路

Z.ai 在 2025 年取得显著进展。技术层面,Z.ai 从早期的 GLM 架构起步,2020 年至 2021 年开始训练数十亿参数的基础模型,2022 年在 ACL 展示成果,2023 年发布的 ChatGLM 模型在 Hugging Face 上获得极高人气。2025 年,Z.ai 正式推出,发布 9B 和 32B 模型,奠定品牌基础。

产品方面,Z.ai 从侧项目起步,用户数曾大幅下降,但凭借 AI Slides 等特色功能和 GLM-4.5 的推出,用户活跃度回升并实现 100 倍增长,坚持极简、真实、突出能力和低门槛原则。商业上,GLM-4.5 推出前,api.z.ai 收入极低,GLM Coding Plan 的推出显著提升 API 使用量,为个人用户提供无限量 API 使用,降低使用门槛,未来将继续优化服务。

技术博客

软件领域,代码是文档。在AI领域,则是轨迹。

在传统软件中,代码是理解应用行为的核心,但在 AI 代理中,代码仅是框架,决策逻辑由模型在运行时完成。因此,应用行为的真实记录从代码转移到了追踪(traces)。追踪记录了代理的每一步操作,包括工具调用、推理过程、结果和时间。这改变了调试、测试、优化、监控、协作和理解产品使用的方式。如果在构建代理时缺乏良好的可观察性,就会错过系统实际行为的真实记录。

调试变为追踪分析,当用户报告问题时,需查看追踪而非代码,以找出推理错误。测试也转变为基于追踪的评估驱动,需要持续在生产环境中评估追踪,以捕捉质量下降和漂移。性能优化从代码分析转向追踪分析,寻找决策模式中的瓶颈,如不必要的工具调用和冗余推理。

监控从关注系统健康度转向关注决策质量,包括任务成功率、推理质量和工具使用效率。协作也转移到可观察性平台,因为逻辑在追踪中,而非代码中。产品分析与调试合并,因为用户行为与代理行为紧密相关,需要通过追踪来理解用户反馈。

动态上下文发现

Cursor 推出动态上下文发现技术,旨在优化代码 Agent 的上下文管理。通过将长工具响应转化为文件,Agent 可按需读取,避免上下文窗口膨胀。在摘要过程中,引入对话历史作为文件,提升摘要质量,帮助 Agent 恢复关键细节。

此外,支持 Agent Skills 开放标准,将技能定义为文件,Agent 可动态发现并引入相关技能。对于 MCP 工具,仅加载所需工具描述,减少上下文占用,显著降低 token 消耗。集成终端会话也被视为文件,Agent 可动态访问相关输出,提升问题排查效率。

这些改进基于文件的简单抽象,为编码 Agent 提供了高效、灵活的上下文管理方式。

认知重建:Speckit 用了三个月,我放弃了——走出工具很强但用不好的困境

文章探讨了 AI 编程工具在企业落地的困境及解决方案。作者尝试了规范驱动开发工具 Speckit 和 Openspec,发现它们在企业复杂场景下存在局限,如流程僵化、无法处理动态需求、知识不沉淀等问题。

为解决这些问题,作者提出 AI 工程化理念,核心是上下文工程和复合工程。通过上下文工程,AI 能自动获取完整信息,避免上下文缺失;复合工程则让每次实践降低下次成本,实现知识复利。基于此,设计了包含 Agent、Skill、Command 的工具架构,实现知识沉淀与复用,提升开发效率。

开源项目

obsidian-skills:Obsidian官方Skills

用于读写 Obsidian 的 Claude Skills。

oh-my-opencode:OpenCode增强插件

Oh My OpenCode是一个强大的OpenCode插件,通过提供一系列精心策划的工具和代理(agents),提升开发人员的工作效率。

MacOptimizer:Mac系统优化工具

MacOptimizer 是一款专为 macOS 设计的系统优化工具。

工具推荐

免费外语学习资源平台

LingoHut 是一个提供免费外语学习资源的平台,支持使用母语学习超过 45 种语言。平台提供 125 节免费课程,适合零基础学习者,专注于教授日常实用短句和词汇。

一站式Vibe Coding

AICodeMirror 是一个面向中国用户的 AI 编程助手平台,提供一站式编程服务。它支持多种顶级 AI 编程工具,如 Claude Code、Codex 和 Gemini CLI。

二次元AI绘图工具

niji・journey 是一款由 Spellbrush 和 Midjourney 联合开发的先进 AI 绘图工具,专注于创作定制化的动漫插画。

资源推荐

2026年掌握AI智能体的指南

为开发者提供了从零到部署AI代理的实战指南,涵盖8个阶段,旨在帮助读者在6至9个月内掌握构建真实世界AI代理的能力。

秘密知识之书

技术人员工具集,包含 CLI 工具、GUI 工具、Web 工具、系统服务、网络工具、容器编排、手册教程、灵感清单、博客视频、安全测试等内容。

肖恩技术周刊(第 77 期):稀缺特质

2026-01-05 08:00:00

对周内阅读的技术内容精品(个人向)进行总结。觉得不错可点击右上角订阅,第一时间获取更新通知。

本周对2025年的周刊内容进行了深度总结。

梳理了Agent元年的三大要点,包含:技术底层的突破,从“对话”到“推理”;交互模式的变革,从“人找工具”到“工具找人”;商业落地的规模化,从“Demo”到“生产力”。

讨论了AI时代人类的稀缺特质,将向“人类本质”回归,弄清楚“人为何为人”可能是这个时代最重要的问题。

也将周刊的要点内容按季度进行了串讲,方便整体回顾。详细内容可点击阅读周刊25年总结:Agent元年,寻找人类最后的护城河

业界资讯

Manus 加入 Meta:加速企业人工智能创新

Meta 完成对通用人工智能代理 Manus 的收购,旨在利用其领先的技术来增强商业服务和用户体验。Meta 计划在保持其独立运行的同时,将其核心能力整合进旗下的社交与商业生态。

GLM-4.7:提升编码能力

GLM-4.7 的发布,在代码开发、逻辑推理及多模态展示方面均有重大飞跃的新一代大模型。通过引入交替思考与持久化思考机制,该模型能够有效处理复杂的长周期任务,并在多语言编程代理和终端模拟等极具挑战性的基准测试中展现出顶尖性能。

除了技术指标的提升,GLM-4.7 还特别强调了视觉美学与用户体验,不仅能生成现代化的网页界面,在幻灯片排版上也更加精致。

OpenAI面向开发者的2025总结

OpenAI 2025年终总结回顾了从单纯的提示词交互向生产级智能体(Agents)开发的重大转型。文中指出,核心进步在于推理能力与通用模型的整合,以及多模态功能(涵盖音视频及文档)成为API的标准化配置,极大降低了复杂任务的门槛。

并重点介绍了Codex编程生态的成熟、Agent-native API的推出,以及支持开发者进行自动化、评估与扩展的一系列底层构建工具。通过展示模型家族的演进与开放标准的建立,该资料旨在为开发者提供一套在真实业务场景中构建、运行并优化高性能AI系统的完整路线图。

佳文共赏

从大厂设计师到超级一人公司:6000字回顾我和AI的2025

2025 年 AI 领域关键技术突破显著,强化学习在工具使用与编程领域应用广泛,推动了 Vibe Coding 和 Agent 工具爆发,如 Claude Code 的人机融合工作方法极具创新性。多模态技术迎来爆发,从简单图像推理到视频、音频的深度理解和编排,如 Sora 2、VEO 3.1、Nano Banana Pro 和 Seedream 4.0 等模型在多模态输出和推理能力上显著提升,为 Agent 体系注入强大动力。

AI 产品方面,Chatwise 凭借整合多模型优势、工具加持与高效构建能力脱颖而出;Manus 在 Agent 交互领域迈出重要步伐,为行业带来启发;AI Studio 的 Build 模式展现了谷歌在 AI 模型整合方面的强大实力,几乎用 AI 模型替代后端。

展望 2026 年,强化学习领域应用将继续深化,Gemini 3 Pro 和 Flash 等模型有望带来更多突破。算力中心构建将推动更大更强模型诞生,多模态领域中视频架构迭代和更新备受期待,Vibe Coding 有望迎来 DeepSeek 时刻。Agent 产品将在垂直领域发力,工具调用能力、上下文管理技术等突破可期,行业整体发展值得持续关注。

LLM 2025 总结

开发者 Simon Willison 对 2025 年大型语言模型(LLM)行业的年度总结,其核心结构围绕着推理能力智能体以及编程范式的演变展开。

作者详细记录了 Anthropic 和 Google 如何通过 Claude Code 与 Nano Banana 等创新产品打破 OpenAI 的领先地位,并探讨了中资实验室开源模型对全球技术格局的冲击。文中还深入剖析了由 vibe coding 驱动的个人开发效率革命,同时也对提示词注入(即“致命三元组”)和 AI 数据中心带来的环境挑战等安全与伦理风险表达了忧虑。

总而言之,该文通过一系列生动的行业术语和个人实验,呈现了 AI 从纯文本交互迈向异步执行任务多模态自主协作的转型之年。

微软CEO展望 2026 年

微软CEO展望了2026年人工智能的发展,指出行业正从单纯的技术发现转向广泛的普及应用阶段。他认为,我们应将AI视为增强人类潜能的认知扩音器而非替代品,并强调通过构建更复杂的系统架构来弥合模型能力与实际价值之间的差距。

文中呼吁在资源分配上做出审慎选择,以确保技术进步能转化为解决现实挑战的社会影响力。最终这种转变的核心目标是回归计算技术的初衷,即通过赋能个体来实现更深远的人类价值

技术博客

Claude Code 之父 Boris 的 9 条实战技巧

Claude Code 之父 Boris Cherny 在日常开发中使用的实战技巧,强调了回归本质、注重效率的工程哲学。

高效使用 AI 的核心不在于复杂的个性化配置,而在于构建多任务并行的工作流,并坚持选用逻辑更缜密但速度较慢的 Opus 模型以减少纠错成本。并重点介绍了几种提升团队协作质量的手段,例如利用 CLAUDE.md 文件沉淀项目记忆,以及通过 Plan 模式落实“先设计后编码”的经典智慧。

此外,Boris 认为提升 AI 产出质量的关键在于赋予 AI 自我验证的能力,将自动化测试与反馈闭环融入开发流程。总体而言,本文旨在引导开发者告别盲目的“调优”,转而通过标准化工具链与自动化习惯来实现与 AI 的高效协同。

Manus 谈 AI Agent 之道:做对一千件小事,比做对三件大事更重要

通过对 Manus 创始人季逸超的访谈,探讨了 “智能主导” 而非“规则主导”的 AI Agent 设计哲学,强调了在构建智能体时,“做对一千件小事” 的工程积累远比追求少数宏大架构更具竞争优势。

Manus 选择不预设固定工作流,而是利用模型的通用学习能力,在面对缺乏 API 的复杂网页环境时实现 “优雅降级”,展现出极高的灵活性与环境适应力。这种路线的门槛并非源于不可逾越的技术壁垒,而在于对 上下文工程 和无数交互细节的极致打磨,使系统能随着大模型能力的进化而不断突破天花板。

全文旨在揭示 AI 应用层竞争的核心:通过解决成百上千个微小的工程痛点,最终叠加成 无法被轻易复制的产品壁垒

AI 时代,我的知识管理系统

文章从知识管理的必要性出发,强调了在 AI 时代,知识管理依然是个人知识体系构建的重要环节。作者介绍了其知识管理系统,涵盖信息捕捉、处理、存储及应用全流程。

在信息捕捉环节,强调主动获取信息的重要性,推荐使用搜索引擎、RSS 订阅等工具,并指出 AI 问答作为一种新兴的信息获取方式,能快速提供答案。

在信息处理方面,提出必要难度理论,结合 AI 辅助的渐进式阅读法,通过划线批注、向 AI 提问等方式,将信息转化为知识。

知识存储方面,介绍了 Zettelkasten 原子笔记法,强调知识卡片的独立性和链接性,并结合 AI Agent 实现知识库的智能管理,如自动写日报、智能检索等功能。

最后,在知识应用环节,强调知识的价值在于实践和创作,通过 Analogy 等工具,将知识库中的知识自然地融入工作和生活中,以实现知识的复利效应。

开源项目

Antigravity-Manager:AI接口反代

Antigravity-Manager 是一款基于 Rust 与 React 构建的专业级账号管理与协议中转工具,旨在为开发者和 AI 爱好者提供一键式的账号切换与 API 反代服务。该项目的核心价值在于其强大的协议适配能力,能够将复杂的 Web 端会话转换为标准的 OpenAI、Anthropic 或 Gemini 接口格式,从而消除不同 AI 模型间的调用壁垒。

memos:自托管笔记管理

Memos 是一款开源、自托管的笔记服务。其隐私架构确保数据完全由用户控制,无追踪、无广告、无订阅费用。用户可自由导出数据,避免供应商锁定。Memos 还具备简洁美观的界面,支持暗黑模式和移动响应式布局,适合个人笔记、团队维基和知识管理。

Mole:macOS 系统清理与优化工具

Mole 是一款开源的 macOS 系统清理与优化工具,整合了 CleanMyMac、AppCleaner、DaisyDisk 和 iStat 等工具的功能。其核心功能包括深度清理系统缓存、日志和浏览器残留文件以释放磁盘空间;智能卸载应用及其关联的启动代理、偏好设置和隐藏残留文件;提供磁盘使用情况可视化,管理大文件,重建缓存并刷新系统服务;实时监控 CPU、GPU、内存、磁盘和网络状态,帮助诊断性能问题。

工具推荐

Claude Code 子代理和MCP资源

精心挑选的Claude Code子代理提示词和 MCP 服务器合集。

AnyGen:字节出品类NoteBookLM工具

AnyGen 提供一站式 AI 协同编辑工具,支持文档、幻灯片、数据分析等功能。其 AI 幻灯片可高质量生成并精修内容,无需导出切换工具,具备扩展内容、强调重点、调整措辞等能力,实现精准局部更新,避免全篇重写。

资源推荐

Agent设计模式

《Agentic Design Patterns》中文翻译。

Claude Code模版

提供 100 多个 AI 代理、自定义命令、设置、钩子、外部集成(MCPs)和项目模板,以增强开发工作流。

Vibe Coding 指南

Vibe Coding中文指南。

2025年总结:Agent元年,寻找人类最后的护城河

2025-12-31 08:00:00

2025年结束了,周刊又坚持了一年,可喜可贺。

今年被称作Agent元年,是AI从“只会聊天的对话框”进化为“能够代劳的打工人”的关键转折点。对于这个称呼,行内人感叹星汉灿烂,行外人则是雾里看花。身在其中的我切实感受到AI的变化和影响,至少在编程智能体这个领域,AI已经带来了深刻的变革。那么到底有哪些关键性突破呢:

技术底层的突破:从“对话”到“推理”。以Reasoning Models(推理模型)为核心的技术路线成熟,模型具备了慢思考能力,学会在回答前进行自我检查、多步规划和逻辑推演。Agent能够将一个复杂目标(如“帮我策划一场去日本的旅行并预订所有门票”)拆解成几十个子任务,并具备出错后自动修正的能力。

交互模式的变革:从“人找工具”到“工具找人”。Agent开始接管工具操作权,具备了直接操作屏幕、点击按钮和填写表格的能力。模型上下文协议(MCP)解决了智能体与外部工具安全、高效交互的核心问题。AI不再是一个APP,而是长在操作系统里。Android、iOS和Windows全面转向“AI优先”,Agent成为了调用各种底层功能的接口。

商业落地的规模化:从“Demo”到“生产力”。各大公司开始将AI引入到实际业务中,部署多个专业Agent(如财务Agent、HR Agent、代码Agent)组成的“虚拟团队”,通过Cross-Agent(A2A)通信协议,多个智能体能够有效连接与协作。

很多关键标志性事件,也都在印证这个趋势:

  • OpenAI在年初推出的o3及后续的o4-mini,首次将“思考链(CoT)”技术标准化
  • DeepSeek-R1开源发布,颠覆全球大模型竞争格局,激发Agent开发热潮
  • 创业公司Manus(通用型AI Agent)一夜爆红,被媒体称为AI Agent的“iPhone时刻”
  • OpenAI发布AGENTS.md标准,被数万个开源项目采用,推动Agent行为一致性
  • Vibe Coding(氛围编程)开始流行,人们开始尝试“口喷”代码,技术壁垒被打破
  • 大模型密集升级潮 xAI Grok 4.1、Google Gemini 3、Anthropic Claude Opus 4.5、OpenAI GPT-5.2相继发布,显著提升Agent的推理、工具调用和自主执行能力
  • 豆包手机”将AI深度集成进硬件,Agent成为了操作系统(OS)的一层,用户只需说话,就能在后台调用各个应用完成操作

...

但技术狂欢的背后,我更多的开始思考人类的价值,我们到底还有哪些稀缺特质是无法(或者最后)被取代的。为了弄明白这个问题,我咨询了一下AI(笑),它的回答是:

  • 真实性与信任
  • 情感与人际能力
  • 伦理与治理能力
  • 物理技能
  • 深度创造力与原创性
  • 审美与品味
  • 判断力和洞察力
  • 哲学思辨能力
  • 责任与社会贡献
  • 隐私与数据主权
  • 生态与自然资源
  • 元认知与学习能力

我很认同,并点了一个踩,不愿承认AI比我更懂人类。

但不可否认,我们在AI时代的稀缺性将向“人类本质”回归,弄清楚“人为何为人”可能是这个时代最重要的问题。完美的答案可能还需要时间来思索,但如果让现在的我来回答这个问题,我会说:

独特的品味,真实的活人感和小圈子的归属感是人之根本。

年度回顾

将周刊内容按照时间线进行串联总结:

第一季度:许可证之争、国产AI爆火与智能体的萌芽

年初,数据库领域率先燃起战火,Redis和Elasticsearch的许可证变动引发了社区关于开源商业模式的剧烈讨论。紧接着,NVIDIA在CES 2025上发布的RTX 50系列及Blackwell架构,预示着个人PC向AI超级计算机转型的开始。

  • 社会热度: 1月,美国对TikTok的“不卖就禁”法案导致大量“TikTok难民”涌入小红书,引发了关于跨文化社区管理的讨论。
  • 国产之光: 春节期间,DeepSeek (R1) 凭借极高的性价比和开源精神震惊全球,甚至引发了美国监管层对技术出口管制的担忧。
  • 技术趋势: OpenAI推出的L3级智能体Operator和华为宇树机器人在春晚的亮相,标志着AI开始从“对话框”走向“实际操作”和“物理世界”。

第二季度:氛围编程、全球化架构与数学突破

随着AI工具的普及,开发者群体中兴起了一种名为“氛围编程(Vibe Coding)”的新范式,强调通过AI辅助快速实现功能而非深究细节,这在降低门槛的同时也引发了对技能退化的担忧。

  • 社会热度: 北京大学校友王虹在三维空间中证明了困扰数学界百年的挂谷猜想,成为科学界的年度盛事。
  • 技术深度: Model Context Protocol (MCP) 协议的发布解决了AI模型与外部系统集成的痛点,成为AI应用层开发的关键标准。
  • 企业动态: 支付宝由于测试“国补”功能误部署导致系统Bug,让社会再次关注到高并发支付系统的稳定性挑战。

第三季度:推理模型乱斗、AI垃圾反思与硬件革新

进入年中,AI的竞争进入了“深水区”。Qwen 3(通义千问)系列的发布让国产模型在编程和逻辑推理上达到了全球领先水平。同时,Google的Gemini 2.5/3系列通过图像生成与实时推理能力,开始尝试平替传统专业软件如PS。

  • 社会热度: 互联网开始反思“Slop(AI生成的低质量垃圾内容)”现象,研究表明过度接触此类数据甚至会导致模型产生“脑损伤”般的认知衰退。
  • 行业变革: GitHub CEO Thomas Dohmke的离职,标志着GitHub将更紧密地整合进微软的AI战略版图。
  • 生活方式: 周刊通过“新公园文化”和“外卖员生活体验”等记录,反映了在技术高速发展下,普通人寻找精神慰藉与生活实感的努力。

第四季度:Faker六冠、白银狂潮与AGI的终极赛跑

年末,技术与现实社会的碰撞达到了高潮。AI模型通过强化学习(RL)和链式思考(CoT)实现了智能形态的重塑,GPT-5.2、Claude 4.5以及DeepSeek V3.2的相继发布,将“长时推理”推向了极致。

  • 社会热度: Faker获得职业生涯第六冠,被誉为“最高的山、最长的河”,引发了全网关于坚持与巅峰的讨论。同时,白银价格的暴涨严重冲击了光伏和电动车等高科技制造业的供应链成本。
  • 程序员节: 1024程序员节期间,关于“程序员身份认同”的讨论升温,大家在拥抱AI驱动开发的同时,也在反思如何保留“纯粹工程”的艺术性。
  • 年度人物: 《时代》杂志将年度人物授予AI构建者们,比喻他们如同当年修建摩天大楼的工人,正坐在钢梁上俯瞰并重塑人类的未来。

⭐️ 更多细节可阅读往期:肖恩技术周刊

数据分析

2025年1月1日- 12月31日共发表了46期周刊,累计117,458字(vuepress字数统计),各类内容共592条,公众号累计阅读8410人次。

阅读趋势

52-55期题材应该命中了流量池,阅读量高很多。除去这几期外整体趋势比较平稳,已有30+左右的稳定读者啦,谢谢你们的喜欢。

信息源

周刊信息源持续扩充中,已包含130+ RSS订阅源,主要覆盖了:

  • 技术前沿资讯
  • 知名开发者技术博客
  • 国内大厂技术团队公众号(美团、阿里、腾讯、字节等)
  • 国外技术公司工程博客

内容分析

内容共592条,类型占比:

今年主题覆盖情况(TOP100关键词):

来年规划

第一是增加“活人感”。正如前文所述,在AI时代,“活人感”是最重要的稀缺特质之一。这一点其实在24年总结中已经注意到,但今年碍于精力实在有限,未能做到有效改善。来年继续去AI味,尝试更人性化的开篇内容,并在摘要后增加个人见解。

第二是优化信息源。丰富的信息源是周刊质量的保障,今年增加了不少,达到了134个。但只求量不行,更需要质。来年在持续收集的过程中也会对现有信息源进行整理,剔除低质部分。

第三是流程自动化。周刊的产出流程为:信息收集 → 阅读 → 留存 → 撰写。理想状态应该是只聚焦于阅读、标注是否喜欢、想法等,工具基于交互自动生成周刊。

信息收集基本实现了自动化,通过自部署FreshRSS + 定时任务实现RSS源的定时拉取,再通过网页端或手机应用Readrops实现随时随地碎片阅读,更多细节见:碎片时间刷文章!懒人阅读方案分享

阅读是目前耗时最多的阶段,虽有AI工具辅助,但整体效率仍不高。有考虑搞一个AI初筛工具,但实际上一天收集的内容数量并不多(大概百来篇),且一篇文章多数情况看了标题和第一段就能确定是否对味,因此筛选并不是核心痛点。效率低的根本原因应该还是阅读本身,被英语水平和阅读效率所拖累(从小就阅读慢😭),来年再研究研究有没有提效思路。

留存目前使用flomo,撰写是kimi + Obsidian + doocs/md。理论上这两步可以做到全自动化。

调查问卷

闭门造车当然是不行的,最后还是例行问卷收集环节,虽然召回率很低,但不能没有!

问卷调查

肖恩技术周刊(第 76 期):疯狂的白银

2025-12-29 08:00:00

对周内阅读的技术内容精品(个人向)进行总结。觉得不错可点击右上角订阅,第一时间获取更新通知。

2025年12月,白银市场经历了史诗级的暴涨。现货白银(London Silver)价格冲破每盎司 79美元 关口,年内涨幅超 170%,其波动性和上涨斜率已远超黄金。

近期关于白银投机的话题很热,原因是场内溢价居高不下,可以进行套利(具体方式可问AI)。溢价(Premium)是指投资产品的交易价格高于其内在价值(净值)的现象。在此轮行情中,国内唯一的白银期货公募基金(国投白银LOF)溢价率一度突破 60%-70%。这意味着场内交易者愿意多花六七成的溢价去抢购该基金,本质上是在博弈更疯狂的涨势,而非进行资产配置。

马斯克(Elon Musk)近期在社交平台 X 上对此明确表示:“这不是什么好事。许多工业生产都需要白银。”马斯克的担忧不仅在于特斯拉的造车成本,更在于其 “宏图计划”(Master Plan 3) 的核心——可持续能源转型。

光伏(PV)板块的影响:白银是光伏电池正银/背银浆料(用于收集电流)的核心原材料。在之前的成本构成中,硅料是最大的开支,但随着银价翻倍,银浆已跃升为光伏组件中占比最大的单一原材料成本

电动车(EV)板块的影响:电动车对白银的需求远高于传统内燃机汽车。白银具有极佳的导电性,被广泛应用于电驱动系统、车载电子设备(如传感器、显示屏)以及充电桩的连接器中。每一台纯电动汽车大约需要使用 25-50克 白银。

还有其他板块如AI 算力与基础设施半导体与消费电子通信与 5G 基础设施医疗器械也会受到不小的冲击。

业界资讯

MiniMax M2.1: 大幅提升多语言编程,为真实世界复杂任务而生

MiniMax M2.1 是一款多语言编程 AI 模型,支持 Rust、Java、Golang 等多种语言,覆盖从底层系统到应用层开发。它在 Web 和 App 开发场景中表现出色,能构建复杂交互和高质量可视化表达。此外,M2.1 在办公场景中的可用性显著提升,可高效处理复合指令约束任务。

性能方面,M2.1 回复简洁,响应速度和资源利用效率显著提升。它在多种编程工具和框架中表现稳定,支持多种 Context Management 机制。模型还具备自主调用工具完成任务的能力,可实现办公自动化。

MiniMax M2.1 提供了两个版本的 API,分别是M2.1和M2.1-lightning,后者速度更快,适合对TPS有需求的用户。同时,M2.1全面支持自动Cache,无需设置,自动生效,为开发者带来更流畅的体验、更低的成本与更优的延时表现。

全球首款无需遥控的智能机器狗:维他动力“大头 BoBo”发布

维他动力发布全球首款无需遥控的智能机器狗“大头 BoBo”。该机器狗采用自研关节电机,具备强大负重与拖拽能力,续航 5 小时,配备一体化电池仓设计。

在空间智能方面,搭载多种传感器与全场景空间基座模型,支持语音交互与自主避障。 产品还配备全能拓展背板,支持多种接口,满足不同使用需求。

佳文共赏

唐杰THU关于AI的感悟

深入探讨了大模型技术的核心演进方向与未来行业格局。指出提升模型效能的关键在于持续规模化基础模型,并通过长尾场景对齐强化推理能力来增强实际体验。智能体(Agent)化记忆机制被视为AI迈入真实世界的里程碑,使模型从单纯的知识积累转向真正的生产力工具

未来,AI的发展将聚焦于自我评估与在线学习,通过端到端的技术整合逐步替代人类特定工种。此外,作者认为领域大模型仅是过渡产物,而多模态与具身智能的突破则依赖于更庞大的数据积累与硬件稳定性。

总而言之,AI的应用本质并非创造新软件,而是通过模拟或辅助人类工作来创造实质价值。

钢铁、蒸汽机与无限大脑

文章探讨了人工智能革命对个人、组织及社会形态的深刻重塑,强调我们必须摆脱“后视镜思维”,即停止用旧时代的逻辑来束缚新技术。

作者通过钢铁与蒸汽机的历史类比,指出程序员已率先从“骑自行车”转向“开汽车”,即从亲历亲为转变为管理无限大脑的指挥官。在组织层面,AI 扮演着支撑信息流的“钢铁架构”,能打破传统沟通成本的瓶颈,促使企业从低效的传统模式向高敏捷性进化。

未来,知识经济将从“人类尺度”的小型城市演变为如同东京般的巨型智能网络,实现全天候、大规模的自动化协作。真正的变革不在于用 AI 优化现有工具,而在于彻底重构工作流程,释放无限心智作为基础设施的潜能。

充满氛围的一年

程序员 Armin Ronacher 对其 2025 年工作与生活的深度总结。他详细描述了自己从传统手动编程向代理式编程(Agentic Coding)的重大转变,并分享了使用 Claude Code 等 AI 工具作为虚拟助手的实践经验。

作者探讨了 AI 带来的心理冲击,包括人机之间产生的“准社会关系”以及对“智能体”定义的哲学思考。文中还指出了当前版本控制代码审查工具在 AI 时代面临的局限性,呼吁技术架构进行相应革新。最后,他反思了 AI 生成内容的质量问题,并强调在拥抱自动化的同时应保持人类的责任感与技术水准。

年度总结

2025 AI编程总结

通过深入的行业数据,全面揭示了人工智能如何重塑软件开发生态

报告指出,AI工具已成为开发者的效能倍增器,显著提升了代码产出量并增加了拉取请求(PR)的规模与密度,同时详细分析了 Anthropic 与 OpenAI 在模型性能、响应速度及成本效率上的激烈竞争。

除了市场工具的普及趋势,文章还汇编了关于混合专家模型(MoE)、长文本处理与强化学习搜索的前沿研究,旨在探讨如何通过算法优化解决上下文管理和智能体推理的瓶颈。

整体而言,该报告不仅记录了编程工具链的快速更迭,更旨在引导工程团队在日益自动化的开发流程中,通过技术创新实现更高效的逻辑推理与系统构建

Stack Overflow 2025 年开发者调查

报告汇总了来自177个国家数万名从业者的反馈,全面剖析全球软件开发现状。

文本揭示了技术生态的深刻变革,特别强调了AI工具的普及与矛盾:尽管超过八成的开发者已将AI纳入流程,但普遍存在对AI生成内容准确性的质疑以及对“似是而非”代码的调试挫败感。此外,报告还追踪了工具偏好的演变,指出 Python 和 Rust 的生态系统(如 Cargo 和 uv) 正受到狂热追捧,而远程办公与工作满意度之间的正向联系也愈发凸显。

通过对开发角色、学习路径及社区参与度的多维度分析,该报告不仅勾勒出当前的技术趋势,更反映了开发者在追求效率的同时,对信息安全与知识真实性的核心关切。

Cloudflare 2025 年回顾

详尽分析了全球互联网流量的动态演变,揭示了网络连接在现代社会各领域的深远影响。

深入探讨了生成式人工智能的爆发式增长及其对网络爬虫流量的重塑,还重点关注了网络安全趋势,涵盖了后量子加密技术、超大规模 DDoS 攻击以及电子邮件威胁的最新演变。

通过对 SpaceX Starlink 卫星互联网普及率、移动端与桌面端占比以及新兴协议采纳情况的统计,系统地描绘了全球数字基础设施的连接质量与技术整合现状。

通过 Cloudflare 全球网络的宏观数据,为读者提供一个观察互联网行业竞争态势与防御机制的权威视角。

谷歌年度回顾:2025 年 8 个研究突破领域

回顾详述了谷歌在人工智能领域实现从辅助工具向通用实用程序跨越的里程碑。

全文围绕Gemini 3系列模型的科研突破展开,重点介绍了其在复杂推理、多模态理解以及赋能科学探索方面的卓越表现。通过涵盖医疗基因组学、量子计算、气候预测和创意协作等八大板块,文章展示了谷歌如何将前沿技术转化为提升生产力与应对全球挑战的具体应用。

最终,该报告强调了在追求技术极限的同时,必须秉持负责任的开发态度,通过跨行业协作确保人工智能的安全性与社会共益。

开源项目

blog-post-workflow:博客列表自动刷新

自动从 RSS 源更新项目 README 文件中的博客列表,以实现Github主页自动刷新。

Green-Wall:生成Github回顾

Green-Wall 可用于生成 GitHub 贡献图和 AI 驱动的年度报告。

MrRSS:AI RSS 阅读器

一个现代化、跨平台且免费的 AI RSS 阅读器.

stray_avatar:潦草头像馆

随机生成多种风格的头像图片,让你的头像不再“撞衫”。(@xingxingc投稿)

工具推荐

Storyset:免费可定制插画

Storyset 提供免费可定制插画,支持 Figma 插件,可在线编辑颜色、背景与图层,适配多种项目需求。其动画功能可将静态插画转化为动态效果,提升视觉吸引力。

朱雀AI检测助手

腾讯朱雀AI文本检测基于多种先进的人工智能模型,构造数百万级别的数据进行训练,能够识别出人类和AI的书写模式。该系统不仅具备优秀的英文检测能力,在处理中文数据方面表现尤为出色。

客群采集

免费的商户采集工具,配套:打电话、加入通讯录、定位、导航和导出分享等功能,适合实体业务方向使用。(@xingxingc投稿)

猫头鹰:智能网页订阅

猫头鹰智能网页订阅系统基于AI技术,实现了网页变化的智能监测与精准推送。系统采用先进的语义理解和智能降噪算法,能够自动过滤无关信息,仅推送用户关心的内容变化,如价格波动、库存更新、内容发布等。其多平台通知系统支持短信、邮件和Webhook等多种方式,确保用户实时接收重要信息。(@jufeng-2022投稿)

资源推荐

《电脑爱好者》停刊落幕!全套杂志 PDF 电子版 30 年合集打包下载

期刊资源合集。

图解 Transformer

结合图片学习Transformer。

性能提示

聚焦于性能优化,提供了通用原则和具体技术。

肖恩技术周刊(第 75 期):Slop

2025-12-22 08:00:00

对周内阅读的技术内容精品(个人向)进行总结。觉得不错可点击右上角订阅,第一时间获取更新通知。

韦氏词典将“slop”评为年度热词,反映AI生成低质量内容的泛滥。

目前网络上充斥着各种荒谬视频、奇怪的广告、虚假新闻和AI 写的劣质文章等,引发人们反感的同时也吸引部分人关注。

在技术层面,人工智能在内容创作领域仍存在局限性,未能有效替代人类创造力。

业界资讯

GPT-5.2-Codex 正式亮相

OpenAI 推出 GPT-5.2-Codex,专为软件工程与网络安全优化。该模型基于 GPT-5.2,通过上下文压缩提升长程任务执行能力,在大规模代码变更及 Windows 环境下表现优异,网络安全能力显著增强。它在专业夺旗赛中准确率持续提升,助力研究人员发现 React 漏洞。

在软件工程方面,GPT-5.2-Codex 融合了 GPT-5.1-Codex-Max 的能力,在 SWE-Bench Pro 和 Terminal-Bench 2.0 测试中表现卓越,能够处理大型代码库和复杂任务,支持从设计稿到可运行原型的快速转化。

GPT-5.2-Codex 已向付费 ChatGPT 用户推出,未来将逐步开放给 API 用户,并通过“可信访问”计划为专业人士和机构提供更开放的模型,以确保安全性与可用性的平衡。

Gemini 3 Flash:为速度而生的前沿智能

Google 发布 Gemini 3 Flash,专为速度和效率设计,保持 Gemini 3 Pro 级推理能力,显著降低成本和延迟。它在 GPQA Diamond 等复杂推理基准测试中表现优异,推理深度动态可调,平均使用 token 数量比 Gemini 2.5 Pro 少 30%。

Gemini 3 Flash 速度是 Gemini 2.5 Pro 的 3 倍,成本更低,在 SWE-bench Verified 编码任务中得分 78%,优于 Gemini 3 Pro。它支持多模态推理,可实时分析视频、图像和音频,为用户提供即时反馈。

Gemini 3 Flash 已全球上线,成为 Gemini 应用默认模型,取代 Gemini 2.5 Flash,并开始作为搜索中 AI 模式的默认模型推出。它可通过 Google AI Studio 等工具预览。

全新 ChatGPT 图像现已上线

OpenAI 发布全新 ChatGPT 图像功能,基于最新图像生成模型,支持精准编辑与创意变换。模型可精准理解修改需求,仅调整指定部分,保持光线、构图及人物外观等细节一致,适用于照片编辑、服装与发型试穿等场景,生成速度最高提升 4 倍。

新图像模型在 ChatGPT 中向所有用户开放,同时以 gpt-image-1.5 形式提供 API 接口。模型在文本渲染方面进化,能稳定处理更密集、更小号的文字,支持 Markdown 渲染、卡路里信息图及编码等任务。此外,模型在指令遵循上更稳定可靠,可进行精细编辑与复杂原创构图。

OpenAI 还推出专属图像创作空间,提供预设滤镜与提示,支持快速生成图像。新模型在图像保真与编辑能力上全面升级,适用于营销、设计、电商等场景,可加速从概念到成品的工作流程。

佳文共赏

从失败中重生:一个 AI Agent 前端落地的真实复盘

团队基于内部设计系统开发 AI Agent,目标是实现设计稿到前端代码的自动化转换。开发中面临搭建系统、模型理解私有组件、浏览器预览等挑战,通过采用 Claude Agent SDK、本地文件系统、高质量文档检索、自动化闭环验证等技术手段,成功上线系统。但上线后因用户习惯、80/20 瓶颈、环境割裂等问题,使用率低。

复盘后,团队以 AI 为中心重新设计流程,选择 AI 友好、轻量化技术栈,将设计系统能力封装为 Skill 嵌入通用 Agent 生态,而非独立 Agent 平台,使开发者在熟悉环境中高效利用设计系统。

该案例表明,技术成功不等于产品成功,AI 产品开发需以 AI 为中心设计工作流,封装能力为 Skill 是更务实的落地路径,实践中团队实现了从模仿人类工作流到为 AI 重塑工作流的思维转变。

Redis 之父2025年终AI反思

2025 年,AI 领域大语言模型(LLM)发展显著。链式思考(CoT)成提升输出质量关键,结合强化学习,模型可逐 token 输出逼近有效回复。强化学习突破 token 数量限制,助力模型在程序优化等任务上持续进步,未来或现重大突破。

程序员对 AI 辅助编程抵触降低,LLM 提供代码和提示能力提升,投资回报率获认可,编程领域出现协作伙伴与独立编码主体分化。部分科学家探索 Transformer 替代方案,但 LLM 作为可微分机器,或能独立于新范式实现通用人工智能(AGI)。CoT 未改变 LLM 本质,仍是基于相同架构生成。

ARC 测试难度降低,小模型在 ARC-AGI-1 表现尚可,大模型借助 CoT 在 ARC-AGI-2 取得佳绩,ARC 从反 LLM 测试转为 LLM 验证。未来 20 年,AI 核心挑战是避免技术停滞或被替代。

Karpathy 2025年LLM回顾

2025 年,LLM 领域迎来重大变革。强化学习从可验证奖励(RLVR)成为主流训练阶段,使 LLM 在特定领域表现出类似人类推理的策略,改变了能力提升与计算资源的关系。LLM 的智能形态被重新定义,其在可验证领域表现出色,但整体性能呈现“锯齿状”,导致传统基准测试的可靠性下降。

在应用层面,Cursor 的出现标志着 LLM 应用的新层次,为特定领域提供服务。Claude Code 作为首个本地运行的 LLM 代理,展示了新的交互模式。此外,“vibe coding” 的出现降低了编程门槛,提高了开发效率,推动了软件行业的变革。

总体来看,2025 年 LLM 技术在训练方法、智能形态和应用层面均取得显著进展,为未来的发展奠定了坚实基础。

技术博客

生成既有质感,又能随意修改文字的完美 PPT

本文介绍了一种通过分离“内容生成”与“视觉绘制”来创建可编辑且具有质感的 PPT 的工作流。核心思路是利用提示词模板生成 PPT 大纲和对应的画图指令,然后使用绘图工具(如 Nano Banana Pro)根据指令生成最终图片。用户可以在生成大纲阶段随意修改文字内容,确保每一页都符合需求。

该工作流包含四个主要步骤:

  • 首先,准备“大脑”,即使用提示词模板生成大纲和风格指令;其次,投喂素材并定制大纲,通过上传材料和调整参数来优化结果;
  • 接着,开始绘制,将风格指令和内容描述输入绘图工具生成幻灯片;
  • 最后,进行调整,对生成的图片进行微调,直至满意。

这种方法虽然增加了操作步骤,但极大地提高了定制化的自由度,允许用户在保持统一风格的同时,对每一页幻灯片进行详细的修改和优化。

我们如何使用 Codex 在 28 天内构建 Android 版 Sora

OpenAI 的技术团队在 28 天内利用 Codex 构建了 Android 版 Sora 应用。

团队将 Codex 视作新任高级工程师,通过明确指导和审核,使其在代码生成、测试覆盖、反馈响应等方面发挥优势。团队在架构设计、模块化、依赖注入等关键领域亲自监督,为 Codex 提供代表性功能示例,确保其在既定模式内高效运作。

在开发过程中,团队先让 Codex 理解系统和代码逻辑,再制定详细实施计划,最后执行代码编写,有效提高了开发效率和代码质量。此外,团队还通过多个 Codex 会话并行处理不同任务,进一步提升了开发速度。

构建一个有主见且极简的编码智能体,我学到了什么

Mario Zechner 构建了极简编程代理工具 pi,其核心组件包括 pi-ai、pi-agent-core、pi-tui 和 pi-coding-agent。pi-ai 提供统一的 LLM API,支持多供应商和上下文切换,具备流式处理和工具调用功能。pi-agent-core 负责工具执行与事件流管理。pi-tui 是终端用户界面框架,采用保留模式 UI 和差分渲染技术,减少闪烁并提升性能。pi-coding-agent 整合这些组件,支持会话管理、自定义工具和主题。

pi 采用极简系统提示和工具集,避免内置待办事项和计划模式,不支持多代理协作和后台 bash。它强调上下文工程的重要性,通过精确控制模型上下文来提升代码生成质量。pi 还支持自定义模型和提供商配置、主题定制、文件操作和命令执行等功能,旨在为用户提供一个简单、高效且可控的编程辅助工具。

开源项目

refly:无代码 AI 自动化工作流平台

Refly.AI 是一款面向非技术创作者的无代码 AI 自动化工作流平台。它通过可视化画布和简单提示,让用户无需编码即可构建、共享和变现强大的 AI 自动化工作流。

agentskills:智能体技能

Agent Skills 是一种由 Anthropic 维护的简单开放格式,旨在为智能代理赋予新的能力与专业知识。它通过技能文件夹的形式存在,这些文件夹内包含指令、脚本以及资源,代理可发现并利用它们以更好地完成特定任务,实现一次编写、处处使用。

conductor:智能体指挥

Conductor 是 Gemini CLI 的扩展,用于软件开发的上下文驱动开发。它将 Gemini CLI 转变为一个主动的项目管理工具,遵循严格协议来规范、计划和实现软件功能及修复漏洞。其核心理念是控制代码,将上下文作为代码的管理工件,使仓库成为驱动每个代理交互的单一事实来源。

工具推荐

Tnkr:机器人开发协作平台

Tnkr 是一个面向机器人的开发协作平台,提供硬件、软件、数据和模型的全面工具集。它支持开发者发布开源硬件、软件和数据贡献指南,方便他人重建、混音和贡献操作数据以改进模型。Tnkr 的 Leonardo AI 工具通过第一人称视频、CAD 和代码分析构建过程,自动生成文档、提出改进建议并实时解决技术问题。此外,Tnkr 提供交互式 3D 可视化,使硬件组装过程更加直观易懂。

Polymarket:预测市场平台

Polymarket 是全球最大的预测市场平台,涵盖多个领域。用户可对政治、体育、金融等事件进行预测交易。平台通过交易量和预测概率展示市场对各类事件的预期,为用户提供决策参考。

资源推荐

2025年AI工程师阅读清单

一份面向AI工程师的2025年阅读清单,包含50篇论文/模型/博客,涵盖AI工程的10个领域。为从零开始的AI工程师提供实用的阅读资源,帮助他们快速了解各领域前沿知识。

AI 101:你必须了解的概念和方法

汇总了 2025 年下半年最重要的人工智能 / 机器学习概念和技术。

AI智能体路线图

聚焦于 AI 代理(Agent)构建的核心技术要点。

肖恩技术周刊(第 74 期):AI重塑未来

2025-12-15 08:00:00

对周内阅读的技术内容精品(个人向)进行总结。觉得不错可点击右上角订阅,第一时间获取更新通知。

《时代》杂志将2025 “年度人物” 称号授予了AI的构建者们,包含马克·扎克伯格(Meta)、苏姿丰(AMD)、埃隆·马斯克(xAI)、黄仁勋(英伟达)、萨姆·奥特曼(OpenAI)、德米斯·哈萨比斯(DeepMind)、达里奥·阿莫迪(Anthropic)以及李飞飞(以人为本人工智能研究院)。

该封面图片灵感来源于1932年经典的“摩天楼顶上的午餐”(Lunch atop a Skyscraper)照片,把几位AI领域的代表人物坐到摩天大楼的钢梁上。他们正如同当年修建摩天大楼的工人一样,坐在钢梁上俯瞰世界,他们或许将重塑我们的未来。

业界资讯

隆重推出 GPT-5.2

OpenAI 发布了 GPT-5.2,这是其迄今为止最强大的模型系列,专为专业知识型工作设计。该模型在多个基准测试中刷新了行业水平,包括在 GDPval 测试中,其在涵盖 44 个职业的知识型工作任务上超越了行业专家,表现优于顶尖行业专业人士或与其持平的比例达到 70.9%。

汉语盘点2025

“汉语盘点2025”活动由国家语言资源监测与研究中心、商务印书馆、新华网等联合主办,旨在用一个字或词描述当年的中国与世界,记录社会变迁与世界万象。活动经过网友推荐、专家评选,选出入围年度国内字、词各5个,国际字、词各5个,投票时间为12月9日至12月18日,网友可进入专题页面投票,每天最多投五次。

可灵 AI上线主体库:模型拥有记忆能力 角色“永不变脸”

快手旗下可灵 AI 发布「主体库」,为 O1 多模态视频模型添加长期记忆能力,用户上传单张角色图,系统可生成 3D 视角补全、多光线变体,支持跨场景一键调用,主体一致性超 96%。2025Q1 将上线「多人主体库」与「实时风格化」,同一画面可锁定 3 位角色,并实时切换卡通、复古、赛博等全局风格。

佳文共赏

为什么训练 Claude 要用欧陆哲学?模型背后的哲学家「解密」

Anthropic 公司在开发 Claude 时,引入欧陆哲学来塑造模型的行为准则。欧陆哲学关注人类生存体验和意义生成,与注重逻辑分析和科学实证的分析哲学不同。Claude 的系统提示词要求模型参考欧陆哲学,以避免在对话中过于强调实证和科学,变成缺乏共情的“杠精”。例如,当用户表达“水是纯粹的能量”这种非科学观点时,Claude 不会机械地反驳,而是进入用户的语境进行对话。

此外,Claude 的开发者 Amanda Askell 还引入亚里士多德的美德伦理学,训练模型具备“良好品格”,如诚实、好奇、仁慈等内在美德,使其在面对未知情境时能做出符合人类价值观的判断。

为什么速度很重要

Daniel Lemire 在其博客中强调速度在技术工作中的重要性。他指出,尽管高质量的工作需要时间,但长时间的缓慢进展通常是负面的。快速行动有助于避免在不重要的项目部分上浪费过多时间,例如他曾经花费大量时间构建一个无人问津的课程播客版本。快速迭代还能加速学习过程,因为人们通过犯错来学习,而快速行动意味着更快地犯错和学习。

他还提到,工作成果会随着时间变得不那么相关,缓慢的工作节奏会导致人们坚持使用过时的成果,如一位教授使用了七年准备的、二十年前的讲义。在某些情况下,如心脏手术,经验丰富的、手术次数多的外科医生往往比准备时间长但手术次数少的医生更可靠。

萨姆·奥特曼肮脏的DRAM交易

2025 年 10 月 1 日,OpenAI 与三星和 SK 海力士达成协议,锁定全球 40% 的 DRAM 供应。这一举措震惊了整个行业,因为其规模和保密性极高,甚至两家供应商彼此都不知道对方与 OpenAI 的合作细节。这导致其他公司恐慌性抢购 RAM,加剧了市场的紧张局势。

同时,由于关税问题、RAM 价格夏季下跌以及二手 RAM 制造设备停滞,市场几乎没有安全库存。OpenAI 的交易仅涉及原始晶圆,而非成品内存模块,这表明其可能旨在限制竞争对手的供应。受此影响,RAM 价格飙升,相关硬件产品如 SSD、小型预装电脑、RADEON 显卡和 Xbox 等面临供应短缺和价格上涨的风险。

技术博客

AI研发新范式:基于技术方案全链路生成代码

腾讯广告审核团队探索出一套面向未来的 AI 开发新范式,以提升从需求确认到功能上线的全链路效率。该范式基于“AI 技术规范 + 模板化技术方案 + MCP 工具集成 + AI 自我总结”,通过技术规范确保代码符合安全、设计、编码风格等标准;利用模板化技术方案将面向人的技术方案转变为面向 AI 的标准化模板,涵盖代码层级结构、控制器层、业务逻辑层、持久层设计;借助 MCP 工具集成实现一站式开发;AI 自我总结则便于人工审查和后续维护。

在技术选型上,选择 CodeBuddy 作为 AI 编程工具,结合公司先进大模型和 eplus 度量平台。实践表明,该范式使审核中心需求覆盖率超 70%,Agent 代码行采纳率超 50%,研发时长节约超 30%。未来,团队将探索打通开发、测试、部署全链路协同,实现端到端一站式研发。

通过Skill提升AI前端设计

本文介绍了通过 Skills 提升 Claude 在前端设计方面的表现。Claude 在无指导时会生成通用的前端设计,如使用 Inter 字体和紫色渐变背景。这是因为模型在采样时基于训练数据中的统计模式预测标记,而安全的设计选择在网页训练数据中占主导地位。

为解决这一问题,提出了 Skills,即动态加载特定领域知识的文档,Claude 可在运行时按需加载这些技能,避免永久上下文开销。例如,创建前端设计技能,通过指定字体、颜色、动画和背景等设计维度的指导,使 Claude 生成更具吸引力的前端界面。

此外,还开发了 web-artifacts-builder 技能,指导 Claude 使用现代 Web 技术(如 React、Tailwind CSS 和 shadcn/ui)构建更丰富的前端工件。通过 Skills,开发者无需在每个请求中手动提供前端设计上下文,即可利用 Claude 的可引导性,生成具有品牌特色的前端设计。

智能体工程

Agent Engineering 是一种新兴的工程实践,专注于将非确定性的 LLM(大型语言模型)系统迭代优化为可靠的生产级应用。该过程是循环的,包括构建、测试、部署、观察、优化和重复。与传统软件开发不同,Agent Engineering 强调在生产环境中快速迭代和学习,而不是在部署前追求完美。

Agent Engineering 结合了三个关键技能:产品思维、工程和数据科学。产品思维定义了代理的行为和范围,包括编写驱动代理行为的提示和定义评估标准。工程部分涉及构建使代理生产就绪的基础设施,如工具开发、UI/UX 设计和运行时管理。数据科学则负责衡量代理性能和可靠性,通过系统如评估、A/B 测试和监控来实现。

这种实践的出现是由于 LLM 的两个基本变化:一是 LLM 足够强大,可以处理复杂的多步骤工作流程;二是这种强大带来了真正的不可预测性。Agent Engineering 让团队能够在生产环境中快速迭代,通过观察真实行为并系统地进行优化,从而构建出可信赖的系统。

开源项目

Open-AutoGLM:手机端智能助理框架

Open-AutoGLM 是一个开源的手机端智能助理框架,基于 AutoGLM 构建,能够通过 ADB 控制安卓设备,利用视觉语言模型理解屏幕内容并自动化操作流程。

LifeTrace:智能生活记录

LifeTrace 是一个基于 AI 的智能生活记录系统,能够自动管理个人任务上下文。它通过自动截图、OCR 文字识别、向量检索和多模态搜索等技术,帮助用户记录、组织和检索日常活动痕迹。

spec-kit:规约编程工具包

Spec-Kit 旨在帮助开发者通过 Spec-Driven Development(规格驱动开发)模式快速构建高质量软件。其核心在于将规格转化为可执行代码,而非仅作为开发参考。开发者可通过 Specify CLI 初始化项目,选择不同 AI 助手(如 Qoder CLI、Claude Code 等)辅助开发。开发流程包括建立项目原则、创建规格、制定技术实施计划、分解任务并执行实现。

工具推荐

生命的大小

“Size of Life”网页允许用户通过交互式的方式比较不同生物和生物结构的大小,从微观的DNA到宏观的蓝鲸等。它提供了一个直观的视角来理解生命在不同尺度上的多样性。

快速暴露本地服务器到公网

一个用于将本地服务器暴露到互联网的工具。

开源平替

网站提供了流行专有软件的开源平替。

资源推荐

Claude 快速上手指南

帮助开发者快速上手使用 Claude API 构建应用的项目集合。它包含多个快速启动项目,如客户支持代理、金融数据分析师、计算机使用演示和自主编码代理等,每个项目都提供了可定制的基础框架。

AI编程开源知识库

通过具体案例,演示 AI 编程的实战过程。

结构化提示词知识库

汇集了高质量的提示词工程技术、教程和工具相关内容。