2026-02-14 19:51:22
国产大模型之中,字节是一个异类。
不像其他大模型轰轰烈烈、争夺眼球,它更低调,不引人注目。
但是,它做的事情反倒最多,大模型、Agent、开发工具、云服务都有独立品牌,遍地开花,一个都不缺,都在高速推进。

Seed 是字节的大模型团队,底下有好几条产品线,最近热得发烫的视频模型 Seedance 2.0 就是他们的产品。

今天,我就用字节的全家桶 ---- 刚刚发布的 Seed 2.0 模型和开发工具 TRAE ---- 写一篇 Skill 教程。
大家会看到,它们组合起来既强大,又简单好用,(个人用户)还免费。这也是我想写的原因,让大家知道有这个方案。
只要十分钟,读完这篇教程,你还会明白 Skill 是什么,怎么用,以及为什么一定要用它。
先介绍 Seed 2.0,它是 Seed 家族的基座模型。

所谓"基座模型"(foundation model),就是一种通用大模型,可用来构建其他各种下游模型。最大的两个特征有两个:一个是规模大,另一个是泛化能力强,这样才方便构建别的模型。
大家熟知的豆包,就是基于 Seed 模型,它也被称为"豆包大模型"。这次 Seed 2.0 包含 Pro、Lite、Mini 三款通用模型,以及专为开发者定制的 Seed 2.0 Code 模型。
由于各种用途都必须支持,Seed 2.0 的通用性特别突出,比以前版本都要强。
1、支持多模态,各种类型的数据都能处理:文字、图表、视觉空间、运动、视频等等。
2、具备各种 Agent 能力,方便跟企业工具对接:搜索、函数调用、工具调用、多轮指令、上下文管理等。
3、有推理和代码能力。
正因为最后一点,所以我们可以拿它来编程,尤其是生成前端代码。跟字节发布的 AI 编程工具 TRAE 配合使用,效果很好,特别方便全栈开发,个人用户还免费。
下载安装 TRAE 以后,它有两种模式,左上角可以切换:IDE 模型和 SOLO 模型。

选择 IDE 就可以了,SOLO 是 AI 任务的编排器,除非多个任务一起跑,否则用不到。
然后,按下快捷键 Ctrl + U(或者 Command + U),唤出对话框,用来跟 AI 对话。

我们要构建 Web 应用,左上角就选 @Builder 开发模式。右下角的模型就选 Seed-2.0-Code。

可以看到,TRAE 自带的国产开源编程模型很全,都是免费使用。
准备工作这样就差不多了。
我选了一个有点难度的任务,让 Seed 2.0 生成。
ASCII 图形是使用字符画出来的图形,比如下图。

我打算生成一个 Web 应用,用户在网页上输入 ASCII 图形,自动转成 Excalidraw 风格的手绘图形。
提示词如下:
"生成一个 Web 应用,可以将 ASCII 图形转为 Excalidraw 风格的图片,并提供下载。"

模型就开始思考,将这个任务分解为四步。

等到 Seed 2.0 代码生成完毕,TRAE 就会起一个本地服务 localhost:8080,同时打开了预览窗口。

生成的结果还挺有意思,上部的 ASCII 输入框提供了四个示例:Box、Tree、Flowchart、Smiley。下面是 Tree 的样子。

然后是 Excalidraw 参数的控制面板:线宽、粗糙度、弯曲度、字体大小。

点击 Convert(转换)按钮,马上得到手绘风格的线条图。

整个页面就是下面的样子。

这个页面的设计,感觉不是很美观,还可以改进。我打算为 Seed 2.0 加入专门的前端设计技能,使其能够做出更美观的页面。
所谓 Skill(技能),就是一段专门用途的提示词,用来注入上下文。
有时候,提示词很长,每次都输入,就很麻烦。我们可以把反复用到的部分提取出来,保存在一个文件里面,方便重复使用。这种提取出来的提示词,往往是关于如何完成一种任务的详细描述,所以就称为"技能文件"。
格式上,它就是一个 Markdown 文本文件,有一个 YAML 头,包含 name 字段和 description 字段。

name 字段是 Skill 的名称,可以通过这个名称调用该技能;description 字段则是技能的简要描述,模型通过这段描述判断何时自动调用该技能。
有些技能比较复杂,除了描述文件以外,还有专门的脚本文件、资源文件、模板文件等等,相当于一个代码库。

这些文件里面,SKILL.md 是入口文件,模型根据它的描述,了解何时何处调用其他各个文件。
这个库发到网上,就可以与其他人共享。如果你觉得 AI 模型处理任务时,需要用到某种技能,就可以寻找别人已经写好的 Skill 加载到模型。
下面,我使用 Anthropic 公司共享出来的前端设计技能,重构一下前面的页面。它只有单独一个 Markdown 文件,可以下载下来。
打开 TRAE 的"设置/规则和技能"页面。

点击技能部分的"+ 创建"按钮,打开创建技能的窗口。

你可以在这个窗口填写 SKill 内容,也可以上传现成的 Skill 文件。我选择上传,完成后,就可以看到列表里已经有 frontend-design 技能了。

然后,我就用下面的提示词,唤起这个技能来重构页面。
"使用 frontend-design 技能,重构这个页面,让其变得更美观易用,更有专业感。"
下面就是模型给出的文字描述和重构结果。


页面确实感觉变得高大上了!
最后,再看一个技能的例子。
代码生成以后,都是在本地机器上运行,能不能发布到网上,分享给更多的人呢?
回答是只要使用 Vercel 公司的 deploy 技能,就能一个命令将生成结果发布到 Vercel 的机器上。
在 Vercel 官方技能的 GitHub 仓库里,下载 Vercel-deploy 技能的 zip 文件。
然后,把这个 zip 文件拖到 TRAE 的技能窗口里面,就会自动加载了。

输入提示词:"将生成的网站发布到 Vercel"。
模型就会执行 vercel-deploy 技能,将网站发布到 Vercel,最后给出两个链接,一个是预览链接,另一个是发布到你个人账户的链接。

大家现在可以访问这个链接,看看网站的实际效果了。
如果你读到这里,应该会同意我的观点,Seed 2.0 的编程能力相当不错,跟自家的编程工具 TRAE 搭配起来,好用又免费。
Skill 则是强大的能力扩展机制,让模型变得无所不能,一定要学会使用。
(完)
2026-02-13 02:34:10
这里记录每周值得分享的科技内容,周五发布。([通知] 下周春节假期,周刊休息。)
本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系([email protected])。

去年7月开通的浙江丽水机场,是一个丘陵之中的山地机场,设计理念是与自然和谐共生,由马岩松 MAD 事务所设计。(via)
两周前,马斯克宣布,特斯拉公司将停产 Model S 和 Model X 两种车型。

他的解释是,生产线空出来,用来生产机器人和无人驾驶出租车。
这显然会打击特斯拉的汽车业务。它的家用轿车一共只有四款,现在一下子少了两款,而且是最贵的两款,只留下低价的 Model 3 和 Model Y。
新闻发布会上,记者就问了,那么有没有计划推出新的车款?
特斯拉的工程副总裁这样回答:
"你们必须转变对我们的看法,我们现在更多是提供交通运输服务,而不仅仅是为市场提供可购买的车辆。"
马斯克补充说:
"我相信,长期中我们将只生产自动驾驶车辆。"
这意味着,特斯拉改变了定位,它将是一家交通运输公司,而不是汽车制造商了。剩下的两种车款,未来也有可能放弃,也许只生产不需要司机的自动驾驶车辆。
国外立刻有评论家,发表了尖锐的批评,认为特斯拉正在放弃造车,这是自杀行为。

他说,马斯克因为兴趣转向其他地方,不再坚持造车了,非常可惜,也非常愚蠢。
"特斯拉听任自家非常成功的汽车制造业务衰落,以便去追逐那些不知道能否成功、也不知道能否获得批准、更不知道有没有市场的机器人和无人驾驶出租车。"
他呼吁,马斯克不要畏惧与中国车企竞争,要坚持下去,造出又好又便宜的美国电动汽车。
"未来可以有另一种版本:特斯拉依然是电动汽车领域的领军企业,同时还在积极研发 AI 和自动驾驶技术,推出价格亲民的车款与中国电动汽车展开竞争,并拓展至新的细分市场。"
这大概是一种相当普遍的看法:马斯克对于与中国车企竞争,没有信心了,不怎么想继续造车了。

毕竟,特斯拉的汽车销量在2025年是衰退的,少于2024年,"世界最大电动车厂商"的头衔也让给了比亚迪。
马斯克是不是害怕中国车企?我说说我的看法。
首先,我不知道,他把生产线转为制造机器人,是不是正确的决定;我也不知道,他还想不想造车。我只知道,那些批评他的人,完全不了解马斯克。
千万不要用普通人的心态,去揣度马斯克,他不是一个常规的人。
如果看过他的传记,就会知道,他迄今所有的创业项目,都不是常规项目。从最早的 Paypal,到后来的电动汽车、太阳能发电、可回收火箭、星链、脑机通信等等,都有一个共同点,那就是他做的时候,那些项目都没有成功先例,因此也不存在竞争对手。
马斯克一生中只喜欢做那些"从0到1"、最前沿的、从没人成功过的事情。 做跟别人一样的产品,争夺市场份额,完全不是他的风格。
电动汽车已经是一种成熟商品了,主要技术问题都解决了,完全没有进入门槛,大家开始比拼成本了。你觉得,马斯克还会有兴趣吗?
我告诉你吧,对于击败中国车企,成为世界最大、最先进的电动车厂商,人家根本没有这个兴趣。他也压根不需要赚更多的钱了,已经是世界首富了。
反倒是,做出无所不能的机器人,组建自动驾驶车队,或者从事其他更酷的、无人见过的业务,更符合马斯克的风格。
我认为,这值得学习。中国企业不仅要追求做大做强,也可以追求做一些前无古人的事情,不仅要做 number one,还要做 only one。
1、世界最贵的域名
一位加密货币网站创始人,花费7000万美元收购了域名"ai.com"。这是迄今已知的域名交易中价格最高的一笔。

真是很难相信,单单一个域名,价值会超过人民币5亿元。
该域名目前可以抢注用户名,并绑定信用卡,将来会提供"AI 智能体"服务。
历史第二贵的域名是币圈公司 Block.one 花费3000万美元从 MicroStrategy 购买的"Voice.com"。第三贵的域名是360公司花费1700万美元买入的"360.com"。
2、华为的表情符号
表情符号(emoji)在各个系统的实现不一样。这些年来,一个趋势是各家的实现逐渐向苹果的设计靠拢。

上图中,"枪"的表情符号最后都变成苹果的"水枪"。
一个例外是华为的鸿蒙系统,表情符号跟其他系统有很多不同。

上图是"恳求"的表情符号,只有华为是双手合十。

上图是风筝,只有华为是中式的纸鹫。
很多网站会追踪用户,以前使用 cookie,现在使用"用户指纹",即为每个用户生成一个特征码。

最近,有人披露了 LinkedIn 网站如何生成"用户指纹",令人瞠目结舌。
它的页面会加载一个清单,里面列出了2,953个浏览器插件,脚本会依次检查你安装了其中哪些插件。下面就是研究人员提取出来的脚本。

这导致的直接后果就是,访问 LinkedIn 时,控制台可能有上千个报错。

1、直接用 Postgres 吧(英文)

一般来说,不同用途可以使用不同的数据库,比如搜索用 Elasticsearch、缓存用 Redis、队列用 Kafka......
本文提出,不管什么用途,Postgres 数据库都适用,只要为它装上相应的插件。
2、TypeScript 的 Brand 类型(英文)

本文介绍 TypeScript 的一个重要编程技巧:为同一种类型添加 brand 属性,防止混淆。
这里还有一篇同样主题的教程,可以结合起来一起看。

3、我如何对本地餐厅排序(英文)

作者介绍他从谷歌地图,下载本地餐厅数据和评价,进行评分排序的过程。
4、如何在开发者工具定位 JavaScript 对象(英文)

本文介绍一个 JS 的高级技巧,有时需要追踪内存中的某个对象的变化,可以利用开发者工具来查看。
5、如何使用 Unix 信号传递消息(英文)

Unix 系统(包括 Linux 和 macOS)有信号机制,用来触发进程的某种行为。信号只是一个数字,本身不能发送文本消息。
本文用一种很巧妙的方法,实现了通过信号向进程发送文本消息。
6、泊松分布背后的原理(英文)

泊松分布是独立小概率事件的概率分布,本文通俗介绍它的原理。
1、Subtrace

一个开源的 Docker 应用,在浏览器里观察本机 Docker 容器的网络通信。
一个抓取网页截图的服务器,需要自己架设,通过 API 调用。
3、QtScrcpy

电脑操作手机的工具,可以将手机投屏到电脑,然后用键盘和鼠标操作手机。
它是用 Qt 重新实现的 scrcpy。
4、ProxyPin

全平台的开源抓包软件,拦截和重写 HTTP(S) 流量。(@wanghongenpin 投稿)

一款 OpenWrt LuCI 现代感主题,基于 Vite 和 Tailwind CSS。(@eamonxg 投稿)

开源的 Mac 录屏软件。(@cosmicqbit 投稿)

开源的 Web 服务,生成处理后的 RSS 源,可用来提取全文、翻译、摘要、过滤等。(@Colin-XKL 投稿)

一个浏览器插件开发的工具库,帮你快速开发一个插件。
9、Yaak

一个跨平台的桌面软件,可以用来调试 API(包括 REST、GraphQL 和 gRPC),是 Postman 的替代品。
10、Neko Master

网络流量的轻量级分析面板,展示与统计本地网关的流量数据。(@foru17 投稿)

OpenAI 公司的编程工具 Codex 的本地数据统计面板。(@onewesong 投稿)
一个 MCP 服务器,可以让 AI 连接17种数据库。(@Anarkh-Lee 投稿)
另有一个 Excalidraw MCP,可以通过 AI 用自然语言来生成手绘风格图表。(@Scofieldfree 投稿)

一个终端应用,使用 AI 分析每个进程,一旦识别为恶意进程,就把它终止。

这个网站用动画解释"什么是神经网络"。

一个 IT 课程网站,学习 Linux 和 DevOps 的实践技能,在网页上连接远程虚拟机进行交互操作,有中文版,免费额度是每天3次虚拟机。(@huhuhuhang 投稿)
3、理解机器学习:从理论到算法(英文)

免费的英文电子书。
1、显卡的包装
现在的显卡包装,都非常简单。比如,下面是5090显卡的包装。



但是,二十多年前的21世纪初,可不是这样,显卡的包装非常花哨。



究其原因,一方面是环保观念的提升,另一方面是显卡现在几乎没有竞争,一上架就会被买走,厂商就不在包装上动脑筋了。


1、迪拜如何走向繁荣
迪拜是中东地区最繁荣的城市。

但是,在1950年的时候,它还是一个海边的沙漠小村庄,除了出产珍珠,没有任何特殊之处。

它的地理位置也不好。

迪拜在红海一个突出的岬角上(上图箭头处),并不靠近主要航线,周围还有其他港口,那些地方也产珍珠,谁会特意来迪拜呢?
幸运的是,1966年,迪拜发现了石油,获取了巨额财富。但是,单单有石油,并不会变成繁荣的大城市。
这时,迪拜的酋长做出了几个重要决定:(1)免税,不对其他国家的商人征税;(2)发展贸易,给予商人各种便利,方便他们做生意;(3)加强基础设施,石油赚到的钱都投在道路、机场、电力、通信、港口;(4)信仰自由,任何信仰的人都可以来迪拜,不会强迫你遵守伊斯兰教。
正是这些措施,使得迪拜高速发展。
后来,迪拜的石油枯竭了,但是贸易已经稳固确立了,城市开始多元化发展:金融、旅游、房地产......
迪拜的故事告诉我们,自然资源不会带来繁荣,但是一个低税收、宽容、安全、低管制的环境会带来繁荣。
1、
根据亚马逊老板贝佐斯的定义,小团队就是可以用两张大披萨喂饱的团队,也就是5到8人。
AI 出现以后,小团队将变得只用一张大披萨就可以喂饱,只需要2到3人(含产品经理和设计师)。
-- 《单披萨工程团队的兴起》
2、
我们的规则是:(1)代码绝不能由人编写。(2)代码不得由人进行审查。(3)如果每位工程师每天消耗的 token 不到1000美元,那么就还有提升空间。
3、
AI 热潮对于美国的影响是,电工越来越难找,一些建筑项目被迫暂停。
亚马逊、谷歌、微软、Meta 和 Oracle 这五家公司,2026年的 AI 硬件投资,将相当于美国军费的四分之三。
-- 《华盛顿邮报》
4、
创业公司可以分成两种:O(n) 与 O(n^2),其中的 n 表示时间。
O(n) 公司随着时间大致呈线性增长,而 O(n^2) 公司会呈超线性的加速增长。
5、
进入物理学领域是我一生的最大错误,我应该选择计算机科学。虽然我还是不会有女朋友,但至少会赚得盆满钵满。
-- 《锗的电子带结构》
重新思考 6G(#338)
技术写作的首要诀窍(#288)
停止寻找的最佳时间(#238)
音乐是反社交(#188)
(完)
2026-02-12 09:26:13
刚才我看到,智谱新一代的旗舰模型 GLM-5 已经正式发布了。
真的拼啊,非要赶在长假之前,上一个版本 GLM-4.7 发布还不到两个月呢......

GLM-4.x 在国内外评价很高,公认是编程领域第一梯队的模型。新的大版本就让人很好奇,会有哪些改进。
实话实说,上个星期,他们团队联系我参与内测,我已经使用这个模型好几天了。
巧的是,也在上个星期,国外两个旗舰模型同时发了新版本:Anthropic 公司发了 Claude Opus 4.6,OpenAI 公司发了 GPT-5.3-Codex。
这三个新模型都主打编程,我就忍不住进行了比较测试,看看它们有没有差别,我想这也是很多人感兴趣的。
下面就是真实编程任务,在这三个 AI 模型上的生成结果。
官方的发布说明,这样介绍 GLM-5:作为开源模型,GLM-5 完全对标顶尖闭源模型,在两个地方做了特别强化。
(1)复杂系统工程
GLM-5 不单善于生成前端网页,更善于处理后端任务、系统重构、深度调试,摒弃了"重前端审美、轻底层逻辑"的模式。
它具备极强的自我反思与纠错机制,能在编译失败或运行报错时,自主分析日志、定位根因并迭代修复,直到系统跑通。
(2)长程 Agent
它能够跑长程任务,即多阶段、长步骤的复杂任务,可以自主拆分需求,自动化连续运行长达数小时,并保持上下文连贯与目标一致性。
(3)小结
GLM-5 可以完成的任务,已经超越了生成前端 UI,而是可以生成系统级大型复杂项目,比如操作系统内核、浏览器内核、V8 引擎之类的。
它的宣传语是"在大模型进入 Agent、大任务的时代,GLM-5 是你可以使用的开源选择。"
我选择的测试题目,是 HuggingFace 公司的布道师亚历杭德罗·奥(Alejandro AO)测试 Opus 4.6 和 GPT 5.3 的题目。

他拍了一个视频,展示这两个模型的表现。
我就拿同样的题目去测 GLM-5,再跟他的结果进行对比。
一共四道题,前端和后端的都有。我已经把原始的提示词和原始脚本,做成了一个仓库,放到了 GitHub。
第一个测试是网页设计和重构能力。
原始页面非常简陋。

它只是把信息做了分类,然后堆叠在一起,我们让 AI 对这个网页进行重新设计,让它变得美观易用,透露出成熟可靠的专业感。
前面说了,提示词和原始文件都在 GitHub,这里不重复贴了。大家可以拿来自己跑,也可以让其他模型跑。
下面就是 GLM-5 的生成结果。





这个结果称得上美观又专业,所有信息组织得井井有条,而且带有动画效果,手机浏览(下图)也没有问题,简直可以直接上线。

我把这个页面发布出来了,大家可以点击这里去看。
下面是 Opus 4.6 的生成结果,从视频截图的。



下面是 GPT-5.3 的生成结果。



这三个设计都是可用的,但是 GPT-5.3 有一个瑕疵(页眉没做成粘性页眉,往下拉就没了),而且在设计上也不如另外两者好看。
所以,在这个测试中,GLM-5 和 Opus 4.6 表现更好,至于哪一个更出色,要看使用者的审美偏好。我个人更喜欢 GLM-5 的设计风格。
第二个测试看看 AI 模型的 3D 动画生成能力。
要求是生成一个教育目的的网页 3D 沙盒,用动画展示太阳系的天体运动,并且能够调整质量、位置、速度等动画参数,还能手动增加新的天体。
下面是 GLM-5 的生成结果。

页面的右侧是动画区,默认展示三个小行星围绕中间的恒星进行轨道运动,可以用鼠标拖拽进行360度旋状,以及放大和缩小。

页面的左侧是操控面板,做得挺不错。


上半部分可以调节动画和天体参数,下半部分用来增加新的天体,或者删除现有天体。
作为比较,Opus 4.6 的生成结果。


GPT-5.3 的生成结果。


这三个生成结果,都满足了需求,都可以顺利运行。但是,GLM-5 的动画缺了引力网格线,而 GPT-5.3 的网格线太凌乱,因此动画效果方面 Opus 4.6 更好一些。
操控面板方面,GLM-5 和 Opus 4.6 都设计得不错,GPT-5.3 有点简单。
总体上,我感觉这一轮的最佳选手是 Opus 4.6,其次是 GLM-5,最后是 Codex 5.3。
第三个测试是生成一个网页游戏"愤怒的小鸟"(angry birds)。
GLM-5 的生成结果还可以,挺像原作的,可以玩,但是游戏性不足,弹跳效果不够好。



Opus 4.6 的还原度很高,游戏体验也接近原作。



GPT-5.3 的生成结果令人尴尬,小鸟根本弹不出去,游戏不能玩。


这一轮很明显,Opus 4.6 最佳,GLM-5 其次。
最后一个测试是,将一个基于 PHP 语言 Laravel 框架的 Web 应用,转为 JavaScript 语言 Next.js 框架。
GLM-5 在处理时,几乎没有出现任何麻烦,很快就将 PHP 语言转成了 JS 语言,并且给出了转换后的代码结构。

它还在转化后,贴心地自动安装了依赖的软件包,做好了脚本编译,提示用户:你只要接入外部 API,一键执行npm run dev就能直接运行了。

我按照它的提示,运行很顺利,没有报错,打开localhost:3000就能访问应用了。

这是一个查看城市天气的应用。因为没有要求改变样式,所以看上去跟 PHP 原版一模一样。
右上角输入框,可以查询城市。

在查询结果中,选中你所要的城市。

点击进去,就是城市的详情页,有天气、日出日落时间、空气质量、地图等信息。

Opus 4.6 和 GPT-5.3 也生成了同样的结果,因为页面、功能完全一样,就不展示截图了。
值得一提的是,GLM-5 和 GPT-5.3 的转换时间都在5分钟左右,Opus 4.6 似乎遇到了一点问题,花费了整整20分钟。
这一轮单看结果,三个模型都很好,但是 GLM-5 花费的生成时间短,没有任何报错,全过程的用户体验好,我愿意投它一票。
经过这些测试,GLM-5 的编程表现可圈可点,是拿得出手的,能够跟国外最新的旗舰模型放在一起。某些方面甚至还能赢出,即使不如人家的地方,往往也是细节问题,不是质的差别。
它听说在训练和运行过程中,都使用了国产的"万卡集群"。可以想象,如果得到更多的卡、更多的算力,它的表现会更好,足以跟世界第一梯队的大模型公司正面 PK。
另外,它这次特别强化的两个点----"复杂系统"和"长程任务"----是有感的。
它生成的系统逻辑和后端代码,可靠性不错,无论是生成时还是运行时,报错都不多。缺失的地方往往就是一些功能的缺失,后期让 AI 再补上就可以了,不是架构出问题。另外,我有一项个人任务,它跑了足足两个小时,最后也完成了,没有乱掉。
我愿意把官方的一段话,作为结尾。
2026年编程大模型正在从"能写代码"进阶为"能构建系统",而 GLM-5 堪称开源界的"系统架构师"模型,从关注"前端审美"转向关注"Agentic深度/系统工程能力",是 Opus 4.6 与 GPT-5.3 的国产开源平替。
(完)