MoreRSS

site icon科技爱好者周刊修改

由阮一峰(RuanYiFeng)主理,可能是中文互联网最受欢迎的技术分享周刊。每周五发布。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

科技爱好者周刊的 RSS 预览

字节全家桶 Seed 2.0 + TRAE 玩转 Skill

2026-02-14 19:51:22

一、引言

国产大模型之中,字节是一个异类。

不像其他大模型轰轰烈烈、争夺眼球,它更低调,不引人注目。

但是,它做的事情反倒最多,大模型、Agent、开发工具、云服务都有独立品牌,遍地开花,一个都不缺,都在高速推进。

Seed 是字节的大模型团队,底下有好几条产品线,最近热得发烫的视频模型 Seedance 2.0 就是他们的产品。

今天,我就用字节的全家桶 ---- 刚刚发布的 Seed 2.0 模型和开发工具 TRAE ---- 写一篇 Skill 教程。

大家会看到,它们组合起来既强大,又简单好用,(个人用户)还免费。这也是我想写的原因,让大家知道有这个方案。

只要十分钟,读完这篇教程,你还会明白 Skill 是什么,怎么用,以及为什么一定要用它。

二、Seed 2.0 简介

先介绍 Seed 2.0,它是 Seed 家族的基座模型

所谓"基座模型"(foundation model),就是一种通用大模型,可用来构建其他各种下游模型。最大的两个特征有两个:一个是规模大,另一个是泛化能力强,这样才方便构建别的模型。

大家熟知的豆包,就是基于 Seed 模型,它也被称为"豆包大模型"。这次 Seed 2.0 包含 Pro、Lite、Mini 三款通用模型,以及专为开发者定制的 Seed 2.0 Code 模型。

由于各种用途都必须支持,Seed 2.0 的通用性特别突出,比以前版本都要强。

1、支持多模态,各种类型的数据都能处理:文字、图表、视觉空间、运动、视频等等。

2、具备各种 Agent 能力,方便跟企业工具对接:搜索、函数调用、工具调用、多轮指令、上下文管理等。

3、有推理和代码能力。

正因为最后一点,所以我们可以拿它来编程,尤其是生成前端代码。跟字节发布的 AI 编程工具 TRAE 配合使用,效果很好,特别方便全栈开发,个人用户还免费。

三、TRAE 的准备工作

下载安装 TRAE 以后,它有两种模式,左上角可以切换:IDE 模型和 SOLO 模型。

选择 IDE 就可以了,SOLO 是 AI 任务的编排器,除非多个任务一起跑,否则用不到。

然后,按下快捷键 Ctrl + U(或者 Command + U),唤出对话框,用来跟 AI 对话。

我们要构建 Web 应用,左上角就选 @Builder 开发模式。右下角的模型就选 Seed-2.0-Code。

可以看到,TRAE 自带的国产开源编程模型很全,都是免费使用。

准备工作这样就差不多了。

四、编程测试

我选了一个有点难度的任务,让 Seed 2.0 生成。

ASCII 图形是使用字符画出来的图形,比如下图。

我打算生成一个 Web 应用,用户在网页上输入 ASCII 图形,自动转成 Excalidraw 风格的手绘图形。

提示词如下:

"生成一个 Web 应用,可以将 ASCII 图形转为 Excalidraw 风格的图片,并提供下载。"

模型就开始思考,将这个任务分解为四步。

五、生成结果

等到 Seed 2.0 代码生成完毕,TRAE 就会起一个本地服务 localhost:8080,同时打开了预览窗口。

生成的结果还挺有意思,上部的 ASCII 输入框提供了四个示例:Box、Tree、Flowchart、Smiley。下面是 Tree 的样子。

然后是 Excalidraw 参数的控制面板:线宽、粗糙度、弯曲度、字体大小。

点击 Convert(转换)按钮,马上得到手绘风格的线条图。

整个页面就是下面的样子。

六、Skill 简介

这个页面的设计,感觉不是很美观,还可以改进。我打算为 Seed 2.0 加入专门的前端设计技能,使其能够做出更美观的页面。

所谓 Skill(技能),就是一段专门用途的提示词,用来注入上下文。

有时候,提示词很长,每次都输入,就很麻烦。我们可以把反复用到的部分提取出来,保存在一个文件里面,方便重复使用。这种提取出来的提示词,往往是关于如何完成一种任务的详细描述,所以就称为"技能文件"。

格式上,它就是一个 Markdown 文本文件,有一个 YAML 头,包含 name 字段和 description 字段。

name 字段是 Skill 的名称,可以通过这个名称调用该技能;description 字段则是技能的简要描述,模型通过这段描述判断何时自动调用该技能。

有些技能比较复杂,除了描述文件以外,还有专门的脚本文件、资源文件、模板文件等等,相当于一个代码库。

这些文件里面,SKILL.md 是入口文件,模型根据它的描述,了解何时何处调用其他各个文件。

这个库发到网上,就可以与其他人共享。如果你觉得 AI 模型处理任务时,需要用到某种技能,就可以寻找别人已经写好的 Skill 加载到模型。

七、前端设计技能

下面,我使用 Anthropic 公司共享出来的前端设计技能,重构一下前面的页面。它只有单独一个 Markdown 文件,可以下载下来。

打开 TRAE 的"设置/规则和技能"页面。

点击技能部分的"+ 创建"按钮,打开创建技能的窗口。

你可以在这个窗口填写 SKill 内容,也可以上传现成的 Skill 文件。我选择上传,完成后,就可以看到列表里已经有 frontend-design 技能了。

然后,我就用下面的提示词,唤起这个技能来重构页面。

"使用 frontend-design 技能,重构这个页面,让其变得更美观易用,更有专业感。"

下面就是模型给出的文字描述和重构结果。

页面确实感觉变得高大上了!

八、Vercel deploy 技能

最后,再看一个技能的例子。

代码生成以后,都是在本地机器上运行,能不能发布到网上,分享给更多的人呢?

回答是只要使用 Vercel 公司的 deploy 技能,就能一个命令将生成结果发布到 Vercel 的机器上。

在 Vercel 官方技能的 GitHub 仓库里,下载 Vercel-deploy 技能的 zip 文件。

然后,把这个 zip 文件拖到 TRAE 的技能窗口里面,就会自动加载了。

输入提示词:"将生成的网站发布到 Vercel"。

模型就会执行 vercel-deploy 技能,将网站发布到 Vercel,最后给出两个链接,一个是预览链接,另一个是发布到你个人账户的链接。

大家现在可以访问这个链接,看看网站的实际效果了。

九、总结

如果你读到这里,应该会同意我的观点,Seed 2.0 的编程能力相当不错,跟自家的编程工具 TRAE 搭配起来,好用又免费。

Skill 则是强大的能力扩展机制,让模型变得无所不能,一定要学会使用。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2026年2月14日

科技爱好者周刊(第 385 期):马斯克害怕中国车企吗?

2026-02-13 02:34:10

这里记录每周值得分享的科技内容,周五发布。([通知] 下周春节假期,周刊休息。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系[email protected])。

封面图

去年7月开通的浙江丽水机场,是一个丘陵之中的山地机场,设计理念是与自然和谐共生,由马岩松 MAD 事务所设计。(via

马斯克害怕中国车企吗?

两周前,马斯克宣布,特斯拉公司将停产 Model S 和 Model X 两种车型。

他的解释是,生产线空出来,用来生产机器人和无人驾驶出租车。

这显然会打击特斯拉的汽车业务。它的家用轿车一共只有四款,现在一下子少了两款,而且是最贵的两款,只留下低价的 Model 3 和 Model Y。

新闻发布会上,记者就问了,那么有没有计划推出新的车款?

特斯拉的工程副总裁这样回答:

"你们必须转变对我们的看法,我们现在更多是提供交通运输服务,而不仅仅是为市场提供可购买的车辆。"

马斯克补充说:

"我相信,长期中我们将只生产自动驾驶车辆。"

这意味着,特斯拉改变了定位,它将是一家交通运输公司,而不是汽车制造商了。剩下的两种车款,未来也有可能放弃,也许只生产不需要司机的自动驾驶车辆。

国外立刻有评论家,发表了尖锐的批评,认为特斯拉正在放弃造车,这是自杀行为。

他说,马斯克因为兴趣转向其他地方,不再坚持造车了,非常可惜,也非常愚蠢。

"特斯拉听任自家非常成功的汽车制造业务衰落,以便去追逐那些不知道能否成功、也不知道能否获得批准、更不知道有没有市场的机器人和无人驾驶出租车。"

他呼吁,马斯克不要畏惧与中国车企竞争,要坚持下去,造出又好又便宜的美国电动汽车。

"未来可以有另一种版本:特斯拉依然是电动汽车领域的领军企业,同时还在积极研发 AI 和自动驾驶技术,推出价格亲民的车款与中国电动汽车展开竞争,并拓展至新的细分市场。"

这大概是一种相当普遍的看法马斯克对于与中国车企竞争,没有信心了,不怎么想继续造车了

毕竟,特斯拉的汽车销量在2025年是衰退的,少于2024年,"世界最大电动车厂商"的头衔也让给了比亚迪。

马斯克是不是害怕中国车企?我说说我的看法。

首先,我不知道,他把生产线转为制造机器人,是不是正确的决定;我也不知道,他还想不想造车。我只知道,那些批评他的人,完全不了解马斯克。

千万不要用普通人的心态,去揣度马斯克,他不是一个常规的人

如果看过他的传记,就会知道,他迄今所有的创业项目,都不是常规项目。从最早的 Paypal,到后来的电动汽车、太阳能发电、可回收火箭、星链、脑机通信等等,都有一个共同点,那就是他做的时候,那些项目都没有成功先例,因此也不存在竞争对手。

马斯克一生中只喜欢做那些"从0到1"、最前沿的、从没人成功过的事情。 做跟别人一样的产品,争夺市场份额,完全不是他的风格。

电动汽车已经是一种成熟商品了,主要技术问题都解决了,完全没有进入门槛,大家开始比拼成本了。你觉得,马斯克还会有兴趣吗?

我告诉你吧,对于击败中国车企,成为世界最大、最先进的电动车厂商,人家根本没有这个兴趣。他也压根不需要赚更多的钱了,已经是世界首富了。

反倒是,做出无所不能的机器人,组建自动驾驶车队,或者从事其他更酷的、无人见过的业务,更符合马斯克的风格。

我认为,这值得学习。中国企业不仅要追求做大做强,也可以追求做一些前无古人的事情,不仅要做 number one,还要做 only one。

科技动态

1、世界最贵的域名

一位加密货币网站创始人,花费7000万美元收购了域名"ai.com"。这是迄今已知的域名交易中价格最高的一笔。

真是很难相信,单单一个域名,价值会超过人民币5亿元。

该域名目前可以抢注用户名,并绑定信用卡,将来会提供"AI 智能体"服务。

历史第二贵的域名是币圈公司 Block.one 花费3000万美元从 MicroStrategy 购买的"Voice.com"。第三贵的域名是360公司花费1700万美元买入的"360.com"。

2、华为的表情符号

表情符号(emoji)在各个系统的实现不一样。这些年来,一个趋势是各家的实现逐渐向苹果的设计靠拢。

上图中,"枪"的表情符号最后都变成苹果的"水枪"。

一个例外是华为的鸿蒙系统,表情符号跟其他系统有很多不同。

上图是"恳求"的表情符号,只有华为是双手合十。

上图是风筝,只有华为是中式的纸鹫。

3、LinkedIn 的用户指纹

很多网站会追踪用户,以前使用 cookie,现在使用"用户指纹",即为每个用户生成一个特征码。

最近,有人披露了 LinkedIn 网站如何生成"用户指纹",令人瞠目结舌。

它的页面会加载一个清单,里面列出了2,953个浏览器插件,脚本会依次检查你安装了其中哪些插件。下面就是研究人员提取出来的脚本

这导致的直接后果就是,访问 LinkedIn 时,控制台可能有上千个报错

文章

1、直接用 Postgres 吧(英文)

一般来说,不同用途可以使用不同的数据库,比如搜索用 Elasticsearch、缓存用 Redis、队列用 Kafka......

本文提出,不管什么用途,Postgres 数据库都适用,只要为它装上相应的插件。

2、TypeScript 的 Brand 类型(英文)

本文介绍 TypeScript 的一个重要编程技巧:为同一种类型添加 brand 属性,防止混淆。

这里还有一篇同样主题的教程,可以结合起来一起看。

3、我如何对本地餐厅排序(英文)

作者介绍他从谷歌地图,下载本地餐厅数据和评价,进行评分排序的过程。

4、如何在开发者工具定位 JavaScript 对象(英文)

本文介绍一个 JS 的高级技巧,有时需要追踪内存中的某个对象的变化,可以利用开发者工具来查看。

5、如何使用 Unix 信号传递消息(英文)

Unix 系统(包括 Linux 和 macOS)有信号机制,用来触发进程的某种行为。信号只是一个数字,本身不能发送文本消息。

本文用一种很巧妙的方法,实现了通过信号向进程发送文本消息。

6、泊松分布背后的原理(英文)

泊松分布是独立小概率事件的概率分布,本文通俗介绍它的原理。

工具

1、Subtrace

一个开源的 Docker 应用,在浏览器里观察本机 Docker 容器的网络通信。

2、ScrapeServ

一个抓取网页截图的服务器,需要自己架设,通过 API 调用。

3、QtScrcpy

电脑操作手机的工具,可以将手机投屏到电脑,然后用键盘和鼠标操作手机。

它是用 Qt 重新实现的 scrcpy

4、ProxyPin

全平台的开源抓包软件,拦截和重写 HTTP(S) 流量。(@wanghongenpin 投稿)

5、luci-theme-aurora

一款 OpenWrt LuCI 现代感主题,基于 Vite 和 Tailwind CSS。(@eamonxg 投稿)

6、BetterCapture

开源的 Mac 录屏软件。(@cosmicqbit 投稿)

7、FeedCraft

开源的 Web 服务,生成处理后的 RSS 源,可用来提取全文、翻译、摘要、过滤等。(@Colin-XKL 投稿)

8、Extension.js

一个浏览器插件开发的工具库,帮你快速开发一个插件。

9、Yaak

一个跨平台的桌面软件,可以用来调试 API(包括 REST、GraphQL 和 gRPC),是 Postman 的替代品。

10、Neko Master

网络流量的轻量级分析面板,展示与统计本地网关的流量数据。(@foru17 投稿)

AI 相关

1、Codex Viz

OpenAI 公司的编程工具 Codex 的本地数据统计面板。(@onewesong 投稿)

2、Universal DB MCP

一个 MCP 服务器,可以让 AI 连接17种数据库。(@Anarkh-Lee 投稿)

另有一个 Excalidraw MCP,可以通过 AI 用自然语言来生成手绘风格图表。(@Scofieldfree 投稿)

3、BrainKernel

一个终端应用,使用 AI 分析每个进程,一旦识别为恶意进程,就把它终止。

资源

1、神经网络的视觉解释

这个网站用动画解释"什么是神经网络"。

2、DevOps Engineer

一个 IT 课程网站,学习 Linux 和 DevOps 的实践技能,在网页上连接远程虚拟机进行交互操作,有中文版,免费额度是每天3次虚拟机。(@huhuhuhang 投稿)

3、理解机器学习:从理论到算法(英文)

免费的英文电子书。

图片

1、显卡的包装

现在的显卡包装,都非常简单。比如,下面是5090显卡的包装。

但是,二十多年前的21世纪初,可不是这样,显卡的包装非常花哨。

究其原因,一方面是环保观念的提升,另一方面是显卡现在几乎没有竞争,一上架就会被买走,厂商就不在包装上动脑筋了。

文摘

1、迪拜如何走向繁荣

迪拜是中东地区最繁荣的城市。

但是,在1950年的时候,它还是一个海边的沙漠小村庄,除了出产珍珠,没有任何特殊之处。

它的地理位置也不好。

迪拜在红海一个突出的岬角上(上图箭头处),并不靠近主要航线,周围还有其他港口,那些地方也产珍珠,谁会特意来迪拜呢?

幸运的是,1966年,迪拜发现了石油,获取了巨额财富。但是,单单有石油,并不会变成繁荣的大城市。

这时,迪拜的酋长做出了几个重要决定:(1)免税,不对其他国家的商人征税;(2)发展贸易,给予商人各种便利,方便他们做生意;(3)加强基础设施,石油赚到的钱都投在道路、机场、电力、通信、港口;(4)信仰自由,任何信仰的人都可以来迪拜,不会强迫你遵守伊斯兰教。

正是这些措施,使得迪拜高速发展。

后来,迪拜的石油枯竭了,但是贸易已经稳固确立了,城市开始多元化发展:金融、旅游、房地产......

迪拜的故事告诉我们,自然资源不会带来繁荣,但是一个低税收、宽容、安全、低管制的环境会带来繁荣。

言论

1、

根据亚马逊老板贝佐斯的定义,小团队就是可以用两张大披萨喂饱的团队,也就是5到8人。

AI 出现以后,小团队将变得只用一张大披萨就可以喂饱,只需要2到3人(含产品经理和设计师)。

-- 《单披萨工程团队的兴起》

2、

我们的规则是:(1)代码绝不能由人编写。(2)代码不得由人进行审查。(3)如果每位工程师每天消耗的 token 不到1000美元,那么就还有提升空间。

-- 《StrongDM AI 的故事》

3、

AI 热潮对于美国的影响是,电工越来越难找,一些建筑项目被迫暂停。

亚马逊、谷歌、微软、Meta 和 Oracle 这五家公司,2026年的 AI 硬件投资,将相当于美国军费的四分之三。

-- 《华盛顿邮报》

4、

创业公司可以分成两种:O(n) 与 O(n^2),其中的 n 表示时间。

O(n) 公司随着时间大致呈线性增长,而 O(n^2) 公司会呈超线性的加速增长。

-- 《O(n) 与 O(n^2) 创业企业》

5、

进入物理学领域是我一生的最大错误,我应该选择计算机科学。虽然我还是不会有女朋友,但至少会赚得盆满钵满。

-- 《锗的电子带结构》

往年回顾

重新思考 6G(#338)

技术写作的首要诀窍(#288)

停止寻找的最佳时间(#238)

音乐是反社交(#188)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2026年2月13日

智谱旗舰 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-Codex

2026-02-12 09:26:13

一、引言

刚才我看到,智谱新一代的旗舰模型 GLM-5 已经正式发布了。

真的拼啊,非要赶在长假之前,上一个版本 GLM-4.7 发布还不到两个月呢......

GLM-4.x 在国内外评价很高,公认是编程领域第一梯队的模型。新的大版本就让人很好奇,会有哪些改进。

实话实说,上个星期,他们团队联系我参与内测,我已经使用这个模型好几天了。

巧的是,也在上个星期,国外两个旗舰模型同时发了新版本:Anthropic 公司发了 Claude Opus 4.6,OpenAI 公司发了 GPT-5.3-Codex。

这三个新模型都主打编程,我就忍不住进行了比较测试,看看它们有没有差别,我想这也是很多人感兴趣的。

下面就是真实编程任务,在这三个 AI 模型上的生成结果。

二、GLM-5 简介

官方的发布说明,这样介绍 GLM-5:作为开源模型,GLM-5 完全对标顶尖闭源模型,在两个地方做了特别强化。

(1)复杂系统工程

GLM-5 不单善于生成前端网页,更善于处理后端任务、系统重构、深度调试,摒弃了"重前端审美、轻底层逻辑"的模式。

它具备极强的自我反思与纠错机制,能在编译失败或运行报错时,自主分析日志、定位根因并迭代修复,直到系统跑通。

(2)长程 Agent

它能够跑长程任务,即多阶段、长步骤的复杂任务,可以自主拆分需求,自动化连续运行长达数小时,并保持上下文连贯与目标一致性。

(3)小结

GLM-5 可以完成的任务,已经超越了生成前端 UI,而是可以生成系统级大型复杂项目,比如操作系统内核、浏览器内核、V8 引擎之类的。

它的宣传语是"在大模型进入 Agent、大任务的时代,GLM-5 是你可以使用的开源选择。"

三、测试方法

我选择的测试题目,是 HuggingFace 公司的布道师亚历杭德罗·奥(Alejandro AO)测试 Opus 4.6 和 GPT 5.3 的题目。

他拍了一个视频,展示这两个模型的表现。

我就拿同样的题目去测 GLM-5,再跟他的结果进行对比。

一共四道题,前端和后端的都有。我已经把原始的提示词和原始脚本,做成了一个仓库,放到了 GitHub

四、网页设计测试

第一个测试是网页设计和重构能力。

原始页面非常简陋。

它只是把信息做了分类,然后堆叠在一起,我们让 AI 对这个网页进行重新设计,让它变得美观易用,透露出成熟可靠的专业感。

前面说了,提示词和原始文件都在 GitHub,这里不重复贴了。大家可以拿来自己跑,也可以让其他模型跑。

下面就是 GLM-5 的生成结果。

这个结果称得上美观又专业,所有信息组织得井井有条,而且带有动画效果,手机浏览(下图)也没有问题,简直可以直接上线。

我把这个页面发布出来了,大家可以点击这里去看。

下面是 Opus 4.6 的生成结果,从视频截图的。

下面是 GPT-5.3 的生成结果。

这三个设计都是可用的,但是 GPT-5.3 有一个瑕疵(页眉没做成粘性页眉,往下拉就没了),而且在设计上也不如另外两者好看。

所以,在这个测试中,GLM-5 和 Opus 4.6 表现更好,至于哪一个更出色,要看使用者的审美偏好。我个人更喜欢 GLM-5 的设计风格。

五、3D 沙盒测试

第二个测试看看 AI 模型的 3D 动画生成能力。

要求是生成一个教育目的的网页 3D 沙盒,用动画展示太阳系的天体运动,并且能够调整质量、位置、速度等动画参数,还能手动增加新的天体。

下面是 GLM-5 的生成结果。

页面的右侧是动画区,默认展示三个小行星围绕中间的恒星进行轨道运动,可以用鼠标拖拽进行360度旋状,以及放大和缩小。

页面的左侧是操控面板,做得挺不错。

上半部分可以调节动画和天体参数,下半部分用来增加新的天体,或者删除现有天体。

作为比较,Opus 4.6 的生成结果。

GPT-5.3 的生成结果。

这三个生成结果,都满足了需求,都可以顺利运行。但是,GLM-5 的动画缺了引力网格线,而 GPT-5.3 的网格线太凌乱,因此动画效果方面 Opus 4.6 更好一些。

操控面板方面,GLM-5 和 Opus 4.6 都设计得不错,GPT-5.3 有点简单。

总体上,我感觉这一轮的最佳选手是 Opus 4.6,其次是 GLM-5,最后是 Codex 5.3。

六、网页游戏

第三个测试是生成一个网页游戏"愤怒的小鸟"(angry birds)。

GLM-5 的生成结果还可以,挺像原作的,可以玩,但是游戏性不足,弹跳效果不够好。

Opus 4.6 的还原度很高,游戏体验也接近原作。

GPT-5.3 的生成结果令人尴尬,小鸟根本弹不出去,游戏不能玩。

这一轮很明显,Opus 4.6 最佳,GLM-5 其次。

七、Laravel 转为 Next.js

最后一个测试是,将一个基于 PHP 语言 Laravel 框架的 Web 应用,转为 JavaScript 语言 Next.js 框架。

GLM-5 在处理时,几乎没有出现任何麻烦,很快就将 PHP 语言转成了 JS 语言,并且给出了转换后的代码结构。

它还在转化后,贴心地自动安装了依赖的软件包,做好了脚本编译,提示用户:你只要接入外部 API,一键执行npm run dev就能直接运行了。

我按照它的提示,运行很顺利,没有报错,打开localhost:3000就能访问应用了。

这是一个查看城市天气的应用。因为没有要求改变样式,所以看上去跟 PHP 原版一模一样。

右上角输入框,可以查询城市。

在查询结果中,选中你所要的城市。

点击进去,就是城市的详情页,有天气、日出日落时间、空气质量、地图等信息。

Opus 4.6 和 GPT-5.3 也生成了同样的结果,因为页面、功能完全一样,就不展示截图了。

值得一提的是,GLM-5 和 GPT-5.3 的转换时间都在5分钟左右,Opus 4.6 似乎遇到了一点问题,花费了整整20分钟。

这一轮单看结果,三个模型都很好,但是 GLM-5 花费的生成时间短,没有任何报错,全过程的用户体验好,我愿意投它一票。

八、总结

经过这些测试,GLM-5 的编程表现可圈可点,是拿得出手的,能够跟国外最新的旗舰模型放在一起。某些方面甚至还能赢出,即使不如人家的地方,往往也是细节问题,不是质的差别。

它听说在训练和运行过程中,都使用了国产的"万卡集群"。可以想象,如果得到更多的卡、更多的算力,它的表现会更好,足以跟世界第一梯队的大模型公司正面 PK。

另外,它这次特别强化的两个点----"复杂系统"和"长程任务"----是有感的。

它生成的系统逻辑和后端代码,可靠性不错,无论是生成时还是运行时,报错都不多。缺失的地方往往就是一些功能的缺失,后期让 AI 再补上就可以了,不是架构出问题。另外,我有一项个人任务,它跑了足足两个小时,最后也完成了,没有乱掉。

我愿意把官方的一段话,作为结尾。

2026年编程大模型正在从"能写代码"进阶为"能构建系统",而 GLM-5 堪称开源界的"系统架构师"模型,从关注"前端审美"转向关注"Agentic深度/系统工程能力",是 Opus 4.6 与 GPT-5.3 的国产开源平替。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2026年2月12日