MoreRSS

site icon科技爱好者周刊修改

由阮一峰(RuanYiFeng)主理,可能是中文互联网最受欢迎的技术分享周刊。每周五发布。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

科技爱好者周刊的 RSS 预览

谷歌的 NotebookLM 能生成中文播客了

2025-05-01 12:26:24

两天前,谷歌发了一个公告

它旗下的 AI 笔记产品 NotebookLM,现在支持50种语言生成播客了(原来只支持英文)。

我一定要分享这个消息,终于能生成中文播客了。这是我一直想要的功能,相信也是很多朋友想要的。

我演示一下,大家听听效果,会惊到你的。

首先,访问它的官网,点开右上角的设置,选择"Output Language"(输出语言)。

切换到"中文(简体)"。

然后,在首页新建一个笔记本。一般来说,一个学习主题,对应一个笔记本。

作为演示,我新建了一个"中国小说"的笔记本。进入后,在 Source(原始材料)标签页上传了鲁迅的《阿Q正传》。

注意,上传的文件格式目前只限于 PDF、TXT 和 Markdown。

另外,经过我测试,如果是图片扫描的 PDF 文件,它会自动进行文字识别。

接着,切换到 Studio(工作室)标签页,点击 Generate(生成)按钮,它就开始生成播客。

几分钟以后,播客就生成了,里面是一男一女在谈论你上传的资料。

大家听听看,是不是很像那些精心准备的真人播客。

NotebookLM 不仅可以上传文本材料,还可以针对网站和 Youtube 视频,生成播客。

我随便找了一个 Youtube 的英文视频,内容是国产旗舰手机的摄影能力比较。

下面是生成的播客

我听了以后,觉得都不必看视频了。而且,中文播客比英文视频,更容易抓住重点。

总之,有了中文播客以后,任何枯燥的学习资料,都能变成平易近人的播客节目。走路、休息、锻炼、开车的时候都能听,学习时间和途径都变多了。

需要注意的是,免费账户一天只能生成三个播客,更多需要付费。

除了播客,NotebookLM 的 AI 笔记功能,也非常好用。

你可以上传自己的学习材料,也可以用它搜索某个主题的学习材料。

下面是我用它搜索 PostgreSQL 数据库的学习材料。

指定学习材料以后,你可以跟这些材料聊天。

它还会自动生成各种笔记:学习指导、内容摘要、常见问题、时间线等等。

以上就是 NotebookLM 的基本用法。

我的评价是,NotebookLM 是一款革命性的笔记工具,属于少数几个真正有重大用处的 AI 产品。

它会改变做笔记的方式和学习方式,每个学习者都应该知道有这样一个工具。

它属于谷歌的产品,似乎还没有竞品,希望国内的厂商能够做出替代品。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年5月 1日

科技爱好者周刊(第 346 期):未来就是永恒感的丧失

2025-04-25 08:09:38

这里记录每周值得分享的科技内容,周五发布。([通知] 下周五一假期,周刊休息。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系[email protected])。

封面图

大阪世博会的中国馆,以"中华书简"为主题。(via

未来就是永恒感的丧失

有一类人叫做未来学家(Futurists),专门研究未来。

这类人通常很快被忘记,因为他们的预测基本不准。就算偶尔说对了,后人也会觉得稀松平常。

历史上最著名的未来学家,大概是一个叫做阿尔文·托夫勒(Alvin Toffler,1928--2016)的美国人。

上个世纪七十和八十年代,他写过很多预测未来的书,非常畅销。1983年,国内就引进了他的书,轰动一时。

时过境迁,现在几乎没人提他了。

前些日子,一个朋友对我说,你可以去看看他的书,居然没有完全过时。

我看了一些片段,很震惊。这些片段根本不像写于半个世纪之前,更像写于现在。

托夫勒的第一本书,叫做《未来的冲击》,写于1970年,国内有中文版。

下面就是他的主要观点。大家一定要记住,这些话写于1970年,那个时候还没有信息革命,既没有个人电脑,也没有手机和互联网。

托夫勒认为,人类以前是农业社会,现在是工业社会,即将进入超工业社会

超工业社会有两个特征。

首先,工业人口只占少部分,大部分人从事脑力劳动。

其次,即使少部分人从业工业,生产出来的工业品,也大大超过需要。

那么,问题就来了。如果50%、甚至40%的工业生产能力,就能生产出满足所有人需要的工业品,那么会怎样?

托夫勒说,为了消化掉多余的工业品,结果就是加速。社会开始让消费加速,让技术也加速,最终让商品的流通速度变快,只有这样才能消费更多的商品。

这意味着,人类社会将变快。我们生活的根本特征,不再是持久,而是短暂

(1)生活用品变得短暂,越来越多一次性产品:一次性筷子,一次性圆珠笔,一次性塑料瓶,甚至一次性衣服。

(2)即使长期使用的产品,也在快速升级换代。微波炉、洗衣机这样的耐用消费品,人们也只要今年的型号,不要去年的型号。

(3)社会充斥着速成食品、速成教育,甚至城镇也可以速成。

(4)知识短暂化,用过即弃。

(5)工作变得短暂。职位、公司、甚至行业,随时都会消失,新的部门和行业不断涌现。

(6)生活环境变得短暂。人们经常搬家,不会在一个地方久居。

(7)人际关系变得肤浅。人与人之间很难产生稳定深入的关系,交流持续的时间缩短,更多的是偶遇和点头之交。

(8)人们面对快速变化,内心感到疲惫和衰弱,情绪变得不稳定,精神病人变多。

总之,未来的根本特征,就是永恒感的丧失,取而代之的是短暂感。

Trae 的 万「友」引力计划

本周,字节的 AI 编辑器 Trae 发了新版,可以调用 MCP 服务器了。

这可是重磅消息,开辟了一个全新天地,我还写了一篇教程

官方为了推广,投入了大量资源,Doubao、DeepSeek、Claude、Gemini、GPT-4o,现在都是免费用(后三个模型需要 Trae 海外版)。

为了让更多的同学参与,只要你深度体验 Trae,完成简单任务,就可以获得相应积分,兑换奖品。

奖品包括 华为 MatePad Air、雷蛇机械键盘、热门 App 会员卡等。

详情访问这个链接,或者扫描上方海报的二维码。

机会难得,既能学习 AI 和 MCP,还能拿奖品,大家不要错过哦。

科技动态

1、虚拟味觉

香港城市大学的科学家,提出了一种虚拟味觉的实现方法。

他们做了一个类似棒棒糖的"虚拟味觉器",用户把它含在嘴里。

它会以"离子泳"的形式,释放水凝胶。目前,一共9种口味的水凝胶,也就是说用户可以尝到9种味道:糖、盐、柠檬酸、樱桃、百香果、绿茶、牛奶、榴莲和葡萄柚。

这里的关键是,水凝胶的释放可以编程控制,因此可以用来在电子游戏中增强用户体验,或者网上购物时让用户先品尝食品味道。

2、旅行推销员问题是一个著名的计算机科学问题。

它的表述是,怎么规划出一条最短路线,可以拜访每一座城市一次,最终回到起始城市。

最近,一个国际团队打破了旅行推销员问题的世界纪录

他们规划出一条最短路线,可以一次性走遍韩国所有81,998家酒吧。

一刻不停的步行,完成这条路线一共需要178天。

此前的世界纪录是2021年创造的,走完荷兰57,912个纪念碑的最短路线。

3、Vision Pro 的新用途

苹果的 AR 头盔 Vision Pro,售价高达3万元人民币,销量并不好。

用户普遍觉得,它的用处并不大,售价又这么贵。但是,它意外在一个场合非常受欢迎。

美国的一些医院发现,它可以用于微创手术。医生戴着头盔,给病人开刀,上图就是两个这样的医生。

很多手术,尤其是涉及血管和神经的手术,要求非常精细,动刀位置不能有一点差错。

医生不可能凑上去看,现在都是用摄像头放大后,看着显示器动刀。

Vision Pro 戴在眼前,影像更大,看得更清楚,而且还能叠加多窗口,显示心率血压等指标。

医生非常喜欢这个设备。价格完全不是问题,因为手术用显示器的价格是 Vision Pro 的好几倍。

4、其他

(1)北京举行机器人半程马拉松比赛。21公里的路程,冠军成绩是2小时40分42秒,需要更换三次电池。

(2)4月25日的日出前,土星、金星、月亮,将组成笑脸图案

(3)亚马逊在欧洲实验,让送货卡车配备心脏除颤器,一旦送货时遇到突发心脏病的人,可以进行急救。

(4)索尼推出全球最小的激光雷达,适合用于无人机、机器人。

文章

1、昊龙:中国首个货运航天飞机(中文)

天宫空间站的补给,目前由天舟飞船完成。但是,天舟每次返回大气层,都会烧毁。

国内正在研究可以重复使用的"昊龙"货运飞船,以降低货运成本。

昊龙已经完成了设计,正在工程测试阶段。

2、如何使用 UTM 在 Mac 电脑架设虚拟机(英文)

一篇教程,教你如何在 MacBook 安装 utm 虚拟机,从而方便地使用 Linux 系统。

3、清理<head>(英文)

网页的<head>部分里面,很多标签是不必要的,这个网站介绍可以删除的标签,比如 favicon、Apple touch icons。

4、线上故障应急处理:4 年多 on call 经验总结(中文)

我的第一份工作是 CDN 基础设施研发,考虑到公司体量,那些年其实故障蛮多的。在故障处理中,积累了一些经验教训,总结回顾一下。(@swananan 投稿)

5、在 Docker 沙箱中运行 MCP Server(中文)

本地运行他人的 MCP 服务器有极大的风险,本文介绍怎么在 Docker 沙箱里面运行。(@ccbikai 投稿)

6、如何用 Whisper 生成字幕(英文)

本文是作者的操作记录,演示如何用 OpenAI 公司的 Whisper 模型为视频文件生成字幕。

工具

1、Open Props UI

一个 CSS 组件库,使用最新的 CSS 规范,也就是说,不考虑兼容老旧浏览器。

2、ts-blank-space

一个从 TypeScript 脚本剥离类型代码的工具,也就是将 TS 脚本转成 JS 脚本,但是不进行类型检查。

3、Better Auth

一个 TypeScript 的用户身份认证库,功能全面,密码登录、双因素认证、外部身份提供商等都支持。

4、Browspilot

Chrome 浏览器插件,自动保存所有浏览过的网页,提供浏览历史的全文搜索。

5、to-unocss

这个网页工具将 CSS 代码转成 unoCSS 或者 TailwindCSS 的写法。(@Simon-He95 投稿)

6、NoteGen

跨平台的 Markdown 笔记软件,支持接入 AI 模型。(@codexu 投稿)

7、speed-github

一个修改 hosts 文件,加快 GitHub 访问速度的 Python 脚本。(@jvxiao 投稿)

这里还有一个 Cursor 的 hosts 文件生成器。(@Oliverwqcwrw 投稿)

8、旅游翻译器

网友做的旅行翻译网站,支持对话翻译和拍照翻译,代码开源。(@traveltranslator1 投稿)

9、Shui

开源的桌面软件,定时提醒喝水。(@rock-zhang 投稿)

10、SnowAdmin

基于 Vue + Vite 的网站管理后台模版。(@WANG-Fan0912 投稿)

AI 相关

1、chatlog

用 AI 处理微信本地聊天记录的工具。(@sjzar 投稿)

2、HowToCook-MCP Server

一个 MCP 服务器,提供中文菜谱、餐食规划。(@worryzyy 投稿)

3、Midscene.js

字节推出的 JS 工具,最新功能是通过 AI 和 adb,完成安卓手机自动化。它早先已经可以浏览器自动化。(@yuyutaotao 投稿)

4、MCP Gateway

一个 Go 语言写的网关服务,将已有的 API 转成 MCP 服务,无需改动任何代码。(@iFurySt 投稿)

资源

1、全球地铁线路图

这个网站收集了全球各大城市的地铁地图。(@027xiguapi 投稿)

2、如是我闻

佛经阅读平台,带有 AI 翻译和问答。(@bolechen 投稿)

3、They see your photos

该网站对用户上传的照片给出详尽描述,从而可以发现照片泄漏了多少信息。

日本木匠大会

日本每年举行一次全国木匠大会

大会有一个项目,就是刨花比赛,看看谁的刨花最薄。

比赛规定,木材必须是宽55毫米、长1800毫米的桧木。进入决赛的5名选手,为了公平,将使用同一块桧木。

刨出来的刨花必须完整,没有裂口,长度在1米左右,才能参加评分。

工作人员把所有选手的刨花,挂在黑板上,进行公示,评委进行打分。

这些的刨花如此之薄,令人不敢相信。

冠军选手的成绩是50微米,也就是1毫米的20分之一。

文摘

1、你是创造者还是消费者?

我是一个信息瘾君子,对各种信息上瘾。

当我想学习一项新技能,或者有了一种新爱好,我就立即前往亚马逊网上书店,购买3~4本该主题的书籍。

现在我的书柜里面、有关于 HTML 基础知识、纸牌魔术、高尔夫、编剧、赛车、冥想、举重以及大约10个其他主题的书籍。

我也会订阅一些博客和播客,阅读所有最受欢迎的帖子,聆听了各种专家访谈。有时候,我甚至会在 Evernote 做一些笔记,或者在浏览器为某些页面添加书签。

然而,我总是缺少一件事:实际成果。

我对那么多东西感兴趣,也学了很多,但是没有做出什么成果。

我只是查找和使用信息,这很容易,对于像我这样好奇的人来说,这通常也非常有趣。

但它实际上并没有完成任何事情,这是伪工作,一种自我安慰。

创造才是更有效的方式,你开始制作东西----网站、成功的高尔夫击球、剧本等等,不管是什么----然后,无非就是两种结果。一种结果是你意识到自己对它不那么感兴趣,另一种结果是你真的喜欢它,开始深入研究。无论哪一种结果,都是值得的,而盲目消费信息,则是一种无效的表面行为。

言论

1、

AI 伴侣可以减少孤独感,但是会产生新的问题。它可能取代人际互动,让你丧失基本社交技能,从而变得更加孤立。

-- 哈佛商学院的一项研究

2、

简单和优雅不受欢迎,因为它们需要努力工作和纪律才能实现。

-- Edsger Dijkstra,著名计算机科学家

3、

规则就像汽车上的安全带:一开始可能会有点不舒服,但一段时间后,使用规则就会成为习惯,不使用规则就变得不可想象。

---- Gerard J. Holzmann

4、

企业编程必须始终依赖流程,而不是个人。

个人能力很重要,应该鼓励,但不能指望它,否则软件质量将不一致,没有可持续性。一旦顶级程序员跳槽,公司就会陷入困境。

企业应该努力改进工作流程,而不是努力改进人员,始终坚持流程优先于人员。

-- 《创作系统,而不是创造英雄》

5、

我喜欢软件,因为软件可以创造无限可能性和一种非凡的民主。

-- Hacker News 读者

往年回顾

AI 的关键是语料(#299)

最成功的软件企业家(#249)

俄罗斯的 HTTPS 证书问题(#199)

新能源汽车,谁会是赢家?(#149)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年4月25日

巨头的新战场:AI 编程 IDE(暨 字节 Trae 调用 MCP 教程)

2025-04-22 15:08:03

一、引言

本周,我要加写一篇文章。

因为 AI 编程 IDE 突然成了热门,国内外都有大事发生。

先说国外,OpenAI 要用30亿美元收购 Windsurf

这个消息太惊人。Windsurf(前身叫做 Codeium)的历史很短,发布至今两年多,市场份额也不高,居然值这么多钱!

OpenAI 最新一轮融资(今年3月)不过400亿美元,现在一下子要拿出30亿去收购,看中 Windsurf 哪一点呀!

OpenAI 自己没有编程助手,所以唯一的解释是,它要收购 IDE 打入 AI 编程市场,这个市场对它很重要。

二、MarsCode 更名 Trae

再看国内,字节也有大动作。

它旗下的编程助手,最早是 MarsCode 插件,后来又多了一个独立的 AI IDE 产品 Trae

本周,MarsCode 宣布改名为 Trae 插件,不再作为独立品牌发展了。

以后,字节的 AI 编程助手,将只有 Trae 这一个品牌,分成两种产品形态。

习惯传统 IDE 的用户,可以加装 Trae 插件;想要更好 AI 体验的用户,可以安装独立的 Trae IDE。

这个消息公布的同时,Trae 新版本也一起发布,加入了重磅的新功能(后面会详谈)。

可以看出,字节是下了决心,整合了产品,准备在 AI 编程工具上发力了。

三、AI IDE + MCP

为什么国内外的巨头,在同一个时间,不约而同都看上了 AI IDE?

我猜想,答案是 MCP 的出现。

有了 MCP 以后,AI IDE 可以扩展外部能力,从而无所不能,这让它成为巨头的必争之地。

下面,我来解释 MCP 是什么,怎么在 Trae 里面调用。大家看了,就会理解为什么 MCP 这么重要。

四、Trae 的简介

我选择 Trae 来演示,主要因为它是国产软件,有中文界面和文档,并且完全免费(国外产品都需要付费)。

前面说过,Trae 分成插件和 IDE 两种形态,它的 IDE 又分成国内版和海外版。这些产品的功能基本一致,就是内置的 AI 模型不一样。

国内版:内置 deepseek R1、V3、v3-0324 和 doubao 1.5 pro 模型

海外版:内置 Claude 3.5、3.7,Gemini 2.5 pro,GPT-4o、GPT-4.1 模型

我建议使用国内版,因为海外版的内置模型经常需要排队,很浪费时间,而且可能还会通信不畅。

不过,这两个版本都支持自定义模型,你可以提供密钥,接入你指定的模型。所以,版本的差别也不算很重要。

顺便提一下,Trae 这个词的意思是"The Real AI Engineer"(真正的 AI 工程师)。我以前总是以为 Trae 的意思是 True Ai。

五、Trae 的新版本

Trae 的 MCP 调用功能,是从新版本 v0.5.0 开始加入的。

没安装的朋友,可以去官网下载新版。已经安装的朋友,请检查一下版本。

它的界面这一次简化了,聊天框和 Builder(项目生成)合并成一个对话框(下图)。所有跟 AI 的对话,都在这里输入。

上图中,左下角多了两个按钮:"@智能体"和"#上下文"。这就是本次新增的核心功能。

至于 Trae 的基本用法,这里就不提了,可以看以前的文章

六、调用智能体

MCP 调用的入口,就是上图左下角的"@智能体"按钮。

如果想要扩展 AI 的功能,就要使用这个按钮。因为 AI 模型的本质只是语言模型,自身的功能是有限的,必须通过外部应用(智能体)来扩展功能。

点击"@智能体"(或者输入@),就会弹出一个对话框,显示目前可用的智能体(下图)。

可以看到,Trae 内置了两个智能体:"@Build" 和 "@Builder with MCP"。

其中,"@Build"用来让 AI 生成一个可运行的新项目。

@Build 俄罗斯方块网页小游戏

输入上面的命令,就会生成一个 HTML 文件,打开就是俄罗斯方块小游戏。

另一个内置的智能体"@Build with MCP",就是用来连接 MCP 服务器。

七、MCP 是什么

我先解释一下,MCP 是什么,很容易理解。

我们知道,AI 模型通过连接外部应用,来扩展功能。每个外部应用的接口,都不一样,如果要接入10个应用,就要写10种接入代码,非常麻烦。而且,要是换一个模型,可能所有接入代码都要重写。

有鉴于此,Anthropic 公司在2024年11月提出了 MCP 协议。外部应用只需要支持这个协议,提供一个 MCP 接口(又称 MCP 服务器),那么 AI 模型就可以用统一的格式接入,不需要了解外部应用的接入细节。

所以,MCP 可以理解成一个 AI 与外部应用之间的适配层。对于 AI 来说,只要安装某个应用的 MCP 服务器,就能接入该应用,不用写任何代码(除了少数的配置项)。

由于 MCP 解决了 AI 应用的接入痛点,诞生至今仅半年,已经变得极其流行,就连 Anthropic 的竞争对手 OpenAI 公司都公开支持,网上开源的 MCP 服务器项目已经有上万个。

八、调用 MCP

现在就来看 Trae 怎么调用 MCP。

点击 AI 标签栏右上角的齿轮图标,弹出一个菜单,选择菜单项 MCP。

它会跳出一个 MCP 的标签页(下图),点击底部的"+ 添加 MCP Servers"。

Trae 内置了 MCP 市场,提供一些常用的 MCP 服务器。如果里面没有你需要的,可以点击"手动配置",添加你自己的 MCP。

为了便于演示,我选择第一个服务器 Puppeteer,让 AI 可以调用无头浏览器。

鼠标点击 Puppeteer 的名字,会进入该开源项目的主页,可以查看一下它提供的内部命令(即能力)。

上图中可以看到,这个 MCP 服务器提供 puppeteernavigator(打开指定网址)、puppeteerscreenshot(截图)、puppeteer_select(选中页面元素)等内部命令,供 AI 模型调用。

用户不需要记住这些命令,只需了解它有哪些能力就可以了。

接着,点击它后面的加号,添加该 MCP 服务器。

这个 MCP 带有"轻松配置"标签,表示不需要任何设置,可以直接运行。

所有自己添加的 MCP,默认都放在内置的智能体"@Build with MCP",所以可以通过这个智能体来使用。

在 AI 对话框里面,选中智能体"@Build with MCP",然后输入下面的命令"打开 https://www.baidu.com",试试看新安装的 Puppeteer 服务器。

正常情况下,Trae 会让你选择一个项目文件夹,然后就会打开一个浏览器窗口,显示百度的首页。

这就是 MCP 的作用。AI 本来没有能力控制浏览器,但是现在就可以通过 MCP 来控制。

接着,可以给出一些更复杂的命令,比如生成截图,也能顺利完成。

这就是调用 MCP 的基本流程。你还可以把添加的 MCP 服务器保存成智能体(下图)。

然后,通过你起的名字,调用该智能体(下图),从而连接指定的 MCP 服务器。

九、上下文功能

除了 MCP 调用,Trae 的本次更新,还加强了上下文功能,这里也简单提一下。

所谓上下文,就是额外提供的信息,帮助 AI 模型思考,来完成任务。

通过#号,可以调出上下文菜单。

从上图可以看到,可以提供的上下文,包括额外的代码(code)、文件(file)、目录(folder)、工作区(workspace)。

本次更新多了两个选项,"Doc"表示额外的文档。

点击"添加文档集",就可以添加文档目录,作为 AI 模型的上下文。

另一个选项"Web",表示用网上信息作为上下文。这为 AI 提供了实时联网能力。

上图的实时天气问题,AI 只有具有联网能力,才能回答。

十、总结

有了 MCP 调用和联网能力,AI IDE 就具备了巨大的想象空间,不仅仅是编程工具,而成了一个无所不能的 AI 控制台。

那些大公司一定是看到了这一点,所以才愿意投入大量资源,去做这个产品。

我认为,在 AI IDE 里面调用 MCP 服务器,将成为近期软件业的热点,值得大家重点关注。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年4月22日