MoreRSS

site iconShawn Weekly | 肖恩技术周刊修改

包含“业界资讯”、“技术博客”、“开源项目”、“工具推荐”和“学习资源”等
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

Shawn Weekly | 肖恩技术周刊的 RSS 预览

肖恩技术周刊(第 63 期):搞笑诺贝尔奖

2025-09-22 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

2025 年度搞笑诺贝尔奖(Ig Nobel)公布了获奖名单。搞笑诺贝尔奖创建于 1991 年,是对诺贝尔奖的善意戏仿,表彰那些令人发笑但又发人深思的研究。

其中生物学奖授予了儿岛朋贵等日本科学家,他们研究发现,将黑毛和牛的身体涂成类似斑马的条纹状,可以使吸血的厩螫蝇等害虫难以靠近。这有望成为不依赖杀虫剂的害虫防治新方法。这是日本连续 19 年获得搞笑诺贝尔奖。

研究团队用 6 头黑毛和牛进行了实验。他们将牛分为三组:一组用白色水性涂料涂成条纹;另一组用黑色涂料涂成不明显的条纹;第三组不涂任何条纹。随后比较了三组牛身上聚集的苍蝇数量,以及甩头、摆尾等驱赶苍蝇的行为次数。结果显示,有黑白条纹的牛身上聚集的苍蝇数量是其他两组的一半,且驱赶行为的次数也较少。但这一现象背后的原理未知。

其他获奖概览:

  • 文学奖授予了已故的 William B. Bean 医生,他记录和分析了一个指甲在 35 年中的生长速度,为此在医学期刊上发表了五篇论文——第一篇是 1953 年,最后一篇是 1980 年,他的儿子代替他领奖;
  • 心理学奖授予了 Marcin Zajenkowsk 和 Gilles Gignac,其研究是告诉自恋者他们很聪明时会发生什么;
  • 营养学奖授予了 Daniele Dendi 等人,他们研究了彩虹鬣蜥在多哥海滨度假胜地选择吃哪种披萨;
  • 儿科学奖授予了 Julie Mennella 和 Gary Beauchamp,他们研究了哺乳期的母亲食用大蒜后婴儿的感受;
  • 化学奖授予了 Rotem Naftalovich 等人,他们研究了食用塑料特氟龙作为一种食物体积和饱腹感而不增加卡路里的方法;
  • 和平奖授予了 Fritz Renner 等人,他们证明了喝酒有时能提高一个人说外语的能力;
  • 工程设计奖授予了 Vikash Kumar 和 Sarthak Mittal,他们研究了通过重新设计鞋架去解决臭鞋问题;
  • 航空奖授予了 Francisco Sánchez 等人,他们研究了饮酒是否会影响蝙蝠的飞行能力和回声定位能力 ;
  • 物理学奖授予 Giacomo Bartolucci 等人,他们研究了意大利面酱的物理学,发现导致结块的相变可能会造成不良体验。

业界资讯

工信部将有条件批准 L3 级车型生产准入

9 月 12 日,工业和信息化部等八部门发布关于《汽车行业稳增长工作方案(2025—2026 年)》的通知。方案提到,推动智能网联技术产业化应用,「推进智能网联汽车准入和上路通行试点,有条件批准 L3 级车型生产准入。」根据国家标准《汽车驾驶自动化分级》,3 级驾驶自动化(有条件自动驾驶)是指驾驶自动化系统在其设计运行范围内持续地执行全部动态驾驶任务。

阿里巴巴新 AI 芯片发布:对标英伟达 H20!

9月16日,央视新闻报道显示,阿里巴巴旗下平头哥开发的PPU芯片在关键参数上超越英伟达A800,与H20相当。PPU配备96GB HBM2e内存,高于A800的80GB,与H20持平;芯片间互联带宽达700GB/s,高于A800的400GB/s,略低于H20;支持PCIe 5.0×15接口,优于A800的PCIe 4.0×16,与H20相当;功耗与A800同为400W,低于H20的550W。此外,中国联通三江源绿色电力智能计算中心项目已签约项目中,阿里巴巴云提供1024台设备,共16384张平头哥计算卡,计算能力达1945P。

英伟达将斥资 50 亿美元购买英特尔股票

Nvidia和Intel宣布将联合开发多代x86产品,包括面向消费级游戏PC市场的“Intel x86 RTX SOCs”,以及为Nvidia AI产品定制的x86数据中心CPU。此外,Nvidia将购买价值50亿美元的Intel普通股,占Intel约5%的股份。此次合作处于早期阶段,产品发布时间和规格尚未确定。Nvidia强调,此次合作是对x86生态系统的重大投资,同时公司仍致力于其他已宣布的产品路线图和架构。

佳文共赏

2像素文字

介绍了一种名为“Two Slice”的字体,其特点是高度仅为2像素,但仍然具有一定的可读性。这种字体提供了大写和小写字母的不同变体,以便用户可以根据自己的需求选择更易读的版本。此外,它还包含了一些数字和标点符号。尽管这种字体在较小尺寸下可能更易于阅读,但它仍然可以在较大的尺寸下使用。

微型发光二极管助力随机数生成

沙特阿拉伯和美国的研究人员开发了一种基于微LED的量子随机数生成器(QRNG),能够以高达9.375 Gbit/s的速率生成随机数。该研究团队利用蓝色GaN微LED的自发发射强度波动来生成随机数,这些微LED的尺寸在5微米到100微米之间。研究人员测试了不同尺寸和驱动电流的微LED,并使用美国国家标准与技术研究院(NIST)的标准测试其随机性,结果表明所有微LED均通过了测试,证明了其生成的随机数的质量和可靠性。

与传统的单光子检测系统相比,该系统通过利用强度波动,每个采样周期可以提取6位随机数,而单光子检测系统通常只能提取2位。这种微LED QRNG具有紧凑、可靠和成本效益高的特点,并且比其他竞争技术消耗更少的功率,需要更简单的电子和光子系统架构。未来的工作将集中在创建2D微LED阵列以实现并行随机数生成,并开发完全集成的系统,而不是使用离散组件。目前的系统包括一个GaN微LED,通过热电冷却器稳定温度,并将光发射连接到雪崩光电探测器,然后通过电子放大器连接到采样示波器。

《麻省理工科技评论》“50家聪明公司”正式发布!

《麻省理工科技评论》2025年9月12日在上海静安举办的EmTech China 2025全球新兴科技峰会上发布的“50家聪明公司”名单。这些公司被认为是在技术创新、全球化能力和商业化能力等方面表现出色的企业,它们在中国诞生、由中国引领、并为中国服务,展现了中国在全球科技领域的影响力和未来潜力。

技术博客

MySQL单表为何别超2000万行?

本文探讨了MySQL单表存储数据量不宜超过2000万行的原因,主要从InnoDB存储引擎的B+树索引结构和16KB数据页角度分析。文章指出,InnoDB存储的最小单位是16KB的数据页,数据页包含页头、页目录、数据记录和页尾。B+树索引通过非叶子节点存储索引信息,叶子节点存储实际数据,使得查询效率较高。通过计算,当B+树为三层时,可支持约2500万行数据,而当数据量突破2000万时,B+树的树高可能从3层变为4层,导致查询I/O次数增加,性能下降。文章还指出,2000万行是推荐上限,实际限制取决于行大小和数据特点。优化建议包括控制单行大小、分库分表、冷热分离等。此外,文章还讨论了16KB页大小的设计原因、字符串索引的实现方式以及索引字段长度的限制等问题。

三个近期问题的复盘报告

Anthropic于2025年9月17日发布了一份技术报告,详细分析了8月至9月初Claude服务出现的三个基础设施问题。这些问题导致Claude的响应质量间歇性下降,最初被误认为是用户反馈的正常波动,直到8月底问题频率和持续性增加后,团队才展开调查。

第一个问题是上下文窗口路由错误,从8月5日开始,部分请求被错误地路由到为1M token上下文窗口配置的服务器上,最初影响了0.8%的请求。8月29日的一次负载均衡变更加剧了问题,导致更多用户受到影响。第二个问题是输出损坏,从8月25日开始,TPU服务器上的错误配置导致生成的token出现错误,影响了特定版本的请求。第三个问题是近似top-k XLA:TPU编译错误,同样从8月25日开始,影响了Claude Haiku 3.5的请求,并可能波及Sonnet 4和Opus 3。

Anthropic通过一系列技术手段解决了这些问题,包括修复路由逻辑、回滚错误配置和与XLA:TPU团队合作修复编译器错误。为防止类似问题再次发生,Anthropic计划改进评估方法,增加更敏感的评估、在更多地方进行质量评估,并开发更快的调试工具,同时强调用户反馈在问题识别和解决中的重要性。

开源项目

fuck-u-code:屎山代码检测器

名为“fuck-u-code”的代码质量分析工具,它以幽默犀利的方式评估代码质量,给出0~100分的“屎山指数”,分数越高表示代码越烂。该工具支持多种编程语言,从七个维度检测代码问题,并提供彩色终端报告和Markdown格式输出,方便集成到文档和CI/CD流程中。

好的,今天我们来做菜!

该项目主要是一个菜谱网站,旨在为在家且材料有限的人提供菜谱。

工具推荐

EdgeOne Pages

腾讯推出的一款基于云边一体化架构的全栈 Web 开发平台——EdgeOne Pages,它融合托管、加速、计算与集成能力,适用于多种应用发布。平台提供多种灵活部署方式,支持团队协作开发,通过全球边缘节点网络实现极速分发。它还支持无服务器架构,提供全栈开发能力,包括 Edge Functions、Edge KV、Edge AI 和 Node Services。此外,Pages 提供多种模板,支持自由组合构建多类型网站与应用,保障数据安全与合规,助力开发者高效开发。

肖恩技术周刊(第 62 期):不纯粹工程

2025-09-15 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

编程工作可以分为两种截然不同的类型。第一种是 纯粹工程 (pure engineering),它的目标是尽可能完美地解决一个技术问题。开源项目常常属于这一类:某个工程师想写出最棒的 HTTP 请求库,或是打造他心目中理想的游戏引擎。第二种是 不纯粹工程 (impure engineering),它的目标是尽可能高效地解决一个现实世界的问题。科技公司的付费工作大多如此:工程师们被要求在截止日期前,尽其所能地交付某个项目或功能。

在纯粹的软件工程中,你所做的事情更接近艺术或研究。说它像艺术,是因为工程师被一种审美意识所驱动(比如,什么样的库或游戏引擎才算得上好)。说它像研究,是因为它是开放式的:工程师一旦找到了一个解决方案,他可以永远地测试和修改下去,不断尝试(也通常会不断放弃)新的方法。

不纯粹的软件工程则更像是水管工或建筑工。工程师的审美必须服从于他人的需求(通常是雇主的需求)。他们是在为别人的问题构建解决方案。既然是别人的问题,就必须按时完成,而这就意味着妥协。

业界资讯

npm 的 debug 和 chalk 包遭到入侵

2025年9月8日,npm上18个流行的JavaScript包(如debugchalk)被恶意代码篡改,每周下载量超20亿次。这些包被注入恶意代码后,会在客户端执行,拦截和篡改与加密货币和Web3相关的网络请求及钱包交互,将资金和批准重定向到攻击者控制的账户,用户却毫无察觉。

恶意代码通过混淆技术隐藏功能,注入浏览器后挂钩fetchXMLHttpRequest和钱包API,监控敏感数据并篡改目标地址,使用“相似地址”减少察觉。即使用户界面显示正确,实际交易已被篡改。

攻击者通过伪造的npm支持邮件(support [at] npmjs [dot] help)进行钓鱼攻击。维护者在得知被攻击后开始清理受影响的包。Aikido系统还检测到另一个包[email protected]被相同攻击者篡改。

修复建议包括检查使用的包版本、清理npm缓存、重新安装包,并使用Aikido SafeChain等工具防止类似攻击。

最轻的 iPhone 亮相,还有这些惊喜:Apple 发布会看点回顾

2025年9月10日凌晨,Apple召开新品发布会,推出iPhone 17系列、Apple Watch系列及AirPods Pro 3等新品。iPhone 17系列包括基础款iPhone 17、轻薄的iPhone Air和旗舰iPhone 17 Pro系列,均配备A19系列芯片,支持更高刷新率屏幕与更好影像系统,容量与续航显著提升。Apple Watch系列更新至Series 11、Ultra 3和SE 3,新增5G蜂窝、双向卫星通信、高血压提醒等功能,续航与健康监测能力增强。AirPods Pro 3则在音质、降噪、佩戴体验及健康监测方面全面升级,新增实时翻译功能。此外,Apple还发布了多款新配件,如MagSafe保护壳、防护边框和MagSafe电池等,进一步丰富了产品生态。此次发布会展现了Apple在技术创新和用户体验提升方面的持续努力,为消费者带来了更多选择和惊喜。

佳文共赏

对 Cloudflare 创始人兼CEO马修・普林斯有关互联网历史与流量付费的采访

本文是Stratechery对Cloudflare创始人兼CEO马修·普林斯的访谈,主要围绕Cloudflare的创立历程、业务模式以及互联网内容分发的未来展开。普林斯分享了他从法律专业转向技术领域的经历,以及如何在哈佛商学院期间构思出Cloudflare的创意。Cloudflare最初通过提供免费服务吸引用户,逐步拓展到企业级市场,并在网络安全和内容分发领域占据重要地位。普林斯还探讨了AI对传统互联网商业模式的影响,尤其是谷歌创建的基于流量的商业模式,并试图通过Cloudflare的力量为内容创作者创造新的商业模式。访谈还涉及了Cloudflare在内容分发、网络安全、AI技术应用等方面的现状和未来展望,以及普林斯对AI时代内容创作者如何获得合理回报的思考。

使用智能体为智能体编写高效工具

文章探讨了为人工智能代理编写工具的方法,以提升其解决现实任务的能力。工具是代理与系统间的桥梁,需为代理设计。编写工具时,应先构建原型并本地测试,接着通过复杂任务评估工具表现,分析代理的困难点和工具调用指标,最后与代理合作优化工具。有效工具的编写需遵循几大原则:选择合适的工具实现,避免简单包装现有功能;为工具命名以明确功能边界;返回对代理有意义的上下文信息;优化工具响应以提高标记效率;精心设计工具描述和规范。未来,随着代理能力的提升,工具开发需适应非确定性模式,通过系统化评估驱动方法持续改进。

技术博客

你的大客户可能是最大的瓶颈

文章讲述了在多租户系统中,如何解决“最大客户可能成为最大瓶颈”的问题。作者所在的公司Trieve在引入最大客户后,发现新客户的大量文档上传导致系统处理管道堵塞,其他客户的文档索引请求被延迟数小时。这揭示了多租户系统中的“嘈杂邻居”问题,即一个贪婪的租户可能会耗尽所有资源,导致其他租户无法获得服务。

为了解决这个问题,作者提出了公平排队(Fair Queueing)的解决方案。传统的先进先出(FIFO)队列只关心谁先到达,而不考虑谁最需要服务。公平排队则通过为每个客户分配独立队列,并通过轮询调度器轮流处理每个客户的消息,确保每个客户都能得到服务,防止饥饿现象。

作者构建了一个名为Broccoli的系统来实现公平排队。其核心架构包括两个主要组件:每个客户的专用队列和一个轮询调度器。这种设计的优点是完全自平衡的,忙碌的客户保持在轮转中,安静的客户自动退出,每个客户都能公平地获得处理时间,无论他们排队的工作量有多大。

类型检查不是解决方案

文章质疑编程行业对类型检查的痴迷,认为这可能是掩盖架构错误的复杂工具。类型检查被视作大型程序可维护性的关键,但实际上,它只是我们创造的不必要的复杂性的证明。软件行业普遍认为类型检查可以捕获错误、使重构更安全,但这些观点是基于当前构建软件的方式。作者指出,类型检查的需求并非规模的自然结果,而是不良架构选择的症状。

作者认为,函数调用作为现代编程的基础抽象,带有隐藏的负担,不适合分布式、基于时间的系统。相比之下,电子工程师设计的系统复杂度更高,但不依赖复杂的类型系统,而是通过严格隔离、明确的时序约束和简单接口来管理复杂性。

作者呼吁重新审视这些假设,探索更好的架构选择,如真正的隔离,使系统更容易理解。

开源项目

Nano Banana 提示词合集

gemini - 2.5 - flash - image(也被称作 Nano Banana)生成的精选图像和提示词合集。

自学计算机科学

TeachYourselfCS 的中文翻译。

工具推荐

西游记取经路线图

跟随唐僧师徒四人的传奇西行之路,体验八十一难的奇幻冒险。

摸摸鱼计时器

一款藏在 macOS 菜单栏里的小工具,每天自动统计摸鱼时间,帮你心里有数、偶尔自省、持续进步!

肖恩技术周刊(第 61 期):Python的故事

2025-09-08 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

关于世界上最受欢迎的编程语言 ——Python 的故事。20 世纪 90 年代,它最初只是阿姆斯特丹的一个副业项目,后来却成为了驱动人工智能、数据科学以及一些全球最大公司的软件。但 Python 的未来并非一帆风顺,它曾一度险些消失。

这部 90 分钟的纪录片有吉多・范罗苏姆、特拉维斯・奥利芬特、巴里・华沙等众多人士参与,他们讲述了 Python 的崛起、由社区推动的发展、险些将其撕裂的冲突,以及这门语言对所有事物的影响。

业界资讯

《人工智能生成合成内容标识办法》

国家网信办等四部门联合发布的《人工智能生成合成内容标识办法》,9月1日起将正式施行,所有AI生成的文字、图片、视频等内容都要“亮明身份”。“标识办法”明确,人工智能生成合成内容是指利用人工智能技术生成、合成的文本、图片、音频、视频、虚拟场景等信息。人工智能生成合成内容标识包括显式标识和隐式标识。“标识办法”中明确,平台在服务提供者的内容上架或上线时要进行审核,核验生成合成内容标识,对未标识或疑似生成内容要添加风险提示,从而在传播端阻断虚假信息扩散。

美团正式发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代

美团技术团队于2025年9月1日宣布正式发布并开源一款名为LongCat-Flash-Chat的AI模型。该模型采用混合专家模型(MoE)架构,拥有560B总参数,平均激活参数量为27B,通过动态计算优化了计算效率与性能。

佳文共赏

高效学习:构建知识的20条黄金法则

学习材料的表述方式对学习速度和效果至关重要,良好的表述能使学习速度大幅提升。作者提出了20条知识表述规则,按重要性排序。首先,学习者应理解学习内容,避免死记硬背不理解的知识。其次,先理解后记忆,构建知识的整体框架,这有助于减少学习时间。此外,基于基础知识构建知识体系,遵循最小信息原则,使用图像和记忆技巧等方法可以提高学习效率。作者还建议使用Cloze deletion(完形填空)方法,将复杂文本转化为适合学习的形式。同时,避免集合和枚举,因为它们难以记忆,可以通过特定技巧将集合转换为有序的枚举。文章还提到,优化措辞、提供来源和时间戳、优先级排序等方法对长期构建高质量知识至关重要。这些规则可以帮助学习者在长期学习中提高效率,减少遗忘,更好地管理知识体系。

技术博客

大模型工具的“京东答案”

京东零售技术团队关于大模型工具应用、发展现状及未来展望的报告。文中指出,大模型工具在行业内发展迅速,以ChatGPT为标志,已广泛应用于文本生成、智能客服等领域,其设计遵循低代码交互、安全性、易用性、可扩展性和高性价比五大原则。

京东在大模型领域积极布局,旗下言犀大模型升级为JoyAI,涵盖多种模态和全尺寸模型,通过技术提升推理效率、降低成本,并在零售、物流等多领域服务超百万商家。京东还构建了JoyAgent、JoyCode、OxyGent等工具。在业务实践方面,京东强调大模型应用落地需选对工具平台、明确量化目标、分阶段迭代验证,其在办公、代码评审、本地生活、物流等场景均有应用实践。

未来展望中,京东关注大模型政策发展,认为政企协同和全球共治是关键;预测Agent将向多Agent协同、具身化、群体智能方向发展;提出具身智能“端到端”实现路径;并指出营销广告在AI时代的新机遇。

CPU 利用率是个谎言

文章通过实验探讨了服务器CPU利用率与实际性能的关系。作者使用Ryzen 9 5900X处理器进行测试,发现CPU利用率并不总是线性增长。在高利用率情况下,实际工作性能可能远高于系统报告的利用率。例如,在通用CPU测试中,系统报告50%利用率时,实际工作性能可达60% - 65%的最大工作能力;在矩阵数学测试中,50%利用率时,实际工作性能可达80% - 100%的最大工作能力。

这种偏差的原因在于超线程和Turbo技术。超线程导致每个额外的工作者与另一个共享资源,使得实际性能与报告的利用率出现偏差。Turbo功能则使处理器在低利用率时运行速度更快,随着更多核心激活,速度逐渐降低,导致CPU利用率计算出现偏差。

作者建议,不应单纯依赖CPU利用率来评估服务器性能,而应通过实际工作性能的基准测试来评估。不同处理器的超线程性能和Turbo行为差异很大,因此需要根据实际工作负载进行测试和评估。

开源项目

bytebot:AI桌面智能体

Bytebot 是一款自托管的AI桌面智能体,它能通过自然语言命令自动执行计算机任务,并在容器化的 Linux 桌面环境中运行。

工具推荐

速通Nano Banana

  • 用 Nano Banana 帮你修图:祛痘、瘦身、瘦脸、都不在话下
  • 烂片拯救者,用 Nano Banana 一键让你的普通照片变大片
  • 用简洁高效的方式展示你的今日穿搭
  • 当然也可以快速让你的照片穿上别人整理的穿搭
  • 通过标记、框选、涂鸦等方式辅助提示词更加精准的生成图片
  • 充分利用 Nano Banana 的世界知识制作视频特效
  • 根据主角图片一键生成连续的电影分镜
  • 将你喜欢的照片或者物品变成实体贴纸送给朋友

AI 笔试面试助手

名为“Gank Interview”的AI智能面试助手,声称能帮助用户在求职面试中取得成功,提供了一系列功能,包括实时语音识别、自动复盘、个性化回答等。尽管该平台可能对某些用户有帮助,但其在求职过程中的使用可能存在道德和诚信问题,甚至可能违反一些公司的面试规则。

学习资源

如何演讲

MIT教授Patrick Winston的课程《如何演讲》。详细介绍了演讲的技巧,包括开场、启发听众、工具使用、激励听众、说服听众、结束演讲等方面,旨在帮助人们提升演讲能力,更好地表达自己的想法。

肖恩技术周刊(第 60 期):AI平替PS?

2025-09-01 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

谷歌推出Gemini 2.5 Flash Image,支持图像生成与编辑,能平替 PS了?在 Google Gemini 可直接体验。通过提供迷你Labubu图片和提示词可生成上图。

Use the nano-banana model to create a 1/7 scale commercialized figure of thecharacter in the illustration, in a realistic style and environment. Place the figure on a computer desk, using a circular transparent acrylic base without any text.On the computer screen, display the ZBrush modeling process of the figure. Next to the computer screen, place a BANDAI-style toy packaging box printed with the original artwork.

业界资讯

Google最先进的图像模型:Gemini 2.5 Flash Image

2025年8月26日,谷歌发布Gemini 2.5 Flash Image(代号“nano-banana”)图像生成与编辑模型。该模型具备多图像融合、角色一致性保持、基于自然语言的针对性图像转换以及利用世界知识生成和编辑图像等功能。用户反馈推动了其在图像质量和创意控制方面的改进。

《时代》公布 AI 100 人:任正非梁文锋王兴兴入选

《时代》杂志于 8 月 28 日发布 2025 年度《全球 AI 领域百大影响力人物》(TIME100 AI)榜单,华为创始人任正非、Deepseek 首席执行官梁文峰、xAI 创始人埃隆・马斯克(Elon Musk)、OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)等人位列“领导者”类别。

SpaceX 星舰第十次试飞成功

2025年8月26日,SpaceX星舰第十次试飞成功。此次试飞从得克萨斯州发射,重点测试部署模拟卫星和发动机重新点火。星舰超重型助推器的33台发动机中损失一台,但未影响飞行和着陆。助推器在墨西哥湾实现软着陆,上面级成功部署8个星链卫星模拟器,并完成发动机重新点火测试。星舰在印度洋溅落时尾部受损,但仍保持可控。星舰是目前人类最强火箭,设计目标是将人和货物送至地球轨道、月球乃至火星,首次试飞于2023年4月。

佳文共赏

做最简单可行的事情

文章提倡软件设计中“做最简单可行的事”。作者认为,无论是在修复漏洞、维护系统还是设计新系统时,都应选择最简单的解决方案。许多工程师追求理想化的系统设计,但这并非最佳方法。真正的设计大师会选择简单的方式解决问题,即使看起来不复杂。例如,Unicorn和Rails REST API通过简单方式实现了重要功能,是优秀设计的典范。

文章指出,“最简单”的定义是系统有更少的活动部件和清晰的组件接口,且更稳定。同时,过度关注可扩展性是错误的,因为难以预测系统未来的行为,且过度设计会使代码库变得不灵活。作者建议专注于当前需求进行设计,而不是预测未来。

技术博客

OAuth的图解指南

OAuth是一种安全的授权协议,最初于2007年在Twitter诞生,用于允许第三方应用代表用户发布推文。它通过访问令牌实现授权,避免了直接传递用户名和密码或使用通用API密钥。文章通过YNAB连接Chase银行账户的例子,展示了OAuth的典型流程:用户授权后,应用通过授权码换取访问令牌,且整个过程通过后端请求确保安全性。OAuth的核心是用户授权流程和授权码流程,涉及资源所有者、OAuth客户端、授权服务器和资源服务器等术语。开发者需要注册应用以获取客户端ID和密钥,并通过特定参数启动OAuth流程。OAuth的多样性还包括隐式流、PKCE以及与OpenID Connect的结合,用于登录等场景。

人工智能如何识别猫?

文章通过简单易懂的方式介绍了神经网络的工作原理,特别是其在图像识别中的应用。神经网络通过学习大量样本数据来识别图像,其基本单元是神经元,神经元通过调整参数(权重和偏置)来分类数据。

文章通过一个简单的分类任务解释了如何通过训练调整这些参数。神经网络的复杂性和能力随着神经元数量和层数的增加而提高。在图像识别中,神经网络将图像的像素值作为输入,在高维空间中找到区分不同类别的边界。此外,神经网络还被应用于语言模型等领域,尽管其内部工作机制复杂,但已被广泛应用于多个科学领域。

开源项目

open-lovable:AI构建React程序

通过与AI聊天来快速构建React应用程序。

windows:docker中运行win

dockur/windows允许在Docker容器中运行Windows操作系统。它提供了ISO下载器、KVM加速、基于Web的查看器等功能。

system_prompts_leaks:流行聊天Agent系统提示词

收集各种公开部署的聊天机器人的系统消息指令,涵盖了 ChatGPT、Claude 和 Gemini 等。

网站推荐

AI游戏平台

Runway 的AI 游戏平台 Game Worlds,用户可以创建或者游玩别人创建的非线性叙事游戏,游戏主要通过不断的选择分支或者对话进行。

未来文明开放式数字沙盒游戏 Aivilization

香港科技大学开发的面向未来文明实验的开放式数字沙盒游戏 Aivilization ,用户可以在游戏中通过提示词驱动自己的 Agent 角色完成各种采集交易学习建造等任务,可以看作一个 AI 星露谷。

平台已汇聚近三万名 AI Agent,参与者可在可视化界面中为 Agent 设定人格、能力、价值观与目标,并通过编辑认知与行为模块、提供提示及长期指导,持续观察其在虚拟社会中的协作、交易、记忆与信任构建过程,进而见证新的社会规则和经济秩序如何自发涌现。

肖恩技术周刊(第 59 期):OpenAI进化之路

2025-08-24 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

以不同年份为节点,呈现了OpenAI模型的进化历程。从2018年的GPT-1只能简单表达困惑,到2019年的GPT-2能与人探讨AI相关问题。2021年的TEXT-DAVINCI-001能礼貌问候并询问未来AI相关事宜,2023年的GPT-4-0314能提出与未来AI对话可能涉及的诸多前沿话题,再到2025年的GPT-5能以更深入、更具哲学意味的方式思考自身与未来模型的关系以及对人类的看法,展现了AI在理解、表达、思考深度和广度等方面的飞速进步。

业界资讯

DeepSeek-V3.1 发布

DeepSeek-V3.1版本发布,包含混合推理架构,支持思考模式与非思考模式。思考效率提升,Agent能力增强,在编程和搜索智能体测试中表现优异。API升级,支持128K上下文和strict模式Function Calling,兼容Anthropic API格式。模型开源,Base模型和后训练模型在Huggingface与魔搭平台发布。价格调整,自2025年9月6日起执行新版价格表,取消夜间时段优惠。

佳文共赏

语言腐败之首:代指泛滥

文章探讨了网络语言中“代指泛滥”现象及其影响。代指是指在讨论具体的人或事物时,不直呼其名,而是使用模糊的代词来代替。这种现象在网络上尤为严重,形式多样,包括缩略/变形/谐音、特征/事件指代、隐喻/象征化和圈层黑话/梗等。

文章指出代指泛滥严重影响了交流的准确性和有效性,增加了沟通成本,模糊了信息,助长了思维惰性和标签化,消解了严肃讨论和公共理性,加速了语言污染和记忆断层,甚至可能成为网络暴力的工具。其背后的原因包括规避风险与审查、构建圈层身份与认同、表达特定情感与立场、追求新奇趣味和传播性、从众心理与语言惰性等。

作者呼吁警惕“代指泛滥”的弊端,努力保持语言的准确性和沟通的开放性,以维护健康的网络生态。

关于优秀系统设计的一切

文章分享了系统设计的经验。好的系统设计应低调且稳定,长时间不出错。系统设计的核心是组装服务,其中数据库是关键。设计时要减少状态组件,因为它们容易出错。处理操作时,慢操作应放入后台作业,避免阻塞主线程。缓存虽能提升性能,但会增加状态管理的复杂性,需谨慎使用。事件驱动架构适用于特定场景,但不应过度依赖。数据推送比拉取更高效,尤其在处理大量客户端时。热点路径是系统中最关键的部分,需特别关注其稳定性和性能。日志和度量对监控系统运行至关重要,失败策略需根据具体功能灵活选择。总之,良好的系统设计需综合考虑多个方面,以实现高效、稳定和可维护的系统。

MIT报告发现95% 的公司在生成式AI支出上 “零回报”

麻省理工学院的一项新研究发现,企业在生成式人工智能项目上花费了约300亿美元,但95%的企业表示这些工具没有带来任何可衡量的收益。只有5%的试点项目实现了价值提取,大多数项目对收入或利润没有影响。许多公司匆忙测试像ChatGPT这样的大型语言模型平台,但发现这些工具往往无法与实际工作流程匹配,缺乏上下文学习和适应性。报告指出,生成式人工智能系统大多无法保留反馈、适应上下文或随着时间推进建立新的推理能力。尽管如此,投资者和高管仍对人工智能充满兴趣,希望技术进步能够弥补这些差距。然而,短期内的进展可能比许多人预期的要慢。

技术博客

一个半月高强度 Claude Code 使用后感受

文章分享了一个半月高强度使用Claude Code(简称CC)后的感受和经验总结。指出CC显著提升了编程的迭代速度,其快速更新和新功能的推出令人印象深刻。

CC作为命令行工具,相比传统编辑器AI,能够更全面地理解和操作整个项目,从而提高开发效率。然而,CC在处理某些任务时存在局限性,如复杂重构和特定语言支持不足。作者建议采用小步迭代的方式使用CC,以确保代码质量和可控性。他还分享了如何通过任务拆解、使用Subagent和合理管理上下文窗口来优化使用体验。

此外,CC在代码提交、文档撰写和数据处理等方面也有广泛应用。尽管存在一些限制,如模型性能波动和资源限制,作者认为vibe coding代表了一种新的编程思维模式,强调技术应为人服务,开发者需适应并利用AI技术以保持竞争力。

可信实验白皮书系列08:开放式分析引擎

本位介绍了AB实验分析方法库在美团的实践。实验分析引擎BETA具备丰富实验方法、易用性、高效性、多重比较修正、功效提升、统合分析和功效测算等特性,旨在帮助用户零门槛进行可信、高效的实验。系统采用模块化分层设计,包括应用层、接口层、路由层、数据准备层和分析方法层,提升迭代和拓展效率。分析引擎已向美团内部成员开放,提供多种接入方式。通过案例展示了如何使用分析引擎进行随机对照实验的设计和评估。白皮书基于美团实践,构建了完整的实验科学方法体系,提供使用指南,未来将持续追踪前沿进展,推动实验能力赋能。

是什么让 Claude Code 如此出色

本文分析了Claude Code作为AI代理的出色之处,并提供了构建类似代理的建议。作者通过使用Claude Code的经验,从控制循环、提示、工具和可操控性四个方面总结了关键要点。控制循环方面,Claude Code采用单一主线程,通过简单分支和待办事项列表处理复杂任务,避免多代理系统带来的调试难题。提示方面,使用上下文文件(如claude.md)传递用户偏好和开发人员指定的上下文,显著提升性能。工具方面,使用复杂的命令搜索代码库,避免RAG带来的复杂性和隐藏故障模式。可操控性方面,系统提示中包含关于语气、风格和主动性的详细指导,使代理的评论和行为更符合用户期望。

开源项目

60s:开放 API 集合

60s API 是一个开源、免费的高质量开放API集合,提供日更资讯、热搜榜单、实用功能和娱乐消遣等多种服务。

claudia:Claude Code图形界面

为Claude Code设计的优雅桌面图形用户界面(GUI)伴侣,旨在提升AI辅助开发的体验。

工具推荐

Qoder

Qoder是通义推出的智能编程平台,通过增强的上下文引擎和智能代理,帮助开发者更高效地进行软件开发。

AI播客

帮助用户将创意转化为播客,提供速听精华和深度探索两种播客时长选择,支持多种文件格式和语言,并且有不同音色可选。

学习资源

吴恩达AI课:Claude Code-高智能的编程助手

Claude Code 实战开发课程,全面教授如何使用进行高效的软件开发工作。将掌握利用 AI 助手进行代码探索、开发、测试、重构和调试的核心技能,显著提升编程效率和代码质量。

AI 相关的笔记

精心组织的引导词集合,帮助提升AI协作效率和质量。

肖恩技术周刊(第 58 期):坠落or飞翔

2025-08-18 08:00:00

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

“假如坠落的时间足够长,你会以为自己是在飞,反之亦然。”

——《焦虑的人》

业界资讯

GitHub CER辞职,团队合并入CoreAI

2025年8月11日,GitHub CEO Thomas Dohmke辞职,GitHub将更紧密地整合进微软的CoreAI团队。自2018年被微软以75亿美元收购后,GitHub一直作为独立公司运营。Dohmke离职后,微软不再任命新CEO,GitHub领导团队将直接向CoreAI团队汇报。CoreAI由前Meta高管Jay Parikh领导,专注于构建AI平台和工具。此次调整意味着GitHub的运营将更依赖微软的AI战略,其未来角色可能发生变化。Dohmke离职可能与他对GitHub在微软AI战略中的角色有不同看法有关,他计划离开微软去创业。

全球首个孕育机器人预计一年内面世 定价不超10万元

新加坡南洋理工博士张其峰正在研发全球首个孕育机器人,或在一年内问世,售价不超10万元。和传统的试管、代孕不同,这套系统模拟了子宫环境,还装进仿人类的机器人体内,让“机器人妈妈”从怀孕到分娩,全流程复刻人类体验。谈及研发初衷,张其峰在接受媒体采访时表示,主要是为了满足当代年轻人不想怀孕,还想要孩子的需求。

佳文共赏

37岁退休一周年:经验与心得分享

作者退休一周年后的经验分享,围绕财务准备、心理建设和退休后生活展开。财务准备方面,作者强调“本金多、收益高、支出少”至少满足两个条件,建议利用人力资本积累本金,减少人生重大变量,通过记账制定支出预算,并寻找被动收入。心理建设上,作者指出需明确FIRE目标,做好长期作战准备,考虑安全上的取舍,应对失去工作身份标签后的心理变化,以及“吃苦一代”的退休困境。退休后生活部分,作者分享了自己每天的活动安排,如玩游戏、上网冲浪、学习金融知识等,强调重要的是过程而非结果,同时认为租房并不会没有安全感。作者提醒FIRE并非适合所有人,需谨慎考虑。

通过手机振动检测对话内容

宾夕法尼亚州立大学的研究人员通过毫米波雷达传感器和开源语音识别模型“Whisper”,成功从手机听筒振动中远程解码对话,生成电话通话转录。实验中,雷达传感器在距离手机约3米处捕捉振动,转录准确率约为60%,且可通过上下文校正提升。研究团队将此技术比作唇读,虽信息有限,但结合上下文可推断对话内容。该研究旨在提高公众对隐私风险的意识,提醒人们在敏感通话时注意隐私保护。

技术博客

小红书自研Binlog Server守护MySQL数据0丢失

小红书技术团队自研了Binlog Server,旨在解决MySQL数据库在异常情况下数据丢失的问题,提升数据库的高可用性和数据一致性。该方案通过提升半同步复制性能,加速日志传输,在故障时自动补数据,保证数据一致性。使用极少的资源(1C1G)即可将复制速度提升至300MB/s+,实现复制性能翻倍。目前,该方案已经100%部署于小红书半同步复制集群,在多次切换中为新主库补数据,守护了核心数据库的安全。

Binlog Server支持级联架构,既可以作为Slave节点从上游接收并保存Binlog,也可以作为Master向下游发送Binlog。它支持SQL语法,减少周围系统的开发和适配成本。在性能方面,Binlog Server在小事务压测条件下,写入速度可达300MB/s,资源消耗极低。在高可用支持方面,当主库宕机时,通过ORC组件进行数据切换,确保数据0丢失。

未来,Binlog Server还可以在从库扩容、库表拆分等场景中发挥作用,支持标准MySQL协议,降低主库压力,并使用S3作为存储节省成本。

开源项目

Claude代码安全检查工具

使用Anthropic的Claude Code工具进行深度语义安全分析,以检测代码变更中的安全漏洞。该工具提供智能、上下文感知的安全分析,支持多种编程语言,具有低误报率和快速启动的特点。它还提供了详细的漏洞解释和修复指导,并可通过GitHub Actions轻松集成到开发流程中。

umami:站点分析工具

Umami是一个现代的、注重隐私的Google Analytics替代品,提供简单快速的分析服务。

JsonPath:json读取工具类

JsonPath 是一个 Java DSL,用于读取 JSON 文档。JsonPath 表达式类似于 XPath,用于查询 JSON 结构,支持多种符号表示法和操作符,还提供多种函数和过滤器,可用于提取、筛选和操作 JSON 数据。JsonPath 提供了静态读取 API、流式 API 和配置选项,支持与多种 JsonProvider 集成,还引入了 Cache SPI,方便用户根据需求进行路径缓存配置。

工具推荐

国外技术公司博客合集

来自谷歌、Meta、OpenAI 等顶尖科技公司的技术博客合集。