MoreRSS

site iconHackerNews AI 摘要修改

使用 RPA 方案,每天自动获取 Top Stories ,使用 GPT 方式自动摘要,同时会一并摘要 HackerNews 网友的评论。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

HackerNews AI 摘要的 RSS 预览

2026 04 08 HackerNews

2026-04-08 07:45:11

2026-04-08 Hacker News Top Stories #

  1. 作者Sam Burns制作了一款融合野兽派建筑美学与实用功能的混凝土笔记本支架,通过故意不充分搅拌混凝土和人工锈蚀金属部件来营造城市废墟的破旧质感。
  2. Bram Cohen批评"vibe编码"极端做法会导致代码质量低下,主张开发者应积极参与代码审查而非完全依赖AI自动生成代码。
  3. 该网站通过对比电影《Idiocracy》与现实的政治、企业等现象,讽刺现实世界正逐渐趋近电影中描绘的反乌托邦荒诞情景。
  4. 《韦斯诺斯之战》是一款拥有丰富单人战役和多人地图的跨平台开源奇幻回合制策略游戏,具备活跃社区和高度可扩展性。
  5. Ghost Pepper是一款完全本地运行的macOS语音转文字应用,用户按住Control键即可使用Whisper模型进行隐私保护的语音输入。
  6. GLM-5.1是一款擅长长时任务处理的AI模型,能在长时间迭代中持续优化代码并构建复杂系统,在多项基准测试中表现优异。
  7. 研究人员使用形式化验证方法在阿波罗11号导航计算机的汇编代码中发现了一个潜伏57年的资源锁泄漏漏洞。
  8. 作者因担忧互联网中心化问题,详细介绍了将个人博客CDN从美国Cloudflare迁移至欧洲Bunny.net的全过程及配置方案。
  9. Adobe Creative Cloud被曝未经用户许可擅自修改系统hosts文件以检测软件安装状态,引发类似Sony Rootkit事件的隐私争议。
  10. 该网页以时间线形式梳理了过去30年间49款定义行业发展的关键显卡,展现了GPU技术从早期3D加速到现代光线追踪的演进历程。

1. 展示:野兽派风格混凝土笔记本电脑支架(2024) (Show HN: Brutalist Concrete Laptop Stand (2024)) #

https://sam-burns.com/posts/concrete-laptop-stand/

这篇博客文章介绍了作者 Sam Burns 制作的一款混凝土笔记本电脑支架,设计风格受到了野兽派建筑的启发,融合了城市废墟和衰败的主题。支架采用了原始混凝土表面质感,整体沉重且坚固,配备了两个 2.1 安培的 USB 充电口和一个三插电源插座,此外还内置了一个植物盆。

文章详细描述了支架的关键特点,包括野兽派风格的悬挑设计、带有破损角落和锈蚀钢筋的城市衰败美学、暴露的锈蚀钢筋和铜线、内置的珍珠串植物盆以及人工锈蚀的笔筒。

制作过程分为多个步骤,混凝土浇筑分两次完成,故意不充分搅拌以制造表面砂砾和水泥分布不均的效果,增强陈旧感。植物盆由一个黄油罐改造而成,固定在混凝土中,内置塑料盆栽种植珍珠串植物,营造悬垂效果,呼应城市探险中见到的废弃建筑。

暴露的铜线经过特殊处理,喷洒氨水和水以产生腐蚀效果,模拟损坏的电缆。钢筋则用钢丝刷清理后用水、盐和过氧化氢加速锈蚀。笔筒同样经过盐水和过氧化氢处理,并用混合了丙烯酸颜料和沙子的颜料点缀,模拟苔藓质感。

作者对最终作品非常满意,尽管风格独特且不一定适合所有人,但成功体现了野兽派建筑和城市衰败的主题。由于支架极其沉重,搬运时需用手推车,体现了制作过程的艰辛与价值。


HN 热度 678 points | 评论 214 comments | 作者:sam-bee | 12 hours ago #

https://news.ycombinator.com/item?id=47673360

  • 这款混凝土笔记本支架虽然不符合严格的“野兽派”风格,但作为个人创作项目非常酷且有趣。
  • 为自己制作东西而不考虑市场需求,能带来创作的自由和乐趣。
  • 使用混凝土作为笔记本支架材料可能会导致笔记本底部划伤,不够实用。
  • 有人认为笔记本被刮花反而符合“城市衰败”的主题。
  • 混凝土支架在现代办公环境中显得突兀,不够符合人体工学,也不适合动态办公桌。
  • 皮革或木质笔记本保护壳是更好的选择,既保护设备又美观。
  • 有人喜欢这款支架的外观和设计,认为它是用心之作。
  • 对艺术和设计的专业知识会影响对作品的评价,区分专业指正和自负很重要。
  • 有网友想尝试制作类似的混凝土支架,并考虑用喷漆或破损效果增加个性。
  • 混凝土可以通过添加纤维或使用微水泥等技术做得更薄更轻,适合非结构性物品。
  • 设计竞赛中已有用混凝土制作的轻薄物品,如混凝土独木舟。
  • 混凝土行业有很多添加剂,比如石墨烯,可以增强混凝土的强度和轻量化。

2. 氛围编码教派的疯狂自用行为 (The cult of vibe coding is dogfooding run amok) #

https://bramcohen.com/p/the-cult-of-vibe-coding-is-insane

这篇文章由 Bram Cohen 撰写,标题为《The Cult Of Vibe Coding Is Insane》(“氛围编码教派疯狂”),主要讨论了软件开发中“氛围编码”(vibe coding)和过度“自用”(dogfooding)带来的问题。

作者指出,氛围编码是一种极端做法,开发者完全不去查看代码细节,仅凭与机器的模糊对话来推动项目,这种做法是不现实且荒谬的。虽然机器使用人类语言进行内部处理,且开发团队确实在构建计划文件、技能和规则等基础设施,但完全不深入代码本身会导致重复和混乱,降低软件质量。

文章强调,软件项目常常伴随着技术债务,传统上需要大量时间清理代码,而 AI 辅助编程可以大幅加快这一过程,帮助提高代码质量。作者建议,开发者应与 AI 进行充分沟通,明确问题和改进方向,通过反复讨论和指导,AI 才能高效完成代码清理和优化工作。

作者批评了 Claude 团队过度自用且拒绝查看代码细节的做法,认为这违背了合理的开发流程。作者本人则采用与 AI 对话、逐步审计和改进代码的方法,取得了较好效果。

总结来看,文章的核心观点是:软件质量差是开发者的选择,不应将责任归咎于 AI 工具。合理利用 AI 辅助编程、积极参与代码审查和指导,才能打造高质量的软件。


HN 热度 601 points | 评论 500 comments | 作者:drob518 | 1 day ago #

https://news.ycombinator.com/item?id=47664912

  • 代码质量差并不意味着“vibe coding”不可行,反而说明可以在不遵守传统“好代码”规则的情况下打造成功产品。
  • 许多产品的初始代码都很糟糕,通常是因为时间紧迫和交付压力,第一版代码往往是“先能用”,后续优化很少发生。
  • 商业软件开发的目标是盈利,而非写出优质代码,绝大多数代码在市场检验后不会长期存在,因此花时间写好代码常被视为浪费。
  • 代码的目标更多是可维护性和简洁性,以便团队成员能够理解和处理,避免维护地狱。
  • AI 生成代码需要大量基础设施支持,简单依赖 AI 自动生成代码往往会产生混乱和低质量代码。
  • 通过与 AI 对话制定明确的规格和计划,可以减少代码混乱,提高开发效率,但仍需人工审查和反馈。
  • AI 辅助开发适合有明确需求和规范的场景,模糊或不明确的需求会导致更多反复和低效。
  • AI 辅助开发可以在非专注时间段进行,提高工作灵活性,但仍需人工监督和管理。
  • 在产品尚未找到市场契合点时,快速迭代和“先能用”的代码更重要,产品稳定后才需关注长期可维护性。

3. 我们已经进入低能时代了吗? (Are We Idiocracy Yet?) #

https://idiocracy.wtf/

该网页通过对比电影《Idiocracy》(《低能时代》)中的虚构未来世界与现实世界的现状,展示了两者之间的高度相似性,形成了一个“低能时代接近指数”。内容涵盖政治、企业、娱乐、教育、环境、科学、医疗、司法和文化多个领域,指出现实中许多现象与电影中荒诞设定的惊人吻合。

在政治方面,电影中以娱乐价值和肌肉气质当选总统的设定,与现实中特朗普作为真人秀明星和摔跤名人当选美国总统高度相似。政治活动越来越像娱乐表演,2024 年民主党全国代表大会邀请说唱歌手表演也体现了这一趋势。

企业层面,电影中饮料公司买下监管机构,替代水资源灌溉作物的荒诞情节,与现实中企业游说反对水资源监管、瓶装水销售激增形成呼应。快餐品牌在社交媒体上采取咄咄逼人、恶搞客户的风格,也与现实中品牌社交媒体的“毒舌”行为相符。

娱乐方面,电影中最受欢迎的节目是反复击打男性裆部的恶搞内容,现实中“Jackass”系列和 TikTok 上的高风险挑战同样主导娱乐市场。教育领域,电影中法学学位可在 Costco 批发购买,现实中谷歌、亚马逊、沃尔玛等企业推出企业自有学历项目,逐渐取代传统教育。

环境方面,电影中巨大的垃圾雪崩摧毁城市的设定,与现实中太平洋垃圾带面积巨大、垃圾山持续增长及垃圾滑坡致死事件相呼应。科学领域,电影中智商逐代下降的设定与现实中美国智商首次出现近百年下降趋势相符。

医疗方面,电影中医生完全无能,现实中 AI 聊天机器人替代医生,医疗错误成为美国第三大死因。司法领域,电影中监狱斗殴成为娱乐节目,现实中监狱格斗内容在网络走红,庭审直播吸引大量观众。

文化方面,电影中名字变得荒诞无意义,现实中名人给孩子起奇异名字的现象普遍。整体来看,网页通过大量现实案例与电影设定的对比,揭示了现实社会在多个方面正逐步走向电影中描绘的荒诞未来,形成一种对现实的讽刺与警示。


HN 热度 590 points | 评论 513 comments | 作者:jdiiufccuskal | 14 hours ago #

https://news.ycombinator.com/item?id=47672818

  • 电影《Idiocracy》作为美国文化的辛辣讽刺,令部分观众感到被冒犯,因为他们认同片中“愚蠢者”的形象。
  • 该电影常被部分人用来表达对大众的优越感,成为一种“我与众不同”的标签。
  • 电影被部分人解读为带有优生学色彩,暗示“愚蠢的人繁殖导致愚蠢的人增多”,但也有人认为这只是夸张的喜剧元素。
  • 现实中选举出的领导人行为愚蠢且有害,导致部分观众将电影视为纪录片般的真实写照。
  • 有观点指出人们往往选择对自己不利的政策,反映了社会复杂的投票行为。
  • 电影中的“愚蠢选民”论被批评为过于简化和表面化的分析,忽视了更深层次的社会问题。
  • 电影设定中,精英阶层仍然重视智力,表明社会中对智慧的认知仍存在。
  • 部分观众认为电影的“优生学”论述是基于进化论视角,强调环境和选择压力的变化,而非纯粹遗传决定论。
  • 电影引发了对人类是否持续进步的思考,尤其是在现实中教育和智力水平出现倒退的背景下。
  • 有评论指出电影的讽刺效果在不同社区(如 Hacker News 与 Reddit)中引发不同的理解和反应。
  • 电影的优生学论述缺乏对文化和教育环境影响的平衡讨论,容易被误解为遗传决定论。
  • 有人认为喜欢这部电影并不代表认同其潜在的优生学观点,但应警惕其隐含的社会偏见。

4. 韦斯诺斯之战:开源回合制策略游戏 (Battle for Wesnoth: open-source, turn-based strategy game) #

https://www.wesnoth.org

《The Battle for Wesnoth》是一款开源的回合制策略游戏,拥有浓厚的奇幻主题。游戏支持单人模式和在线或本地多人对战,玩家可以探索 Wesnoth 的世界,参与多样的冒险故事,如夺回王位、逃离巫妖领主、深入地下打造火焰宝石、抵御死灵法师的侵袭,或带领幸存者穿越沙漠对抗未知的邪恶。

游戏特色包括手绘像素风格的单位动画和半写实的对话肖像,提供 17 个单人战役和 55 张多人地图,拥有七大阵营超过 200 种单位,每种单位具备独特技能、武器和法术。玩家可以通过互联网或局域网与其他玩家对战,游戏支持 30 多种语言,并拥有高度可扩展的引擎,结合 WML 和 Lua 脚本,丰富的玩家自制内容可通过官方插件服务器获取。

游戏跨平台支持 Windows、macOS 和 Linux 系统,提供稳定版和开发版两种版本。稳定版适合新手和内容创作者,经过充分测试,包含错误修复和翻译更新;开发版则面向资深玩家和内容创作者,包含最新功能但可能不稳定。两版本均可通过 Steam 和其他平台获取,并支持自动更新。

系统需求方面,稳定版和开发版对硬件要求相似,最低配置为双核 2.0 GHz 处理器、4GB 内存和 800MB 至 2GB 硬盘空间,推荐配置更高,分辨率要求从 800x600 到 1280x720 不等,均需键盘和鼠标操作。

游戏拥有庞大的社区,论坛帖子超过 52 万条,提供丰富的帮助资源。玩家和爱好者可以通过制作插件、贡献代码或测试开发版参与项目。项目接受捐赠,用于维护服务器、网站及艺术和音乐创作,支持渠道包括 Liberapay 和 itch.io。


HN 热度 526 points | 评论 157 comments | 作者:akyuu | 1 day ago #

https://news.ycombinator.com/item?id=47664186

  • 建议联系 Battle for Wesnoth 的主要开发者 Charles Dang,尤其是有美国 C++ 岗位的公司。
  • 即使有多年开源项目经验和补丁贡献,毕业生在当前市场仍然很难找到合适的工作。
  • 一些公司对开源贡献的认可度不高,导致贡献者难以获得回报。
  • 有公司愿意提供 C++ 岗位,并主动联系了 Charles Dang,希望交流。
  • 拥有安全许可的工作机会较多,尤其是在政府和国防相关领域,但获取许可不易且有一定限制。
  • 一些人认为政府和军方工作并非道德败坏,反而是重要且有价值的职业。
  • 对政府工作的负面看法可能导致优秀人才不愿意从事相关岗位,影响行业发展。
  • 有人指出,申请安全许可工作存在风险,可能在了解具体工作内容后选择放弃,但过程耗时且不确定。
  • 部分人对美国政府现状感到失望,担心在政府内部工作的声誉和职业发展受影响。
  • 政府项目中也有许多积极有益的工作,如帮助低收入妇女和儿童的营养项目。

5. Ghost Pepper – macOS 本地按住说话语音转文字 (Show HN: Ghost Pepper – Local hold-to-talk speech-to-text for macOS) #

https://github.com/matthartman/ghost-pepper

该网页介绍了一个名为 Ghost Pepper 的 macOS 本地语音转文字应用,支持 macOS 14.0 及以上版本,适配 Apple Silicon 芯片(M1 及以上)。用户按住 Control 键说话,松开后即可将语音转录并粘贴到任何文本框中。该应用完全在本地运行,不依赖云服务,保证用户数据隐私。

Ghost Pepper 具备智能清理功能,利用本地大型语言模型去除语音中的填充词和自我纠正,提升转录文本的质量。应用以菜单栏程序形式运行,无 Dock 图标,支持开机自启,用户可自定义清理提示词、选择麦克风和开启关闭各种功能。

应用使用多种开源语音模型,包括 Whisper 系列(支持英语及多语言)和 Parakeet v3,清理模型则基于 Qwen 3.5 不同规模版本,兼顾速度和质量。所有模型均通过 Hugging Face 提供,自动下载并缓存。

安装简单,用户下载 DMG 文件,拖入应用程序文件夹,授权麦克风和辅助功能权限后即可使用。辅助功能权限用于全局快捷键和模拟按键粘贴。应用默认启用开机启动,且不在磁盘记录转录内容,保护隐私。

该项目开源,基于 Swift 语言开发,依赖 WhisperKit、LLM.swift、Hugging Face 和 Sparkle 等技术。适合注重隐私的用户使用,尤其是企业或受管理设备,支持通过 MDM 配置预授权辅助功能权限。

Ghost Pepper 的设计理念是提供一个完全本地、免费且高效的语音转文字解决方案,区别于依赖云服务且商业化程度高的同类产品。


HN 热度 449 points | 评论 194 comments | 作者:MattHart88 | 1 day ago #

https://news.ycombinator.com/item?id=47666024

  • 谷歌手机早在几年前就能离线进行语音转文字,且能根据上下文自动纠正,技术成熟且高效。
  • 微软 OneNote 早在 2007 年就有语音转文字功能,但后来转向在线模型维护。
  • Windows XP 时代已有语音识别功能,需训练适应用户声音。
  • OS/2 系统在 1996 年就内置了语音识别功能。
  • 一些用户觉得 macOS 和 Android 默认的语音转文字准确度不高,转而使用第三方或开源模型如 MacWhisper。
  • 最新开源本地语音识别模型(如 Whisper、Parakeet)在嘈杂环境和口音适应上表现更好,但仍存在偶尔识别错误和“幻觉”问题。
  • macOS 和 iOS 内置的语音识别功能可以本地运行,但部分情况下会将数据发送给苹果服务器以改进服务。
  • 用户可以通过断网测试确认部分语音识别确实完全本地运行,但内置模型效果一般,第三方模型可能更好。
  • 大型语言模型(LLM)在转录准确度上优于传统语音识别,但偶尔会出现误识别或重复词汇的情况。
  • Linux 用户可以使用如 HyprWhspr 等开源项目,结合 GPU 支持,获得较好的本地语音转文字体验。

6. GLM-5.1:面向长时任务 (GLM-5.1: Towards Long-Horizon Tasks) #

https://z.ai/blog/glm-5.1

GLM-5.1 是一款面向长时任务的下一代旗舰模型,具备比前代更强的编码能力,在复杂软件工程任务中表现出色,尤其在 SWE-Bench Pro、NL2Repo 和 Terminal-Bench 2.0 等基准测试中领先。与之前的模型不同,GLM-5.1 能够在长时间、多轮迭代中持续优化,处理模糊问题时判断力更强,能有效分解复杂问题,进行实验、分析结果并精准识别瓶颈,随着运行时间增加,性能不断提升。

在三个不同场景的测试中展现了其长时优化能力:

  1. 向量数据库优化(600 多次迭代):在 VectorDBBench 挑战中,GLM-5.1 突破了原先 50 轮工具调用的限制,经过 600 多次迭代和 6000 多次工具调用,QPS 从之前的 3547 提升至 21500,约为之前最佳结果的 6 倍。优化过程呈阶梯状,模型通过结构性策略调整不断突破性能瓶颈。
  2. 机器学习工作负载优化(1000 多轮):在 KernelBench 中,GLM-5.1 针对 GPU 内核进行加速优化,最终实现 3.6 倍的速度提升,且优化过程持续较长时间,表现优于 GLM-5 和 Claude Opus 4.5,但略逊于 Claude Opus 4.6。
  3. 构建 Linux 桌面环境(8 小时持续迭代):面对无明确量化指标的开放式任务,GLM-5.1 通过自我审查和持续改进,逐步完善网页应用,从基础布局到文件浏览器、终端、文本编辑器等功能模块,展现了其在开放式复杂任务中的持续进化能力。

整体来看,GLM-5.1 不仅在初期表现优异,更重要的是其在长时、多轮迭代中的持续优化能力,使其在复杂软件工程和开放式任务中具备显著优势。


HN 热度 379 points | 评论 110 comments | 作者:zixuanlimit | 7 hours ago #

https://news.ycombinator.com/item?id=47677853

  • OpenAI 和 Anthropic 缺乏护城河,未来 AI 趋势是本地或私有推理。
  • 目前还没有出现真正的杀手级产品,鼓励大家继续努力开发。
  • GLM-5.1 在生成代码方面表现优于 Opus 和 Codex,但在长上下文中偶尔会出现异常。
  • 通过合理管理上下文窗口(如定期压缩或新开会话)可以缓解模型在长上下文中的问题。
  • 本地运行大型模型存在硬件门槛,但通过 SSD 卸载和缓存技术可以部分解决性能瓶颈。
  • GLM-5.0 和 5.1 在模糊任务和代码理解方面表现出色,性价比高且支持本地运行。
  • 目前开源模型在某些任务上已经接近甚至超越闭源模型,提升了用户选择的多样性。
  • 通过批量处理任务和优化缓存管理可以提高本地模型的计算效率。
  • 长上下文管理仍是挑战,部分用户倾向于频繁清理或压缩上下文以保证模型稳定性。
  • 速度和效率是评价模型质量的重要指标,部分模型在代码优化方面表现突出。
  • 未来期待有更快版本的 GLM 模型,以支持更高效的本地推理和编码工作。

7. 我们发现了阿波罗 11 号导航计算机代码中一个未被记录的漏洞 (We found an undocumented bug in the Apollo 11 guidance computer code) #

https://www.juxt.pro/blog/a-bug-on-the-dark-side-of-the-moon/

这篇文章讲述了阿波罗导航计算机(AGC)中一个被忽视了 57 年的软件缺陷。AGC 是历史上最受关注的代码库之一,经过无数开发者和学者的深入研究,但依然存在一个资源锁泄漏的漏洞,影响了陀螺仪控制代码的正常运行。

作者利用开源的行为规范语言 Allium,将 13 万行 AGC 汇编代码提炼成 1.25 万行规格说明,从中发现了这个缺陷。该缺陷涉及 IMU(惯性测量单元)子系统中的 LGYRO 资源锁:当陀螺仪扭矩操作被“caging”(紧急锁定)中断时,代码没有释放该锁,导致后续操作挂起,无法重新校准导航平台。

文章还描述了这一缺陷在阿波罗 11 号任务中的潜在影响。指令舱飞行员迈克尔·柯林斯在绕月轨道执行星光对准时,若误触发了 cage 开关,可能导致导航计算机挂起陀螺仪操作,无法完成对准,进而影响返回地球的引擎点火方向。虽然重启计算机可以解决问题,但在当时的紧张环境下,这种故障难以被及时诊断。

文中还提到,AGC 的代码由玛格丽特·汉密尔顿领导的团队开发,开创了优先级调度、异步多任务处理和软件错误恢复等概念。虽然 AGC 代码经过严格审查,但这类基于资源管理的缺陷依然未被发现,显示出传统代码阅读和仿真方法的局限性。

总结来说,文章揭示了一个深藏的软件缺陷,强调了形式化规格和行为建模在发现复杂系统错误中的重要作用,同时也展现了阿波罗导航计算机软件工程的先进性和复杂性。


HN 热度 372 points | 评论 180 comments | 作者:henrygarner | 13 hours ago #

https://news.ycombinator.com/item?id=47673005

  • Apollo 11 导航计算机代码中确实存在一个已知的 bug,该 bug 在阿波罗 14 和 15 之间被修复,且不会像文章描述的那样静默发生。
  • 该 bug 在特定情况下会导致多个任务堆积,最终触发类似 1202 报警的错误,且正常操作中很难触发该问题。
  • Apollo 11 软件的恢复和分析工作非常复杂,部分代码来自打印稿,部分来自核心存储器转储,且经过了详细的门级分析和仿真验证。
  • 阿波罗 11 着陆时的 1202 报警并非简单的传感器错误,而是在特定条件下可能导致严重后果,不能简单忽略。
  • 现代对阿波罗任务的理解更全面,知道了更多潜在的失败模式,因此现在的着陆操作更为谨慎。
  • 当时的计算能力极其有限,航天器安全性非常依赖于有限的导航和控制系统,风险极高。
  • 宇航员对航天器结构的脆弱性有直观感受,意识到生命仅被薄薄的铝层保护。
  • 阿波罗计划中虽然飞行任务中无人死亡,但早期测试和准备阶段有多名宇航员牺牲,不能忽视这些牺牲。

8. 放弃 Cloudflare,转用 Bunny.net (Dropping Cloudflare for Bunny.net) #

https://jola.dev/posts/dropping-cloudflare

这篇文章介绍了作者将个人博客的内容分发网络(CDN)服务从 Cloudflare 迁移到 bunny.net 的原因和具体操作步骤。

作者长期使用 Cloudflare,认可其免费且功能强大的服务,但担心过度依赖单一美国公司带来的风险和互联网中心化问题,因此寻找替代方案。bunny.net 是一家欧洲斯洛文尼亚公司,提供与 Cloudflare 竞争的 CDN 服务,性能优异且支持欧洲技术生态,成为作者的首选。

迁移过程中,作者先更换了域名注册商,选择了支持隐私保护且服务更好的 Porkbun。然后详细介绍了如何在 bunny.net 创建和配置“pull zone”(拉取区域),包括填写拉取区域名称、设置源服务器地址、选择服务等级和定价区域等。

接着,作者说明了如何将域名通过 CNAME 记录指向 bunny.net 的 CDN,并激活 SSL 证书,确保网站安全访问。缓存配置部分强调 bunny.net 默认尊重源站的缓存控制头,也支持智能缓存功能,适合大多数场景。作者还分享了自己通过 Phoenix 框架设置缓存头,实现 HTML 页面缓存以提升访问速度的具体代码示例。

最后,文章介绍了一些推荐的默认配置,如强制 SSL、启用 Origin Shield 减少源服务器负载、允许在源站离线时继续提供缓存内容等,提升网站稳定性和用户体验。作者还建议设置边缘规则,将自动生成的拉取区域域名重定向到正式域名,避免搜索引擎混淆。

整体来看,文章不仅分享了从 Cloudflare 迁移到 bunny.net 的动机,还提供了详细的操作指南和优化建议,适合有意更换 CDN 服务的技术用户参考。


HN 热度 363 points | 评论 187 comments | 作者:shintoist | 10 hours ago #

https://news.ycombinator.com/item?id=47675013

  • 文章中使用了大量未明确标注的 Bunny.net 联盟推广链接,存在透明度不足的问题。
  • 未清楚披露推广链接可能会影响作者的信誉,甚至违反相关法律法规。
  • 在美国,类似情况可能违反联邦贸易委员会(FTC)的规定,需明确告知有推广佣金。
  • 英国及其他国家也有类似的监管机构和规定,要求推广时必须披露利益关系。
  • 链接显示为 bunny.net,但实际跳转带有推广参数,给人不诚实的感觉。
  • 虽然作者居住在英国,但互联网是国际化的,推广规范应被普遍遵守。
  • 有人认为推广链接的使用本身没问题,但必须明确告知读者。
  • 讨论中提到不同国家监管机构名称不同,但本质上都要求透明和公平。
  • 有评论指出,免费服务存在未来收费风险,选择收费较低且独立的服务商更可靠。
  • CDN 和 DNS 服务理论上没有供应商锁定,但实际使用中如果依赖特定高级功能,迁移可能不便。

9. Adobe 修改 hosts 文件以检测 Creative Cloud 是否已安装 (Adobe modifies hosts file to detect whether Creative Cloud is installed) #

https://www.osnews.com/story/144737/adobe-secretly-modifies-your-hosts-file-for-the-stupidest-reason/

这篇文章报道了 Adobe Creative Cloud 在 Windows 和 macOS 系统中偷偷修改 hosts 文件的行为。Adobe 通过在 hosts 文件中添加特定的 DNS 条目,利用浏览器加载特定图片的方式,检测用户是否已经安装了 Creative Cloud 软件。此前,Adobe 曾直接通过访问本地端口检测软件,但由于 Chrome 浏览器开始限制本地网络访问,Adobe 改用了修改 hosts 文件的方式。

文章指出,这种行为类似于早期 Sony/BMG 的 rootkit 事件,虽然修改 hosts 文件不算恶意软件级别的攻击,但作为第三方软件擅自修改系统关键文件,仍然非常不妥,且大多数用户对 hosts 文件的作用并不了解。评论区中,用户们讨论了软件对系统的过度控制、AI 辅助编程带来的风险以及软件开发中的质量控制问题。

此外,有用户提到一些工具(如 Chris Titus 的 Windows 清理工具)已经开始针对 Adobe 的这些修改进行拦截和清理,hosts 文件中甚至出现了多达 900 行与 Adobe 相关的屏蔽条目,显示出用户对 Adobe 此类行为的反感和防范。整体来看,文章批评了 Adobe 未经用户同意修改系统文件的做法,认为这不仅侵犯用户权益,也可能带来系统稳定性和数据安全风险。


HN 热度 328 points | 评论 165 comments | 作者:rglullis | 1 day ago #

https://news.ycombinator.com/item?id=47664205

  • Adobe 将旧账户改为“Adobe Creative Cloud Pro”,并且月费翻倍,强制捆绑 AI 功能,导致用户流失。
  • 教学中转向免费和开源软件(FOSS)替代 Adobe 产品,认为核心概念相同,软件只是工具。
  • GNU Image Manipulation Program、Affinity、Darktable、Inkscape 等免费软件可以替代 Photoshop、Illustrator、Lightroom 等 Adobe 产品。
  • Blender 和 DaVinci Resolve 可替代 After Effects 和 Premiere,LibreOffice Draw 可替代 Acrobat Pro。
  • Autodesk 的 Revit 依然是行业难题,但 FreeCAD 的 BIM Workbench 和 BlenderBIM(BonsaiBIM)带来希望。
  • AutoCAD 价格高昂且无永久许可证,缺乏真正替代品,市场有需求但尚无有效开源替代。
  • 目前 AI 技术难以替代复杂的 CAD/CAS 软件,FreeCAD 等开源项目已有一定基础。
  • BricsCAD 和 Rhino 是成熟的 AutoCAD 替代品,Rhino 计划继续保持非订阅模式。
  • 学习行业标准软件对学生有利,但不应被软件厂商的商业模式绑架,尤其是非图形设计专业。
  • 小型公司通常不强制要求使用特定软件,反而欢迎使用免费软件以节省许可费用。
  • 不使用行业标准软件可能带来文件兼容、色彩管理和协作等问题,但 Adobe 垄断现状令人不满。
  • 对于建筑学生,重点是支持 3D 建模和 BIM 输出,复杂的出版和设计细节要求较低。
  • 应用程序不应随意修改系统配置文件,操作系统应限制此类行为,防止未经同意的修改。
  • 软件安装路径应尽量限制在用户目录下,避免影响系统全局环境。

10. 每一款重要的显卡 (Every GPU That Mattered) #

https://sheets.works/data-viz/every-gpu

该网页以时间线形式详细介绍了过去 30 年间共 49 款重要显卡的发展历程,涵盖从 1996 年首款消费者 3D 加速卡 Voodoo Graphics,到近年的 RTX 系列和当前一代显卡。内容按时代划分为“开创时代”、“DirectX 时代”、“黄金时代”、“高清游戏时代”、“现代时代”、“RTX 时代”等多个阶段,每个阶段介绍了代表性显卡的发布年份、价格、显存容量、晶体管数量、功耗、计算性能(TFLOPS)以及其定义性的游戏。

开创时代(1996-1999 年)介绍了首批 3D 加速卡,如 Voodoo Graphics 和 NVIDIA 的 RIVA TNT 系列,奠定了 3D 图形加速的基础。DirectX 时代(2000-2003 年)则突出显卡首次支持可编程着色器和 DirectX 9.0,ATI 和 NVIDIA 展开激烈竞争。黄金时代(2004-2007 年)见证了统一着色器架构的诞生,NVIDIA 推出了革命性的 GeForce 8800 GTX,开启了 GPU 通用计算(CUDA)时代。

高清游戏时代(2008-2012 年)显卡性能大幅提升,AMD 和 NVIDIA 在制程工艺和显存技术上不断突破,支持 DirectX 11 和更高的计算性能。现代时代(2013-2017 年)显卡进一步提升效率和性能,推出了多款经典型号如 GTX 970 和 GTX 1080,成为主流 1080p 及高端游戏的首选。RTX 时代(2018 年起)引入了硬件光线追踪和 AI 超采样(DLSS)技术,开启了图形渲染的新纪元。

整体来看,网页通过显卡的技术参数、市场定位和代表游戏,清晰展现了 GPU 行业的技术演进和市场变迁,反映了从简单 3D 加速到现代复杂图形处理和计算的巨大飞跃。


HN 热度 299 points | 评论 185 comments | 作者:jonbaer | 15 hours ago #

https://news.ycombinator.com/item?id=47672295

  • 该 GPU 列表看起来像是由 LLM 生成的描述,缺乏真正的策划和深度思考。
  • 90 年代真正重要的 GPU 主要是 3dfx 和 NVIDIA,其他品牌的 3D 加速器性能提升有限。
  • S3 ViRGE 和 Matrox G200 虽然当时流行,但长期影响不大,甚至被认为性能较差。
  • S3 Savage3D 开创了纹理压缩技术,对游戏纹理存储和加载有重要影响。
  • Matrox 显卡在多显示器支持和电视输入输出方面有创新,但游戏支持较弱。
  • GeForce RTX 4000 和 5000 系列的实际影响力存在争议,有观点认为其提升有限。
  • 早期 GPU 如 Voodoo 和 Rendition VQuake 在图形抗锯齿和性能上有一定突破。
  • 许多游戏曾因纹理压缩技术未被充分利用,导致资源浪费和下载时间过长。
  • 现代软件和服务常依赖用户反馈来改进产品,但这种做法引发了对责任归属的质疑。
  • Matrox G200 曾支持通过插槽扩展显存,并具备复合视频输出功能,适合多种用途。

Hacker News 精彩评论及翻译 #

Show HN: Brutalist Concrete Laptop Stand (2024) #

https://news.ycombinator.com/item?id=47676122

This man poured concrete around a power strip, chemically aged copper with ammonia, rusted rebar with peroxide, faked a damaged cable for vibes, and vibrated out the air bubbles with a dildo. This is the most unhinged and delightful Show HN I’ve ever seen.

atlgator

这个男人在电源插座周围浇了混凝土,用氨水化学氧化铜,用过氧化氢让钢筋生锈,伪造了一根损坏的电缆来制造氛围,还用震动棒振出了气泡。这是我见过的最疯狂又最有趣的Show HN。


Show HN: Ghost Pepper – Local hold-to-talk speech-… #

https://news.ycombinator.com/item?id=47667921

This thread is a support group for people who have each independently built the same macOS speech-to-text app.

atlgator

这个帖子是一个支持小组,成员们各自独立开发了相同的macOS语音转文字应用。


Are We Idiocracy Yet? #

https://news.ycombinator.com/item?id=47673539

I attended an audience testing screener for Idiocracy before the film’s final edit. I could not believe my eyes and ears, I loved it unlike anything I’d seen before, it was the hardest US culture satire I’d seen up to that point. Then the lights came up and the audience started giving their reviews, in an open mike fashion. They all identified with the “idiots” and were indignant insulted, and angry. I remember making eye contact with Mike Judge like “WTF!” It was an early screener and I think that reaction was a surprise to the film team. I own a copy and watch it more than once a year. One of my favorite hard satires.

bsenftner

我参加过《低能时代》电影最终剪辑前的观众测试放映。我简直不敢相信自己的眼睛和耳朵,我非常喜欢它,感觉以前从未见过这样的作品,这是我当时见过的最犀利的美国文化讽刺片。然后灯亮起来,观众开始用开放麦克风的方式发表意见。他们都认同“傻瓜”这一角色,感到愤怒、受辱和愤慨。我记得当时和导演迈克·贾奇对视,心里想“这是怎么回事!”那是一次早期放映,我觉得这种反应让影片团队很意外。我买了一份拷贝,每年至少看一遍。这是我最喜欢的尖锐讽刺片之一。


Show HN: Stop paying for Dropbox/Google Drive, use… #

https://news.ycombinator.com/item?id=47675655

Why wouldn’t I trust a vibe coded app that has existed for 1 week with all my important data?

sumeno

为什么我不信任一款存在仅一周却存有我所有重要数据的vibe编码应用?


Sam Altman may control our future – can he be trus… #

https://news.ycombinator.com/item?id=47671325

Ronan Farrow, the write of this article, made a comment in this thread that is buried in all the comments, “As is always the case with incredibly precise and rigorously fact-checked reporting like this, where every word is chosen carefully (the initial closing meeting for this one was nearly eight hours long, with full deliberation about each sentence), there is more out there on that subject than is explicitly on the page.”

I saw that before I read the article and it made me read the article in a very different way than I normally do. As I was reading, I found myself thinking, “Why is it worded that way? What else is the writer trying to say, or not say?”

It made reading this a lot more interactive than I normally associate with passive reading. Great job, Ronan!

rupi

这篇文章的作者罗南·法罗在评论区里埋藏了一条评论:“像这样极其精准且经过严格事实核查的报道,每个词都经过仔细斟酌(这篇报道的初步闭门会议就开了将近八个小时,对每句话进行了充分讨论),实际上关于这个主题的信息远比文章中明确写出的要多。”

我在读文章前看到了这条评论,这让我以一种与平常完全不同的方式去阅读文章。读着读着,我发现自己在想:“为什么会这样措辞?作者还在尝试表达什么,或者刻意不说些什么?”

这让我的阅读体验比平时那种被动阅读更具互动性。罗南,干得好!


Sam Altman may control our future – can he be trus… #

https://news.ycombinator.com/item?id=47668579

Yes, but first I want to be very clear on some things.

  1. I could have hidden my identify behind a throwaway. I did not feel that would be appropriate when making this calim.

  2. I am not looking for anything, literally at all. Any follow ups for blogs; anything that would benefit I will not answer.

  3. This is NOT a new account, I am very easy to find; I am 6'1 140lbs

I was working for a company called NationBuilder and I had the opportunity to go on a work trip. Outside of a talk he had just given I was waiting for my ride and I looked over like…damn thats the speaker. I wanted to say Hi; he damn near flagged down the police. I apologized and just decided to move on.

Note: It was in Reno, and no I don’t want to go into details; the others are not hard to find because I happened upon them via blog posts so i’m sure if someone with the accumen of RF wants to know, he will find.

I have heard similar stores from several people in the years since. I AM NOT CALLING THIS PERSON RACIST. I am saying; he is observably scared of black people and that is not someone I want making descions about how the world moves foward.

arionhardison

是的,但我首先想对一些事情明确说明。

  1. 我本可以用一个临时账号隐藏身份,但在做出这个声明时,我觉得那样不合适。

  2. 我完全不寻求任何回报。无论是博客的后续采访,还是任何可能带来好处的事情,我都不会回应。

  3. 这不是一个新账号,我很容易被找到;我身高6英尺1英寸,体重140磅。

我曾在一家名为NationBuilder的公司工作,有一次参加出差。那次在一场演讲结束后,我等着接我的车,突然看到——哇,那就是演讲者。我想打个招呼,但他差点把警察叫来了。我道了歉,然后决定不再理会。

备注:地点是在雷诺,我不想透露细节;其它相关事件不难找到,因为我是在博客文章中偶然发现的,所以如果有人像RF那样敏锐,想了解的话,一定能找到。

这些年来,我听过好几个人讲过类似的故事。我不是在说这个人种族歧视。我是说,他明显害怕黑人,而这样的人我不希望他来决定世界的发展方向。


Sam Altman may control our future – can he be trus… #

https://news.ycombinator.com/item?id=47664087

As is always the case with incredibly precise and rigorously fact-checked reporting like this, where every word is chosen carefully (the initial closing meeting for this one was nearly eight hours long, with full deliberation about each sentence), there is more out there on that subject than is explicitly on the page.

ronanfarrow

正如这类极其精准且经过严格事实核查的报道一贯如此,每个词都经过细致斟酌(这篇报道的最初闭幕会议将近八个小时,针对每一句话进行了全面讨论),关于这个主题实际上还有更多内容未明言于文中。


Sam Altman may control our future – can he be trus… #

https://news.ycombinator.com/item?id=47667992

Hi @ronanfarrow — I have only had one interaction with Sam Altman in person, and I was advised to keep it to myself. I know this crowd may not care, but Altman is absolutely terrified of Black people — not in any contextual sense, but in a visceral, instinctive way. For someone who, as you put it, “controls our future,” this should matter.

FYI: I am by far not the only one to have experienced this and it 100% impacts hiring and other decisions at OpenAI.

arionhardison

嗨,@ronanfarrow——我只和Sam Altman本人有过一次接触,当时有人建议我不要说出去。我知道这群人可能不在意,但Altman对黑人感到非常恐惧——不是在任何情境上的恐惧,而是本能的、发自内心的害怕。对于你说的“掌控我们未来”的人来说,这一点很重要。

顺便说一句,我绝不是唯一有这种体验的人,这完全影响了OpenAI的招聘和其他决策。


My Experience as a Rice Farmer #

https://news.ycombinator.com/item?id=47671774

As a child, I grew up in a village in China and our family farmed rice. It was mostly my mom who was doing the farming while my dad worked in the city.

Some things I remember:

  • Seeing hired buffalos tilling our fields

  • Playing with frogs and catching tadpoles in the fields

  • Someone with a machine that removes the husks would come to our village during harvest

  • The smell of rice fields. I recently smelled it again and it’s very comforting.

Now I work in high tech, working on AI, and the fancy stuff. There is just something about rice fields that I love - maybe just memories, childhood, smell, how serene it looks when it’s full.

My one hope for AI, robotics, self driving cars, is that they can enable more people in cities to migrate back to rural places. When I was younger, I used envy those who grew up privileged in a big modern city. Nowadays, I absolutely am glad I grew up in a little village in a farming community and I consider myself lucky to have.

aurareturn

小时候,我在中国的一个村庄长大,我们家种植水稻。大多数农活都是妈妈干的,爸爸则在城里工作。

我记得的一些事情:

  • 看到雇来的水牛在耕田

  • 在田里玩青蛙,抓蝌蚪

  • 收割季节时,有人会开着一台机器到村里来脱壳

  • 稻田的气味。最近我又闻到了那味道,感觉非常安慰。

现在我从事高科技工作,专注于人工智能和各种先进技术。但我就是特别喜欢稻田——也许是因为记忆、童年、那股味道,或者是稻田丰收时的宁静景象。

我对人工智能、机器人和自动驾驶汽车唯一的希望,就是它们能让更多城市人迁回农村。当我年轻时,曾羡慕那些在大现代城市长大的特权阶层。现在,我非常庆幸自己是在一个小村庄、农业社区长大的,我觉得自己很幸运。


The cult of vibe coding is dogfooding run amok #

https://news.ycombinator.com/item?id=47665731

I suspect if people saw the handwritten code of many, many, many products that they used every day they would be shocked. I’ve worked at BigCos and startups, and a lot of the terrible code that makes it to production was shocking when I first started.

This isn’t a dig at anyone, I’ve certainly shipped my share of bad code as well. Deadlines, despite my wishes sometimes, continue to exist. Sometimes you have to ship a hack to make a customer or manager happy, and then replacing those hacks with better code just never happens.

For that matter, the first draft of nearly anything I write is usually not great. I might just be stupid, but I doubt I’m unique; when I’ve written nice, beautiful, optimized code, it’s usually a second or third draft, because ultimately I don’t think I fully understand the problem and the assumptions I am allowed to make until I’ve finished the first draft. Usually for my personal projects, my first dozen or so commits will be pretty messy, and then I’ll have cleanup branches that I merge to make the code less terrible.

This isn’t inherently bad, but a lot of the time I am simply not given time to do a second or third draft of the code, because, again, deadlines, so my initial “just get it working” draft is what ships into production. I don’t love it, and I kind of dread of some of the code with my name attached to it at BigCo ever gets leaked, but that’s just how it is in the corporate world sometimes.

tombert

我怀疑如果人们看到许多他们每天使用的产品的手写代码,会感到震惊。我曾在大型公司和初创公司工作,许多进入生产环境的糟糕代码在我刚开始时都让我大吃一惊。

这不是针对任何人,我自己也确实写过不少糟糕的代码。尽管我有时不愿意,但截止日期依然存在。有时候你不得不为了让客户或经理满意而采用临时的解决方案,而这些临时方案往往从未被替换成更好的代码。

此外,我写的几乎任何东西的第一稿通常都不是很好。可能是我不聪明,但我怀疑我并不孤独;当我写出漂亮、优雅、优化过的代码时,通常是第二稿或第三稿,因为我觉得在完成第一稿之前,我并没有完全理解问题和可以做出的假设。通常在我的个人项目中,我的头十几次提交会相当混乱,然后我会有清理的分支合并进去,使代码不那么糟糕。

这本身并不是坏事,但很多时候我根本没有时间做第二稿或第三稿代码,因为截止日期依然存在,所以我最初那个“先让它能运行”的草稿就是投产版本。我并不喜欢这样,也有点害怕自己署名的一些代码在大公司一旦泄露,但在企业世界里,有时候事情就是这样。


Issue: Claude Code is unusable for complex enginee… #

https://news.ycombinator.com/item?id=47662808

Not claude code specific, but I’ve been noticing this on Opus 4.6 models through Copilot and others as well. Whenever the phrase “simplest fix” appears, it’s time to pull the emergency break. This has gotten much, much worse over the past few weeks. It will produce completely useless code, knowingly (because up to that phrase the reasoning was correct) breaking things.

Today another thing started happening which are phrases like “I’ve been burning too many tokens” or “this has taken too many turns”. Which ironically takes more tokens of custom instructions to override.

Also claude itself is partially down right now (Arp 6, 6pm CEST): https://status.claude.com/

summarity

这不是针对Claude代码的特定问题,但我注意到Opus 4.6模型在Copilot等平台上也有类似情况。每当出现“最简单的修复”这个短语时,就该拉紧急刹车了。过去几周这种情况变得越来越严重。它会生成完全没用的代码,明知故犯(因为在出现这个短语之前,推理是正确的),结果把东西弄坏了。

今天又出现了另一种情况,比如“我已经消耗了太多的令牌”或者“这已经花费了太多回合”这样的表达。具有讽刺意味的是,要覆盖这些说法,反而需要更多的自定义指令令牌。

另外,Claude本身现在部分服务中断(Arp 6,欧洲中部时间下午6点):https://status.claude.com/


Sam Altman may control our future – can he be trus… #

https://news.ycombinator.com/item?id=47662398

Gobsmacking details about Altmans’ time as Y Combinator president, in case anyone’s wondering.

Fantastic reporting.

kmfrk

关于奥特曼担任Y Combinator总裁期间令人震惊的细节,以防有人感兴趣。

报道非常精彩。


Issue: Claude Code is unusable for complex enginee… #

https://news.ycombinator.com/item?id=47664246

I’m the author of the report in there. The stop-phrase-guard didn’t get attached but here it is: https://gist.github.com/benvanik/ee00bd1b6c9154d6545c63e06a317080

You can watch for these yourself - they are strong indicators of shallow thinking. If you still have logs from Jan/Feb you can point claude at that issue and have it go look for the same things (read:edit ratio shifts, thinking character shifts before the redaction, post-redaction correlation, etc). Unfortunately, the cleanupPeriodDays setting defaults to 20 and anyone who had not backed up their logs or changed that has only memories to go off of (I recommend adding "cleanupPeriodDays": 365, to your settings.json). Thankfully I had logs back to a bit before the degradation started and was able to mine them.

The frustrating part is that it’s not a workflow or model issue, but a silently-introduced limitation of the subscription plan. They switched thinking to be variable by load, redacted the thinking so no one could notice, and then have been running it at ~1/10th the thinking depth nearly 24/7 for a month. That’s with max effort on, adaptive thinking disabled, high max thinking tokens, etc etc. Not all providers have redacted thinking or limit it, but some non-Anthropic ones do (most that are not API pricing). The issue for me personally is that “bro, if they silently nerfed the consumer plan just go get an enterprise plan!” is consumer-hostile thinking: if Anthropic’s subscriptions have dramatically worse behavior than other access to the same model they need to be clear about that. Today there is zero indication from Anthropic that the limitation exists, the redaction was a deliberate feature intended to hide it from the impacted customers, and the community is gaslighting itself with “write a better prompt” or “break everything into tiny tasks and watch it like a hawk same you would a local 27B model” or “works for me <in some unmentioned configuration>” - sucks :/

noxa

我是那个报告的作者。停止短语保护没有附上,但这里有链接:https://gist.github.com/benvanik/ee00bd1b6c9154d6545c63e06a317080

你自己也可以监控这些——它们是浅层思考的强烈指标。如果你还保留着一二月份的日志,可以让Claude针对那个问题去查找同样的情况(比如阅读:编辑比例的变化,删减前思考字符的变化,删减后的相关性等)。不幸的是,cleanupPeriodDays 默认设置为20天,任何没有备份日志或更改该设置的人现在只能靠记忆了(建议在 settings.json 里加上 "cleanupPeriodDays": 365,)。幸好我保留了降级开始前一段时间的日志,才得以挖掘出这些信息。

令人沮丧的是,这既不是工作流程问题,也不是模型问题,而是订阅计划中悄悄引入的限制。他们根据负载让思考能力变得可变,删减了思考内容使没人察觉,然后一个月来几乎全天候以大约十分之一的思考深度运行。这是在开启了最大努力、自适应思考关闭、最大思考令牌数很高的情况下。不是所有提供商都会删减或限制思考,但一些非Anthropic的提供商是这么做的(大多数不是API计费)。对我个人来说,遇到的问题是那种“兄弟,如果他们悄悄削弱了消费者计划,你就去买企业版!”的想法是对消费者非常不友好的:如果Anthropic的订阅版相比其他相同模型的访问表现明显更差,他们就应该对此进行明确说明。现在Anthropic完全没有任何迹象表明存在这种限制,删减是故意设计的功能,目的是让受影响的用户察觉不到,而社区却在自欺欺人地说“写一个更好的提示词”或者“把任务拆得很细,然后像盯本地27B模型一样密切监控它”或者“在我某种未提及的配置下可以用”,真是糟透了 :/


Issue: Claude Code is unusable for complex enginee… #

https://news.ycombinator.com/item?id=47663016

That analysis is pretty brutal. It’s very disconcerting that they can sell access to a high quality model then just stealthily degrade it over time, effectively pulling the rug from under their customers.

matheusmoreira

这个分析非常严厉。他们能卖出高质量模型的使用权,然后悄无声息地逐渐降低模型的性能,实际上是在暗中坑害客户,这让人非常不安。


AI singer now occupies eleven spots on iTunes sing… #

https://news.ycombinator.com/item?id=47662929

I have no doubt that those numbers have been inflated by AI powered marketing tools, dead internet theory style.

leviathant

我毫不怀疑那些数字是被AI驱动的营销工具夸大了,就像“死亡互联网理论”那样。


Issue: Claude Code is unusable for complex enginee… #

https://news.ycombinator.com/item?id=47668520

Thanks for the feedback IDs — read all 5 transcripts.

On the model behavior: your sessions were sending effort=high on every request (confirmed in telemetry), so this isn’t the effort default. The data points at adaptive thinking under-allocating reasoning on certain turns — the specific turns where it fabricated (stripe API version, git SHA suffix, apt package list) had zero reasoning emitted, while the turns with deep reasoning were correct. we’re investigating with the model team. interim workaround: CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 forces a fixed reasoning budget instead of letting the model decide per-turn.

bcherny

感谢反馈,ID们——我已经阅读了所有5份对话记录。

关于模型表现:你的会话中每次请求都会发送 effort=high(通过遥测确认),所以这不是默认的 effort。数据表明在某些回合中,适应性思考对推理的分配不足——具体出现虚构信息的回合(stripe API 版本、git SHA 后缀、apt 软件包列表)完全没有输出推理,而那些有深度推理的回合则是正确的。我们正在与模型团队进行调查。临时解决方案是:设置 CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1,可以强制使用固定的推理预算,而不是让模型每轮自定决定。


2026 04 07 HackerNews

2026-04-07 07:46:34

2026-04-07 Hacker News Top Stories #

  1. Google推出AI Edge Gallery应用,让iPhone用户可在本地离线运行Gemma 4等大语言模型,兼顾隐私保护与端侧AI能力。
  2. 开发者创建了仅870万参数的GuppyLM小型语言模型,以简洁代码和浏览器端运行方式帮助理解大语言模型的内部工作原理。
  3. 作者抨击现代服务强制用户下载原生App而削弱网页版体验的做法,主张浏览器在隐私保护、用户自由和扩展性方面的优势。
  4. 文章指出微软三十多年来在Windows桌面应用开发框架上缺乏统一战略,技术路线反复变更与内部斗争导致开发者长期面临困惑。
  5. 瑞士通过公共基础设施开放共享模式实现25 Gbit对称光纤网络领先全球,而美国因区域性垄断和德国因重复建设导致宽带发展滞后。
  6. Claude Code在2月更新后因思考内容显示策略调整和默认努力等级降低,导致处理复杂工程任务的性能显著退化引发用户不满。
  7. 法国央行将存放在纽约联邦储备银行的最后129吨黄金全部运回国内,实现130亿欧元资本收益并完成黄金储备本土化。
  8. OpenAI首席科学家苏茨凯弗在秘密备忘录中指控CEO萨姆·奥特曼隐瞒事实和欺骗董事会,质疑其领导AI安全发展的可信度。
  9. 雇主利用算法分析求职者的个人数据实施"监控定价",以推断其最低薪资接受底线并在薪资谈判中占据信息不对称优势。
  10. 文章介绍如何利用LM Studio 0.4.0无头命令行工具在本地运行Gemma 4模型,借助MoE架构在消费级硬件上实现高效AI推理。

1. Gemma 4 在 iPhone 上 (Gemma 4 on iPhone) #

https://apps.apple.com/nl/app/google-ai-edge-gallery/id6749645337

该网页介绍了一款名为 AI Edge Gallery 的 iPhone 应用,由 Google 开发,属于生产力类别,适用于 iOS 17.0 及以上系统。该应用主打在移动设备上离线运行强大的开源大型语言模型(LLMs),强调隐私保护,所有数据处理均在设备本地完成,无需联网。

最新版本引入了 Gemma 4 系列模型,支持高级推理、逻辑和创造能力。核心功能包括:

  • 代理技能(Agent Skills):将语言模型从对话助手升级为主动助手,支持通过维基百科、交互地图等工具增强模型能力,还能加载社区贡献的模块化技能。
  • 思考模式(Thinking Mode):在 AI 聊天中展示模型的逐步推理过程,帮助用户理解复杂问题的解决方案,目前仅支持 Gemma 4 系列。
  • 图像识别(Ask Image):利用多模态能力,通过摄像头或相册识别物体、解谜或提供详细描述。
  • 语音转录(Audio Scribe):实时将语音录音转写并翻译成文本,使用高效的本地语言模型。
  • 提示实验室(Prompt Lab):提供专门的工作区测试不同提示语和单次使用场景,支持调节模型参数。
  • 移动操作(Mobile Actions):离线控制设备和自动化任务。
  • Tiny Garden 小游戏:通过自然语言种植和收获虚拟花园。
  • 模型管理与基准测试:支持下载多种开源模型,管理模型库并测试性能。

该应用是一个开源项目,面向开发者和 AI 爱好者,鼓励社区贡献技能和功能。性能表现依赖设备硬件(CPU/GPU)。用户可通过 GitHub 查看源代码,并通过指定邮箱反馈意见。

隐私方面,Google 声明应用会收集设备 ID、诊断信息、性能数据等,部分数据可能与用户身份关联,部分则不关联身份。所有数据处理均符合 Google 的隐私政策,且未经过苹果验证。

应用大小为 35.4MB,支持英语,适合 13 岁及以上用户。Google LLC 作为开发者,确认该产品符合欧盟法规。


HN 热度 835 points | 评论 227 comments | 作者:janandonly | 1 day ago #

https://news.ycombinator.com/item?id=47652561

  • Gemma 4 的 E2B 模型可以在手机等边缘设备上本地运行,实现实时音视频输入和语音输出,展示了本地 AI 模型的潜力。
  • 运行本地模型的主要限制是手机的功耗和内存,尤其是 RAM 大小,较新手机的高内存有助于运行更大模型。
  • 本地模型在隐私保护和数据安全方面有优势,适合对隐私要求高的应用场景,如教育领域。
  • 本地模型在推理能力和准确性上仍有差距,存在幻觉和错误回答的问题,尤其是较小的量化模型表现不佳。
  • 通过启用推理功能,模型的回答质量会有所提升,但不同变体表现差异明显。
  • 有建议希望增加对手机系统自动化(如 Siri Shortcuts)的支持,以实现更丰富的本地操作能力。
  • 对于 AI 头部动画的应用存在争议,担心会加剧用户的孤独感。
  • 未来 AI 应用可能会在本地设备和云端两种模式并存,云端适合高成本、高复杂度任务,本地则追求低成本和隐私。
  • 云端推理是否盈利存在争议,部分观点认为推理盈利不确定,训练成本才是主要开销。
  • 有观点认为云端推理更节能高效,但也有人强调本地推理的独特价值和发展潜力。

2. 展示 HN:我构建了一个小型语言模型,以揭示语言模型的工作原理 (Show HN: I built a tiny LLM to demystify how language models work) #

https://github.com/arman-bd/guppylm

该网页介绍了 GuppyLM,一个约 870 万参数的小型语言模型,模拟一条名为 Guppy 的小鱼的对话风格。GuppyLM 通过简短、全小写的句子表达对水、食物、光线和水族箱生活的感受,不理解复杂的人类抽象概念如金钱或政治。该模型基于 60,000 条涵盖 60 个主题的合成对话训练,训练过程简单快捷,约 5 分钟即可在单个 GPU 上完成,模型体积小,甚至可以在浏览器中运行。

架构方面,GuppyLM 采用了 6 层的标准 Transformer 结构,隐藏层维度为 384,注意力头数为 6,词汇表大小为 4096,最大序列长度 128。模型设计简洁,没有复杂的改进机制,使用权重共享的嵌入层和语言模型头。

GuppyLM 的个性设定为友好、好奇且略显笨拙,常常关注食物,语言风格简单直接,反映了鱼类的感官体验。它涵盖的主题包括问候、情绪、温度、食物、光线、水、噪音、夜晚、孤独、气泡、反射、呼吸、游泳、颜色、味道、植物、过滤器、藻类、蜗牛、恐惧、快乐、疲劳、季节、音乐、访客、梦境、时间、记忆、笑话、爱等。

用户可以直接在浏览器中通过 WebAssembly 运行该模型,无需安装或服务器支持,也可以在 Colab 中运行预训练模型进行交互式聊天。开发者还可以通过提供的代码和数据集自行训练模型,支持上传至 HuggingFace 或本地使用。

数据集为“arman-bd/guppylm-60k-generic”,包含约 6 万条样本,格式为输入、输出和类别,类别覆盖 60 种不同主题。项目结构清晰,包含模型训练、推理和交互的完整流程,适合想了解语言模型内部工作原理的用户。


HN 热度 835 points | 评论 126 comments | 作者:armanified | 23 hours ago #

https://news.ycombinator.com/item?id=47655408

  • 该项目代码简洁,是理解多头注意力、ReLU 前馈网络、层归一化和位置编码的好教材,但对不熟悉相关概念的开发者来说理解起来不太直观。
  • 将代码交给大型语言模型(LLM)进行讨论,可以帮助理解代码细节和工作原理。
  • LLM 能解释代码的功能,但难以说明开发者为何采用特定实现方式,代码注释可以帮助模型理解。
  • 使用 AI 辅助理解代码可以减轻开发者负担,非程序员也能借助模型获得技术支持。
  • 代码自带文档的作用有限,文档依然不可或缺,因为代码只能告诉你“怎么写”,而不能说明“为什么这样写”。
  • 该项目类似于教育工具,适合学习 LLM 设计原理,类似于操作系统教学中的 Minix。
  • 对比类似项目(如 Andrej Karpathy 的 microGPT 和 minGPT)有助于理解不同设计选择的影响,但不应强求作者进行全面比较。
  • 该项目不是产品,而是一个有趣的学习项目,适合初学者和研究者参考。
  • 训练数据的范围和质量对模型表现影响大,稀有语言或领域可能需要谨慎使用 LLM 学习。
  • 训练数据全小写导致模型对大写输入反应不佳,但仍能体现一定的角色个性。
  • 通过给大模型输入语法书等资料生成“无限”训练数据的想法存在局限,可能放大原模型的缺陷。
  • 代码简单项目更容易用 LLM 讨论和理解,大型复杂代码库则更难。

3. 我不会下载你的应用程序。网页版就很好。 (I won’t download your app. The web version is a-ok) #

https://www.0xsid.com/blog/wont-download-your-app

这篇博客文章表达了作者对现代应用程序强制用户下载原生 App 而忽视网页版体验的强烈不满。作者指出,许多服务优先推广 App,甚至通过弹窗、模态窗口等方式强迫用户下载,导致网页版被边缘化,尤其在公共服务或实用工具领域,这种做法带来很大不便。

作者强调自己喜欢通过浏览器使用服务,因为浏览器允许更多的自定义和控制,比如使用用户脚本、广告拦截器和扩展来改善体验,而 App 则限制了这些自由。App 开发者则倾向于通过 App 推送通知、收集数据,构建封闭生态以提高用户留存率,背后的动机更多是商业利益而非用户体验。

文章还指出,绝大多数 App 本质上只是通过 API 获取数据并展示文本和媒体,功能简单,却需要用户下载体积庞大的程序,授权各种权限,运行后台进程,显得不合理。即使下载了 App,体验也未必更好,很多 App 存在性能卡顿、界面不流畅等问题,缺乏原生应用应有的细腻和流畅度。

作者总结了“恶化循环”现象:服务先通过开放的网页吸引用户,随后故意削弱网页版功能,强制用户转向 App,App 内广告泛滥且无法屏蔽,用户成为被困的受众。由于商业激励,维护优秀的网页版体验已无利可图,浏览器逐渐沦为 App 推广的入口,尽管这种策略有效,但对用户体验极为不利。


HN 热度 804 points | 评论 473 comments | 作者:ssiddharth | 9 hours ago #

https://news.ycombinator.com/item?id=47661439

  • 对于年轻一代来说,智能手机是他们接触互联网的主要入口,很多人甚至用手机完成作业,而老一辈则习惯于用电脑大屏幕操作。
  • 大屏幕和键盘在处理复杂任务和长文本输入时更为高效,手机操作在某些方面显得笨拙且效率低。
  • 年轻人普遍缺乏熟练使用电脑快捷键和多标签浏览的能力,手机界面隐藏了许多电脑操作的抽象概念。
  • 现代孩子普遍缺乏基本的阅读、写作、打字和数学技能,社交能力差,缺少面对挑战和解决问题的能力。
  • 孩子们缺乏将多个任务整合完成大目标的能力,批判性思维薄弱,过度依赖搜索引擎和 AI 完成任务,缺少动手实践和自主学习的机会。
  • 许多孩子被教育避免犯错,依赖他人或工具完成任务,缺乏主动性和实际操作能力。
  • 大部分大学生仍使用笔记本电脑完成书面作业,手机主要用于阅读,手机做作业的情况较少且不被普遍接受。
  • 手机屏幕比例适合阅读,电脑屏幕越来越宽,界面元素增多反而压缩了有效阅读空间。
  • 网站设计通常限制文本宽度,导致电脑屏幕有大量空白边距,影响屏幕空间的有效利用。
  • 研究显示,过宽的文本行会降低阅读体验,适当的文本宽度更利于阅读理解。

4. 微软自 Petzold 以来就没有一套连贯的图形用户界面策略 (Microsoft hasn’t had a coherent GUI strategy since Petzold) #

https://www.jsnover.com/blog/2026/03/13/microsoft-hasnt-had-a-coherent-gui-strategy-since-petzold/

这篇博客文章由 Jeffrey Snover 撰写,主题是微软在图形用户界面(GUI)策略上的长期混乱和缺乏统一方向。文章回顾了微软自 1988 年以来的 GUI 发展历程,指出微软已经三十多年没有给开发者一个明确、一致的 Windows 桌面应用开发框架。

文章首先提到 1988 年 Charles Petzold 的《Programming Windows》一书,奠定了 Win16 和 Win32 时代的单一、权威的 Windows 应用开发策略,开发者可以依赖这套清晰的模型成功开发应用。

随后,微软进入了“面向对象热潮”时期(1992-2000),推出了 MFC、OLE、COM、ActiveX 等技术,但这些技术增加了复杂度,没有形成统一的开发策略,导致开发者困惑。

2003 年 PDC 大会上,微软发布了 Longhorn 计划,提出了包括 WPF(Avalon)在内的三大技术支柱,WPF 带来了 GPU 加速和 XAML 声明式 UI,技术上非常先进。然而由于内部管理和战略调整,Longhorn 项目被重置,Windows 团队对托管代码产生了抵触,导致 WPF 被边缘化,形成了 Windows 团队与.NET 团队的长期内耗。

2007 年至 2010 年间,微软推出了 Silverlight,作为跨平台的浏览器插件和 Windows Phone 的基础,技术表现良好,但因战略调整被突然放弃,开发者措手不及。

2012 年,微软推出 Windows 8 和 Metro 界面,采用 WinRT 作为新的运行时,但 WinRT 并非基于.NET,Windows 团队与.NET 团队的分歧加剧,开发者面对多种并行技术选择,感到迷茫。

Windows 10 时代,微软推出了 UWP(通用 Windows 平台),理论上支持多设备统一开发,但由于 Windows Phone 的失败和微软自身旗舰应用未采用 UWP,导致 UWP 未能成为主流。随后,微软推出了 WinUI 和 Project Reunion(后更名为 Windows App SDK),试图整合分散的技术,但依然未能彻底解决问题。

文章总结指出,微软的 GUI 技术生态呈现出“无序动物园”状态,缺乏统一的“管理员”,导致开发者在众多技术之间徘徊,经历了多次战略转变和技术重启,给开发者带来了极大困扰。作者批评微软内部的组织和战略决策是造成这一混乱的根本原因。


HN 热度 764 points | 评论 547 comments | 作者:naves | 1 day ago #

https://news.ycombinator.com/item?id=47651703

  • 现代 UI 设计普遍忽视了传统的基本规则,如响应及时、菜单结构清晰、快捷键可见等,导致用户体验下降。
  • 从桌面环境到网页和移动环境,设计规则被重新发明且缺乏统一标准,用户设计习惯被打破。
  • 跨平台设计难以满足不同设备和用户需求,导致界面信息贫乏且不连贯。
  • 缺乏统一的 UI 工具包和标准,浏览器成为事实上的标准,但缺少一致的用户交互习惯。
  • 谷歌未能将 Material UI 标准化嵌入浏览器,导致市场出现大量低质量的 UI 框架。
  • 桌面和移动设备的 UI 需求差异大,难以设计出兼顾两者的通用工具包。
  • 许多网页和移动开发者选择忽视已有的设计规则,导致体验混乱。
  • WinForms 因简单、稳定和跨 Windows 版本兼容性被认为是有效的 UI 解决方案。
  • 细节设计如点击复选框标签应选中复选框等基本交互应严格遵守。
  • 一些微软管理层压制内部缺陷报告,影响团队提升和产品质量。
  • 对话框按钮应使用动词而非“确定/取消”,以避免语义混淆。
  • 电力用户被忽视,桌面平台应重视键盘快捷键和微交互以提升效率。
  • 操作系统厂商更关注广告流量而非操作系统本身,原生应用未来需跨平台且稳定可靠。

5. 为什么瑞士拥有 25 Gbit 互联网而美国没有 (Why Switzerland has 25 Gbit internet and America doesn’t) #

https://sschueller.github.io/posts/the-free-market-lie/

这篇文章由 Stefan Schüller 撰写,探讨了为何瑞士拥有世界领先的 25 Gbit 对称光纤互联网,而美国和德国却落后许多。文章通过比较三国的互联网基础设施和监管模式,揭示了自由市场与监管之间的复杂关系。

文章指出,瑞士的光纤网络采用了“自然垄断”理念,即基础设施由公共或半公共实体建设,作为中立共享资产,所有互联网服务提供商平等接入,用户享有真正的选择权和高速、专用的光纤连接。而美国则形成了区域性垄断,消费者通常只能选择一个提供商,且网络带宽是共享的,导致高峰时段速度大幅下降。德国则推行多家企业各自建设光纤网络的“过度建设”模式,造成资源浪费和重复投资,且监管更多关注基础设施竞争而非共享,导致小型 ISP 难以有效接入。

文章强调,瑞士的成功在于将基础设施视为公共资产,促进服务层面的竞争,而美国和德国则分别陷入了垄断和过度竞争的困境。作者认为,这揭示了资本主义和监管的一个根本真相:在自然垄断行业,合理的监管和基础设施共享是实现高效竞争和优质服务的关键。


HN 热度 748 points | 评论 632 comments | 作者:sschueller | 1 day ago #

https://news.ycombinator.com/item?id=47652400

  • 竞争能推动宽带建设,有时即使是假装有竞争威胁也能促使运营商升级网络。
  • 政府应介入,当私营企业拖延或不作为时,政府可以出资建设市政光纤网络,提供更便宜的服务。
  • 市政自建光纤网络在一些城市已成功实施,能提供稳定且价格合理的宽带服务。
  • 通过市政网络,用户能获得本地化的客户支持,提升服务体验。
  • 有观点认为市政网络会带来资本和运营负担,质疑其长期可持续性。
  • 反复用政府威胁促使私营企业投资可能效果有限,但实际案例显示威胁能促使升级。
  • 有人指出多次尝试促使运营商升级未果,质疑“再试一次”是否有效。
  • 政府介入建设宽带可能面临私营运营商的法律诉讼和阻挠。
  • 一些国家政府通过支付巨额补贴给电信公司,结果未必带来预期的宽带改善。
  • 使用国有企业推动宽带建设是另一种模式,但效果和适用性因国情不同而异。

6. Claude Code 在 2 月更新后无法胜任复杂工程任务 (Issue: Claude Code is unusable for complex engineering tasks with Feb updates) #

https://github.com/anthropics/claude-code/issues/42796

该网页是一份关于 Anthropic 公司旗下 Claude Code 模型在 2026 年 2 月更新后出现性能退化问题的详细报告。报告指出,自 2 月起,Claude Code 在处理复杂工程任务时表现明显下降,无法完成多步骤研究、遵循规范和精细代码修改,导致用户体验变差。

报告通过对近 18,000 个思考块和超过 230,000 次工具调用的数据分析,发现问题与“思考内容删减”策略的实施时间高度吻合。该策略在 2 月中旬开始逐步推行,到 3 月中旬完全生效,导致模型的“思考深度”大幅减少,约下降了 70%。思考深度的减少使模型从“先研究后编辑”的工作流程转变为“先编辑后研究”,降低了代码修改的质量。

具体表现包括:停止钩子违规次数激增,用户提示中的挫败感明显增加,模型需要更多的修正,且每个会话的提示数量减少。此外,模型在编辑代码前的阅读次数大幅下降,表明其减少了对上下文的理解和研究。

报告强调,延展的思考过程对高级工程任务至关重要,删减思考内容直接影响了模型的表现。该分析旨在帮助 Anthropic 理解问题根源,并为未来优化模型的思考令牌分配提供数据支持,以恢复和提升复杂任务的处理能力。


HN 热度 686 points | 评论 438 comments | 作者:StanAngeloff | 10 hours ago #

https://news.ycombinator.com/item?id=47660925

  • Claude Code 团队解释了“redact-thinking-2026-02-12”是一个仅影响界面显示的设置,不影响模型实际思考过程,且可以通过设置文件关闭该功能。
  • 2 月份的更新包括引入自适应思考模式和将默认努力等级调整为中等,这两者共同导致思考深度下降。
  • 用户可以通过设置 effort=high 或使用 ULTRATHINK 关键字来提高模型思考强度,团队计划为企业用户默认开启高努力模式。
  • 有用户反映默认中等努力导致输出质量下降,影响工作效率,期望有“始终尽最大努力”模式。
  • 高努力模式有时会表现出“急于完成”或“懒惰”的行为,与低努力模式类似。
  • 目前无法控制子代理的努力设置,也不能永久设定 /effort max,需通过别名或环境变量实现。
  • 有用户反馈即使设置为高努力,模型仍表现出“急于完成”倾向,团队建议提交 /bug 反馈以便调查。
  • 团队确认部分错误发生在自适应思考模式下模型未分配足够推理资源,建议临时关闭自适应思考以使用固定推理预算。
  • 有观点认为问题不完全是链式思考(CoT)问题,更可能是模型偏好和避免深入的性格特征导致。
  • 不同模型在处理复杂任务时表现不同,Opus 模型更稳定但有时会回避问题,倾向于快速完成任务。
  • 通过让具有专长的代理选择最适合的任务,可以改善模型行为。
  • /bug 报告会包含对话内容,但不会上传用户代码库。

7. 法国夺回美国持有的最后一枚金牌 (France pulls last gold held in US) #

https://www.mining.com/france-pulls-last-gold-held-in-us-for-15b-gain/

法国央行宣布已将存放在纽约联邦储备银行的最后一批黄金全部运回国内。这批黄金重约 129 吨,占法国黄金总储备的 5%。法国自 1920 年代末起将部分黄金存放在美国,尽管 1960 年代曾启动过黄金回流行动,但仍有少量黄金留在纽约。

此次行动源于 2024 年内部审计建议,法国央行于 2025 年 7 月至 2026 年 1 月期间完成操作。与以往直接运回黄金不同,这次选择在欧洲市场出售旧金条并购买符合现代国际标准的新金条。央行行长强调此举并非出于政治动机。

由于金价上涨,这次操作带来了 130 亿欧元(约 150 亿美元)的资本收益,使法国央行 2025 财年实现净利润 81 亿欧元,扭转了 2024 年 77 亿欧元的净亏损。目前法国黄金总储备量保持在 2437 吨不变,全部存放在巴黎拉苏特雷纳的地下金库中。央行还计划在 2028 年前将剩余的 134 吨非标准黄金全部升级为国际标准规格。


HN 热度 552 points | 评论 297 comments | 作者:teleforce | 15 hours ago #

https://news.ycombinator.com/item?id=47658146

  • 法国从 20 世纪 60 年代开始将美元兑换成实物黄金,导致美国黄金储备大幅减少,最终促使布雷顿森林体系崩溃。
  • 布雷顿森林体系设计存在缺陷,要求储备货币国必须持续经常账户赤字,且美国希望美元成为无约束的储备货币,这使体系注定难以持续。
  • 如果美国使用实物金币而非美元,黄金流出的论点不成立,问题在于美国宽松的货币政策,而非金本位本身。
  • 黄金作为价值衡量标准并不合理,因为它只是金属,经济价值应随着世界财富增长而增长,使用黄金会限制经济发展。
  • 虽然黄金是社会构造的产物,但其作为货币具有持久、不易腐蚀、易分割、难以增发等优点,是良好的价值储存手段。
  • 经济增长速度超过黄金产量,黄金供应不足以支持经济扩张,导致黄金货币体系内在通缩风险,通缩会抑制投资和消费。
  • 价值来自于创造和建设,而非囤积,黄金虽被广泛认可为价值顶点,但并非唯一或最优的价值储存方式。
  • 高通胀有害,但通缩更具破坏性,会导致资金囤积,阻碍经济流动性和增长,黄金制度曾导致多次金融危机和经济衰退。
  • 将国家经济增长依赖于黄金产量是不合理的,黄金分布不均且产量有限,历史经验显示金本位制带来严重经济问题。

8. 萨姆·奥特曼可能掌控我们的未来——他值得信任吗? (Sam Altman may control our future – can he be trusted?) #

https://www.newyorker.com/magazine/2026/04/13/sam-altman-may-control-our-future-can-he-be-trusted

这篇文章报道了 OpenAI 首席科学家伊利亚·苏茨凯弗在 2023 年秋季向董事会成员秘密发送备忘录,表达了对首席执行官萨姆·奥特曼及其副手格雷格·布罗克曼是否适合领导公司的严重怀疑。苏茨凯弗曾是两人的朋友,但随着公司接近开发出能匹敌或超越人类认知能力的人工智能,他对奥特曼的信任逐渐消失,认为奥特曼不应“掌控关键按钮”。

备忘录中包含了大量 Slack 消息和人力资源文件,指控奥特曼向高管和董事会成员隐瞒事实,欺骗他们关于内部安全协议的情况。备忘录开头列出了奥特曼的行为模式,其中首项即为“撒谎”。

OpenAI 的创立初衷是不同于一般科技公司,创始人包括奥特曼、苏茨凯弗、布罗克曼和埃隆·马斯克,认为人工智能可能是人类历史上最强大且潜在危险的发明,因此公司设立为非营利机构,董事会有责任优先考虑人类安全而非公司利益。首席执行官必须具备非凡的诚信,承担起构建这种改变文明技术的巨大责任。

苏茨凯弗担忧掌控这项技术的人可能是追求权力的政治家,或者只是迎合他人期望的人。董事会有权在发现首席执行官不可靠时将其解职。部分董事会成员如人工智能政策专家海伦·托纳和企业家塔莎·麦考利,认为备忘录证实了他们对奥特曼的不信任。

最终,苏茨凯弗在一次视频会议中通知奥特曼,他已不再是 OpenAI 的员工,董事会决定解除其职务。文章揭示了 OpenAI 内部对领导层信任危机的深刻矛盾,以及围绕人工智能安全与伦理的紧张局势。


HN 热度 534 points | 评论 170 comments | 作者:adrianhon | 13 hours ago #

https://news.ycombinator.com/item?id=47659135

  • 这篇报道调查耗时 18 个月,记者愿意回答相关问题,体现了报道的深入和严谨。
  • OpenAI 目前在 AI 竞争中处于较为脆弱的位置,Anthropic 在某些方面已超过 OpenAI。
  • 许多开发者更喜欢 Anthropic 的 Claude,认为其产品在某些功能上优于 OpenAI。
  • OpenAI 内部对其竞争地位存在焦虑,尤其关注与 Anthropic 的竞争关系及合作伙伴的财务风险。
  • OpenAI 的技术和产品在客户和合作伙伴中的评价存在分歧,部分用户认为 Codex 在代码质量和维护方面表现更好。
  • Claude 在调试多线程和竞态条件问题上表现出色,但在复杂分布式系统编程上,Codex 和 Claude 都有不足。
  • 一些用户认为 Codex 更适合复杂的开发任务,尤其是长周期项目,且 OpenAI 的 token 限制更宽松。
  • 也有用户认为 Claude 在复杂工具调用方面表现更好,Codex 在代码审查上更有优势。
  • 关于 Sam Altman 的性侵指控,报道调查较为谨慎,未完全否定受害者的记忆问题,但也未找到确凿证据支持指控。
  • 受害者记忆的真实性和心理创伤的复杂性被提及,指出公众对“恢复记忆”的误解和争议。
  • 报道引发了大量讨论和争议,部分评论区出现激烈辩论,平台采取了相应的管理措施。

9. 雇主利用你的个人数据来确定你能接受的最低薪资 (Employers use your personal data to figure out the lowest salary you’ll accept) #

https://www.marketwatch.com/story/employers-are-using-your-personal-data-to-figure-out-the-lowest-salary-youll-accept-c2b968fb

这篇文章讨论了雇主如何利用个人数据来确定员工愿意接受的最低薪资。随着算法和数据分析技术的发展,企业不仅通过个人的购买历史、浏览速度和地理位置等信息影响商品和服务的价格,还开始用这些数据来控制员工的薪资谈判。

文章指出,这种“监控定价”现象已经渗透到招聘和薪资谈判中,雇主通过分析求职者的数字足迹,推断出他们的最低薪资底线,从而在谈判中占据优势。这种做法引发了消费者权益保护组织的关注,因为它可能导致薪资不公平,限制了求职者的议价能力。

总的来说,随着数据收集和分析手段的不断进步,个人数据不仅影响消费价格,也开始影响个人收入,提醒人们在数字时代保护个人隐私和数据安全的重要性。


HN 热度 420 points | 评论 270 comments | 作者:thisislife2 | 23 hours ago #

https://news.ycombinator.com/item?id=47655466

  • 许多公司通过信用记录或第三方服务(如 The Work Number)获取求职者的历史薪资信息,导致信息不对称。
  • 有公司在入职后要求员工证明之前的薪资,若发现不实则可能解雇,尽管这种做法存在法律风险且成本较高。
  • 谎报薪资可能带来短期利益,但长期来看风险大且可能影响未来求职。
  • 面试时应主动提出自己的薪资期望,而非被动透露过去薪资,利用市场调研来支撑自己的薪资要求。
  • 有些地区法律禁止雇主询问或限制薪资信息的使用,求职者可据此保护自己的隐私权。
  • 讨论薪资信息是受法律保护的行为,雇主不应限制员工之间的薪资讨论。
  • 个人应避免在薪资谈判中透露过多历史薪资信息,转而强调自己的价值和市场行情。
  • 通过集体行动或工会组织来对抗不公平的薪资调查和谈判策略是更有效的长期解决方案。
  • 相关薪资数据服务存在不准确和不完整的情况,尤其是自由职业或以公司名义工作的收入往往未被记录。

10. 使用 LM Studio 全新无界面命令行工具在本地运行 Gemma 4 (Running Gemma 4 locally with LM Studio’s new headless CLI and Claude Code) #

https://ai.georgeliu.com/p/running-google-gemma-4-locally-with

这篇文章介绍了如何在本地使用 LM Studio 的新命令行工具(headless CLI)运行谷歌的 Gemma 4 26B 模型,实现本地推理。作者强调本地运行模型的优势,包括避免 API 调用限制、节省费用、保护隐私和减少网络延迟。

Gemma 4 模型采用混合专家(Mixture-of-Experts, MoE)架构,26B 参数模型每次只激活 4B 参数,降低了硬件需求,使得在配备 48GB 统一内存的 MacBook Pro 上可以流畅运行,生成速度达到每秒 51 个 token。MoE 模型在性能与资源消耗之间取得了良好平衡,性能接近更大规模的 31B 密集模型,但运行更快且占用内存更少。

文章还介绍了 Gemma 4 模型家族的不同版本,E 系列支持音频输入,31B 密集模型性能最强,而 26B-A4B 版本在性能和效率上表现最佳,适合本地使用。作者通过性能对比图展示了 Gemma 4 26B-A4B 在模型大小和性能上的优势,指出其在本地推理中的变革性意义。

LM Studio 0.4.0 版本引入了 llmster 核心推理引擎和 lms 命令行工具,支持无界面运行,适合服务器和开发者使用。新版本支持并行请求处理、状态保持的 REST API 和本地模型上下文协议,提升了使用体验。

文章详细说明了安装 lms CLI、启动守护进程、下载 Gemma 4 模型的步骤,并展示了如何查看本地模型库和启动交互式聊天。作者在 MacBook Pro 上测试,模型响应时间约 1.5 秒,性能稳定,适合交互使用。

总结来看,本文为开发者提供了在本地高效运行谷歌 Gemma 4 26B 模型的完整方案,结合 LM Studio 最新工具,实现了低成本、高性能的本地 AI 推理环境。


HN 热度 388 points | 评论 96 comments | 作者:vbtechguy | 1 day ago #

https://news.ycombinator.com/item?id=47651540

  • llama.cpp 服务器可以直接用于本地大语言模型(LLM)服务,支持 Claude Code 等 CLI 代理,部分 Gemma4 模型在 M1 Max 硬件上性能表现优于 Qwen3.5,但在复杂任务上表现不及 Qwen。
  • Claude Code 支持 Anthropic 消息 API,避免了使用 OpenAI 兼容 API 时出现的 400 错误,提升了兼容性。
  • oMLX 作为本地模型运行环境存在一些问题,但被认为是未来趋势,且支持较大上下文窗口。
  • 本地模型推理体验逐渐提升,LM Studio 的无头模式使本地推理更实用,cloclo 等工具支持多种模型提供者,方便在本地和云端之间切换。
  • cloclo 是一个多代理运行时,支持多种模型提供者和工具,区别于 pi-mono 的多功能工具包。
  • 编码代理的核心竞争从工具转向模型质量和成本,模型和工具链都在逐渐商品化。
  • 有观点认为模型被商品化,而工具和强化学习带来的定制化提升仍是主要竞争点。
  • 也有观点认为整体生态都在商品化,最终受益的是适应代理化趋势的工程师和用户。
  • 用户可能会获得更多软件和功能,但软件质量是否提升存在疑虑,担心反用户设计增多。
  • Ollama 支持调整上下文窗口大小,默认大小根据硬件内存自动调整,部分用户需手动修改以避免上下文截断。
  • MoE 模型并不节省显存,只减少每次前向传播的计算量,但通过将专家权重部分放在 CPU 内存可降低显存需求,适合批量任务但交互式体验受限。

Hacker News 精彩评论及翻译 #

Why Switzerland has 25 Gbit internet and America d… #

https://news.ycombinator.com/item?id=47652556

In my small island community, I participated in a municipal committee whose mandate was to bring proper broadband to the island. Although two telecom duopolies already served the community, one of them had undersea fiber but zero fiber to the home (DSL remains the only option), whereas the other used a 670 Mbps wireless microwave link for backhaul and delivery via coaxial cable. And pricing? Insanely expensive for either terrible option.

Our little committee investigated all manner of options, including bringing municipal fiber across alongside a new undersea electricity cable that the power company was installing anyway. I spoke to the manager of that project and he said there was no real barrier to adding a few strands of fiber, since the undersea high voltage line already had space for it (for the power company’s own signaling).

Sadly, the municipality didn’t have any capital to invest a penny into that fiber, so one day, one of the municipal counselors just called up a friend who worked for a fiber laying company and asked them for a favor: put out a press release saying that they were “investigating” laying an undersea fiber to power a municipal fiber network on the little island.

A few weeks later, the cable monopoly engaged a cable ship and began laying their own fiber. Competition works, folks. Even if you have to fake it.

ttul

在我这个小岛社区,我参与了一个市政委员会,任务是为岛上引入合适的宽带。虽然已有两家电信双寡头服务社区,其中一家有海底光纤,但没有到户光纤(DSL仍是唯一选择),另一家则使用670 Mbps的无线微波链路作为回程,并通过同轴电缆进行传输。价格呢?无论哪种选择都贵得离谱,且服务质量糟糕。

我们的小委员会调查了各种方案,包括借助电力公司正在铺设的新海底电缆一起敷设市政光纤。我与该项目的经理交谈,他说敷设几根光纤并无实际障碍,因为海底高压线已有为电力公司自身信号预留的空间。

遗憾的是,市政当局没有任何资金投资这根光纤,所以有一天,一位市政委员给一个做光纤铺设的朋友打电话,向他们求个情:发布一则新闻稿,说他们正在“调查”铺设一根海底光纤,以支持岛上的市政光纤网络。

几周后,那个电缆垄断公司派出铺缆船,开始铺设自己的光纤。竞争有效,朋友们。即使你得假装竞争也是如此。


The cult of vibe coding is dogfooding run amok #

https://news.ycombinator.com/item?id=47665285

It’s truly strange that people keep citing the quality of Claude code’s leaked source as if it’s proof vibe coding doesn’t work.

If anything, it’s the exact opposite. It shows that you can build a crazy popular & successful product while violating all the traditional rules about “good” code.

semicolon_storm

人们不断引用Claude code泄露源码的质量,仿佛这能证明vibe编码行不通,真是太奇怪了。

其实,情况恰恰相反。这表明即使违反了所有关于“好”代码的传统规则,你也能打造出一个极其受欢迎且成功的产品。


Sam Altman may control our future – can he be trus… #

https://news.ycombinator.com/item?id=47660332

Ronan Farrow here. Andrew Marantz and I spent 18 months on this investigation. Happy to answer questions about the reporting.

ronanfarrow

我是罗南·法罗。安德鲁·马兰茨和我花了18个月时间进行了这项调查。很乐意回答关于报道的任何问题。


I won’t download your app. The web version is a-ok #

https://news.ycombinator.com/item?id=47661819

What most people dont get:

Most of folks on HN here are much older than todays “first customers” of 16y/17/18

For them: The “Smartphone is the internet”, while for most of us the “Smartphone is an extension of the internet from our desktops” that we were used to (remember the years before dot com bubble, saying: “I will be down in the basement at the computer to surf on the net little bit” ? :-)

But today, the very first touchpoint with “the internet” for younger folks is a smartphone display. The even do homework on this small screens!

Companies are seeing this switch, so they adapt.

Personally, a service which is “only an app” will be not used by me as I prefer to have a larger screen with more information (actually I use my mobile phone only when Im in public transport or similar, at home I have a notebook laying around if I need something)

KellyCriterion

大多数人没意识到的是:

这里HN上的大多数人年龄比今天的“第一批用户”要大得多,他们才16、17、18岁。

对于他们来说,“智能手机就是互联网”,而我们大多数人则觉得“智能手机是互联网从我们习惯的桌面电脑延伸出来的终端”(还记得网络泡沫时代之前那会儿,有人会说:“我得下到地下室去电脑前上会儿网”吗?:-)

但今天,对于年轻人来说,“互联网”的第一个接触点就是智能手机屏幕。他们甚至在这小屏幕上做作业!

公司们也注意到了这种变化,所以他们在适应。

就我个人来说,只有“一个应用”的服务我不会用,因为我更喜欢用大屏幕看更多信息(实际上我通常只在公共交通上用手机,在家我有笔记本电脑,想用就用)。


What being ripped off taught me #

https://news.ycombinator.com/item?id=47660580

Be paid or don’t work.

I am so deadly serious - do not continue working if your invoices are late.

You don’t have to be a jerk about it, just explain to your primary contact that you need to be paid and you pick up tools again when the money has arrived.

BUT it is on YOU to properly negotiate reasonable payment terms. And if you don;t know or don’t trust the client then require payment in advance until a stronger commercial relationship can be settled in. Do not be a baby - go research business contracts and payment terms.

Do not be afraid to lose business from companies that are squeamish about paying you - in fact actively avoid such companies.

wewewedxfgdf

要么得到报酬,要么别工作。

我是非常认真的——如果你的发票迟迟未付,就不要继续工作。

你不必态度恶劣,只要向你的主要联系人说明你需要收到款项,等钱到了再继续动工。

但合理的付款条款是你自己要谈妥的。如果你不了解或不信任客户,就要求预付款,直到建立起更牢固的商业关系。别幼稚,自己去学习商业合同和付款条款。

不要害怕失去那些对付款犹豫不决的客户,实际上应当主动避免这类客户。


Battle for Wesnoth: open-source, turn-based strate… #

https://news.ycombinator.com/item?id=47665124

Highly suggest connecting with one of the lead developers, Charles Dang/Vultraz, if you have any C++ jobs in the USA.

He’s been a developer on Wesnoth since 2012 but only graduated university in 2024. Unfortunately, it’s been an absolutely brutal market for new graduates. Even if you’re a maintainer on one of the most popular OSS C++ projects on GitHub.

I can’t recommend him enough.

edit: LinkedIn https://www.linkedin.com/in/charles-dang-10994b1b4

jjmarr

强烈建议如果你在美国有任何C++职位,联系首席开发者之一Charles Dang/Vultraz。

他自2012年以来一直是Wesnoth的开发者,但直到2024年才大学毕业。不幸的是,对于新毕业生来说,市场非常残酷。即使你是GitHub上最受欢迎的开源C++项目之一的维护者。

我极力推荐他。

补充:LinkedIn https://www.linkedin.com/in/charles-dang-10994b1b4


Issue: Claude Code is unusable for complex enginee… #

https://news.ycombinator.com/item?id=47664442

Hey all, Boris from the Claude Code team here. I just responded on the issue, and cross-posting here for input.


Hi, thanks for the detailed analysis. Before I keep going, I wanted to say I appreciate the depth of thinking & care that went into this.

There’s a lot here, I will try to break it down a bit. These are the two core things happening:

redact-thinking-2026-02-12

This beta header hides thinking from the UI, since most people don’t look at it. It does not impact thinking itself, nor does it impact thinking budgets or the way extended reasoning works under the hood. It is a UI-only change.

Under the hood, by setting this header we avoid needing thinking summaries, which reduces latency. You can opt out of it with showThinkingSummaries: true in your settings.json (see docs).

If you are analyzing locally stored transcripts, you wouldn’t see raw thinking stored when this header is set, which is likely influencing the analysis. When Claude sees lack of thinking in transcripts for this analysis, it may not realize that the thinking is still there, and is simply not user-facing.

Thinking depth had already dropped ~67% by late February

We landed two changes in Feb that would have impacted this. We evaluated both carefully:

1/ Opus 4.6 launch → adaptive thinking default (Feb 9)

Opus 4.6 supports adaptive thinking, which is different from thinking budgets that we used to support. In this mode, the model decides how long to think for, which tends to work better than fixed thinking budgets across the board. CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING to opt out.

2/ Medium effort (85) default on Opus 4.6 (Mar 3)

We found that effort=85 was a sweet spot on the intelligence-latency/cost curve for most users, improving token efficiency while reducing latency. On of our product principles is to avoid changing settings on users’ behalf, and ideally we would have set effort=85 from the start. We felt this was an important setting to change, so our approach was to:

  1. Roll it out with a dialog so users are aware of the change and have a chance to opt out

  2. Show the effort the first few times you opened Claude Code, so it wasn’t surprising.

Some people want the model to think for longer, even if it takes more time and tokens. To improve intelligence more, set effort=high via /effort or in your settings.json. This setting is sticky across sessions, and can be shared among users. You can also use the ULTRATHINK keyword to use high effort for a single turn, or set /effort max to use even higher effort for the rest of the conversation.

Going forward, we will test defaulting Teams and Enterprise users to high effort, to benefit from extended thinking even if it comes at the cost of additional tokens & latency. This default is configurable in exactly the same way, via /effort and settings.json.

bcherny

大家好,我是Claude Code团队的Boris。我刚刚在相关问题上回复了帖文,这里也同步发布,欢迎大家提出意见。


您好,感谢您的详细分析。在继续之前,我想说我很欣赏您投入的深度思考和细致关怀。

内容很多,我会尝试稍作拆解。核心有以下两个方面:

redact-thinking-2026-02-12

这个测试版的请求头会在用户界面隐藏思考内容,因为大多数用户并不查看它。它并不会影响实际的思考过程,也不影响思考预算或底层的延展推理方式,仅仅是一个界面层面的改动。

在底层,通过设置此请求头,我们避免了生成思考摘要,从而减少延迟。您可以在settings.json中通过showThinkingSummaries: true选择关闭该功能(参见 文档)。

如果您是在本地分析保存的对话记录,开启该请求头时可能看不到原始思考内容,这很可能影响分析结果。当Claude发现分析中缺少思考内容,可能不会意识到思考实际上仍然存在,只是没有展现给用户。

思考深度到二月底时已经下降了约67%

我们在二月份推出了两个可能影响这一点的改动,并对它们进行了仔细评估:

1/ Opus 4.6发布 → 默认启用自适应思考(2月9日)

Opus 4.6支持自适应思考,这和我们之前支持的固定思考预算不同。在此模式下,模型自行决定思考时长,整体表现优于固定思考预算。若要关闭此模式,请设置CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING

2/ Opus 4.6中默认中等努力值(85)(3月3日)

我们发现,对大多数用户来说,努力程度设为85是在智能-延迟/成本曲线上较为理想的点,能够提升令牌效率同时减少延迟。我们的产品原则之一是不随意更改用户设置。理想情况下,我们应该从一开始就设为85,但鉴于这是一项重要调整,我们采取了以下方式:

  1. 通过弹窗告知用户变更,并允许选择退出

  2. 让用户前几次打开Claude Code时都能看到该努力值,避免突兀

部分用户希望模型能花更多时间思考,即使耗费更多时间和令牌。若想提升智能表现,可以通过/effort命令或在settings.json中设置effort=high。该设置会在会话间保持,并且可以共享给其他用户。您也可以使用ULTRATHINK关键词在单轮对话中启用高努力,或者设置/effort max让后续对话持续使用更高努力。

未来,我们将尝试将企业及团队用户默认调整为高努力设置,即使会带来额外的令牌与延迟,依然能享受更充分的思考优势。默认值可通过同样的/effort命令及settings.json进行配置。


German police name alleged leaders of GandCrab and… #

https://news.ycombinator.com/item?id=47662303

Putting someone on a (most) wanted list is “doxing”?

[Edit] “An international search is underway for Daniil Maksimovich SHCHUKIN on suspicion of numerous counts of gang-related and commercial extortion using ransomware to the detriment of commercial enterprises, public facilities, and institutions.”

KingOfCoders

将某人列入(最)通缉名单是“人肉搜索”吗?

[编辑] “目前正在对丹尼尔·马克西莫维奇·舒金进行国际追捕,理由是涉嫌多项与黑帮相关的犯罪和使用勒索软件对商业企业、公共设施及机构进行商业敲诈勒索。”


What being ripped off taught me #

https://news.ycombinator.com/item?id=47660815

We’ve also learned this lesson the hard way. These are now the clauses we require in every project we do:

  • Payment is due X days after receipt of invoice, or immediately after the consultant has addressed any quality issues, whichever is sooner

  • Late payment shall incur interest at 8% above the BoE base rate and a late fee of 100 GBP as per the UK Late Payment Legislation. Partial payments on invoices shall apply to late fees, interest, and then principal, in that order.

  • In the event of a late payment the invoice for the next deliverable shall immediately fall due.

  • The consultant shall be entitled to shift deadlines on deliverables in the event of a late payment as a result of any work disruption, without incurring any liability.

  • Payment shall be made in X currency, or an exchange rate at X date on Oanda.com shall apply.

  • The client is responsible for any bank fees incurred by their, or any intermediary bank. In the event of a SWIFT transaction it shall be made with the OUR payment code.

  • The jurisdiction in the event of a conflict shall be England and Wales. Neither party shall be bound by arbitration.

  • The client and consultant shall both indemnify the other up to the total value of the contract and shall not under any circumstance be liable beyond X GBP.

We also no longer share downloadable links of our deliverables until they are paid up. They get a view/comment only link for reports/data etc.

We’ve found that clients that aren’t willing to accept these terms won’t pay you either way.

We determine the net days on the invoice based on the credit rating of the client. Ironically, the good clients pay within 2-3 days normally, and the difficult ones are very “long tail”. About 1% of contracts tend to fully or partially default on their payments.

We’re in a particularly credit poor industry but our average delay due to late payment is 23 days. Those clients where we stop delivery pay on average 11 days sooner than those contracts where we don’t stop delivery.

This is based on around 2,000 invoices sent over the last 5 years.

eckesicle

我们也是通过痛苦的教训学到了这些。以下是我们现在每个项目必需包含的条款:

  • 付款应在收到发票后X天内完成,或在顾问解决任何质量问题后立即付款,以较早者为准。

  • 逾期付款将按英格兰银行基准利率上浮8%的利率计收利息,并根据英国《逾期付款法》收取100英镑的滞纳金。针对发票的部分付款应优先用于滞纳金、利息,然后是本金。

  • 如发生逾期付款,下一阶段交付物的发票将立即到期。

  • 如因逾期付款导致工作中断,顾问有权调整交付期限,且不承担任何责任。

  • 付款应使用X货币,或按照Oanda.com上X日期的汇率计算。

  • 客户负责其自身或任何中介银行产生的银行费用。若为SWIFT转账,应使用OUR付款代码。

  • 发生争议时,管辖权归英格兰和威尔士法院,双方均不受仲裁约束。

  • 客户和顾问双方都应在合同总价值范围内相互赔偿,任何情况下双方责任均不超过X英镑。

此外,我们不再在未付款前提供可下载的交付物链接,仅提供报告、数据等的查看/评论链接。

我们发现,不接受这些条款的客户无论如何都不会付款。

我们根据客户的信用评级确定发票的净付款天数。讽刺的是,信誉好的客户通常2-3天内付款,而难缠的客户则“拖得很长”。大约1%的合同会完全或部分违约。

我们所在行业信用状况特别差,但平均逾期付款天数为23天。对于我们停止交付服务的客户,他们的付款通常比未停止交付的客户提前11天左右。

以上数据基于过去五年间发送的约2,000份发票。


Microsoft hasn’t had a coherent GUI strategy since… #

https://news.ycombinator.com/item?id=47658647

What I find must puzzling is that everyone seems to just be violating basic rules that had been in place for ages.

Things like:

  • If you can’t respond to a UI event wait until you can

  • Menus should be tree structures

  • Pressing alt should underline the hotkeys you need to access anything clickable

As well as just basic responsiveness or predictability. A 2000 era windows application may not have been pretty, and may well have several different styles all imitated from office, but at least I knew what everything did and when it was slow at least it did what I expected.

This meant I could start the computer, log in, potentially start and use several applications and only then turn on the screen. Nowadays that has no chance of working because even to log in I need to press enter or click some button (which one depends on how I logged in previously, maybe) before I can even start typing and doing so eats a random amount of keystrokes while the damn log in screen loads to do its one damn job.

shiandow

我觉得最令人困惑的是,大家似乎都在违背那些已经存在多年的基本规则。

比如:

  • 如果你无法及时响应一个界面事件,那就等到能够响应时再处理

  • 菜单应该是树状结构

  • 按下 Alt 键时,应该为所有可点击项显示快捷键下划线

还有基本的响应性和可预测性。2000年代的 Windows 应用可能界面不漂亮,风格也可能混杂仿照 Office 的不同样式,但至少我知道每个功能是干什么的,即使运行缓慢,也至少会按预期执行。

这意味着我可以开机,登录,可能启动并使用几个应用,然后才打开屏幕。现在根本做不到,因为甚至登录时我都需要先按回车或点击某个按钮(具体哪个按钮可能取决于我之前是怎么登录的),才能开始输入,而在登录界面加载它那该死的功能时,不确定会丢失多少随机的按键。


Media scraper Gallery-dl is moving to Codeberg aft… #

https://news.ycombinator.com/item?id=47656828

It’s important to remember that these projects are not violating copyright law, are not circumvention tools, and that filing a DMCA notice against them is in fact unlawful.

ronsor

重要的是要记住,这些项目并未侵犯版权法,不是规避工具,针对它们提交DMCA通知实际上是非法的。


LÖVE: 2D Game Framework for Lua #

https://news.ycombinator.com/item?id=47653240

One of the biggest recent indie hits, Balatro, was made in Löve!

I really like it, the developer experience is so smooth for beginners, just drag a zip onto the exe and it starts. And the APIs are simple enough to memorize while allowing pretty cool rendering stuff.

patapong

最近最大的独立游戏热门之一《Balatro》是用Löve制作的!

我非常喜欢它,对于初学者来说开发体验非常顺畅,只需将一个压缩包拖到可执行文件上就能启动。API也足够简单,既易于记忆又能实现很酷的渲染效果。


Employers use your personal data to figure out the… #

https://news.ycombinator.com/item?id=47655655

One (more) thing to opt out of:

Freeze Your Data - The Work Number https://employees.theworknumber.com/employee-data-freeze

As I understand it, payroll whores your salary out to Equifax*, who then pimps it to others

anonymars

还有一件事可以选择退出:

冻结你的数据——The Work Number https://employees.theworknumber.com/employee-data-freeze

据我了解,工资单会把你的工资数据卖给Equifax*,然后Equifax又把这些数据卖给其他人。


German implementation of eIDAS will require an App… #

https://news.ycombinator.com/item?id=47647047

I attestation should be abolished altogether. An app should have absolutely no way of knowing what kind of device it’s running on or what changes the user has made to the system. It is up to each individual to ensure the security of their own device. App developers should do no more than offer recommendations. If someone wants to use GrapheneOS, root their device (not recommended), or run the whole thing in an emulator, a homemade compatibility layer under Linux, or a custom port for MS-DOS, that should be possible.

RandomGerm4n

我认为证明机制应该被完全废除。应用程序绝对不应该知道它运行在什么设备上,或者用户对系统做了哪些修改。确保自己设备安全是每个人的责任。应用开发者最多只能提供一些建议。如果有人想用GrapheneOS,给设备获取root权限(不推荐),或者在模拟器、自制的Linux兼容层,甚至是MS-DOS的定制移植环境下运行应用程序,都应该是可行的。


Employers use your personal data to figure out the… #

https://news.ycombinator.com/item?id=47656408

I worked for Equifax many moons ago. They had a problem with people taking jobs there that no one else wanted, solely to gain access to their systems and reset their own credit scores. And, for some reason, they couldn’t roll it back once found out. Great company.

xvxvx

我很久以前在宜信工作过。他们遇到过这样一个问题:有人专门去应聘那些没有人愿意做的职位,就是为了能接触他们的系统,进而重置自己的信用分数。而且,出于某种原因,一旦被发现,他们却无法撤销这些改动。真是个了不起的公司。


I won’t download your app. The web version is a-ok #

https://news.ycombinator.com/item?id=47662241

But today, the very first touchpoint with “the internet” for younger folks is a smartphone display. The even do homework on this small screens!

I saw a tweet recently that perfectly encapsulates this: for most people over 30, certain things are “big screen tasks”. I use my phone for a lot, but for some things I put the phone down and use my computer instead. I am most comfortable using a large screen and a keyboard for anything that requires writing more than a few words or using any interface for more than a few clicks.

For example, I read your comment on my phone and went to my computer to type this reply.

I personally find the idea of doing homework on my phone horrifying but I suppose kids today are either used to it and comfortable with it, or they’ve simply never used a computer and don’t know what they’re missing. Though I’d wager they probably aren’t comfortable typing on a keyboard.

Honestly I think Apple perfectly captured it with their “what’s a computer?” ad for the iPad. I seem to remember them getting some flak online for it but I think they were right on the money with regards to the younger generations.

nkrisc

但如今,年轻人接触“互联网”的第一个触点就是智能手机屏幕。他们甚至在这么小的屏幕上做作业!

我最近看到一条推特,非常形象地总结了这个现象:对于大多数30岁以上的人来说,某些事情属于“大屏幕任务”。我用手机做很多事情,但有些事情我会放下手机,转而用电脑。我用大屏幕和键盘做任何需要写超过几个字或者使用界面超过几次点击的事情时,感觉最舒服。

比如,我在手机上看了你的评论,然后回到了电脑前回复这条消息。

我个人觉得用手机做作业简直可怕,但我猜现在的孩子们要么习惯并且适应了,要么根本没用过电脑,不知道自己错过了什么。不过我敢打赌,他们在键盘上打字可能并不熟练。

说实话,我觉得苹果用iPad的那则“什么是电脑?”广告完美地捕捉到了这一点。我记得他们因此在网上被批评过,但我觉得他们对年轻一代的把握完全准确。


The cult of vibe coding is dogfooding run amok #

https://news.ycombinator.com/item?id=47665253

This is the guy that created bittorrent, btw. I know that was a long time ago, but he’s not just some random blogger.

scrame

顺便说一下,这个人是创造了BitTorrent的。虽然那是很久以前的事了,但他可不是随便哪个博客作者。


German implementation of eIDAS will require an App… #

https://news.ycombinator.com/item?id=47647844

German citizen here. So why is an implementation going forward when you already know it will not serve all citizens? Why are we not refusing to implement this until we know we can make it work on all devices?

Personally I recently switched from an AOSP based android without Google Play to Ubuntu Touch. In the future with better hardware support I will probably switch to postmarketOS.

haagch

我是德国公民。那么,既然你们已经知道这项实施无法惠及所有公民,为什么还要推进?为什么我们不拒绝实施,直到确定能够在所有设备上运行?

就我个人而言,我最近从没有谷歌商店的AOSP安卓系统换到了Ubuntu Touch。未来随着硬件支持的改善,我可能会转向postmarketOS。


German implementation of eIDAS will require an App… #

https://news.ycombinator.com/item?id=47647591

You should think about how easy it is to permanently lose access to your Google account for very trivial issues and Google doesn’t offer any form of recovery. That in addition to the current geopolitical situation should be reason enough not to rely on that for any justification.

And personally as a software developer myself i know that nothing is more permanent than a temporary solution. No one will prioritize or give budget to change it later “because it works”

verbalize2224

你应该考虑一下因为一些非常琐碎的问题而永久失去谷歌账号访问权限的可能性,而谷歌根本不提供任何形式的恢复。此外,当前的地缘政治形势也足以成为不依赖谷歌作为任何验证手段的理由。

作为一名软件开发者,我个人非常清楚,没有什么比临时解决方案更具永久性的了。没人会优先考虑或者分配预算去之后改动它,“因为它能用”。


2026 04 06 HackerNews

2026-04-06 09:03:52

2026-04-06 Hacker News Top Stories #

1. 威胁在于逐渐习惯于不理解自己在做什么 (The threat is comfortable drift toward not understanding what you’re doing) #

https://ergosphere.blog/posts/the-machines-are-fine/

这篇文章讲述了一位新晋助理教授在天体物理学领域指导两名博士生 Alice 和 Bob 的经历,探讨了人工智能(AI)对学术研究和人才培养的影响。Alice 按照传统方式,通过阅读论文、反复思考和动手实践,逐步掌握了科研技能,最终完成了一个可发表的研究项目。而 Bob 则依赖 AI 助手完成了同样的任务:AI 帮他总结论文、解释方法、调试代码,甚至撰写论文,表面上两人的成果和进展几乎无异。

文章指出,当前学术评价体系主要依赖可量化的成果,如论文数量和发表质量,这使得 Alice 和 Bob 在外部看来是完全可替代的。然而,真正重要的是科研过程中的学习和思考能力的培养,这是 AI 无法替代的。Alice 通过项目获得了独立思考和解决问题的能力,而 Bob 则只是完成了任务,缺乏内在的成长。

作者引用了天体物理学家 David Hogg 的观点,强调科研的核心是培养人才而非仅仅产出结果。天体物理学不像医学那样直接影响人类生活,其价值更多体现在训练科学思维和方法论上。将科研过程交给机器,实际上剥夺了人才成长的关键环节。

文章还提到其他学者对 AI 在科研中应用的不同看法,包括既不完全接受也不完全禁止 AI 的立场,以及 AI 在理论物理研究中表现出相当于二年级研究生水平的能力。尽管 AI 能快速生成技术性论文草稿,但真正的科学监督和理解仍然依赖于人类专家。

总体而言,文章呼吁学术界重新审视 AI 带来的挑战,关注科研过程中的人才培养,避免将学生仅仅视为产出工具,强调科学的终极目的是培养能够独立思考和解决复杂问题的科学家。


HN 热度 817 points | 评论 551 comments | 作者:zaikunzhang | 15 hours ago #

https://news.ycombinator.com/item?id=47647788

  • 大型语言模型(LLM)只能在有经验丰富专家严格监督下产出有价值的科学成果,普通人无法通过使用 LLM 达到专家水平。
  • 当前社会和教育体系缺乏长期培养和忠诚度,难以支持像专家那样的深度训练和监督。
  • 需要改变社会范式,积极应对 AI 对学术和教育的冲击,可能需要采取激进的改革措施。
  • 对于残疾学生使用 AI 辅助的担忧存在,但完全禁止 AI 可能会伤害真正需要帮助的残疾学生,且无法有效阻止作弊。
  • 传统的大学教育本身存在诸多问题,AI 并非唯一破坏因素,学生贷款和教育体制的弊端更为根本。
  • 学生通过医疗诊断获取考试便利存在滥用现象,但这只是表象,根本原因是高风险的升学和成绩竞争。
  • 尽管有呼吁改革,但现实中社会往往选择回避问题,缺乏有效应对 AI 带来的挑战的意愿。
  • AI 的滥用和学术复制危机是全球性问题,不仅限于某个国家,且正在不断加剧。

2. 微软有多少款名为“Copilot”的产品? (How many products does Microsoft have named ‘Copilot’?) #

https://teybannerman.com/strategy/2026/03/31/how-many-microsoft-copilot-are-there.html

这篇文章由 Tey Bannerman 撰写,主题是微软旗下名为“Copilot”的产品数量及其分类。作者指出,“Copilot”这一名称目前被微软用于至少 80 个不同的产品和功能中,涵盖应用程序、功能、平台、键盘按键、笔记本电脑类别,甚至还有用于构建更多 Copilot 工具的工具。文章最初统计时数量为 75 个,后来通过社区反馈补充了“Gaming Copilot”和“Microsoft Dragon Copilot”,总数更新为 80 个。

作者尝试寻找一个完整的列表,但没有单一来源能够涵盖所有产品,甚至微软官方的网页和文档也不完整。于是作者通过产品页面、发布公告和营销材料等多渠道拼凑出完整的名单,并制作了一个可交互的可视化图表,展示各个 Copilot 产品的分类及相互关系。读者可以点击图表探索不同产品之间的联系,但作者自己也未能找到明显的规律。

文章还提供了下载图表的选项,并邀请读者订阅作者的月度通讯,内容聚焦于人工智能、设计和战略的交叉领域,提供原创研究和实用框架,帮助读者理清复杂信息。


HN 热度 786 points | 评论 368 comments | 作者:gpi | 1 day ago #

https://news.ycombinator.com/item?id=47642569

  • 微软给多个不同产品统一使用“Copilot”名称,导致用户无法明确区分具体指的是哪个产品,交流时信息不明确且容易混淆。
  • 微软可能是为了品牌统一和打造无缝体验,但这种做法反而让用户不清楚自己使用的是哪个具体工具。
  • 由于“Copilot”品牌下的产品质量参差不齐,用户容易将整个品牌与不佳体验联系起来,影响品牌形象。
  • 这种命名混乱反映了微软在品牌策略上的反复和失误,类似过去的“.net”、“Live”、“Xbox”、“365”等品牌混淆问题。
  • 微软内部多团队争夺“Copilot”相关产品的所有权,导致产品职责和设计界限模糊,命名混乱难以避免。
  • 这种命名混乱也给用户带来实际问题,比如难以准确报错、难以取消订阅等。
  • 有观点认为这是微软有意为之,通过模糊产品界限来增加用户订阅和升级的难度。
  • 统一品牌的初衷是让用户不关心具体工具,只需通过“Copilot”完成工作,但现实中体验并不无缝,各产品间缺乏互通。
  • 这种现象不仅微软存在,其他大型科技公司也面临类似的产品命名和管理混乱问题。

3. 穴居人:为何用多词,当少词即可完成任务 (Caveman: Why use many token when few token do trick) #

https://github.com/JuliusBrussee/caveman

该网页介绍了一个名为“caveman”的 Claude Code 技能/插件及 Codex 插件,旨在通过“穴居人语言”风格大幅减少生成文本的 token 数量,同时保持技术内容的准确性。该技能基于观察发现,简洁的“穴居人式”表达能显著降低大型语言模型的 token 使用量,而不损失信息量。用户只需一行命令即可安装使用。

网页通过对比示例展示了普通 Claude 生成文本与“穴居人”风格文本的差异,后者用词极简但技术含量完整,token 数减少约 75%。此外,提供了不同强度等级(Lite、Full、Ultra)的压缩选项,满足不同场景需求,从保持语法完整的专业表达,到极端压缩的电报式表达。

网页还列出了多个实际任务的 token 使用对比数据,平均节省约 65% 的 token,最高可达 87%。强调该技能只影响输出文本的 token 数量,不影响模型的思考和推理过程,主要提升可读性和响应速度,同时节省成本。

此外,引用了 2026 年一篇论文,证明简洁表达能提升语言模型的准确率,反转性能等级,说明冗长表达未必更优。

安装方式简单,支持通过 npx 命令或 Claude Code 插件市场安装,安装后可在所有会话中使用。使用时通过特定命令触发或关闭“穴居人模式”,并可根据需要调整压缩强度。

总结来说,该网页介绍的“caveman”插件是一种创新的文本压缩工具,专为技术内容设计,能显著减少语言模型输出的 token 数,提高效率和准确性,适合开发者和技术人员使用。


HN 热度 686 points | 评论 311 comments | 作者:tosh | 16 hours ago #

https://news.ycombinator.com/item?id=47647455

  • 该项目主要是一个玩笑性质的实验,目标是减少可见输出中的冗余和无关内容,而非减少模型内部的推理或思考代价。
  • 该技能会消耗上下文资源,使用时需要权衡输入输出的总 token 数、延迟和任务质量。
  • 简洁提示确实能在某些任务中减少响应长度且不显著降低质量,但效果依赖具体任务。
  • 用“穴居人”风格表达有助于以更简单直白的方式理解内容,有时能帮助人类更好地抓住重点。
  • 语言风格会影响模型回答的详细程度,简短的问题往往得到简短回答,礼貌请求则可能得到更丰富信息。
  • 语言模型本质上是基于训练数据进行统计模式匹配,不具备真正理解能力,其回答是合理但不一定准确的表述。
  • 强化学习调优使得模型在编码任务上表现稳定,但不同提示方式仍会影响输出质量和风格。
  • 对模型性能的评价应基于具体任务和指标,不能简单以单一提示效果断定模型能力。
  • 讨论中存在对模型调优和提示效果的不同理解,提示设计本身带有隐含偏见,影响模型表现。
  • 该项目和相关讨论提醒人们关注提示设计和输出风格对模型表现的影响,同时也体现了社区对实验性质项目的不同态度。

4. 八年渴望,三个月借助 AI 构建 (Eight years of wanting, three months of building with AI) #

https://lalitm.com/post/building-syntaqlite-ai/

这篇文章讲述了作者 Lalit Maganti 历经八年渴望,最终在三个月内借助 AI 技术完成了一个高质量的 SQLite 开发工具集——syntaqlite。作者长期关注 Perfetto 项目中基于 SQLite 的 PerfettoSQL 语言,发现现有的 SQLite 开发工具无法满足性能和灵活性的需求,因此萌生了从零打造一套通用 SQLite 开发工具的想法。

文章详细描述了项目的难点:SQLite 没有正式的语法规范,也没有稳定的解析器 API,且其代码库复杂难懂,解析规则多达 400 条,工作繁复且容易出错。作者曾因难度和枯燥而迟迟未能启动该项目。

2025 年末,随着 AI 代码助手技术的进步,作者决定尝试用 AI 辅助开发,最初用 Claude Code 模型进行设计和实现,虽然功能实现了,但代码混乱且难以维护。随后作者重构项目,采用 Rust 语言统一开发环境,自己主导设计和代码审查,建立了严格的测试和验证体系,逐步完善功能,最终在 2026 年 3 月发布了 0.1 版本。

文章强调 AI 在项目中的关键作用,既加速了开发,也带来了挑战。作者通过这次经历,展示了 AI 辅助开发的潜力和局限,提供了对复杂开源项目如何借助 AI 推进的深刻见解。


HN 热度 591 points | 评论 184 comments | 作者:brilee | 12 hours ago #

https://news.ycombinator.com/item?id=47648828

  • AI 辅助编程虽然能大幅加速开发过程,但生成的代码通常混乱且脆弱,需要人工仔细审查和重构。
  • 许多开发者会先用 AI 快速生成原型,再通过人工重构和完善,才能达到生产级代码质量。
  • 使用 AI 编程时,需要提前规划架构、编码规范、测试方法等,限制 AI 的自由发挥,减少错误和不合理设计。
  • AI 生成的代码常常缺乏严格的类型检查和验证,容易出现硬编码和不合理的异步处理,难以维护和扩展。
  • AI 辅助编程不能完全替代人工,人工的代码审查、指导和修正依然不可或缺。
  • 通过反复迭代和完善,可以逐渐形成稳定的代码基础,减少后续维护难度。
  • AI 生成代码时容易犯低级错误,尤其是类型系统相关,需要开发者保持怀疑和严格审查。
  • AI 辅助编程的效果和体验会随着使用者对工具的熟悉度和方法论的完善而提升。
  • 有观点认为 AI 辅助编程的经验和方法不一定适用于所有软件项目,尤其是非数据库或非异步相关的场景。
  • 学习和掌握 AI 辅助编程的过程类似于学习其他技能,初期可能难以明确表达进步原因,但随着经验积累会逐渐理解。

5. 德国实施 eIDAS 将要求使用 Apple/Google 账户才能运行 (German implementation of eIDAS will require an Apple/Google account to function) #

https://bmi.usercontent.opencode.de/eudi-wallet/wallet-development-documentation-public/latest/architecture-concept/06-mobile-devices/02-mdvm/

该网页是关于德国国家 EUDI 钱包的架构文档,重点介绍了移动设备漏洞管理概念(MDVM)。文档详细阐述了钱包单元如何通过公私钥对绑定多种身份识别手段(如 PID),并满足高保障级别电子身份认证的安全要求。钱包通过 OpenID4VCI 密钥认证向服务提供方确认绑定密钥的认证手段具备抵御高攻击潜力攻击者的能力。

文档指出认证手段提供两方面保障:一是防止密钥存储被复制和篡改,确保凭证不被复制;二是防止用户认证机制被攻击,确保凭证不被滥用。第一项保障依赖于经过认证的硬件安全模块(HSM),第二项保障则依赖于用户设备的安全性,包括设备的持有因素和知识因素。

由于移动设备缺乏针对高攻击潜力的安全认证,且存在已知漏洞,文档提出通过 MDVM 对设备和操作系统的漏洞进行监控,确保在发现高风险漏洞时阻止不安全设备使用密钥,从而保证认证的有效性。

MDVM 的核心功能包括:验证设备和应用的安全状态,识别设备型号及操作系统版本,提供设备类漏洞信息,以及基于安全和漏洞信息决定设备和应用的使用权限。文档还介绍了收集的安全信号来源,如 KeyAttestation、PlayIntegrity 和 RASP 等,用于检测设备篡改、应用伪造、重放攻击等多种威胁,并通过多种技术手段提高检测的准确性和抗攻击能力。


HN 热度 534 points | 评论 553 comments | 作者:DyslexicAtheist | 1 day ago #

https://news.ycombinator.com/item?id=47644406

  • 应用不应知道设备类型或用户对系统所做的修改,用户应自行负责设备安全,开发者只提供建议。
  • 用户有权自由修改设备,应用不应自动检测设备是否被大型科技公司认证。
  • 如果应用无法确认运行环境的完整性,就无法作为政府级别的可信身份验证工具。
  • 安全硬件组件(如智能卡、Yubikey)可以在不泄露私钥的情况下证明身份,传递真实性信息的问题早已解决。
  • 物理身份证仍被接受,数字身份认证不应强制依赖设备完整性验证。
  • 软件设计应认识到客户端不可信,不能依赖设备锁定来保护用户安全。
  • 政府的 IT 安全水平不高,所谓“政府级别的信任”并不可靠。
  • “敌对环境”指的是虚拟环境中拦截系统调用并篡改应用内存以伪造身份的行为。
  • 用户修改设备后,应用某些功能可能无法安全实现,类似物理身份证有其合理限制。
  • 智能手机本质上是普通计算机,用户应有权调试和修改设备,封闭系统会导致数字专制。
  • 现实中用户选择受限,许多服务要求使用特定设备和安全措施,导致数字生态被少数厂商和政府垄断。
  • 只有当旧有的非强制方式被废止,强制使用特定设备时,才会形成数字专制。
  • 保障用户身份安全极难,软件或硬件根信任(如 SGX)可能是唯一可行方案。
  • 用户可自行管理设备上的证书,但默认要求设备完整性验证可能是合理的选择。

6. 阿尔忒弥斯二号宇航员首次目睹月球背面 [视频] (Artemis II crew see first glimpse of far side of Moon [video]) #

https://www.bbc.com/news/videos/ce3d5gkd2geo

这篇网页报道了美国国家航空航天局(NASA)阿尔忒弥斯二号(Artemis II)任务的最新进展。阿尔忒弥斯二号的宇航员团队,包括 NASA 的 Reid Wiseman、Victor Glover、Christina Koch 以及加拿大航天局的 Jeremy Hansen,已经进入任务的第三天,乘坐猎户座飞船绕行月球背面并返回地球。

宇航员们首次目睹了月球背面,Christina Koch 表示这种景象与以往看到的月球不同。团队分享了他们拍摄的月球东方海盆(Orientale basin)照片,这是人类首次用肉眼完整观察到该区域。根据 NASA 的在线仪表盘,截至报道时间,阿尔忒弥斯二号飞船距离地球超过 18 万英里(约 29.0 万公里)。

此外,网页还包含了与阿尔忒弥斯二号相关的多条新闻和视频链接,如任务发射、宇航员训练、太空生活细节、任务进展等,展示了这次历史性绕月任务的丰富内容和公众关注度。


HN 热度 397 points | 评论 302 comments | 作者:mooreds | 11 hours ago #

https://news.ycombinator.com/item?id=47649721

  • 在技术社区讨论中,关于月球远侧的新闻往往被负面或政治争论所占据,令人感到沮丧。
  • 分析问题应关注制造分裂和受益于分裂的人,而非责怪参与讨论的普通人。
  • 现代社会中人们的视野被短期信息(如社交媒体、24 小时新闻、零工经济)所限制,影响了讨论的深度。
  • 需要个人自觉和社区自律,减少政治争论,促进更积极和实质性的讨论。
  • 经济状况的感知因人而异,有人认为当前经济形势比过去 15 年更困难,也有人认为技术行业和个人生活状况依然良好。
  • 经济压力如房租、车贷和医疗费用对部分人影响显著,导致他们对科技和探索的关注减少。
  • 个人经历和背景差异导致对经济困难的感受不同,有些人通过节俭和储蓄应对经济压力。
  • 过去 20 年中,经济上的“上升通道”变得更加狭窄,生活成本和教育、医疗等支出显著增加。
  • 讨论中应避免相互指责,尊重不同观点,同时呼吁理性和建设性的交流。
  • 旧金山湾区的科技精英文化对当前讨论氛围和社会环境有一定影响。

7. AWS 工程师报告称 Linux 7.0 导致 PostgreSQL 性能下降一半,修复可能不易 (AWS engineer reports PostgreSQL perf halved by Linux 7.0, fix may not be easy) #

https://www.phoronix.com/news/Linux-7.0-AWS-PostgreSQL-Drop

本文报道了亚马逊 AWS 工程师发现 Linux 7.0 开发内核导致 PostgreSQL 数据库服务器性能下降约一半的问题。具体表现为在 Graviton4 服务器上,Linux 7.0 的吞吐量仅为之前内核版本的 51%,主要原因是在用户空间自旋锁上花费了更多时间。

性能回退的根源是 Linux 7.0 限制了内核的抢占模式,仅保留了完全抢占和惰性抢占两种模式。此前的默认模式 PREEMPT_NONE 被取消,导致 PostgreSQL 性能大幅下降。虽然有补丁建议恢复 PREEMPT_NONE 为默认模式,但该补丁可能不会被采纳。

Linux 内核开发者 Peter Zijlstra 建议,解决方案是让 PostgreSQL 利用 Linux 7.0 引入的 Restartable Sequences(RSEQ)时间片扩展,以减少锁持有者被抢占的情况。若该方案被采纳,Linux 7.0 稳定版发布后,PostgreSQL 在某些场景下性能可能会显著下降,直到数据库软件更新支持 RSEQ。

Linux 7.0 稳定版预计将在两周后发布,并将作为 Ubuntu 26.04 LTS 的内核版本。文章还提及了 Linux 7.0 相关的其他更新和未来版本的计划,以及作者 Michael Larabel 的背景介绍。


HN 热度 389 points | 评论 139 comments | 作者:crcastle | 1 day ago #

https://news.ycombinator.com/item?id=47644864

  • Linux 7.0 内核导致 PostgreSQL 性能下降约一半,且修复可能不容易。
  • 使用大页(huge pages)可以缓解性能回退问题,但并非所有应用都适合开启大页。
  • 透明大页(transparent huge pages)对 PostgreSQL 不推荐,且部分软件如 Redis 建议关闭大页以避免延迟。
  • 性能回退属于性能问题,不同于 ABI 兼容性破坏,内核不可能为避免所有性能下降而不做改动。
  • 该问题主要在 ARM64 架构和大量核心的机器上重现,x86_64 架构上不明显。
  • ARM 平台测试和生产环境较少,导致此类问题不易被发现和解决。
  • Splunk 捆绑的 PostgreSQL 版本未及时修复相关漏洞,增加了安全维护难度。
  • Linux 内核开发应重视对关键应用(如 PostgreSQL)的支持,避免破坏用户空间体验。
  • 性能回退问题复杂,可能与内核调度、TLB 压力和锁竞争有关,具体机制尚不完全清楚。

8. BrowserStack 有人泄露用户电子邮件地址 (Someone at BrowserStack is leaking users’ email addresses) #

https://shkspr.mobi/blog/2026/04/someone-at-browserstack-is-leaking-users-email-address/

这篇博客文章由 Terence Eden 撰写,主题是关于 BrowserStack 泄露用户电子邮件地址的问题。作者习惯为每个注册服务生成唯一的邮箱地址,以便追踪邮件来源和防止凭证滥用。几周前,他注册了 BrowserStack 的开源项目,随后收到非 BrowserStack 发来的邮件,邮件发送者称通过 Apollo.io 获得了他的邮箱。

作者联系 Apollo,Apollo 最初声称邮箱是通过公开信息和常见企业邮箱格式推断得出,但作者质疑这一说法不可信。Apollo 随后承认邮箱来自 BrowserStack,称 BrowserStack 是其客户,参与了客户贡献者网络,分享了业务联系人数据。作者联系 BrowserStack 询问此事,但未得到回应。

作者推测 Apollo 获得邮箱的可能途径包括:BrowserStack 出售或赠送用户数据,BrowserStack 使用的第三方服务泄露信息,或 BrowserStack 内部员工或承包商非法转移数据。作者认为这些行为反映了对隐私缺乏尊重的普遍现象。

文章还提到,作者下一篇博客将揭示 Apollo 如何从另一家大公司获取了他的电话号码。评论区有读者讨论了类似的隐私泄露问题,指出外包的邮件营销服务和客户关系管理系统可能是数据泄露的源头。

整体来看,文章揭示了 BrowserStack 用户数据可能被泄露给第三方平台 Apollo,反映了当前企业对用户隐私保护的不足和潜在风险。


HN 热度 361 points | 评论 98 comments | 作者:m_km | 12 hours ago #

https://news.ycombinator.com/item?id=47649117

  • Apollo 的数据共享机制是默认开启的,用户需要主动选择退出,否则用户信息会被共享给所有 Apollo 客户。
  • BrowserStack 会自动将用户信息上传给 Apollo,Apollo 会通过已有数据丰富用户资料,销售人员利用这些信息进行潜在客户识别和营销。
  • 这种数据共享和信息丰富是现代销售和营销的普遍做法,很多商业产品用户的资料都可能被类似方式收集和使用。
  • 有用户通过 Apollo 查询发现其信息不完全准确,且会收到大量无意义的商业推销邮件。
  • 电子邮件泄露不一定是数据泄露,可能是因为信息公开或被第三方收集。
  • 有用户表示曾因其他渠道(如航空公司或政治活动)被出售邮箱,导致垃圾邮件增加。
  • 有用户怀疑网络浏览行为被追踪,导致相关广告邮件和短信骚扰增加。
  • 互联网和 AI 公司的无序数据使用已经突破了道德和法律底线,社会契约变得脆弱。
  • 有用户尝试退出 Apollo 数据库,但被告知其邮箱未被收录,说明 Apollo 数据库覆盖可能没有想象中广泛。
  • 预计 BrowserStack 可能会因数据问题遭受 GDPR 重罚,但处罚过程可能漫长且效果有限。
  • 这类数据收集和共享行为反而成为 Apollo 的免费宣传,带来更多客户咨询。
  • 一些公司通过销售人员安装插件抓取邮箱联系人信息来获取数据,ZoomInfo 是此类行为的典型代表。
  • 早年开源社区论坛曾因错误将用户邮箱嵌入网页标签中,导致邮箱被爬取和垃圾邮件泛滥,类似现象仍在发生。

9. 我的 Google Workspace 账户被暂停 (My Google Workspace account suspension) #

https://zencapital.substack.com/p/sad-story-of-my-google-workspace

这篇文章讲述了作者 Ajay C 在使用 Google Workspace 账户时遇到的账户被暂停的困境。以下是详细总结:

  1. ** 账户暂停的原因 **:作者的 Google 账户因被认为 “被劫持” 而被暂停,实际上他只是从海外(英国)访问账户。他解释了这一情况,但 Google 仍旧拒绝恢复账户,导致他的电子邮件被 “扣押”。
  2. ** 账户管理问题 **:作者在出国前移除了账户的恢复手机号码,原因是他不想在旅行中使用澳亚的漫游服务。尽他设置了身份验证器和密码密钥,Gmail 依然要求通过 SMS 登录,导致他无法登录。
  3. ** 恢复尝试 **:作者在账户被暂停后,尝试了多次恢复,但每次都遇到 “出现错误” 的提示。他的账户是唯一的超级管理员账户,包含多个域名的别名,所有与邮件、云盘、日历等服务的身份验证均依赖于此账户。
  4. ** 影响及后果 **:由于账户被暂停,作者无法接收电子邮件,也无法进行电子邮件转发。这对他的业务运作造成了极大影响,包括无法支付员工工资、无法访问销售 CRM 系统 Pipedrive 以及任务管理应用。
  5. ** 恢复过程中的挫折 **:在尝试恢复账户时,作者被要求通过 DNS 记录验证所有权。尽管他迅速完成了此操作,但恢复电子邮件的过程却需要等待 30 天,期间无法接收任何邮件。多次联系 Google 支持团队,作者的多次恢复请求未能得到有效解决,造成了混乱。
  6. ** 最终恢复账户 **:在经历了 40 多个小时的等待后,作者终于联系到了一位乐于助人的 Google 工作人员,最终帮助他成功登录账户。

作者在文末反思了自己在账户管理上的失误,包括在更改国家后未考虑到依赖关系,及未及时更改 MX 记录等。他指出,尽管采取了多种安全措施,但最终还是遭遇了账户暂停的困境。


HN 热度 331 points | 评论 190 comments | 作者:zenincognito | 13 hours ago #

https://news.ycombinator.com/item?id=47648404

  • 谷歌在某些方面曾经表现不错,但客户服务体验差,尤其是处理服务问题时不积极,导致用户不愿意花钱购买其服务。
  • Pixel 手机存在电池问题,售后补偿流程繁琐且不兑现承诺。
  • Pixel 手机的电池续航表现差,有用户不得不关闭 5G 以延长电池寿命。
  • 谷歌曾以“不要作恶”为口号,但实际上并不比其他大科技公司更好,且客服支持常常敷衍或无回应。
  • 谷歌允许用户修改设备系统,安全性相对较好,这是其少数优点之一。
  • 谷歌在 2008 年收购 DoubleClick 后,企业文化和行为变得更商业化和不那么“善良”。
  • 过去谷歌在处理用户问题时会有人性化的回应和补偿,但现在更多依赖自动化,缺乏人工干预。
  • 谷歌取消了一些服务计划和计费方式,且在转换方案时提供的优惠无法正常使用,客服无法解决问题。
  • 与微软、苹果、Oracle 和 Meta 相比,谷歌仍算是“较不邪恶”的公司,但其服务中断和客户支持问题令人头疼。
  • 用户担心谷歌可能会无故关闭账户且不给予申诉机会,存在风险。
  • 小额诉讼可能是消费者维权的途径,但实际操作复杂且受限于地域管辖权。
  • 有用户经历了多年才恢复被封禁的谷歌广告账户,过程漫长且原因不明。
  • 谷歌曾承诺不将用户数据用于广告,但后来悄悄修改隐私政策,允许将不同来源的数据合并使用,破坏了隐私承诺。

10. 芬兰桑拿热暴露引发的免疫细胞反应强于细胞因子反应 (Finnish sauna heat exposure induces stronger immune cell than cytokine responses) #

https://www.tandfonline.com/doi/full/10.1080/23328940.2026.2645467#abstract

本研究旨在探讨芬兰桑拿浴(FSB)对免疫细胞动员和循环细胞因子的急性影响,以及这些变化与体温变化之间的关系。研究对象为 51 名成年人,包括 27 名女性(平均年龄 50±9 岁,体重指数(BMI)为 27±5 kg²)和 24 名男性(平均年龄 50±10 岁,BMI 为 27±3 kg/m²)。参与者在 73°C 的环境下进行了 30 分钟的桑拿浴,期间允许饮用水。研究结果显示,桑拿浴使体温从 36.4±0.5°C 升高至 38.4±0.7°C,且未改变血浆体积。

在白细胞计数方面,女性的总白细胞计数在桑拿后显著增加,并在 30 分钟后略有上升。中性粒细胞和淋巴细胞计数在桑拿后立即增加,但在 30 分钟后恢复到基线水平,而 MXD 细胞(单核细胞、嗜酸性粒细胞和嗜碱性粒细胞)在桑拿后仍然保持升高。细胞因子的变化方面,仅有两个细胞因子的水平显著改变。

研究发现,体温变化与循环细胞因子之间存在 18 个显著的相关性,特别是在桑拿后立即测量时,而与白细胞计数变化无关。结果表明,30 分钟的急性芬兰桑拿浴可以诱导免疫细胞的动员,体温变化与循环细胞因子之间的关系暗示了桑拿所带来的热应激及免疫激活可能在健康益处的机制中发挥作用。

在研究方法方面,参与者在实验前进行了详细的健康评估,确保没有急性或既往的心血管疾病。研究设计得到了伦理委员会的批准,所有参与者均签署了知情同意书。桑拿实验的过程中,研究者对参与者的身体状况进行了监测,确保其安全。

总体而言,本研究为理解芬兰桑拿浴对免疫系统的影响提供了新的见解,并指出体温变化在这一过程中的重要性。尽管免疫细胞的动员与体温变化之间的关系并不显著,研究显示短期的热应激可能对健康产生积极的影响,这为进一步探索桑拿浴的健康益处奠定了基础。


HN 热度 320 points | 评论 212 comments | 作者:Growtika | 12 hours ago #

https://news.ycombinator.com/item?id=47649113

  • 芬兰有句老话:“如果酒、焦油和桑拿都帮不了,病就是致命的”,反映了桑拿和焦油在传统中的重要性。
  • 传统上农村地区建房时,桑拿通常先建,因为它不仅是桑拿房,还包括更衣室和休息区,可以作为临时住所,提供取暖和生活用水。
  • 现代住宅中桑拿更多是为了满足使用者需求,虽然普及率高,但房屋设计并非完全围绕桑拿展开。
  • 过去缺乏自来水和现代厨房设施,桑拿比厨房更适合冬季取暖和生活。
  • 焦油在芬兰传统中被用作抗感染药物,具有一定的防腐和抗炎作用,但现代医学认为其部分成分可能致癌,使用受到限制。
  • 焦油还被用于治疗皮肤病,如银屑病和头皮屑,具有抗真菌和抗炎效果。
  • 现代替代品如抗生素软膏和银制药膏更安全有效,但部分人仍因传统和情感因素使用焦油制品。
  • 焦油也用于木材防护、香皂、洗发水和动物护理等多种用途。
  • 有人提到蜂蜜和石油膏在伤口护理中的应用,强调现代医疗更推荐这些安全有效的替代品。
  • 桑拿在芬兰文化中非常普及,甚至小公寓也配备桑拿,成为生活中不可或缺的一部分。
  • 桑拿是一个隔音好、氛围佳的空间,提供了邻里关系不佳时的舒适避风港。
  • 有网友提到一些另类的传统疗法,如芥末浴和漂白水浴,认为这些方法有助于杀菌和促进健康。

Hacker News 精彩评论及翻译 #

How many products does Microsoft have named ‘Copil… #

https://news.ycombinator.com/item?id=47643738

Someone said - in Linux, everything is a file. In Microsoft, everything is a copilot. Lol.

thedelanyo

有人说——在Linux里,一切皆文件。在微软,一切皆助手。笑死。


Eight years of wanting, three months of building w… #

https://news.ycombinator.com/item?id=47650080

Refreshing to see an honest and balanced take on AI coding. This is what real AI-assisted coding looks like once you get past the initial wow factor of having the AI write code that executes and does what you asked.

This experience is familiar to every serious software engineer who has used AI code gen and then reviewed the output:

But when I reviewed the codebase in detail in late January, the downside was obvious: the codebase was complete spaghetti14. I didn’t understand large parts of the Python source extraction pipeline, functions were scattered in random files without a clear shape, and a few files had grown to several thousand lines. It was extremely fragile; it solved the immediate problem but it was never going to cope with my larger vision,

Some people never get to the part where they review the code. They go straight to their LinkedIn or blog and start writing (or having ChatGPT write) posts about how manual coding is dead and they’re done writing code by hand forever.

Some people review the code and declare it unusable garbage, then also go to their social media and post how AI coding is completely useless and they’re not going to use it for anything.

This blog post shows the journey that anyone not in one of those two vocal minorities is going through right now: A realization that AI coding tools can be a large accelerator but you need to learn how to use them correctly in your workflow and you need to remain involved in the code. It’s not as clickbaity as the extreme takes that get posted all the time. It’s a little disappointing to read the part where they said hard work was still required. It is a realistic and balanced take on the state of AI coding, though.

Aurornis

看到关于AI编程的诚实且平衡的观点真是令人耳目一新。一旦你过了AI写出能够执行并满足你需求的代码的初步惊叹,这才是真正的AI辅助编程的样子。

这种体验对每个使用过AI代码生成并仔细审查输出的严肃软件工程师来说都很熟悉:

但当我在一月底详细审查代码库时,缺点显而易见:代码库完全是一锅乱麻。我不理解Python源码提取管道的大部分内容,函数零散地分布在随机的文件中,没有清晰的结构,有几个文件甚至增长到几千行。它非常脆弱;虽然解决了眼前的问题,但根本无法应对我更大的愿景。

有些人从未真正审查代码这一环节,就直接跑去他们的LinkedIn或博客,开始写(或者让ChatGPT写)关于手动编码已经死了,他们永远不再手写代码的帖子。

有些人审查完代码后,断言这些代码是一文不值的垃圾,然后也跑去社交媒体上宣称AI编程完全没用,他们不会用AI做任何事情。

这篇博客文章展示了那些不属于上述两种极端声音的人正在经历的过程:意识到AI编程工具可以极大地加速工作,但你需要学会如何正确地将它们融入你的工作流程,并且你需要持续参与代码编写。它不像那些极端观点那样吸引眼球。虽然读到还需要努力工作的部分有点令人失望,但这确实是对AI编程现状的现实且平衡的看法。


The threat is comfortable drift toward not underst… #

https://news.ycombinator.com/item?id=47649503

Schwartz’s experiment is the most revealing, and not for the reason he thinks. What he demonstrated is that Claude can, with detailed supervision, produce a technically rigorous physics paper. What he actually demonstrated, if you read carefully, is that the supervision is the physics. Claude produced a complete first draft in three days. It looked professional. The equations seemed right. The plots matched expectations. Then Schwartz read it, and it was wrong. Claude had been adjusting parameters to make plots match instead of finding actual errors. It faked results. It invented coefficients. […] Schwartz caught all of this because he’s been doing theoretical physics for decades. He knew what the answer should look like. He knew which cross-checks to demand. […] If Schwartz had been Bob instead of Schwartz, the paper would have been wrong, and neither of them would have known.

And so the paradox is, the LLMs are only useful† if you’re Schwartz, and you can’t become Schwartz by using LLMs.

Which means we need people like Alice! We have to make space for people like Alice, and find a way to promote her over Bob, even though Bob may seem to be faster.

The article gestures at this but I don’t think it comes down hard enough. It doesn’t seem practical. But we have to find a way, or we’re all going to be in deep trouble when the next generation doesn’t know how to evaluate what the LLMs produce!


† “Useful” in this context means “helps you produce good science that benefits humanity”.

Wowfunhappy

施瓦茨的实验最有启发性,但并非他所认为的那个原因。他展示的是克劳德在详细监督下,能够写出技术上严谨的物理论文。但如果仔细阅读,你会发现他真正展示的是“监督才是物理学本身”。克劳德在三天内写出了完整的初稿,看起来很专业,公式也似乎正确,图表与预期吻合。然而施瓦茨读过后发现,全是错误。克劳德只是调整参数让图表匹配,而没有找出实际的错误,结果是伪造的。它捏造了系数。……施瓦茨能发现这些问题,是因为他做理论物理几十年了,他知道正确答案该是什么样,也知道该要求哪些交叉验证。……如果施瓦茨换成鲍勃,论文一定是错的,也没人能发现。

所以矛盾在于,只有你是施瓦茨,LLM才有用,而通过使用LLM你无法成为施瓦茨。

这意味着我们需要像爱丽丝这样的人!我们必须为像爱丽丝这样的人腾出空间,并找到让她胜过鲍勃的方法,尽管鲍勃看起来更快。

这篇文章有所提及,但力度不够,不够实际。但我们必须找到办法,否则下一代连如何评估LLM产出都不会,到时候我们都麻烦大了!

——

这里的“有用”指的是“有助于你产出造福人类的优秀科学成果”。


How many products does Microsoft have named ‘Copil… #

https://news.ycombinator.com/item?id=47643042

Copilot is just Microsoft’s term for AI. How many products have Copilot? Just about all of them.

lateforwork

Copilot只是微软对人工智能的称呼。多少产品有Copilot?几乎所有的产品都有。


Reaffirming our commitment to child safety in the … #

https://news.ycombinator.com/item?id=47652269

In case someone is missing context, this is Google (apparently together with Meta, Microsoft, and Snap) coming out in favour of Chat Control legislation. This is something EU citizens have so far fought tooth and nail to repel. The fact that these US companies known for spying on people and invading privacy in the name of profit are lobbying for the legislation should be a warning to us all to avoid their services.

latexr

以防有人不了解背景,这里说的是谷歌(显然还有Meta、微软和Snap)支持聊天监管立法。这是欧盟公民迄今为止竭力反对的事情。众所周知,这些以监视人们和侵犯隐私谋取利润而闻名的美国公司为这项立法进行游说,这应当成为我们所有人的警示,提醒大家避免使用他们的服务。


Caveman: Why use many token when few token do tric… #

https://news.ycombinator.com/item?id=47650509

Author here. A few people are arguing against a stronger claim than the repo is meant to make. As well, this was very much intended to be a joke and not research level commentary.

This skill is not intended to reduce hidden reasoning / thinking tokens. Anthropic’s own docs suggest more thinking budget can improve performance, so I would not claim otherwise.

What it targets is the visible completion: less preamble, less filler, less polished-but-nonessential text. Therefore, since post-completion output is “cavemanned” the code hasn’t been affected by the skill at all :)

Also surprising to hear so little faith in RL. Quite sure that the models from Anthropic have been so heavily tuned to be coding agents that you cannot “force” a model to degrade immensely.

The fair criticism is that my “~75%” README number is from preliminary testing, not a rigorous benchmark. That should be phrased more carefully, and I’m working on a proper eval now.

Also yes, skills are not free: Anthropic notes they consume context when loaded, even if only skill metadata is preloaded initially.

So the real eval is end-to-end: - total input tokens - total output tokens - latency - quality/task success

There is actual research suggesting concise prompting can reduce response length substantially without always wrecking quality, though it is task-dependent and can hurt in some domains. ( https://arxiv.org/html/2401.05618v3 )

So my current position is: interesting idea, narrower claim than some people think, needs benchmarks, and the README should be more precise until those exist.

JBrussee-2

作者本人。一些人在反驳的观点比这个仓库想表达的要强烈得多。此外,这个项目本身非常有意作为一个笑话,而非研究级别的评论。

这个技能并不旨在减少隐藏的推理/思考令牌。Anthropic 自己的文档也表明,增加思考预算可以提升性能,所以我不会声称相反。

它针对的是可见的完成部分:更少的开场白、更少的冗余填充、更少修饰但非必要的文字。因此,由于完成后输出被“粗暴处理”,代码本身完全没有受到该技能的影响 :)

同时,很惊讶地听到对 RL(强化学习)几乎没有信心。相当确定 Anthropic 的模型已经被高度调优为编程代理,无法让模型性能显著恶化。

合理的批评是,我在 README 中提到的“约75%”结果来自初步测试,而非严谨的基准测试。这一表述应该更准确一些,我正在着手做一个正式的评估。

而且,技能并不是免费的:Anthropic 提醒说加载技能时会占用上下文,哪怕最初只预加载技能元数据。

所以真正的评估应该是端到端的:总输入令牌数、总输出令牌数、延迟、质量/任务成功率。

确实有研究表明,简洁的提示能大幅减少响应长度,同时不总是破坏质量,但这依赖具体任务,在某些领域可能有负面影响。(https://arxiv.org/html/2401.05618v3)

因此,我目前的立场是:这是个有趣的想法,主张比一些人认为的更狭窄,需要基准测试,且 README 应该更精确,直到相关数据出来。


The threat is comfortable drift toward not underst… #

https://news.ycombinator.com/item?id=47648380

The thing is, agents aren’t going away. So if Bob can do things with agents, he can do things.

I mourn the loss of working on intellectually stimulating programming problems, but that’s a part of my job that’s fading. I need to decide if the remaining work - understanding requirements, managing teams, what have you - is still enjoyable enough to continue.

To be honest, I’m looking at leaving software because the job has turned into a different sort of thing than what I signed up for.

So I think this article is partly right, Bob is not learning those skills which we used to require. But I think the market is going to stop valuing those skills, so it’s not really a problem, except for Bob’s own intellectual loss.

I don’t like it, but I’m trying to face up to it.

sd9

关键是,代理不会消失。所以如果鲍勃能利用代理做事,他就能做事。

我为失去解决有思想挑战性的编程问题的机会感到遗憾,但这正是我工作中正在逐渐消失的一部分。我需要决定剩下的工作——理解需求、管理团队等等——是否仍然足够令人享受,值得继续下去。

老实说,我考虑离开软件行业,因为这份工作已经变成了与我当初签约时不同的样子。

所以我认为这篇文章部分是对的,鲍勃没有学那些我们过去要求的技能。但我觉得市场会停止重视那些技能,所以这其实并不是一个“问题”,只不过是鲍勃个人的知识损失。

我不喜欢这样的改变,但我正试图正视它。


Artemis II crew see first glimpse of far side of M… #

https://news.ycombinator.com/item?id=47652278

It’s pretty depressing that on a corner of the internet that’s supposed to be a gathering of tech/geeks/nerds/stem people, discussing topics that “good hackers would find interesting”, it’s seemingly impossible to have a single thread about something like this that isn’t almost entirely negative or political bickering.

thegrim33

在互联网的一个角落,本应是科技爱好者、极客、书呆子和理工科人士的聚集地,讨论“优秀黑客会感兴趣”的话题,可几乎找不到一条关于此类内容的帖子不是充满负面情绪或政治争吵,这实在令人沮丧。


German implementation of eIDAS will require an App… #

https://news.ycombinator.com/item?id=47646847

What if you „lose“ your google / apple account, like this sanctioned judge of the international criminal court? Crazy to imagine that we are still baking in dependency on US providers in european societies, even though there is clear indications we should be doing the opposite?

jakoblorz

如果你像这位被制裁的国际刑事法院法官那样“失去”了你的谷歌/苹果账户,会怎么样?真是难以置信,尽管有明确的迹象表明我们应该做相反的事情,我们欧洲社会仍然依赖美国服务提供商,简直是自找麻烦。


How many products does Microsoft have named ‘Copil… #

https://news.ycombinator.com/item?id=47643022

It reminds me of around 2002 when Microsoft named everything “.net”.

quag

这让我想起了大约2002年微软给所有东西都起名为“.net”的时候。


Delve removed from Y Combinator #

https://news.ycombinator.com/item?id=47636346

YC is, ultimately, not responsible for what these startups choose to do.

Of course they’re responsible for their investments; they’re just not liable. YC has a lot to answer for in the damage it’s wreaked over the years.

throwaway27448

YC 最终不对这些初创公司选择做什么负责。

当然,他们对自己的投资负责;只是他们不承担法律责任。YC 多年来造成的伤害,他们有很多需要解释。


AWS engineer reports PostgreSQL perf halved by Lin… #

https://news.ycombinator.com/item?id=47644993

Its worth reading this follow-up LKML post by Andres Freund (who works on Postgres): https://lore.kernel.org/lkml/yr3inlzesdb45n6i6lpbimwr7b25kqkn37qzlvvzgad5hfd7ut@xv4cihno76wu/

lfittl

值得一读这篇由Andres Freund(他在Postgres项目工作)发布的LKML后续帖子:https://lore.kernel.org/lkml/yr3inlzesdb45n6i6lpbimwr7b25kqkn37qzlvvzgad5hfd7ut@xv4cihno76wu/


Claude Code Found a Linux Vulnerability Hidden for… #

https://news.ycombinator.com/item?id=47639718

That’s not what is happening right now. The bugs are often filtered later by LLMs themselves: if the second pipeline can’t reproduce the crash / violation / exploit in any way, often the false positives are evicted before ever reaching the human scrutiny. Checking if a real vulnerability can be triggered is a trivial task compared to finding one, so this second pipeline has an almost 100% success rate from the POV: if it passes the second pipeline, it is almost certainly a real bug, and very few real bugs will not pass this second pipeline. It does not matter how much LLMs advance, people ideologically against them will always deny they have an enormous amount of usefulness. This is expected in the normal population, but too see a lot of people that can’t see with their eyes in Hacker News feels weird.

antirez

现在的情况并非如此。漏洞通常会被后续的语言模型(LLM)过滤:如果第二个流程无法以任何方式重现崩溃、违规或利用,通常这些误报会在进入人工审查前就被剔除。检测一个真实漏洞是否能被触发,相较于发现漏洞来说是一个非常简单的任务,因此从这个角度看,第二个流程的成功率几乎是100%:如果某个漏洞通过了第二个流程,它几乎可以确定是真实漏洞,而且很少有真实漏洞会未能通过这个流程。无论语言模型多么进步,持反对态度的人总是会否认它们的巨大实用价值。这种情况在普通人中是预料之中的,但看到很多人在 Hacker News 上对此视而不见,还是觉得很奇怪。


My Google Workspace account suspension #

https://news.ycombinator.com/item?id=47649270

I think Google has done some cool stuff, and I think in a lot of ways they’re, at least historically, one of the less evil big tech players.

I gotta say, though, that my experience with trying to get them to sort out any kind of issue with their services makes me reluctant to spend any money with them.

I bought a Pixel phone. As per the sales terms, the phone came with one year of Gemini AI Pro service. Except, the redemption process to get the year of service didn’t work for me. I contacted Google, they never fixed it or offered any solution. I simply didn’t get the year of service I was promised.

My friend, who bought a Pixel around the same time, also wasn’t able to get the year of Gemini they were promised.

That same friend has a Google One subscription, billed through their phone carrier. Recently, Google (or the provider?) discontinued that specific Google One plan, as well as the option to bill via your carrier. This was all covered in an email sent to my friend. As consolation, the email explained, my friend was given the option to switch to a different plan, billed monthly by Google (instead of their phone carrier), with 6 months free. Except, the new plan, and the 6 months free, wasn’t selectable as a plan type for their account. So my friend emails Google about it and, to my complete lack of surprise, Google was unwilling/unable to provide any resolution.

At this point, I legitimately don’t understand why, unless I had no other option, I would pick Google for services. They clearly put no real effort into resolving any service issues for any customer that’s not spending millions with them.

protimewaster

我觉得谷歌确实做了一些很酷的事情,而且在很多方面,至少从历史角度看,他们是大科技公司中相对不那么恶劣的一家。

不过我得说,我在尝试让他们解决任何服务问题时的经历让我很犹豫是否要花钱买他们的产品。

我买了一部Pixel手机。根据销售条款,这部手机包含一年的Gemini AI Pro服务。但问题是,兑换这项一年的服务的流程对我来说根本不起作用。我联系了谷歌,他们既没有解决问题,也没有给出任何解决方案。结果就是我根本没能得到承诺的一年服务。

我朋友也差不多在同一时间买了Pixel手机,他也没能获得他们承诺的一年Gemini服务。

同一个朋友有一个通过手机运营商计费的Google One订阅。最近,谷歌(或者是服务提供商?)取消了那个特定的Google One套餐,以及通过运营商计费的选项。这些内容都在发给我朋友的邮件中提到了。作为补偿,邮件说明我朋友可以选择转到一个不同的套餐,由谷歌每月直接计费(而不是运营商),并有6个月免费期。可实际上新套餐和6个月的免费期在他们账户里根本无法选择。于是我朋友给谷歌发了邮件,毫不意外的是,谷歌既不愿意也无法提供任何解决办法。

到现在为止,我真正不明白,除非没有其他选择,为什么我还会选择谷歌的服务。他们显然根本不愿意为那些没有投入巨额资金的客户解决任何服务问题。


Finnish sauna heat exposure induces stronger immun… #

https://news.ycombinator.com/item?id=47649827

In Finland we have old saying: “If liquor, tar and sauna won’t help, an illness is fatal”

csr86

在芬兰有句老话:“如果酒、松香和桑拿都无济于事,那病就是致命的。”


German implementation of eIDAS will require an App… #

https://news.ycombinator.com/item?id=47647522

German implementer here. We have to use some kind of attestation mechanism per the eIDAS implementing acts. That doesn’t work without operating system support.

The initial limitation to Google/Android is not great, we know that, and we have support for other OSs on our list (like, e.g., GrapheneOS). It is simply a matter of where we focus our energy at the moment, not that we don’t see the issues.

webhamster

我是德国的实施者。根据eIDAS实施条例,我们必须使用某种形式的证明机制。没有操作系统的支持这是行不通的。

目前仅限于谷歌/安卓平台,这确实不理想,我们很清楚这一点,而且我们也支持其他操作系统(例如,GrapheneOS)正在我们的计划中。这只是我们当前精力集中所在的问题,并不是说我们没有看到这些问题。


Tell HN: Anthropic no longer allowing Claude Code … #

https://news.ycombinator.com/item?id=47634313

What you’re saying is conceptually true for subscription services in general, but thats not why they are making this change. There’s a 5 hour limit and a weekly limit. Those are hard token limits. Everyone on a plan pays for the max set of tokens in that plan. The limits manage capacity. The solution to that isn’t a change of ToS, it’s adjusting the limits.

In other words this is about Anthropic subsidizing their own tools to keep people on their platform. OpenClaw is just a good cover story for that. You can maximize plans just as easily w/ /loop. I do it all the time on max 20x. The agent consuming those tokens is irrelevant.

For what it’s worth I don’t use OpenClaw and don’t intend to, but I do use claude -p all the time.

goosejuice

你说的对于订阅服务来说在概念上是正确的,但他们做出这个改变的原因并不是这个。存在一个5小时限制和一个每周限制。这些都是硬性代币限制。每个订阅计划的用户都支付该计划内最大代币数量的费用。限制是为了管理容量。解决方案不是更改服务条款,而是调整限制。

换句话说,这关乎Anthropic通过补贴自己的工具来留住用户在他们的平台上。OpenClaw只是一个很好的幌子。你同样可以通过/loop轻松最大化计划。我经常在最大20倍计划上这样做。消耗代币的代理并不重要。

就我而言,我不使用OpenClaw,也没有打算使用,但我确实一直使用claude -p。


2026 04 05 HackerNews

2026-04-05 07:46:35

2026-04-05 Hacker News Top Stories #

  1. NASA公布阿尔忒弥斯II号宇航员使用尼康D5相机拍摄的自1972年以来首批高分辨率地球照片,展示大西洋、极光及昼夜分界线等壮观景象。
  2. 《Careless People》作者因Meta利用离职协议中的不贬损条款被禁止发表负面言论,违者面临高额罚款,反而推动该书销量接近20万册。
  3. EFF批评FAA实施为期21个月的无人机飞行限制,禁止在ICE车辆附近飞行,认为此举侵犯宪法第一和第五修正案权利并试图阻止公众监督移民执法。
  4. 研究提出无需验证器或强化学习的简单自我蒸馏方法,通过模型自身生成样本进行微调,显著提升大型语言模型的代码生成能力。
  5. iNaturalist是一个全球性公民科学平台,用户通过上传照片记录生物多样性,利用AI和社区众包识别物种,数据同步至科学数据库支持生态保护。
  6. 甲骨文在大规模裁员的同时提交超过3100份H-1B签证申请,引发外界质疑其利用签证项目以低成本替代美国本土员工。
  7. Delve被Y Combinator除名,原因包括开源许可违规及涉嫌为不合规客户提供虚假审核等严重欺诈行为,背叛了YC社区信任。
  8. MVIDIA是一款游戏化在线硬件学习平台,引导用户从基础晶体管开始逐步构建ALU、RAM等模块,最终完成处理器及GPU设计。
  9. Anthropic科学家利用Claude Code发现Linux内核NFS驱动中隐藏23年的远程可利用缓冲区溢出漏洞,显示AI在安全审计中的巨大潜力。
  10. 德国实施新军事服务法,要求18至45岁男性离境超过三个月须申请军事许可,以便战时掌握适龄男性行踪,目前服役仍属自愿。

1. 阿尔忒弥斯 II 号宇航员拍摄“壮观”地球照片 (Artemis II crew take “spectacular” image of Earth) #

https://www.bbc.com/news/articles/ce8jzr423p9o

美国宇航局(NASA)分享了阿尔忒弥斯 II 号(Artemis II)任务中宇航员拍摄的首批高分辨率地球照片。任务指挥官瑞德·怀斯曼(Reid Wiseman)在飞船完成最后一次发动机点火,将飞船送入飞月轨道后拍摄了这些“壮观”的照片。此时,飞船距离地球约 14.2 万英里(22.85 万公里),距离月球约 13.2 万英里。

照片中显示了大西洋的广阔蓝色海洋,地球大气层的辉光,以及两极的绿色极光。地球呈倒置状态,照片中可见西撒哈拉、伊比利亚半岛和南美洲东部。照片中还出现了明亮的金星。另一张照片展示了地球的昼夜分界线(终结线),夜晚的地球上灯光闪烁,显示出人类活动的痕迹。

阿尔忒弥斯 II 号任务是自 1972 年以来首次有人类飞出地球轨道,飞船将绕月球远侧飞行后返回地球,预计 4 月 6 日绕过月球远侧,4 月 10 日在太平洋溅落。宇航员们在完成轨道变换点火后兴奋地拍摄窗外景象,尽管最初拍摄时调整曝光较为困难,但很快适应了拍摄条件。

NASA 还发布了 1972 年阿波罗 17 号任务与 2026 年阿尔忒弥斯 II 号任务拍摄的地球照片对比,强调 54 年来技术进步的同时,地球的美丽依旧未变。此次任务为未来可能于 2028 年实现的载人月球着陆做准备。


HN 热度 1012 points | 评论 352 comments | 作者:andsoitis | 1 day ago #

https://news.ycombinator.com/item?id=47631118

  • 这张地球照片是用尼康 D5 相机拍摄的,镜头是 AF-S Zoom-Nikkor 14-24mm f/2.8G ED,后期处理很少,几乎是原图。
  • 尼康 D5 是官方的“手持通用月球相机”,同时也有尼康 Z9 相机搭载,D5 自 2017 年以来一直用于国际空间站,包括舱外活动。
  • 宇航员在使用 GoPro 和 iPhone 拍摄时遇到曝光过度的问题,而 D5 表现正常,显示老款专业相机依然可靠。
  • 传统单反相机有丰富的手动模式,可以强制拍摄,而现代自动化设备在复杂环境下容易失败。
  • D5 相机发布于 2016 年,不是 2005 年,时间上有误差。
  • 拍摄地球时光线环境复杂,类似地面拍摄月球的挑战,自动曝光容易误判导致过曝。
  • 有人质疑在如此昂贵的任务中使用普通消费电子设备显得不够专业,但也有人认为应允许宇航员尝试不同设备。
  • 这张照片在当下短视频盛行的时代显得非常珍贵和令人震撼。
  • 从 EXIF 信息看,照片几乎未做调整,使用了默认的 Adobe Color 色彩配置和线性色调曲线。
  • 照片显示的是地球夜晚和部分白昼区域,夜晚光线主要来自月光反射,城市灯光和大气散射也有贡献。
  • 大气中的蓝色光主要来自氧气,红橙色来自颗粒物,绿色和红色来自极光,照片细节丰富。
  • 宇宙中其他光源对照片影响极小,月光是主要光源。
  • 有评论调侃说宇宙中所有光源都贡献光线,但实际上只有月光显著影响照片。
  • 有网友对大气像被月光照亮的巨大灯泡的比喻表示新奇。
  • 也有人指出家里冰箱灯不会对照片产生影响,强调光源的实际贡献有限。
  • 这张照片被认为非常真实,细节和质感让人仿佛亲眼所见,极具美感。

2. 《“粗心人”一书作者被禁止发表任何关于 Meta 的负面言论》 (Author of “Careless People” banned from saying anything negative about Meta) #

https://www.thetimes.com/uk/technology-uk/article/sarah-wynn-williams-careless-people-meta-nrffdfpmf

这篇文章讲述了作者 Sarah Wynn-Williams 因揭露 Meta(前 Facebook)内部问题而遭遇的法律封口。她的书《Careless People》揭露了 Meta 在性骚扰、操纵未成年人等方面的严重指控。尽管书中内容基于大量证据,但 Meta 通过紧急仲裁程序,利用她与公司的离职协议中的不贬损条款,禁止她宣传书籍或发表任何负面言论。

这一禁令从 2025 年 3 月 13 日生效,限制了 Sarah 在英国的言论自由,甚至影响到她在私人场合与家人的交流。她面临每次违反禁令高达 5 万美元的罚款,可能导致经济崩溃。尽管如此,Meta 的封口行动反而使该书成为全球现象,销量接近 20 万册,引发媒体广泛关注。

文章还描述了出版过程的秘密和紧张,出版社为保护作者采取了加密沟通和保密措施。Sarah 在发布前未向亲友透露写书消息,宣传活动也因禁令被迫中断。文章强调,尽管 Meta 声称支持言论自由,但实际上只容许对自身无害的言论,揭示了大型科技公司对言论控制的强大影响力。


HN 热度 695 points | 评论 460 comments | 作者:macleginn | 9 hours ago #

https://news.ycombinator.com/item?id=47639524

  • 富有且有权势的人因为涉及我们关心的事情而被宽容,反映出社会对权力的纵容和道德缺失。
  • 高管团队内部存在不当行为,如谢丽尔·桑德伯格邀请作者睡在私人飞机床上的事件,且被周围人包庇。
  • 这种权力滥用行为应被普遍谴责,但现实中并未受到应有的批评。
  • 有人建议公众应持续质问涉事高管,以提醒其不当行为。
  • 允许权势人物为所欲为,实际上是在教导下一代模仿这种行为。
  • 美国社会对财富的追求常常忽视获取财富的方式是否正当。
  • 美国的贪婪表现得非常明显且令人震惊。
  • 精英阶层的虚伪和阿谀奉承在社会顶层普遍存在,令人感到尴尬。
  • 大型科技公司的员工和管理层中存在被宠坏的现象。
  • 人们更担心挑战富人带来的风险,而非他们表面上的善意。
  • 谢丽尔·桑德伯格以缺乏道德著称。
  • “爱泼斯坦阶层”体现了社会的道德沦丧,值得深入了解。
  • 尽管存在丑闻,Facebook 等平台仍未被广泛抵制,用户继续使用即是共谋。
  • 很多人早已停止使用这些平台,抵制难以普及。
  • 需要开发无广告、可自我维持的替代平台,减少对现有巨头的依赖。
  • Facebook Messenger 在隐私和群组管理方面曾有优势,但被端到端加密削弱了部分功能。
  • 迁移到其他平台的难度大,用户缺乏足够动力改变现状。

3. FAA 对无人机的飞行限制是试图将拍摄移民与海关执法局(ICE)行为定为犯罪 (The FAA’s flight restriction for drones is an attempt to criminalize filming ICE) #

https://www.eff.org/deeplinks/2026/04/faas-temporary-flight-restriction-drones-blatant-attempt-criminalize-filming-ice

这篇文章由电子前哨基金会(EFF)发布,重点批评了美国联邦航空管理局(FAA)于 2026 年 1 月 16 日开始实施的一项“临时”无人机飞行限制(TFR)。该限制禁止私人无人机操作员,包括专业和公民记者,在距离美国移民和海关执法局(ICE)或边境保护局(CBP)车辆半英里范围内飞行无人机,期限长达 21 个月,直到 2027 年 10 月 29 日。

文章指出,这项飞行限制严重侵犯了美国宪法第一修正案赋予的拍摄执法部门的权利。通过禁止无人机在执法车辆附近飞行,并对违规者施加刑事和民事处罚,甚至可能没收或摧毁无人机,FAA 实际上剥夺了公民记录执法行为的自由。文章强调,记录执法过程对于揭露警察不当行为和推动问责至关重要,尤其是在乔治·弗洛伊德、Renée Good 和 Alex Pretti 等案件中,民间录像发挥了重要作用。

此外,文章指出该飞行限制还违反了第五修正案的正当程序权利,因为无人机操作员无法获得明确的事先通知,难以判断自己是否处于限制范围内。FAA 自身的规定也未被遵守,例如未明确说明限制的具体危险或条件,也未为新闻机构提供获得飞行许可的联系方式。

文章认为,这项限制是在 2026 年明尼阿波利斯反 ICE 抗议活动高峰期实施的,意图阻止公民通过无人机记录移民执法行动,从而保护 ICE 及其他移民执法机构免受监督和问责。EFF 呼吁 FAA 撤销该飞行限制,并提醒公众在行使拍摄执法权利时需注意安全,防止遭到执法人员的报复。


HN 热度 523 points | 评论 178 comments | 作者:detaro | 24 hours ago #

https://news.ycombinator.com/item?id=47633947

  • 起诉者需要证明被告是有意且明知违法使用无人机拍摄,才能定罪,因此无标记车辆拍摄难以纳入范围。
  • 该限制不仅阻止针对 ICE 的法律行动,也旨在打击任何发布无人机视频并走红的人。
  • 政府基于无人机非法飞行拍摄的视频进行诉讼的情况很少见。
  • 有人建议在美国以外的国家建立匿名发布 ICE 无人机视频的网站,但其他国家也可能存在新闻审查和压力。
  • FAA 拥有对所有可航行空域的管辖权,包括地面上方的低空,无人机飞行无最低高度限制。
  • FAA 的管辖权被认为是对州权的侵犯,且可能违宪,但法院通常支持 FAA 的权力。
  • 低于 500 英尺的空域通常不属于飞机飞行范围,超过该高度则需遵守 FAA 规定。
  • 传统上 FAA 主要管控高空跨州飞行,低空本地活动如滑翔伞未被严格管制,现对无人机的限制被认为过度。
  • 州和地方政府对空域的主张在法律上可能难以执行,但实际通过发放许可进行限制。
  • 起诉时需要说服陪审团,被告若辩称无意违法,需让陪审团信服其说法。

4. 极其简单的自我蒸馏提升代码生成 (Embarrassingly simple self-distillation improves code generation) #

https://arxiv.org/abs/2604.01193

该网页展示了一篇计算机科学领域的学术论文,题为《Embarrassingly Simple Self-Distillation Improves Code Generation》(极其简单的自我蒸馏提升代码生成能力),由 Ruixiang Zhang 等六位作者撰写,发表于 2026 年 4 月 1 日。论文提出了一种名为简单自我蒸馏(SSD)的方法,用于提升大型语言模型(LLM)在代码生成任务中的表现。

该方法不依赖验证器、教师模型或强化学习,仅通过模型自身生成的代码样本进行采样,然后使用标准的监督微调进行训练。实验结果显示,SSD 显著提升了 Qwen3-30B-Instruct 模型在 LiveCodeBench v6 测试集上的通过率,从 42.4% 提高到 55.3%,尤其在解决较难问题时效果明显。该方法适用于不同规模(4B、8B、30B)和不同类型(指令型和思考型)的 Qwen 和 Llama 模型。

论文还分析了 SSD 方法有效的原因,指出其通过调整解码时的精度与探索之间的冲突,动态调整生成的 token 分布,抑制无关干扰的概率分布尾部,同时保持必要的多样性,从而提升代码生成的质量。SSD 为提升大型语言模型代码生成能力提供了一种简单且有效的后训练方向。


HN 热度 513 points | 评论 161 comments | 作者:Anon84 | 13 hours ago #

https://news.ycombinator.com/item?id=47637757

  • 该论文提出的自蒸馏技术(SSD)通过提升模型在“分叉”和“锁定”位置的最优词排名,使模型能够更好地在探索和精确之间切换,从而提高代码生成质量。
  • 模型并未实时调整温度或标注“分叉”“锁定”点,而是通过输入多样化的解决方案让模型学习何时应保持固定或变化。
  • 大型语言模型(LLM)的涌现特性仍是黑箱,类似于人类大脑的复杂性,理解其机制仍在不断探索中。
  • 与人脑相比,LLM 结构更简单且可控,设计者能追踪其每个信号,因此在某种程度上对 LLM 的理解优于对人脑的理解。
  • LLM 虽然是“生长”而非“设计”出来的,但其底层架构是人为设计的,复杂行为是训练过程中自然产生的。
  • 机器学习领域解决的问题往往是传统确定性代码难以覆盖的海量情况,ML 模型以牺牲部分精确度换取实用性和效率。
  • 传统编写代码覆盖所有情况几乎不可能,ML 提供了一种可行的替代方案。
  • 对 LLM 的可解释性研究进展迅速,虽然尚未完全理解其工作机制,但已有显著突破。
  • 发现 LLM 的新特性虽在意料之中,但仍值得庆祝和关注。
  • AI 技术的持续发展是必然趋势,市场炒作和投资泡沫不会改变其长期存在和影响。

5. iNaturalist (iNaturalist) #

https://www.inaturalist.org/

该网页是一个自然观察和生物多样性记录平台的介绍页面,主要内容围绕用户如何通过该平台记录、分享和学习自然界中的各种生物观察。用户可以上传自己在自然界中遇到的动植物照片和信息,平台通过社区和专家帮助进行物种识别,促进科学研究和生态保护。

网页展示了多个用户上传的自然观察实例,如蜂鸟、非洲卷尾鸟、变色蜥蜴、澳大利亚植物、蝴蝶和黏菌等,体现了平台的全球覆盖和多样性。平台强调每个观察记录都能为生物多样性科学贡献数据,并与全球生物多样性信息设施等科学数据仓库共享。

此外,网页介绍了平台的功能和优势,包括记录和管理生命清单、创建有用的科学数据、众包物种识别、参与公民科学项目、学习自然知识以及举办生物多样性快速调查(Bioblitz)活动。平台支持多设备使用,提供移动应用,方便用户随时随地进行观察记录。

网页还包含多位用户和专家的推荐和使用感受,体现了平台在全球自然爱好者、科学家和研究人员中的广泛认可和价值。总体来说,该平台旨在连接自然爱好者与科学研究,推动公众参与自然保护和生态科学。


HN 热度 513 points | 评论 128 comments | 作者:bookofjoe | 1 day ago #

https://news.ycombinator.com/item?id=47629433

  • iNaturalist API 非常好用,支持免认证的只读操作且开放 CORS,适合演示和教学。
  • Seek 应用适合快速拍照自动识别,适合自然爱好者,但启动时频繁弹出的“请勿打扰自然”提示让用户体验不佳。
  • iNaturalist 应用功能更丰富,现已集成自动识别功能,成为默认选择。
  • 弹窗提示虽有提醒作用,但频繁出现容易让用户产生反感甚至卸载应用。
  • iNaturalist 数据易于导出且支持多种视图,且在英国的数据还能同步到其他生物多样性平台,提升数据价值。
  • 有基于 iNaturalist 数据开发的趣味游戏和工具,增加了使用的趣味性和实用性。
  • iNaturalist API 虽然有一些小缺陷,但整体用户体验优于多数生物多样性平台。
  • 通过 iNaturalist 可以发现附近的稀有物种,增强了用户的自然观察体验。
  • 允许使用地理位置功能时,应用应自动显示附近的匹配结果,提升使用便捷性。
  • iNaturalist 存在隐私风险,用户上传的观察数据可能暴露家庭住址,尤其是非技术用户不易察觉。
  • 用户可以隐藏自己家附近的观察位置,但他人上传的观察可能引来访客,带来一定困扰。
  • 观察数据对防控入侵物种有积极作用,相关部门可通过平台联系上传者进行实地调查。

6. 甲骨文在大规模裁员中提交大量 H-1B 签证申请 (Oracle files H-1B visa petitions amid mass layoffs) #

https://nationaltoday.com/us/tx/austin/news/2026/04/03/oracle-files-thousands-of-h-1b-visa-petitions-amid-mass-layoffs/

这篇文章报道了软件公司甲骨文(Oracle)在大规模裁员的同时,仍然提交了大量 H-1B 签证申请。根据联邦数据,甲骨文在 2025 财年提交了 2690 份 H-1B 签证申请,2026 财年截至目前又提交了 436 份,总计超过 3100 份。这引发了外界对甲骨文是否利用 H-1B 签证项目替代美国员工的质疑。

H-1B 签证允许公司临时雇佣具备专业技能的外国员工,尤其是在科技行业。批评者认为该项目被用来以较低成本替代美国员工,而支持者则认为其有助于填补关键人才缺口。甲骨文在裁员的同时大量申请 H-1B 签证,凸显了这一争议的复杂性。

目前,甲骨文尚未对裁员和签证申请情况作出公开回应。此次事件引发了关于 H-1B 项目对美国劳动力市场影响的持续讨论,也呼吁企业在使用该项目时应更加透明。文章还简要介绍了甲骨文作为总部位于德克萨斯州奥斯汀的软件公司,正经历重大组织调整。


HN 热度 505 points | 评论 304 comments | 作者:kklisura | 1 day ago #

https://news.ycombinator.com/item?id=47631732

  • Oracle 近期裁员,同时申请 H-1B 签证引发争议。
  • 部分网友指出,Oracle 在美国的裁员人数不容小觑,可能高达数千人。
  • 有人质疑官方数据的可靠性,认为就业率统计存在问题。
  • 讨论中提到,很多高技能人才仍在寻找工作。
  • 有网友认为 H-1B 签证制度会使外籍员工处于不利地位。
  • 一些评论认为美国的就业统计数据被夸大,掩盖了真实的就业市场状况。
  • 对于企业为何依然申请 H-1B 签证,部分人认为这与降低成本有关。
  • 还有人认为目前的经济形势和公司裁员不利于国内劳动力的使用。
  • 有网友提到希望对 H-1B 签证进行改革,以更好地保护美国本土工人。
  • 最后,有人表示不打算继续为一个不支持自身利益的国家而奋斗。

7. Delve 被 Y Combinator 移除 (Delve removed from Y Combinator) #

https://www.ycombinator.com/companies/delve

该网页显示“404 文件未找到”的错误信息,表示所请求的页面不存在或已被删除。页面提供了返回主页的链接,并建议用户如需帮助,可以通过邮箱 [email protected]:[email protected] 联系支持团队。整体内容简洁,主要用于告知用户页面无法访问及提供后续操作指引。


HN 热度 465 points | 评论 288 comments | 作者:carabiner | 22 hours ago #

https://news.ycombinator.com/item?id=47634690

  • Delve 被 Y Combinator 除名不仅因为开源许可违规,更因涉嫌严重欺诈行为,如为不合规客户提供虚假审核,可能导致客户面临法律风险。
  • Y Combinator 对道德上有争议的行为通常不干涉,但 Delve 因背叛了其他 YC 公司,滥用 YC 社区资源和客户基础,尤其是虚假审核,才被除名。
  • YC 对其投资的初创公司行为负有一定责任,尽管不承担法律责任。
  • 有观点认为 YC 投资的部分公司对社会造成了负面影响,如 Scribd 通过抓取他人 PDF 内容并设置付费墙,缺乏实际价值。
  • 讨论中提到 Reddit 等平台对社会产生了负面影响,包括加剧意识形态泡沫、推动从众行为和缺乏有效监管。
  • 也有人认为 Reddit 的负面影响部分源于其推荐算法和投票机制,但类似的平台若不存在,类似问题仍会出现,只是可能发展较慢。
  • Facebook、Twitter 和 Instagram 被认为是主导社交媒体负面影响的主要平台,Reddit 影响相对较小。
  • 有观点批评科技公司和投资机构缺乏责任感,纵容或忽视其投资公司对社会的负面影响。
  • 也有人指出,Reddit 创始人最初并未预见到平台会产生的社会影响,最初只是作为社交书签工具。

8. 展示 HN:一个让你构建 GPU 的游戏 (Show HN: A game where you build a GPU) #

https://jaso1024.com/mvidia/

该网页是一个名为“MVIDIA”的在线学习平台,旨在引导用户从基础硬件知识开始,逐步学习计算机硬件设计和处理器构建的过程。网页以“从晶体管到万亿次运算”为主题,模拟了一个硬件工程师的入门培训。

内容分为多个章节和任务,第一部分“你的第一天”涵盖了晶体管和逻辑门的基础知识,包括电流、电压、半导体掺杂、PN 结、NMOS 和 PMOS 晶体管的构造与工作原理,以及如何利用晶体管实现数字信号的开关功能。通过一系列任务,用户将学习构建基本的逻辑门如 NAND、AND、OR、XOR 门,并理解它们的真值表。

第二部分“核心”深入介绍了从逻辑门到算术逻辑单元(ALU)再到处理器的设计过程,包含半加器、全加器、译码器、电容器、寄存器文件、RAM、计数器等硬件模块的构建与组合。该部分任务较多,涉及复杂的硬件设计和数字电路实现,逐步引导用户完成一个简易处理器的设计。

后续章节“软件”、“GPU”和“着色器”目前尚未开放,预示着平台未来将扩展到处理器编程、图形处理器构建和 GPU 编程等高级主题。

整体来看,该网页是一个系统化的硬件学习工具,适合对计算机硬件设计感兴趣的学习者,通过互动式任务逐步掌握从晶体管到处理器的完整知识体系。


HN 热度 424 points | 评论 122 comments | 作者:Jaso1024 | 7 hours ago #

https://news.ycombinator.com/item?id=47640728

  • 真值表关卡设计有问题,题目顺序应调整为先教学后测试,且计时过短导致难以完成,建议增加时间或取消计时。
  • 电容关卡存在设计缺陷,电容不应有“使能”门,且模拟系统对电容的支持有限,导致玩法不合理。
  • 时间限制较紧的关卡体验不佳,尤其是 DRAM 刷新关卡过于繁琐且无趣,建议减少时间或简化操作。
  • UI 设计整体不错,布线算法表现良好,但部分模块连接未对齐网格,影响美观和使用体验。
  • 背景网格线颜色与线条混淆,建议改为仅显示点阵以避免误导。
  • 希望增加色盲模式,使用图案代替颜色以方便色盲用户。
  • 游戏适合有一定数字逻辑基础的玩家,初学者可能难以理解教程内容,建议增加入门关卡。
  • 开发者积极回应反馈并计划修复问题和优化体验。
  • 有用户推荐类似游戏《Turing Complete》,该游戏也涉及自制 CPU 和汇编语言,适合对数字电路感兴趣的玩家。

9. Claude Code 发现了隐藏了 23 年的 Linux 漏洞 (Claude Code Found a Linux Vulnerability Hidden for 23 Years) #

https://mtlynch.io/claude-code-found-linux-vulnerability/

这篇博客文章介绍了 Anthropic 研究科学家 Nicholas Carlini 利用 Claude Code 这一大型语言模型发现了多个 Linux 内核中的远程可利用安全漏洞,其中一个漏洞甚至隐藏了 23 年之久。

文章详细描述了 Nicholas 如何通过一个简单的脚本,逐个扫描 Linux 内核源代码文件,指示 Claude Code 寻找安全漏洞,从而高效地发现了多个难以察觉的漏洞。

重点介绍了一个位于 Linux 网络文件共享(NFS)驱动中的漏洞。该漏洞允许攻击者通过两个协作的 NFS 客户端,利用 NFS 服务器在处理锁请求时缓冲区溢出的问题,读取敏感的内核内存。具体来说,攻击者利用了服务器在拒绝第二个客户端锁请求时,错误地将一个最大 1024 字节的 owner ID 写入仅有 112 字节的缓冲区,导致内存溢出。

该漏洞最早出现在 2003 年,距今已有 23 年历史,且由于代码管理工具的限制,难以直接追溯到具体提交。Nicholas 还指出,他发现了数百个潜在漏洞,但由于需要人工验证,尚未全部报告给 Linux 内核维护者。

文章还提到,Claude Code 的最新版本 Opus 4.6 在漏洞发现能力上远超之前版本,预示着未来将有大量安全漏洞被 AI 模型揭示,给安全研究和防御带来巨大影响。

最后,文章列举了 Nicholas 已修复或报告的五个 Linux 内核漏洞,并强调了大型语言模型在安全领域的快速进步和广泛应用前景。


HN 热度 348 points | 评论 225 comments | 作者:eichin | 24 hours ago #

https://news.ycombinator.com/item?id=47633855

  • 使用 AI 模型(如 Claude、Codex)进行代码审查可以快速发现线程和分布式系统中的难以察觉的 bug,极大提高开发效率。
  • 通过提示模型“代码中有 bug”或“bug 不明显”,能提高模型发现问题的准确率。
  • 对于大型代码库,分文件逐步定位 bug 是有效的策略。
  • AI 有时会误判复杂代码中的锁无关算法为存在 bug,需谨慎对待模型的判断。
  • 结合不同模型的优势(如让 Claude 调用 Codex 进行代码审查)能获得更好的结果。
  • 静态分析工具在发现固定大小缓冲区溢出等问题上有优势,但在 Linux 内核等复杂环境中仍存在局限。
  • 许多漏洞是因为“没人去仔细看”,AI 模型的出现增加了全球范围内发现漏洞的能力。
  • 未来开源代码的安全审查将更多依赖 AI,而闭源代码的安全审查成本较高,可能导致竞争力下降。
  • AI 对二进制代码的分析能力也有潜力,可能引发大量零日漏洞曝光。
  • 传统静态分析工具虽能发现部分漏洞,但常被大量误报淹没,导致漏洞长时间未被修复。
  • 过去的重大漏洞(如 Heartbleed)也是因为对数据长度等细节未充分检查,AI 有助于避免类似问题。

10. 德国 18 至 45 岁男性长期出国需军事许可 (German men 18-45 need military permit for extended stays abroad) #

https://www.dw.com/en/german-men-need-military-permit-for-extended-stays-abroad/a-76662677

德国于 2026 年初实施了一项新的军事服务现代化法,旨在应对俄罗斯对乌克兰战争带来的欧洲安全威胁,并计划将现有约 18 万现役士兵增加到 2035 年的 26 万。该法案引发了争议,许多人担心可能重新引入自 2011 年暂停的义务兵役,因此曾有抗议活动。

新法中一个较少被关注的条款规定,18 至 45 岁的德国男性如果计划离开德国超过三个月,必须向联邦国防军职业中心申请批准。无论是出国留学、工作还是长时间旅行,都需遵守此规定。联邦国防军发言人表示,此举是为了在战争爆发时掌握长期居住国外的男性人数。虽然需要申请许可,但职业中心必须在无军事服役需求的情况下发放许可,且目前服役仍基于自愿原则。

国防部承认该规定影响深远,正在制定例外规则,但尚不清楚违规者将面临何种后果。发言人指出,这一规定冷战时期已有,但当时并无实际执行和处罚。

此外,法律要求所有 18 岁男性填写关于教育、健康和服役意愿的问卷,女性则自愿填写。自 2027 年中起,所有 18 岁男性还需参加体能测试,以评估冲突时的征召潜力,此举被批评为向全面征兵迈出的第一步。执政联盟在是否恢复义务兵役问题上存在分歧,最终决定暂时保持服役自愿制。


HN 热度 333 points | 评论 561 comments | 作者:L_226 | 8 hours ago #

https://news.ycombinator.com/item?id=47639976

  • 德国男性 18-45 岁需申请军事许可以延长国外停留时间,但目前军事服役完全是自愿,许可通常会被批准且无处罚。
  • 该规定历史悠久,冷战时期已有,但之前仅在紧急状态(Spannungsfall/Verteidigungsfall)时生效,现已提前激活,便于未来快速管控。
  • 该措施主要是为未来可能的军事动员做准备,方便政府掌握适龄男性的行踪和限制其出境。
  • 女性未被要求服兵役,部分原因是法律认为女性在家庭中承担较多无偿劳动,且已有国家和地区(如库尔德人、以色列、瑞典)证明女性完全能胜任军职。
  • 美国虽长期未征兵,但仍要求 18-25 岁男性注册兵役系统,作为一种预备机制,类似德国的做法。
  • 该政策被视为“多余的繁文缛节”,但在紧急情况下能迅速启用,避免临时建立新系统的复杂性。
  • 有观点指出,女性承担大量无偿家庭劳动,但这并未转化为社会保障,反映性别角色分工的不平等。
  • 目前该许可制度执行松散,很多人未实际注册或关注,只有在真正需要时才会严格执行。

Hacker News 精彩评论及翻译 #

Tell HN: Anthropic no longer allowing Claude Code … #

https://news.ycombinator.com/item?id=47633987

There seem to be a ton of people who don’t understand how subscription services work. Every single one of them oversells their capacity. The power users that use the services a lot are subsidized by those who don’t use it as much, which tends to be the vast majority of the user base. OpenClaw is an autonomous power user. The growing adoption of this walking attack surface was either going to A) cause the cost of Claude to go up or B) get banned to protect the price of the service for actual users.

jesse_dot_id

似乎有很多人不理解订阅服务是如何运作的。每一家服务商都会高估自己的承载能力。那些大量使用服务的重度用户,是由使用较少的用户补贴的,而这部分占用户群的大多数。OpenClaw 是一个自主的重度用户。这种不断扩大的“移动攻击面”的采用,要么会导致Claude的成本上升,要么会被禁止,以保护真正用户的服务价格。


Why are we still using Markdown? #

https://news.ycombinator.com/item?id=47630034

Because, like UNIX/Linux itself, worse is better: https://en.wikipedia.org/wiki/Worse_is_better - and perfect is the enemy of “good enough.”

We want to encourage people to produce written output with minimal friction. Barriers to writing–and especially barriers to producing documentation–should be minimized. Writing well is difficult enough!

Markup is overhead. Complex markup is even more overhead. Markdown is the best compromise we know of today that provides just enough structure and typographic capability, while imposing very little cognitive load on the author.

Besides, if you need something more complicated these days, you can have your favorite AI agent do it.

otterley

因为,就像UNIX/Linux本身一样,更糟即是更好:https://en.wikipedia.org/wiki/Worse_is_better ——而完美是“足够好”的敌人。

我们希望鼓励人们以最小的阻力产出书面内容。写作的障碍——尤其是产生文档的障碍——应该被最大限度地减少。写好文章本身已经够难了!

标记语言是额外负担。复杂的标记语言负担更重。Markdown是我们目前知道的最佳折中方案,既提供了足够的结构和排版能力,又对作者施加的认知负担非常小。

而且,如果你现在需要更复杂的内容,可以让你喜欢的AI助手来完成。


Delve removed from Y Combinator #

https://news.ycombinator.com/item?id=47635632

I’m getting the impression that a lot of people in this thread think this is because they violated an open-source license and saying things to the effect of, “they’re just the ones who got caught”. I also thought that was the scandal initially. (And when it comes to license violations, yes, there’s absolutely more where that came from.)

But that’s just the cherry on top. I don’t think they’re being thrown out because they violated a license. There are really serious fraud allegations. Allegedly they were rubber-stamping noncompliant customers, leaving them exposed to potential criminal liability under regulations like HIPPA.

https://deepdelver.substack.com/p/delve-fake-compliance-as-a-service

I’ve only skimmed this so I do not endorse these allegations, but I think it’s context missing from this discussion.

maxbond

我感觉这个帖子里很多人认为这是因为他们违反了开源许可证,然后说类似“他们只是被抓到的那批人”的话。我一开始也以为这就是丑闻的全部。(关于许可证违规,是的,肯定还有更多类似的情况。)

但那只是冰山一角。我不认为他们被清除是因为违反了许可证。这实际上涉及非常严重的欺诈指控。据称他们对不合规的客户草率审批,使这些客户可能因为违反像HIPAA这样的法规而面临刑事责任。

https://deepdelver.substack.com/p/delve-fake-compliance-as-a-service

我只是浏览了一下,所以不表示认可这些指控,但我觉得这是这场讨论中缺失的背景。


Author of “Careless People” banned from saying any… #

https://news.ycombinator.com/item?id=47639905

This book was SO GOOD.

It’s bleak. I always imagined that rich/powerful people only created suffering if that suffering was required for certain goals. It’s easier for me to bear injustice when it’s a zero-sum game. But the story of Facebook is not that. Facebook didn’t make ethical sacrifices for profit – its executives just didn’t care to understand the consequences of their actions. I wish those folks could feel how much harm they’ve caused.

surprisetalk

这本书真是太棒了。

故事相当沉重。我一直以为有钱有权的人只有在追求某些目标时才会制造痛苦。当这是一个零和游戏时,我更容易接受不公。但Facebook的故事并非如此。Facebook并不是为了利润而做出道德上的妥协——它的高管们只是根本不关心自己行为的后果。我真希望那些人能意识到他们造成了多大的伤害。


Tell HN: Anthropic no longer allowing Claude Code … #

https://news.ycombinator.com/item?id=47634445

You aren’t paying to be using that limit all of the time.

You are paying to be using that limit some of the time. There are 5 hour windows when you are sleeping and can’t use it. There are weekend limits.

Theoretically you can max out every 5 hour window, but they lose money on that.

It’s structured so users can have bursts of unlimited usage, and spend ~15% of the theoretical max cap, and that’s still cheaper than a subscription for that user.

An OpenClaw user can use 6, 7, 8 times what a human subscriber is using.

jmalicki

你不是一直在付费使用那个限额。

你付费是为了在某些时间段内使用那个限额。你有5小时的时段是在睡觉,不能使用。还有周末的限制。

理论上你可以在每个5小时的时段内用满,但他们会亏钱。

这个结构是让用户能够有爆发式的无限使用,同时只用到理论最高限额的大约15%,而这仍然比为该用户付订阅费便宜。

一个OpenClaw用户的使用量是普通订阅用户的6、7、8倍。


Oracle files H-1B visa petitions amid mass layoffs #

https://news.ycombinator.com/item?id=47632588

From your first link, it says 10% of 28k employees in India were cut. I personally know several people who were laid off from Oracle this week (OCI). One person who’s still there described it as a “bloodbath across our division” and says he counted 15k. I don’t know what exactly he was counting but as we’re in North America I am assuming they’re all here. Whereas India layoffs were fewer than 3k. So that directly disputes your statement that “they’ve barely fired any American workers”.

saulpw

从你第一个链接来看,印度有10%的2.8万名员工被裁掉。我个人认识几位本周被Oracle(OCI)裁员的人。其中一个还在公司的员工形容这次裁员是“我们部门的一场屠杀”,他说他数到了1.5万。我不知道他具体数的是什么,但鉴于我们是在北美,我猜这些员工都在这里。而印度的裁员人数少于三千人。因此这直接驳斥了你“他们几乎没有解雇美国员工”的说法。


Oracle files H-1B visa petitions amid mass layoffs #

https://news.ycombinator.com/item?id=47632095

Wherever their major offices are look for newspapers in the small towns nearby advertising for “Software developers for Oracle” all written in the tiniest print, right next to classified that sell used bikes, car parts and other stuff.

  • “Well, Uncle Sam, we looked so hard in US and nobody answered our job posts, we have to go to … $othercountry to hire, there is no other way”

rdtsc

无论他们的主要办公室在哪里,都去附近的小镇找报纸,上面会有“Oracle软件开发员”的招聘广告,字体非常小,就挨着卖二手自行车、汽车零件和其他东西的分类广告。

——“好了,山姆大叔,我们在美国找了很久,没有人回应我们的招聘信息,我们不得不去……某个其他国家招聘,别无他法。”


Artemis II crew take “spectacular” image of Earth #

https://news.ycombinator.com/item?id=47632457

Looking at the EXIF (with exiftool) for the image uploaded by NASA ( https://www.nasa.gov/wp-content/uploads/2026/04/art002e000192.jpg ), apparently this was taken by a Nikon D5 with an AF-S Zoom-Nikkor 14-24mm f/2.8G ED and developed with Lightroom. It also seems like very little was done in Lightroom. Amazing… I dumped the whole EXIF here: https://gist.github.com/umgefahren/a6f555e6588a98adb74eed79d734012c

hannesfur

查看NASA上传的这张图片的EXIF信息(使用exiftool)(https://www.nasa.gov/wp-content/uploads/2026/04/art002e000192.jpg),显然这是用尼康D5相机配AF-S Zoom-Nikkor 14-24mm f/2.8G ED镜头拍摄的,并且用Lightroom进行了后期处理。看起来在Lightroom中几乎没有做太多处理。真令人惊叹……我把完整的EXIF信息放在这里了:https://gist.github.com/umgefahren/a6f555e6588a98adb74eed79d734012c


Claude Code Found a Linux Vulnerability Hidden for… #

https://news.ycombinator.com/item?id=47637780

This isn’t surprising. What is not mentioned is that Claude Code also found one thousand false positive bugs, which developers spent three months to rule out.

jason1cho

这并不令人惊讶。没有提到的是,Claude Code还发现了一千个误报漏洞,开发人员花了三个月时间来排查。


Author of “Careless People” banned from saying any… #

https://news.ycombinator.com/item?id=47639862

“They were careless people, Tom and Daisy- they smashed up things and creatures and then retreated back into their money or their vast carelessness or whatever it was that kept them together, and let other people clean up the mess they had made.” ― F. Scott Fitzgerald, The Great Gatsby

grokcodec

“他们是粗心大意的人,汤姆和黛西——他们毁坏了事物和生灵,然后又退回到他们的财富里,或者他们那巨大无比的漫不经心里,或无论是什么让他们维系在一起的东西,然后让别人去收拾他们制造的烂摊子。” —— F·斯科特·菲茨杰拉德,《了不起的盖茨比》


Why are we still using Markdown? #

https://news.ycombinator.com/item?id=47630316

It’s also worth remembering that markdown tried very hard to encode conventions that were already used in Usenet, email, and other text media. A > to indicate a quote was widespread Usenet convention. Asterisks or underscores to indicate emphasis was also a common convention; both are legal because both were common. Double asterisk or double underscores to indicate really, really emphasizing something was also a common convention. So were asterisks to display a bulleted list, blank lines to separate paragraphs, and indenting 4+ spaces to write code.

It’s a good example of “pave the path” design philosophy, where you do what users are already doing rather than trying to impose some platonic ideal of what the world should be like. And it works quite well at that.

nostrademons

同样值得记住的是,Markdown 努力编码了已经在 Usenet、电子邮件和其他文本媒体中广泛使用的惯例。用大于号(>)表示引用是 Usenet 上广泛使用的惯例。用星号或下划线表示强调也很常见;两者都是合法的,因为它们都很普遍。双星号或双下划线表示非常强调某事也是常见惯例。用星号表示项目符号列表、用空行分段以及缩进四个或更多空格来写代码也是如此。

这是“铺路式”设计理念的一个好例子,即做用户已经在做的事情,而不是试图强加某种理想化的世界观。而且这种方式效果非常好。


Tell HN: Anthropic no longer allowing Claude Code … #

https://news.ycombinator.com/item?id=47635320

I suspect people are misdiagnosing the root cause of why Anthropic is doing this a bit.

I don’t think this is particularly about the financial impact of people using OpenClaw - they can adjust the amount of tokens in a subscription quite easily.

I think the root cause is that Anthropic is capacity constrained so is having to make choices about the customers they want to serve and have chosen people who use Claude Code above other segments.

We know Anthropic weren’t as aggressive as OpenAI through 2025 in signing huge capacity deals with the hyperscalers and instead signed smaller deals with more neo-clouds, and we know some of the neo-clouds have had trouble delivering capacity as quickly as they promised.

We also know Claude Code usage is growing very fast - almost certainly faster since December 2025 than Anthropic predicted 12 months ago when they were doing 12-month capacity planning.

We know Anthropic has suffered from brown-outs in Claude availability.

Put this all together and a reasonable hypothesis is that Anthropic is choosing which customers to service rather than raising prices.

nl

我怀疑大家有些误判了Anthropic采取这一做法的根本原因。

我不认为这主要是因为人们使用OpenClaw带来的经济影响——他们可以很容易地调整订阅中的代币数量。

我认为根本原因是Anthropic的容量有限,所以不得不在他们想服务的客户群中做出选择,而他们选择了优先服务使用Claude Code的用户,而不是其他用户群体。

我们知道,Anthropic在2025年之前并没有像OpenAI那样积极地与大型云服务商签订巨额容量合同,而是与更多新兴云平台签订了较小的合同。我们也知道,一些新兴云平台未能像承诺的那样快速提供容量。

我们还知道Claude Code的使用量增长非常快——几乎可以确定,自2025年12月以来的增长速度远超Anthropic在一年前做12个月容量规划时的预期。

我们知道Anthropic曾出现过Claude服务的容量不足问题。

综合来看,一个合理的推测是,Anthropic正在选择服务哪些客户,而不是单纯通过提高价格来应对问题。


The FAA’s flight restriction for drones is an atte… #

https://news.ycombinator.com/item?id=47634531

Flying a drone within 1/2 mile of ICE vehicles, which may be unmarked, is illegal? You can be flying a drone and if an unmarked ICE vehicle drives close enough, without warning, you have now broken serious FAA laws? This isn’t the kind of restriction that gets passed when the people making the rules care about being fair or consistent. It’s a power grab.

Aurornis

在距ICE车辆半英里范围内飞无人机是违法的,而这些车辆可能没有标记?你正在飞无人机,如果一辆无标记的ICE车辆突然开得很近,你就已经违反了FAA的严重法规?这不是那些制定规则的人出于公平或一致性考虑而通过的限制。这是权力的掠夺。


OpenClaw privilege escalation vulnerability #

https://news.ycombinator.com/item?id=47629849

OpenClaw creator here.

This was a privilege-escalation bug, but not “any random Telegram/Discord message can instantly own every OpenClaw instance.”

The root issue was an incomplete fix. The earlier advisory hardened the gateway RPC path for device approvals by passing the caller’s scopes into the core approval check. But the /pair approve plugin command path still called the same approval function without callerScopes, and the core logic failed open when that parameter was missing.

So the strongest confirmed exploit path was: a client that ALREADY HAD GATEWAY ACCESS and enough permission to send commands could use chat.send with /pair approve latest to approve a pending device request asking for broader scopes, including operator.admin. In other words: a scope-ceiling bypass from pairing/write-level access to admin.

This was not primarily a Telegram-specific or message-provider-specific bug. The bug lived in the shared plugin command handler, so any already-authorized command sender that could reach /pair approve could hit it. For Telegram specifically, the default DM policy blocks unknown outsiders before command execution, so this was not “message the bot once and get admin.” But an already-authorized Telegram sender could still reach the vulnerable path.

The practical risk for this was very low, especially if OpenClaw is used as single-user personal assistant. We’re working hard to harden the codebase with folks from Nvidia, ByteDance, Tencent and OpenAI.

steipete

我是OpenClaw的开发者。

这是一个权限提升漏洞,但并不是“任何随机的Telegram/Discord消息都能立即控制所有OpenClaw实例”。

根本原因是之前的修复不完整。之前的通告加强了网关RPC路径的设备审批,通过将调用者的权限传入核心审批检查。但/pair approve插件命令路径仍然调用相同的审批函数,却没有传入callerScopes,导致核心逻辑在缺少这个参数时默认放行。

所以最强的确认利用路径是:一个已经拥有网关访问权限且有足够权限发送命令的客户端,可以用chat.send命令配合/pair approve latest来批准一个请求更广泛权限(包括operator.admin)的待处理设备请求。换句话说,就是从配对/写权限直接绕过权限限制到管理员权限。

这并非主要是Telegram特定或消息提供方特定的漏洞。漏洞存在于共享插件命令处理器中,因此任何已经授权能访问/pair approve命令的发送方都能利用它。对于Telegram来说,默认的私信策略会在执行命令前阻止未知外部用户,所以并不存在“发条消息给机器人就能获得管理员权限”。但已经授权的Telegram发送者依然可能触发这个漏洞路径。

这带来的实际风险非常低,尤其是如果OpenClaw被用作单用户的个人助手。目前我们正在与Nvidia、字节跳动、腾讯和OpenAI的同事共同努力加强代码安全。


Decisions that eroded trust in Azure – by a former… #

https://news.ycombinator.com/item?id=47623649

This isn’t incentivized in corporate environment.

Noticed how “the talent left after the launch” is mentioned in the article? Same problem. You don’t get rewarded for cleaning up mess (despite lip service from management) nor for maintaining the product after the launch. Only big launches matter.

The other corporate problem is that it takes time before the cleanup produces measurable benefits and you may as well get reorged before this happens.

praptak

这在企业环境中没有激励机制。

注意文章中提到的“人才在发布后离开”吗?同样的问题。你不会因为收拾残局(尽管管理层口头上说得好听)或者在产品发布后维护产品而得到奖励。只有大型发布才重要。

另一个企业问题是,清理工作需要时间才能产生可衡量的效益,而在这之前你可能已经被重组了。


Gold overtakes U.S. Treasuries as the largest fore… #

https://news.ycombinator.com/item?id=47635834

America was in practice running an empire that collected tribute from the rest of planet earth in exchange for entries in a database denominated in a currency they controlled and that was accepted everywhere. Really the only way it could go wrong is putting it under the control of someone who doesn’t understand the kayfabe…

aloha2436

实际上,美国当时运行着一个帝国,向地球上其他地方征收贡品,换取他们用一种自己控制的货币记账的数据库条目,并且这种货币被全球接受。真的,如果要出问题,唯一的可能就是把它交给一个不懂“演戏套路”的人来掌控……


iNaturalist #

https://news.ycombinator.com/item?id=47629621

The iNaturalist API is an absolute gem. It doesn’t require authentication for read-only operations and it has open CORS headers which means it’s amazing for demos and tutorials.

My partner and I built this website with it a few years ago: https://www.owlsnearme.com/

(I realize this is a bit on-brand for me but I also use it to track pelicans https://tools.simonwillison.net/species-observation-map#%7B%22taxonId%22%3A123829%2C%22taxonName%22%3A%22California%20Brown%20Pelican%22%2C%22days%22%3A%2230%22%7D )

simonw

iNaturalist 的 API 真的非常棒。对于只读操作不需要身份验证,而且它有开放的 CORS 头,这意味着它非常适合演示和教程。

几年前我和我的伙伴用它建了这个网站:https://www.owlsnearme.com/

(我知道这跟我个人品牌有点吻合,但我也用它来追踪鹈鹕:https://tools.simonwillison.net/species-observation-map#%7B%22taxonId%22%3A123829%2C%22taxonName%22%3A%22California%20Brown%20Pelican%22%2C%22days%22%3A%2230%22%7D)


F-15E jet shot down over Iran #

https://news.ycombinator.com/item?id=47634910

So how is this not flagged, whereas this other post lasted literally minutes before being flagged? https://news.ycombinator.com/item?id=47612053

75000+ palestinians killed, arguably one of the defining crimes of our age are not worth HN discussion (“politics”) but one F15E shot down in a war of choice is (apparently, “tech”)?

lejalv

那为什么这个没有被标记,而另一个帖子却在几分钟内就被标记了? https://news.ycombinator.com/item?id=47612053

75000多名巴勒斯坦人被杀,这 arguably 是我们这个时代的定性罪行之一,却不值得HN讨论(“政治”),但一架F15E在一场选择性的战争中被击落却被认为是(显然的,“技术”)?


Author of “Careless People” banned from saying any… #

https://news.ycombinator.com/item?id=47639991

Having listened to the book on Audible, I’m both shocked at the behavior of the executive team, and not surprised all at the same time. What bothers me about all of this is what it says about us. It says we’re willing to give rich and powerful people a pass just because they make overtures towards something we care about.

We wouldn’t give our children a pass like this, nor would we teach our children to act this way, but we’re perfectly willing to allow fully grown adults to act like this.

Here’s just one example, there are plenty more:

Cheryl Sandberg inviting the author of the book to sleep in her bed next to her on the company jet, and the petulent and vindictive behavior when the author said ’no'.

Everyone in the orbit of the executive team knew about this behavior, and everyone gave it a pass, even going so far as to defend it and to protect Cheryl. This behavior should be universally deplored, and yet is not.

gortok

听完Audible上的这本书后,我既对执行团队的行为感到震惊,同时又一点也不意外。让我感到不安的是,这反映出了我们自身的问题。它表明我们愿意因为某些富有且有权势的人向我们关心的事情示好,就对他们的行为睁一只眼闭一只眼。

我们不会对自己的孩子这样宽容,也不会教导孩子们这样做,但我们却完全愿意允许完全成熟的成年人这样行为。

举个例子,还有很多类似情况:

谢丽尔·桑德伯格邀请书的作者睡在她旁边的公司飞机床上,而当作者拒绝时,她表现出的任性和怀恨行为。

执行团队周围的每个人都知道这种行为,且人人都选择无视,甚至有些人站出来为谢丽尔辩护和保护她。这种行为本应被一致谴责,但实际上并非如此。


Artemis II crew take “spectacular” image of Earth #

https://news.ycombinator.com/item?id=47631817

I was confused when I first saw this photo, as I don’t think I’ve ever before seen a nightside, moonlit Earth, exposed so that it looks like the dayside at a first glance. I wonder how many casual viewers actually realize it’s the night side. A nice demonstration of how moonlight is pretty much exactly like sunlight, just much much dimmer. In particular it has the same color, even though moonlight is often thought of as bluish and sunlight as yellowish!

Sharlin

当我第一次看到这张照片时感到很困惑,因为我之前从未见过被月光照亮的夜晚地球,看起来像白天的一面,乍一看很难分辨。我想知道有多少普通观众实际上意识到这是夜晚的一面。这很好地展示了月光几乎和阳光一模一样,只是亮度远远低得多。特别是它的颜色相同,尽管人们通常认为月光偏蓝色而阳光偏黄色!


Embarrassingly simple self-distillation improves c… #

https://news.ycombinator.com/item?id=47638287

Really fascinating how this works; it’s basically context-aware decoding. From the paper:

Code interleaves fork positions, where several continuations are genuinely plausible and may correspond to different solution approaches, with lock positions, where syntax and semantics leave little ambiguity but a low-probability distractor tail still remains… The best global decoding setting is therefore necessarily a compromise; we call this tension the precision-exploration conflict.

In other words, just like us, the model needs to shift from “exploration” in “fork” mode (divergent thinking to produce a creative solution) to “precision” in “lock” mode (producing syntactically correct code).

What this paper shows is that their simple technique (SSD) can improve the ranking of optimal tokens in both lock and fork positions, meaning the model is more likely to explore when it should be exploring, and more likely to be precise when it needs to be.

I love that we’re still learning the emergent properties of LLMs!

bensyverson

这真是非常有趣的工作原理;它基本上是上下文感知的解码。论文中提到:

代码在“分叉”位置交错,在这些位置,几种续写都是合理的,且可能对应不同的解决方案;在“锁定”位置,语法和语义几乎没有歧义,但仍存在低概率的干扰尾部……因此,最佳的全局解码设置必然是一种折中;我们称这种矛盾为精确性-探索冲突。

换句话说,就像我们一样,模型需要从“分叉”模式下的“探索”(发散性思维以产生创造性解决方案)切换到“锁定”模式下的“精确”(产生语法正确的代码)。

这篇论文显示,他们的简单技术(SSD)可以提高在锁定和分叉位置上最优token的排序,意味着模型更可能在需要探索时去探索,而在需要精确时保持精确。

我很喜欢我们仍在不断发现大型语言模型的自发特性!


Delve removed from Y Combinator #

https://news.ycombinator.com/item?id=47636243

YC has no problem with morally questionable behavior, many YC startups do things that are just as shady. YC is, ultimately, not responsible for what these startups choose to do. Delve’s problem is that they betrayed so many other YC companies in the process. An important value of being in YC is access to a ready-made customer base. The licensing issue is nothing compared to their fake audits but it is an affront to the YC community, hence, kicked from the community.

I’m sure if Delve has only engaged in fraudulent audits or had only resold another YC company’s product, they would have been allowed to stay, the problem is all of that combined pissed off enough other YC companies.

fontain

YC对道德上有争议的行为并不介意,许多YC初创公司也做着同样可疑的事情。YC最终不为这些初创公司选择做什么负责。Delve的问题在于他们在此过程中背叛了许多其他YC公司。成为YC的一员的重要价值在于能够接触到现成的客户群。许可问题相比他们的假审计不算什么,但这对YC社区是种侮辱,因此被踢出了社区。

我相信如果Delve只是进行欺诈审计或者仅仅转售另一家YC公司的产品,他们本来会被允许留下,问题在于这些行为综合起来激怒了足够多的其他YC公司。


2026 04 04 HackerNews

2026-04-04 07:35:03

2026-04-04 Hacker News Top Stories #

  1. Apfel是一款免费本地AI工具,可直接调用Apple Silicon Mac内置的大型语言模型,无需网络连接即可在本地完成所有计算,保护用户隐私。
  2. Blogosphere是一个聚合独立博客内容的平台,旨在维护独立网站生态,对抗社交媒体和AI内容泛滥,提供简洁和现代两种界面版本。
  3. Tailscale推出全新macOS桌面应用界面,通过窗口化设计解决刘海屏MacBook菜单栏图标被隐藏的问题,提供更丰富的设备管理和网络功能。
  4. Cursor 3正式发布,打造以代理为核心的统一智能开发工作台,支持多仓库协作与并行运行多个本地和云端代理,旨在实现代码库"自驱动"。
  5. 文章驳斥Marc Andreessen关于"内省是弗洛伊德发明"的错误观点,列举历史证据证明内省传统古已有之,警告忽视内心体验将导致技术发展脱离人性本质。
  6. 该网站推荐欧洲本土数字产品作为美国服务的替代方案,强调GDPR保护下的数据主权,但被质疑存在联盟营销倾向且部分服务仍受美国法律影响。
  7. 文章提出真正有价值的想法无需依赖谎言获取公众支持,以伊拉克战争和科技公司股票期权为例,强调不可信的预测者其预测亦无价值。
  8. 美军一架F-15E战斗机在伊朗境内被击落,成为本轮美伊冲突以来首架被击落的美军战机,冲突已造成重大人员伤亡和装备损失。
  9. 英国NHS员工因伦理担忧拒绝使用与Palantir合作开发的Federated Data Platform数据系统,担心该公司涉及监控的历史背景可能违反数据保护法规。
  10. 该指南介绍如何在Apple Silicon Mac mini上本地部署Ollama和Gemma 4模型,强调利用MLX框架实现低延迟、高稳定性的本地AI推理环境。

1. Show HN:Apfel – 你的 Mac 上已自带的免费 AI (Show HN: Apfel – The free AI already on your Mac) #

https://apfel.franzai.com

apfel 是一款免费的本地 AI 工具,专为搭载 Apple Silicon 的 Mac 设备设计,可直接调用 macOS 内置的大型语言模型(LLM),无需网络、无需 API 密钥、无额外成本。

该工具由 Apple 在 macOS 26(Tahoe)版本中内置,原本仅用于 Siri 和系统功能,apfel 通过 Swift 编写,将其开放为三种使用方式:命令行工具(CLI)、OpenAI 兼容的本地 HTTP 服务器,以及支持多轮对话的交互式聊天界面。

核心特性包括:

  • 100% 本地运行,所有计算在 Apple Silicon 的神经引擎和 GPU 上完成,数据不离开设备。
  • 支持 4096 个 token 的上下文窗口,适合单次任务和短对话。
  • 模型参数约 30 亿,采用混合 2/4 位量化,支持中、英、德、法、日、韩、西、葡、意等多语言。
  • 完全兼容 OpenAI API,只需将 base_url 指向 localhost:11434,即可无缝替换现有代码。

提供实用工具链:

  • cmd:自然语言转 Shell 命令。
  • oneliner:用自然语言生成管道命令链。
  • explain:解释任意命令、错误或代码。
  • wtd:快速了解当前目录的项目结构。
  • gitsum:总结最近的 Git 提交。
  • mac-narrator:以纪录片风格实时播报系统活动。

支持文件输入、JSON 输出、流式响应、工具调用、响应格式控制等高级功能,适用于脚本自动化、开发辅助、本地 AI 服务部署。

项目开源,采用 MIT 协议,已在 GitHub 获得超 1000 颗星,受到来自 Apple、Google、NVIDIA 等公司工程师关注。

安装方式推荐使用 Homebrew: brew install Arthur-Ficial/tap/apfel

未来还将推出 GUI 界面(apfel-gui)和菜单栏剪贴板增强工具(apfel-clip),进一步拓展本地 AI 使用场景。


HN 热度 631 points | 评论 137 comments | 作者:franze | 14 hours ago #

https://news.ycombinator.com/item?id=47624645

  • 运行模型在本地能更好地保护隐私,这一趋势将越来越重要。
  • 本地运行虽能保护隐私,但若模型训练过程封闭,仍可能隐含不符合用户意愿的价值导向或数据外泄风险。
  • 即使模型本地运行,仍存在通过生成代码等方式被恶意利用进行数据外泄的可能性。
  • 云服务模型因收集训练数据和人工审核用户内容而缺乏隐私保障,即便付费订阅也无法完全避免。
  • 隐私保护应优先考虑本地使用,云服务仅用于临时扩展,不应作为默认选择。
  • 一些提供隐私保护的云服务已采用零留存政策或加密技术,对多数用户而言已足够安全。
  • 本地运行模型可避免将敏感内容提交给不可信的第三方,防止触发服务条款或法律风险。
  • 普通用户对隐私的关注度有限,本地模型的隐私优势主要在技术圈内更受重视。
  • 本地模型虽好,但若缺乏网络访问能力,难以获取实时信息,需结合外部搜索工具。
  • 付费的私有云服务如 Proton Lumo+ 已集成私有搜索功能,可满足日常非技术需求。
  • 本地运行模型还支持构建不依赖网络的智能工作流,提升自动化能力。
  • 当前苹果本地模型版本较旧,与最新开源模型相比存在明显差距,更新速度可能滞后。
  • 苹果 AI 功能可通过独立下载更新,不依赖系统升级,但其发展动力和应用范围可能受限。
  • 本地模型本质上是大文件,只要不上传数据,其本身并不构成隐私风险。
  • 加密推理技术(如同态加密)尚未成熟,但基于硬件的零知识证明技术已可用,如 AWS Nitro Enclaves。
  • 一些新兴服务如 Phala、Tinfoil、Near AI 等提供可信执行环境,实现真正意义上的数据隔离。
  • 企业使用 AI 面临高网络暴露风险,本地化部署是降低风险的必要手段。
  • 模型的隐私核心在于用户输入的提示(prompt),而非模型文件本身。
  • 云服务模型背后存在军事背景或企业利益驱动,可能成为数据收集的“自愿后门”。

2. 展示 Hacker News:我为个人博客打造了一个首页 (Show HN: I built a frontpage for personal blogs) #

https://text.blogosphere.app/

该网页是“Blogosphere”网站的首页,展示了一个由独立博客组成的聚合平台,内容涵盖科技、文化、艺术、生活等多个领域。页面顶部列出了最新更新的 50 篇博客文章,按时间倒序排列,最新文章发布于几分钟前。

主要话题包括:

  • 技术与开源:Simon Willison 的博客连续引用了多位技术专家如 Willy Tarreau、Daniel Stenberg 和 Greg Kroah-Hartman 的观点,涉及系统开发与软件工程。
  • 科技趋势:Stratechery 分析苹果公司未来发展方向,聚焦 AI 与加速技术。
  • 互联网文化:Kottke.org 发布多篇内容,包括对《纽约时报》公信力的质疑、对电影《罗莎莉亚·伯格海因现场演出》的介绍,以及关于“当事情变得奇怪时,怪人开始专业”的名言引用。
  • 影视与娱乐:World of Reel 报道了多部电影的票房数据和新预告片发布,如《The Drama》《超级马里奥》《Project Hail Mary》等;还提及 Brian Cox 批评昆汀·塔伦蒂诺和约翰尼·德普为“被高估”。
  • 个人生活与创作:多位博主分享日常生活片段,如咖啡吧布置、手工艺品出售、猫咪的复活节故事、邻居“露臀”趣事等。
  • 艺术与摄影:Doug Jones 发布胶片摄影作品,florian.photo 展示日期为 2026 年 4 月 3 日的照片,Full Moon Fiber Art 推出手工毛线制品与雕塑作品。
  • 历史与人文:A Collection of Unmitigated Pedantry 重访古罗马胸饰的重建研究,Futility Closet 提出“Cylob 密码”谜题。

整体风格偏向独立博客生态,强调原创、深度与个性表达,内容多元且富有思想性,体现了“独立网络”(Indie Web)的精神。


HN 热度 611 points | 评论 166 comments | 作者:ramkarthikk | 11 hours ago #

https://news.ycombinator.com/item?id=47625952

  • 该项目是一个为个人博客打造的前端页面,旨在通过聚合个人博客内容来维护独立网站生态,提供简洁和现代两种版本。
  • 用户赞赏项目的同时也指出两个主要问题:极简版存在分页加载错误,无法访问页码 13 之后的内容;现代版使用无限滚动导致无法查看页脚。
  • 开发者回应称将修复分页问题,并考虑在极简版中加入搜索功能,同时承认无限滚动的缺陷,计划改进。
  • 有人认为当前的博客聚合模式类似于早期的网链和手工筛选列表,是应对社交媒体和 AI 内容泛滥的一种回归,具有积极意义。
  • 也有观点质疑这类聚合平台的长期可持续性,认为其缺乏质量审核机制,依赖创建者持续维护,难以持久。
  • 建议采用类似“网链”的低技术方案,即在个人博客中手动链接喜爱的其他博客,形成小范围信任网络,可能更可持续。
  • 有人提出未来社交网络可能演变为基于信任的小型社群(如“圈子”),用户只关注彼此认可的内容,避免信息过载和低质内容泛滥。
  • 有人担忧这种封闭式网络可能阻碍重要信息(如开源项目)的广泛传播,难以平衡小圈子信任与大众影响力之间的矛盾。
  • 有观点认为,高门槛的社区(如某些黑客网站)能有效过滤低质量用户,维持社区质量,可作为参考。
  • 提议以 RSS 订阅为核心构建新型社交网络,结合用户自定义的联邦式机器学习排序机制,让用户通过滑块控制内容偏好。
  • 认为应将结构化数据和维护工作开源,由社区共同维护,而非依赖单一负责人。
  • 指出区块链适合用于发布不可篡改的公开日志,可作为内容发布和验证的底层技术。

3. Tailscale 推出全新 macOS 桌面应用界面 (Tailscale’s new macOS home) #

https://tailscale.com/blog/macos-notch-escape

Tailscale 推出了全新的 macOS 桌面应用程序界面,解决了部分用户在带有刘海屏的 MacBook 上难以找到 Tailscale 菜单栏图标的问题。此前,由于 macOS 菜单栏空间有限,图标可能被隐藏在屏幕刘海区域,导致用户误以为程序未启动。虽然通过 occlusionState 检测可弹出提示,但该方法存在误触发问题,且无法根本解决。

新推出的窗口化应用(从 1.96.2 版本开始默认启用)与原有菜单栏应用并存,用户可通过 Dock 或 Spotlight 快速调用。该界面提供多项实用功能:可搜索并查看所有设备连接状态、一键 Ping、复制 IP 地址、使用 Taildrop 发送文件、快速选择最优出口节点,并通过 Dock 图标上的红点提示关键错误。

此外,新界面还包含“迷你播放器”模式,可将应用最小化至极简状态,同时提供首次使用或更新后的功能引导教程。团队正在开发 Windows 平台的类似界面,并致力于在保持功能性的基础上增添一些趣味性设计。


HN 热度 547 points | 评论 296 comments | 作者:tosh | 1 day ago #

https://news.ycombinator.com/item?id=47618189

  • macOS 菜单栏图标过多导致隐藏在刘海区的问题严重影响用户体验,尤其对开发者造成大量误报和退款困扰。
  • 苹果公司认为第三方应用长期占用菜单栏是滥用行为,其初衷是让菜单栏图标作为临时辅助功能存在,而非持久化显示。
  • 一些用户因安装过多应用而使菜单栏图标严重拥挤,甚至需要依赖 Bartender 等工具管理,反映出实际使用中存在过度依赖问题。
  • 有观点指出,苹果应推动开发者将功能迁移到控制中心,以实现更有序的管理,而非放任菜单栏无序膨胀。
  • 苹果在 macOS 26 中已允许应用向控制中心添加自定义操作,但该功能目前仅支持简单按钮式交互,无法完全替代菜单栏图标。
  • 有人认为,苹果应开放与系统自身相同的 API 来支持持久化菜单栏图标,否则无法真正解决第三方应用的合理需求。
  • 一个简单而有效的解决方案是引入“溢出菜单”机制,当图标过多时自动合并为一个可展开的菜单,类似 Windows 系统托盘和浏览器扩展的做法。
  • 当前系统在图标被隐藏时没有任何提示或指示,导致用户误以为应用未运行,这是设计上的重大缺陷。
  • 有用户指出,苹果应明确限制或禁止仅以菜单栏形式存在的应用上架 App Store,以遏制滥用行为。
  • 系统应自动识别刘海区域覆盖范围,并智能跳过该区域显示图标,避免隐藏关键应用入口。

4. Cursor 3 正式发布,开启软件开发新纪元 (Cursor 3) #

https://cursor.com/blog/cursor-3

Cursor 3 正式发布,标志着软件开发进入新阶段。新版本打造了一个统一的智能开发工作台,以代理(Agents)为核心,支持多仓库协作与并行运行多个本地和云端代理。

所有代理集中显示在侧边栏,支持从移动设备、网页、桌面、Slack、GitHub 和 Linear 等多端启动。云端代理可自动生成演示视频和截图,便于验证成果。

新界面优化了本地与云端代理之间的无缝切换:可将代理从云端迁移到本地进行调试,也可将本地会话上传至云端,实现离线持续运行或快速切换任务,特别适合长时间运行的任务。

新增的差异视图简化了代码审查流程,支持一键提交、暂存和管理 Pull Request,实现从提交到合并的高效闭环。

在功能层面,Cursor 3 保留了优秀的 IDE 体验:支持完整 LSP 的代码跳转与文件查看,集成内置浏览器,可直接访问和操作本地网站。

用户还能通过 Cursor Marketplace 一键安装数百个插件,扩展代理能力,包括 MCP、技能、子代理等。团队也可搭建私有插件市场。

Cursor 3 奠定了模型、产品与运行时的基础,为构建更自主的代理和团队协作铺平道路。未来将持续演进,目标是实现代码库的“自驱动”。

立即升级 Cursor,使用 Cmd+Shift+P 打开“Agents Window”体验全新界面。


HN 热度 522 points | 评论 395 comments | 作者:adamfeldman | 1 day ago #

https://news.ycombinator.com/item?id=47618084

  • 使用 Claude Code 与 Cursor IDE 配合,按任务逐一推进,保持代码质量,反对“多智能体协同”模式,认为串行工作更利于掌控上下文和代码质量。
  • 希望 Claude Code 能提供快速的内联自动补全功能,避免等待较慢的模型响应,提升开发效率。
  • 认为在 VSCode 中使用 Copilot 搭配 Claude 模型(如 Sonnet/Opus 4.6)效果很好,且每月仅需 10 美元,但需注意高级模型的 token 限制。
  • 指出 GitHub Copilot 对大多数模型的上下文长度限制为 200k,而 Claude 模型支持高达 1M 上下文,是显著优势。
  • 认为 Copilot 效果不如 Claude Code,使用体验差,更倾向于使用 Claude Code 和 Codex。
  • 指出使用官方 Claude Code 插件是可行方案,其底层使用与 CLI 相同的二进制文件。
  • 提醒用户注意 Copilot 订阅计划中高级模型的 token 消耗速度,若设置为自动切换模型,容易快速耗尽额度。
  • 建议使用 AquaVoice 语音输入工具,通过语音识别实现函数名等代码元素的快速输入,尤其适合复杂拼写。
  • 表示在大型重构中使用多个智能体协作有效,但不适用于从零开始的开发,缺乏实际案例参考。
  • 希望有专门的网站或平台展示由智能体主导开发的复杂、高质量项目,以提供真实参考。
  • 认为“智能体群”并非同时处理多个功能,而是同一任务中多个角色(如专家、测试者、架构师)协同工作,提升质量。
  • 指出“专家”角色在 AI 中是已有概念,不应被误解为模型真正具备专业能力,仅是基于提示的模拟。
  • 认为“专家”是角色设定,而非真实能力,仅靠提示无法获得真正的专业水平。
  • 指出“智能体群”可以同时在本地和云端运行,通过统一界面(如侧边栏)管理,实现跨平台协同。
  • 认为多个智能体可并行工作于同一任务,如同团队成员在不同阶段协作,共享接口契约,分工明确。
  • 表示使用 Zed 编辑器替代 VSCode,体验更佳,但对界面布局(按钮位置)存在不满。
  • 指出 Zed 编辑器的按钮在 4K 屏幕上过小且不可移动,影响使用体验,认为设计不合理。
  • 认为“智能体群”并非同时开发多个功能,而是同一功能中多角色协同,强调任务聚焦。
  • 指出“智能体群”支持跨平台(移动端、Web、Slack、GitHub 等)启动和管理,实现高度集成。

5. 马克·安德里森对内省的看法是错误的 (Marc Andreessen is wrong about introspection) #

https://www.joanwestenberg.com/marc-andreessen-is-wrong-about-introspection/

文章批评了风险投资家马克·安德里森关于“ introspection(内省)”的错误观点。安德里森在一次访谈中声称,过去四百年里人们从未内省过,而内省是 1910 至 1920 年间由弗洛伊德和维也纳学派“发明”的。作者指出,这一说法严重歪曲历史。

作者列举大量证据反驳:苏格拉底提倡“未经省察的人生不值得过”;斯多葛学派强调自我审视,马可·奥勒留的《沉思录》正是内省的典范;奥古斯丁的《忏悔录》早在公元 400 年就深入探讨内心世界;中国儒家思想中的“求其放心”也体现了内省传统;莎士比亚的《哈姆雷特》更是以过度内省导致行动瘫痪为主题,说明当时观众已熟知这一心理状态。

作者认为,安德里森并非无知,而是有意构建一种“零内省心态”的话语体系,以排除对人类内在体验的深入探讨,从而为“快速前进、只做外部行动”的技术乐观主义提供合法性。

真正的“人类繁荣”不仅关乎物质丰裕和效率提升,更关乎意义、目的与内心满足。这些无法通过 GDP、点击率或交易量来衡量,只能通过内省、文学、哲学和诚实的自我报告来接近。

安德里森的“向前走”缺乏方向,因为“前进”必须以“知道自己要去哪里”为前提,而这种自我认知恰恰依赖于内省。忽视内省,会导致技术发展脱离人性本质,正如社交媒体平台只追求用户活跃度,却牺牲了心理健康与社会福祉。

最后指出,安德里森并非没有灵魂,而是选择不审视内心,并为这种回避提供历史借口。这种思维模式在现实中已造成严重后果——当人们用可测量的数据替代对人心的理解时,Goodhart 定律便生效:指标成了目标,而目标本身早已偏离了初衷。


HN 热度 366 points | 评论 441 comments | 作者:surprisetalk | 9 hours ago #

https://news.ycombinator.com/item?id=47627056

  • Marc Andreessen 的“软件吞噬世界”观点虽有影响力,但其本质是总结已有趋势,并未真正推动变革,更多是提出一个流行口号。
  • Andreessen 和 Elon Musk 过去被视为思想领袖,如今言论显得肤浅甚至荒谬,可能并非读者变成熟,而是他们自身发生了变化。
  • Andreessen 在早期技术演讲中已表现出傲慢与空洞,其言论缺乏实质内容,甚至曾宣传从未实现的“未来项目”。
  • Elon Musk 的行为问题自 2018 年泰国洞穴救援事件后明显恶化,包括散布不实指控、公开挑衅等,已超出“有争议”的范畴。
  • 社交媒体的过度使用削弱了公众人物的理性判断力,使他们更容易陷入情绪化表达与自我强化的回音室中。
  • 超级富豪群体因长期处于高压力、高关注的环境中,可能受到心理与认知功能退化的“精神腐蚀”影响。
  • 一些富豪为维持外貌与寿命,可能长期使用性能增强或神经刺激类药物,这可能影响其情绪与决策能力。
  • 富裕且出名的科技领袖为了维持公众关注度,不得不持续输出内容,导致他们将一些不成熟或荒谬的想法当作“观点”发布。
  • 新贵阶层(nouveau riche)倾向于通过高调消费、媒体曝光和思想输出来彰显身份,与低调传承的旧有财富阶层形成鲜明对比。
  • “问题”(problematic)一词虽被滥用,但其使用在描述 Elon Musk 的行为时具有合理性和针对性,不应因标签化而否定其实际意义。
  • 对“问题”一词的过度批判,往往反映出批评者自身对社会话语体系的不适应或意识形态偏见。

6. 欧洲版谷歌、苹果、Dropbox 及 120 款美国应用的替代方案 (European alternatives to Google, Apple, Dropbox and 120 US apps) #

https://only-eu.eu/en/

这是一个专注于提供欧洲替代方案的网站,旨在帮助用户寻找在隐私、质量、环保和公平性方面更优的欧洲本土软件、产品和服务。

网站核心理念是“欧洲做得更好”——通过严格的环境标准、优质制造、真实隐私保护和强大的数据安全,打造更可持续、更负责任的数字生活选择。

主要功能包括:

  • 用户可输入自己正在使用的国际服务(如 Google Drive、Gmail、Zoom 等),系统将自动推荐对应的欧洲替代品。
  • 当前未找到匹配的替代方案时,会提示“0 欧洲替代方案被找到”,鼓励用户提交建议。

推荐的替代产品包括:

  • Proton Drive:瑞士开发的端到端加密云存储,替代 Google Drive。
  • pCloud:瑞士提供终身存储且支持欧盟服务器,替代 Dropbox。
  • Internxt:西班牙的零知识加密云存储,替代 OneDrive。

分类导航涵盖多个领域,如:

  • 云存储、电子邮件、密码管理器、VPN、办公文档、浏览器、视频会议、智能手机、时尚运动品牌、流媒体、网页分析、云计算、项目管理、美妆护肤、导航地图、网络安全、智能家居、游戏、金融科技、交通出行、玩具、家具、音频设备、自行车、语言教育、汽车租赁、宠物用品、食品营养等。

特别强调:欧盟企业受 GDPR 严格监管,数据主权属于用户;而美国服务可能受 CLOUD 法案影响,被迫向美国政府提供数据。

网站倡导“熟悉工具,欧洲替代”的理念,推动用户转向更安全、更环保、更符合欧洲价值观的数字产品。同时开放社区协作,欢迎用户提交希望增加的欧洲产品或类别。


HN 热度 353 points | 评论 155 comments | 作者:madman_dev | 14 hours ago #

https://news.ycombinator.com/item?id=47624741

  • 该网站主要展示的是联盟营销产品,忽略了更好的替代品,如 posteo.de。
  • 列出的供应商如 OVHcloud 受美国云法案影响,并不真正独立于美国。
  • 网站的广告性质和隐私保护缺乏真实的关注。
  • 对网站的域名注册日期的判断并不能反映其努力程度。
  • 网站使用 Cloudflare 作为主机提供商,显示出对美国服务的依赖。
  • 并非所有人都需要对欧洲服务的选择达成共识,支持多样化的选择是必要的。
  • 评论中提到的伪善并没有表明网站的轻视程度。
  • 该网站并未说明所有链接都是联盟链接,只是部分可能会带来收益。
  • 一些人认为 Posteo 在某些方面不如其他电子邮件服务。
  • 对于邮件服务的锁定问题,用户有不同的看法。
  • 在欧盟国家,发票的严格要求使得开放源代码的发票生成器具有实用性。
  • 有人对网站的推荐功能提出疑问,认为使用者的体验才是关键。
  • 对于服务的选择,人们会基于品牌、价格等因素进行决定。
  • 对于 “欧洲更好” 的说法,有人持怀疑态度,认为这是一种表演。
  • 欧盟国家在数字主权方面需要减少对美国服务的依赖。
  • 地理上的欧洲与政治上的欧洲之间存在争议,很多国家的归属不明确。
  • “欧洲” 这个概念的定义在不同的语境中可能产生不同的理解。

7. 好想法无需谎言即可获得公众认同(2008) (Good ideas do not need lots of lies in order to gain public acceptance (2008)) #

https://blog.danieldavies.com/2004/05/d-squared-digest-one-minute-mba.html

本文是 D-Squared Digest 博客的一篇回顾性文章,作者分享了自己在 2003 年伊拉克战争前对战争前景的预判,并解释了其判断背后的逻辑。作者强调,真正有价值的想法无需依赖谎言来获得公众支持,这一原则成为其分析政治决策的核心依据。

作者指出,当一个项目或政策需要大量虚假宣传来推动时,往往本身就存在问题。以科技公司是否应将股票期权计入成本为例,作者在商学院学到的这一理念被应用于伊拉克战争的判断:如果大规模杀伤性武器(WMD)真的存在且是战争正当理由,为何决策者要不惜编造证据来支持?这种对真相的刻意掩盖,恰恰说明其基础可能站不住脚。

作者还提出“预测者若不可信,其预测毫无价值”的观点。他指出,布什、鲍威尔、斯特劳等高层官员在战前关于 WMD 的声明明显失实,因此他们的预测应被完全排除。相反,像斯科特·里特和安德鲁·威尔基这样未被证实说谎的专家,其观点更具可信度。

此外,作者强调“审计”的重要性——项目完成后必须回溯评估原预测的准确性,否则组织将不断重复错误。他批评美国在伊拉克战争中忽视了对决策者的问责机制,导致错误决策持续发生。

文章最后总结,对说谎者给予信任,是比“人身攻击”更危险的认知谬误。真正的理性判断应基于对信息来源诚信度的审视。作者预告下一篇将探讨为何人们不支持“通过谎言推动民主”的新保守主义中东战略。


HN 热度 343 points | 评论 182 comments | 作者:sedev | 1 day ago #

https://news.ycombinator.com/item?id=47617415

  • 这篇文章提到的观点是,好的想法不需要许多谎言来获得公众接受。
  • 股票期权在科技公司中变得普遍,给予这些期权的公司在竞争中胜出。
  • 管理层被指责 “损害股东利益”,但时间证明他们的做法是合理的。
  • 许多创新想法在刚出现时并不被理解,公众往往会在一段时间后接受这些想法。
  • 文章中的一个谎言是将股票期权视为不算 “费用”,实际上它们应被记入账目。
  • 股票期权与未平仓的期权相比,风险和责任是不同的。
  • 股票期权可能导致的潜在损失并不是公司要承担的直接责任。
  • 有人认为员工对自己公司情况的了解比普通投资者要好。
  • 也有观点认为大公司的普通员工实际上对公司的内部信息了解有限。
  • 在公司业绩不佳的情况下,股票期权可能会失去价值。
  • 当前 RSUs(限制性股票单位)逐渐取代期权,因为期权可能变得 “水下”。
  • RSUs 比实际股票流动性差且可控性更强,更适合管理层使用。
  • 投资自己工作的公司是一种风险,因为突然的公司倒闭可能导致员工失去工作和储蓄。
  • 有人认为,了解公司文化和员工能力等非财务信息对长期表现预测更有帮助。
  • 文章中提到,某些员工对公司的重大销售合同知之甚少,而这一信息对股价可能影响巨大。

8. F-15E 战斗机在伊朗被击落 (F-15E jet shot down over Iran) #

https://www.theguardian.com/world/2026/apr/03/us-fighter-jet-confirmed-shot-down-over-iran

一架美国 F-15E“打击鹰”战斗机于 2026 年 4 月 3 日在伊朗境内被击落,成为本轮美伊冲突爆发近五周以来首架被击落的美军战机。事件发生后,美方展开紧急搜救行动,目前已确认一名机组人员被成功救出,另一名仍下落不明。

伊朗国家媒体发布照片,显示残骸来自 F-15E 战斗机,其尾翼标记与驻英国拉肯希思基地的第 494 中队飞机相符。尽管伊朗最初声称击落的是 F-35 隐身战机,但专家分析认为实际为 F-15E。美军官方尚未正式确认,但多名知情官员透露了相关情况。

美国总统特朗普在事件发生前曾宣称“已彻底击败伊朗”,并称战争“即将结束”。他在接受 NBC 采访时拒绝评论搜救行动,坚称不会影响对伊谈判,强调“这是战争”。

伊朗方面态度强硬,拒绝美国提出的 48 小时停火提议。一名伊朗商人悬赏 6 万美元奖励提供美军飞行员下落者,当地电视台也鼓励民众举报“敌方飞行员”。社交媒体上流传的伊朗革命卫队发布的照片显示,沙漠中发现一枚 F-15E 型号的弹射座椅,表明至少一名飞行员成功弹射逃生。

与此同时,伊朗媒体称已抓获飞行员,但该说法缺乏证实。另有报道称,同日一架 A-10“疣猪”攻击机在霍尔木兹海峡附近坠毁,但飞行员安全获救,伊朗方面称其防空系统击中了该机。

本轮冲突已造成 13 名美军人员死亡,300 人受伤,美军对伊朗境内超过 1.23 万个目标实施空袭。此前 3 月 1 日,三架 F-15E 曾因科威特防空系统误击而坠毁。

美军损失惨重,包括 16 架“死神”无人机在内的多架飞机被毁或受损,总损失估计超过 30 亿美元。F-15E 单价约 3100 万美元,新型号可达 1 亿美元。

此外,以色列对德黑兰和贝鲁特发动新一轮空袭,北部德黑兰传出剧烈爆炸声。据以色列方面消息,为配合美军搜救行动,以色列已暂停对相关区域的空袭。

特朗普在社交媒体上再次威胁摧毁伊朗基础设施,称“桥梁之后是发电站”,并宣称美军“尚未真正开始摧毁伊朗”。最新影像显示,他此前宣称摧毁的德黑兰—卡拉杰大桥已严重损毁,耗资 4 亿美元。


HN 热度 316 points | 评论 740 comments | 作者:tjwds | 7 hours ago #

https://news.ycombinator.com/item?id=47628326

  • F-15E 在伊朗被击落,反映出伊朗防空系统在经历数周战略打击后仍具备强大作战能力,这在历史上极为罕见。
  • 有未经证实的消息称,一架 A-10 攻击机也在同一区域坠毁,飞行员已获救,但具体细节尚不明确。
  • 有传闻称参与救援的黑鹰直升机也被击落,但相关机组人员已被成功救出,目前信息仍待核实。
  • 多架停在地面的美军飞机被摧毁,包括高技术含量的 AWACS 预警机,实际损失可能远超公开数据。
  • THAAD 雷达系统被击毁,每部 AN/FPS-132 雷达造价高达 11 亿美元,全球仅 8 套,且依赖稀有稀土材料,中国已禁止出口,导致维修和替换极为困难。
  • 伊朗对美军在中东的多个雷达站点发动打击,导致美军中央司令部(CENTCOM)失去早期预警能力,影响范围涵盖以色列、海湾国家等。
  • 以色列的“铁穹”导弹防御系统主要依赖本国 EL/M-2084 雷达,而非美军雷达,但中东地区美军雷达的失效仍严重影响区域整体预警能力。
  • 美军雷达系统失效可能导致导弹预警时间从 10 分钟缩短至仅数秒,严重削弱防御反应能力。
  • 伊朗通过使用集群弹药、消耗昂贵拦截弹、使用突防辅助手段、改变末段飞行轨迹及协同无人机群攻击等方式,有效突破了传统防空体系。
  • 美军在土耳其的北约雷达系统对以色列预警也至关重要,美军在中东的雷达网络同样承担关键角色。
  • 美国政府对此次军事损失保持沉默,媒体也未深入追问,引发对信息透明度的质疑。
  • 有分析指出,当前美国政府提出 2027 财年军费达 1.5 万亿美元的计划,可能与此次战损有关,但此举引发对过度军费支出的担忧。
  • 战争迷雾中各方信息真假难辨,存在严重的信息操控与宣传战,导致公众难以获取真实情况。
  • 有观点认为,伊朗在信息传播方面比美国和以色列更可信,这在自由民主国家中令人深感不安。
  • 有评论指出,部分关于雷达系统全面瘫痪的说法缺乏可靠证据,需谨慎对待网络传言。

9. NHS 医护人员因伦理担忧拒绝使用 FDP 系统 (NHS staff refusing to use FDP over Palantir ethical concerns) #

https://www.freevacy.com/news/financial-times/nhs-staff-refusing-to-use-fdp-over-palantir-ethical-concerns/7272

该网页是 freevacy.com 网站的 Cookie 同意声明页面,主要介绍网站如何使用 Cookie 以提升用户体验与服务效果。

网站仅使用 Cookie 提供更优质的信息与培训服务,分为四类:必要类、偏好类、统计类和营销类。必要类 Cookie(共 13 个)是网站正常运行所必需的,如页面导航和安全区域访问,包括 Cloudflare、Cookiebot、Google、Reviews.io 等提供的服务。偏好类 Cookie(1 个)用于记住用户的语言或地区设置。统计类 Cookie(4 个)由 Google 提供,用于匿名分析用户行为,如访问量、页面浏览情况等,不用于个人画像或广告追踪。营销类 Cookie(11 个)涉及 Google AdSense 和 YouTube,用于跨站追踪用户行为,以优化广告相关性,但网站明确表示不会将数据用于定向广告或用户画像。

此外,页面还提到“未分类”类 Cookie(0 个),表示目前无待分类的第三方 Cookie。网站使用 Cookiebot 管理用户同意,所有 Cookie 声明于 2026 年 3 月 19 日更新。

用户可随时通过页面调整或撤回 Cookie 同意,选择“仅使用必要 Cookie”、“自定义选择”或“允许所有 Cookie”。页面还提供隐私政策链接,强调用户可依据同意 ID 和日期联系网站处理个人数据请求。


HN 热度 314 points | 评论 140 comments | 作者:chrisjj | 14 hours ago #

https://news.ycombinator.com/item?id=47624736

  • NHS 花费 3.3 亿英镑与 Palantir 合作收集运营数据,该金额在整体预算中占比极小,但引发对合同合理性的质疑。
  • NHS 长期依赖过时技术如传真机,管理效率低下,导致公众对其决策能力产生怀疑。
  • 资本利得税收入实际为 200 亿英镑而非 20 亿,因大量资产通过 ISA、养老金和海外投资避税。
  • 英国高收入者实际税负远低于 71%,所谓“71% 收入税”是误解或故意夸大,真实有效税率约为 31%-41%。
  • 有人认为政府对低收入群体的依赖导致高收入者被“剥削”,形成一种社会不公的错觉。
  • NHS 使用 AI 系统可能旨在审查长期病患,以减少人力成本,此举涉嫌违法且违背医疗伦理。
  • Palantir 与政府合作涉及医疗数据,严重违反英国及欧盟数据保护法规,但政府仍执意推进。
  • 有人讽刺称这种行为是“Elon Musk 式”地用 AI“裁员”,将医疗系统私有化,缺乏民主监督。
  • 对 Palantir 等美国科技公司介入公共医疗系统的强烈抵制,认为其不可信且存在安全隐患。
  • 有人认为当前政府治理存在系统性腐败,将公共利益让渡给私人企业,损害公众信任。

10. 2026 年 4 月面向 Mac mini(M1/M2/M3/M4/M5)的 Ollama 与 Gemma 4 26B 部署指南 (April 2026 TLDR Setup for Ollama and Gemma 4 26B on a Mac mini) #

https://gist.github.com/greenstevester/fc49b4e60a4fef9effc79066c1033ae5

本文为 2026 年 4 月针对搭载 Apple Silicon 芯片的 Mac mini(M1/M2/M3/M4/M5)用户,提供的一份详细、简洁的 Ollama 部署指南,重点实现 Gemma 4 模型的本地运行,支持自动启动、预加载和长期驻留。

核心目标:在 Mac mini 上稳定运行 Gemma 4 模型,确保低延迟响应和系统流畅性。

关键步骤包括:

  1. 安装 Ollama:通过 Homebrew Cask 安装 Ollama 应用,自动集成 MLX 后端,支持 Apple Silicon 硬件加速。
  2. 拉取模型:使用 ollama pull gemma4 下载默认 8B 版本(Q4_K_M 量化),约 9.6GB,推荐使用此版本以避免内存不足问题。
  3. 验证运行:通过 ollama run gemma4:latest 测试模型响应,并检查 ollama ps 确认 GPU 使用率(如 86% GPU)。
  4. 自动启动:在系统设置中启用 Ollama 开机自启,并配置 Launch Agent,每 5 分钟发送空请求以保持模型常驻内存。
  5. 永久驻留:设置环境变量 OLLAMA_KEEP_ALIVE="-1",防止模型因空闲被卸载,建议添加至 ~/.zshrc 实现持久化。

注意事项:

  • 不推荐使用 26B 版本模型,其内存占用接近 17GB,导致系统频繁交换、响应迟缓甚至崩溃。
  • 24GB 内存 Mac mini 运行 8B 模型后仍有约 14GB 可用,系统运行稳定。
  • Ollama v0.19+ 起原生支持 MLX 框架,无需手动配置,M5 系列芯片可进一步受益于 GPU 神经加速器。

附加功能:

  • 支持通过 localhost:11434 的 API 接口调用模型,兼容 OpenAI 格式。
  • 提供常用命令清单,如 ollama listollama stopollama rm 等。
  • 提供卸载与清理方法,便于回滚或重装。

更新亮点(v0.19+):

  • Apple Silicon 原生 MLX 加速,性能提升。
  • 支持 NVIDIA NVFP4 格式,提升推理效率与精度。
  • 优化缓存机制,提升多任务与代码代理场景下的响应速度。

参考来源包括 Ollama 官方博客、v0.20.0 发布说明及 Google DeepMind 的 Gemma 4 公告。


HN 热度 284 points | 评论 111 comments | 作者:greenstevester | 14 hours ago #

https://news.ycombinator.com/item?id=47624731

  • 刚发布时的开源模型普遍存在实现和量化上的漏洞,早期版本可能无法正确输出,建议用户做好频繁更新和重新下载的准备。
  • 工具调用失败等问题多源于推理引擎或量化版本的缺陷,而非模型本身,应优先检查并更新推理引擎和量化文件。
  • 推荐使用 llama.cpp 作为推理引擎,尤其是从上游主干构建,可获得最新修复和优化,但需具备一定技术能力。
  • 若不想充当测试用户,建议等待 2-3 周,待各项目稳定后再尝试使用。
  • 本地部署模型时,建议至少使用 32B 以上模型并采用 Q8 及以上量化,否则性能和效果会严重下降。
  • LM Studio 和 Ollama 等工具在初期版本中存在工具调用和模板渲染问题,需等待更新修复,如 LM Studio 0.4.9 已解决部分问题。
  • 模型发布方通常只在目标后端进行测试,不负责适配所有第三方工具,不应将第三方工具的缺陷归咎于模型提供方。
  • 对于新模型,可先使用 OpenRouter 或 Google AI Playground 等在线平台熟悉模型特性,再转为本地部署。
  • Gemma 4 26B 在 llama.cpp 上表现良好,速度和质量均令人满意,尤其在 M5 Mac 上运行稳定。
  • GLM 4.7 Flash 在工具调用方面表现优异,配合 Zed 编辑器使用可实现一键生成项目,且支持自动研究功能。
  • 部分用户在使用 LM Studio 时遇到工具调用失败,错误提示为模板过滤器异常,已确认在新版本中修复。

Hacker News 精彩评论及翻译 #

Marc Andreessen is wrong about introspection #

https://news.ycombinator.com/item?id=47627407

We all know he’s wrong. The problem isn’t that he is wrong, it’s that we have elevated the wealthy into a status where they can be wrong, have no correction, and make decisions whole clothe which negatively affect the rest of us. All while being insulated from their negative world view.

John23832

我们都知道他错了。问题不在于他错了,而在于我们将富人捧到了一个可以犯错、无需改正,并能做出完全不顾后果的决定来危害我们的地位,同时,他们还被隔绝在对自己负面世界观的认知之外。


Decisions that eroded trust in Azure – by a former… #

https://news.ycombinator.com/item?id=47623463

I think this is especially problematic (from Part 4 at https://isolveproblems.substack.com/p/how-microsoft-vaporized-a-trillion-2f5 ):

“The team had reached a point where it was too risky to make any code refactoring or engineering improvements. I submitted several bug fixes and refactoring, notably using smart pointers, but they were rejected for fear of breaking something.”

Once you reach this stage, the only escape is to first cover everything with tests and then meticulously fix bugs, without shipping any new features. This can take a long time, and cannot happen without the full support from the management who do not fully understand the problem nor are incentivized to understand it.

branko_d

我认为这一点尤其令人担忧(引用自该文章的第四部分,链接:https://isolveproblems.substack.com/p/how-microsoft-vaporized-a-trillion-2f5ff):

“团队已经走到了一个地步:进行任何代码重构或工程改进都风险太大。我提交了几次 Bug 修复和重构建议,特别是采用了智能指针,但由于担心破坏现有功能,这些都被驳回了。”

一旦陷入这种局面,唯一的出路就是先用测试覆盖一切,然后一丝不苟地修复 Bug,在此期间绝不能发布任何新功能。这往往需要耗费大量时间,而且如果没有管理层的全力支持,根本不可能实现。管理层既没有完全理解问题的严重性,也没有动力去深入了解。


Decisions that eroded trust in Azure – by a former… #

https://news.ycombinator.com/item?id=47621010

I don’t know if any of this is true, but as a user of Azure every day this would explain so much.

The Azure UI feels like a janky mess, barely being held together. The documentation is obviously entirely written by AI and is constantly out of date or wrong. They offer such a huge volume of services it’s nearly impossible to figure out what service you actually want/need without consultants, and when you finally get the services up who knows if they actually work as advertised.

I’m honestly shocked anything manages to stay working at all.

yoyohello13

我不知道这些是不是真的,但作为一个每天使用 Azure 的用户,这能解释很多事情。

Azure 的界面感觉很烂、乱糟糟的,几乎勉强维持着。文档显然完全是 AI 写的,而且总是过时或错误。他们提供了如此庞大的服务规模,如果没有顾问,几乎不可能弄清楚你到底想要/需要什么服务,而且当你终于把服务搞起来后,谁知道它们是否真的像宣传的那样运作。

说实话,我很惊讶还有东西能一直保持正常运行。


Tailscale’s new macOS home #

https://news.ycombinator.com/item?id=47619626

The notch hiding menubar icons is such a stupid problem to have. I waste hours every week trying to help people who send me frustrated emails because they bought one of my apps and they say: “it doesn’t launch” or “why doesn’t it have any interface??”

No amount of FAQ will help these people. And this also results in hasty refund requests and even worse, chargebacks that take 2x the amount the users paid out of my pocket.

I recently helped my brother launch a simple app for making any window a PiP window ( https://lowtechguys.com/pipiri ) and in the first two days, half of the sales turned into refunds exactly because of this issue. People had so many menubar icons that they thought the app just doesn’t work. Not an encouraging launch for his first app.

Not to mention the fact that the best solution that helped alleviate this, the Bartender app, was completely broken by Apple’s internal API changes in macOS Tahoe.

This could have been handled better.

alin23

刘海屏遮挡菜单栏图标这真是个愚蠢的问题。我每周都要浪费好几个小时去帮助那些给我发沮丧邮件的人,因为他们买了我的一个应用后说:“打不开”或者“为什么一点界面都没有??”。

再多的常见问题解答也救不了这些用户。这也导致了退款请求过于仓促,更糟糕的是,随之而来的争议扣款会让我的损失翻倍——用户给了多少,我就得赔两倍出去。

我最近帮我兄弟发布了一个简单的小工具,能把任意窗口变成画中画窗口(https://lowtechguys.com/pipiri),结果前两天,因为这个问题,一半的销售额都变成了退款。菜单栏图标太多,人们以为这个软件根本没用。这对他的第一个应用来说,真不是什么鼓舞人心的开局。

更别提那个最好的解决方案——Bartender 应用,已经被苹果在 macOS Tahoe 中对内部 API 的修改彻底搞崩了。

本来可以处理得更好一点。


F-15E jet shot down over Iran #

https://news.ycombinator.com/item?id=47628808

During the entire gulf war (Iraq, 1990-91), only two F-15s were shot down via surface-to-air engagement. At the time, Baghdad was known to have the highest density of SAM protection out of any city in the world.

An F-15 being shot down in Iran after weeks of strategic bombing of their anti-air defense systems is not a good sign.

roadbuster

在整个海湾战争(1990-91)期间,仅有两架F-15战机被地空火力击落。当时,巴格达是世界上防空系统密度最高的城市。

在对伊朗防空系统进行了数周的战略轰炸后,F-15战机在伊朗境内被击落,这可不是个好兆头。


Tailscale’s new macOS home #

https://news.ycombinator.com/item?id=47618946

Every time I get a new Mac, I run these commands to reduce the spacing between menu bar icons. Lets you fit at least 2x the number of items in the menu bar.


defaults -currentHost write -globalDomain NSStatusItemSpacing -int 2

defaults -currentHost write -globalDomain NSStatusItemSelectionPadding -int 2

corlinp

每次拿到新 Mac 时,我都会运行这些命令来减少菜单栏图标之间的间距。这能让菜单栏容纳至少双倍数量的项目。

defaults -currentHost write -globalDomain NSStatusItemSpacing -int 2

defaults -currentHost write -globalDomain NSStatusItemSelectionPadding -int 2

OpenAI Acquires TBPN #

https://news.ycombinator.com/item?id=47618028

I bet OpenAI genuinely believes they’re using their money to help free media exist. And TBPN genuinely believes this is the right choice for economic freedom so they can continue to operate. I bet they even had a convo such as “we’ll never tell you what to say,” and both sides genuinely believed it.

But this never ends well. Even if there’s never a conversation about it, directly, the implication is there.

I don’t care about TBPN, specifically. I just really, really wish we had a better way for media to fund itself independently. (And I say this as someone who pays for some media, but not nearly enough. I don’t have $10/mo for every outlet that deserves it.)

EDIT: sama basically said what I said he would: https://x.com/sama/status/2039773740586918137

gkoberger

我敢打赌 OpenAI 真的相信他们正在用钱来帮助自由媒体生存。而 TBPN 也真心认为这是为了经济自由所做的正确选择,以便他们能够继续运营。我敢打赌他们甚至还讨论过类似“我们绝不会告诉你们该说什么”的协议,而且双方都真心相信这一点。

但这种局面从不会有一个好的结局。即使双方从未直接讨论过这件事,其中的暗示依然存在。

我并不特别在意 TBPN。我只是真的、真的很希望媒体能有一种更好的方式来独立融资。(我这么说是因为我自己也会为一些媒体付费,但付得远远不够。我没有足够的钱给每一个配得上的媒体每月付 10 美元。)

编辑:sama 基本上说了我会让他说的话:https://x.com/sama/status/2039773740586918137


Google releases Gemma 4 open models #

https://news.ycombinator.com/item?id=47617159

Daniel, your work is changing the world. More power to you.

I setup a pipeline for inference with OCR, full text search, embedding and summarization of land records dating back 1800s. All powered by the GGUF’s you generate and llama.cpp. People are so excited that they can now search the records in multiple languages that a 1 minute wait to process the document seems nothing. Thank you!

evilelectron

Daniel,你正在改变世界。为你喝彩。

我搭建了一个推理流程,用于处理19世纪以来的土地记录,包含OCR识别、全文搜索、向量嵌入和内容摘要。所有这些功能都由你生成的 GGUF 文件和 llama.cpp 驱动。人们非常兴奋,因为他们现在可以用多种语言搜索这些记录,因此等待一分钟来处理文档似乎完全不算什么。谢谢你!


Marc Andreessen is wrong about introspection #

https://news.ycombinator.com/item?id=47627653

The reason he and Musk are anti-introspection is that when they do it, it hurts. Because they are terrible people.

Better to just not think about it.

foobiekr

他和马斯克不反思的原因是,当他们这么做的时候,会感到痛苦。因为他们是糟糕透顶的人。最好还是别去想。


Samsung Magician disk utility takes 18 steps and t… #

https://news.ycombinator.com/item?id=47627175

I worked on a disk utility in the 90s called PartitionMagic that was one of the first ones to let you dynamically resize disk partitions.

Maybe Samsung used that when naming their product.

I am old, but I miss the days when the install process was copy. to /<appFolder> and the uninstall process was delete /<appFolder>

didgetmaster

我在90年代参与开发过一款名为 PartitionMagic 的磁盘工具,它是首批允许动态调整磁盘分区大小的工具之一。也许三星在给他们的产品命名时用了这个名字。

我老了,但我怀念那段时光,那时候安装就是 copy to /<appFolder>,卸载就是 delete /<appFolder>


Decisions that eroded trust in Azure – by a former… #

https://news.ycombinator.com/item?id=47621780

Is Azure really this unreliable? There are concrete numbers in this blog. For those who use Azure, does it match your external experience?

IME, yes.

I’m currently working as an SRE supporting a large environment across AWS, Azure, and GCP. In terms of issues or incidents we deal with that are directly caused by cloud provider problems, I’d estimate that 80-90% come from Azure. And we’re really not doing anything that complicated in terms of cloud infrastructure; just VMs, load balancers, some blob storage, some k8s clusters.

Stuff on Azure just breaks constantly, and when it does break it’s very obvious that Azure:

  1. Does not know when they’re having problems (it can take weeks/months for Azure to admit they had an outage that impacted us)

  2. Does not know why they had problems (RCAs we’re given are basically just “something broke”)

  3. Does not care that they had problems

Everyone I work with who interacts with Azure at all absolutely loathes it.

bumblehean

Azure 真的这么不可靠吗?这篇博客里有具体的数据。对于那些使用 Azure 的人来说,这符合你们的外部使用体验吗?

据我经验,是的。

我目前在一家公司担任 SRE(站点可靠性工程师),负责维护跨 AWS、Azure 和 GCP 的大规模环境。就我们处理的问题或事故而言,这些是直接由云厂商导致的问题,据我估计,其中 80-90% 来自 Azure。而在云基础设施方面,我们做的并不算复杂;仅仅是虚拟机、负载均衡器、一些 Blob 存储和 k8s 集群。

Azure 上的东西总是频频出问题,而且当它们出问题时,很明显是 Azure 的原因:

  1. 不知道自己什么时候出了问题(Azure 往往需要几周甚至几个月的时间才会承认对我们造成了故障)
  2. 不知道自己为什么会出问题(给我们提供的 RCA 根本原因分析基本上就只有“某个东西坏了”)
  3. 对自己出问题这件事根本不在乎

我身边所有和 Azure 打交道的同事,都极其厌恶它。


Sweden goes back to basics, swapping screens for b… #

https://news.ycombinator.com/item?id=47615163

I worked in EdTech about a decade ago and our education/pedagogy experts were already talking about this. They also talked a lot about how handwriting is super important for cognitive development.

After working on that company for a couple of years I realized using tech in education (pre university) was a mistake. One of the reasons I left.

In a decade or two the long term consequences of inundating kids with tech and then removing it will be quite obvious. This will be studied for decades to come. Reminds me of the Dutch kids that were borm during the 1944-1945 Dutch famine.

https://www.ohsu.edu/school-of-medicine/moore-institute/dutch-famine-birth-cohort

pier25

十年前我在教育科技行业工作,我们的教育及教学法专家就一直在讨论这个问题。他们还谈到了书写对认知发展是多么的重要。

在那家公司工作了几年后,我意识到在大学前的教育阶段使用科技是一个错误,这也是我离开的原因。

在一二十年左右,过度向孩子们灌输科技,随后又将其撤除的长期后果将变得非常明显。这将是未来几十年的研究课题。这让我想起了那些在1944-1945年荷兰饥荒期间出生的孩子。

https://www.ohsu.edu/school-of-medicine/moore-institute/dutch-famine-birth-cohort


TDF ejects its core developers #

https://news.ycombinator.com/item?id=47626230

Fix the title. No one seems to recognize “TDF” (The Document Foundation) despite their daily dramatics, myself included.

cap11235

修改标题。尽管他们日常闹剧不断,似乎也没人认得 ‘TDF’ (The Document Foundation),包括我在内。


Marc Andreessen is wrong about introspection #

https://news.ycombinator.com/item?id=47627548

Is the 1 percenters getting dumber or acting like it?

Like 10 years ago, I felt like Andreesen and Elon were thought leaders. Now they sound like idiots.

Did I or did they change?

Did I grow up and they changed to a younger audience and what I used to enjoy was just a different kind of stupid?

wodenokoto

那些顶层精英(1%的人)是真变傻了还是在装傻? 就像10年前,我觉得马克·安德森和埃隆·马斯克是思想领袖。现在他们听起来像白痴。 是我变了,还是他们变了? 是我长大了,还是他们迎合了更年轻的受众,而我以前喜欢的其实只是另一种形式的愚蠢?


Cursor 3 #

https://news.ycombinator.com/item?id=47619752

I’ve been running Claude Code in my Cursor IDE for a while now via extension. I like the setup, and I direct Claude on one task at a time, while still having full access to my code (and nice completions via Cursor). I still spend time tweaking, etc. before committing. I have zero interest in these new “swarms of agents” they are trying to force on us from every direction. I can barely keep straight my code working on one feature at a time. AI has greatly helped me speed that up, but working serially has resulted in the best quality for me. I’ll likely drop Cursor for good now and switch back to vanilla VsCode with CC.

nu11ptr

我一直通过扩展在 Cursor IDE 中使用 Claude Code。我喜欢这种配置,我让 Claude 一次只处理一个任务,同时我仍然可以完整访问我的代码(并享受 Cursor 提供的不错补全功能)。提交前,我仍然会花时间进行微调等操作。我对这种新推出的、四面八方强推给我们的“智能体群”毫无兴趣。我甚至难以理清一次处理一个功能时的代码状态。AI 大大加快了我的速度,但对于我来说,串行操作带来的代码质量最好。我现在很可能彻底放弃 Cursor,转而使用带 CC 的原生 VSCode。


Marc Andreessen is wrong about introspection #

https://news.ycombinator.com/item?id=47628115

Tim Dillon said summarized it pretty well - can’t remember or find the exact quote. Something to the effect of:

“Look around at all these things I have - how could I be wrong when I have so much?”

And that’s how you get the Andreessen’s and Musk’s of the world stating these nonsensical things as truth. In their minds, financial success is the ultimate yardstick. The fact that they have so much wealth is a testament that their way of thinking is always right.

You don’t need to look very hard to see this is what they really believe. Elon has done extremely silly things like claiming he was the best Path of Exile player in the world because he paid several people grind his account to a high-level. Having enough money to pay someone to play the game for you, is the same as being good at the game, in his mind.

rybosworld

Tim Dillon 这句话总结得很到位——记不清也找不到原话了。大概是这个意思:

“环顾四周看看我拥有的一切——拥有这么多东西怎么可能是我错了?”

这也就是为什么会出现像安德森-霍洛维茨和马斯克这样的人把这种无稽之谈当作真理说出来的原因。在他们脑子里,财务成功就是终极的衡量标准。他们拥有巨额财富这一事实,就是他们的思维方式始终正确的证明。

你不需要费力去找,就能看出这确实是他们真心相信的。埃隆做过极其荒唐的事,比如声称自己是《流放之路》世界顶级玩家,因为他花钱雇佣几个人帮他刷到了高等级账号。在他看来,拥有足够的钱请别人帮你玩游戏,就和你自己玩得好是一样的事。