2026-04-08 07:45:11
- 作者Sam Burns制作了一款融合野兽派建筑美学与实用功能的混凝土笔记本支架,通过故意不充分搅拌混凝土和人工锈蚀金属部件来营造城市废墟的破旧质感。
- Bram Cohen批评"vibe编码"极端做法会导致代码质量低下,主张开发者应积极参与代码审查而非完全依赖AI自动生成代码。
- 该网站通过对比电影《Idiocracy》与现实的政治、企业等现象,讽刺现实世界正逐渐趋近电影中描绘的反乌托邦荒诞情景。
- 《韦斯诺斯之战》是一款拥有丰富单人战役和多人地图的跨平台开源奇幻回合制策略游戏,具备活跃社区和高度可扩展性。
- Ghost Pepper是一款完全本地运行的macOS语音转文字应用,用户按住Control键即可使用Whisper模型进行隐私保护的语音输入。
- GLM-5.1是一款擅长长时任务处理的AI模型,能在长时间迭代中持续优化代码并构建复杂系统,在多项基准测试中表现优异。
- 研究人员使用形式化验证方法在阿波罗11号导航计算机的汇编代码中发现了一个潜伏57年的资源锁泄漏漏洞。
- 作者因担忧互联网中心化问题,详细介绍了将个人博客CDN从美国Cloudflare迁移至欧洲Bunny.net的全过程及配置方案。
- Adobe Creative Cloud被曝未经用户许可擅自修改系统hosts文件以检测软件安装状态,引发类似Sony Rootkit事件的隐私争议。
- 该网页以时间线形式梳理了过去30年间49款定义行业发展的关键显卡,展现了GPU技术从早期3D加速到现代光线追踪的演进历程。
https://sam-burns.com/posts/concrete-laptop-stand/
这篇博客文章介绍了作者 Sam Burns 制作的一款混凝土笔记本电脑支架,设计风格受到了野兽派建筑的启发,融合了城市废墟和衰败的主题。支架采用了原始混凝土表面质感,整体沉重且坚固,配备了两个 2.1 安培的 USB 充电口和一个三插电源插座,此外还内置了一个植物盆。
文章详细描述了支架的关键特点,包括野兽派风格的悬挑设计、带有破损角落和锈蚀钢筋的城市衰败美学、暴露的锈蚀钢筋和铜线、内置的珍珠串植物盆以及人工锈蚀的笔筒。
制作过程分为多个步骤,混凝土浇筑分两次完成,故意不充分搅拌以制造表面砂砾和水泥分布不均的效果,增强陈旧感。植物盆由一个黄油罐改造而成,固定在混凝土中,内置塑料盆栽种植珍珠串植物,营造悬垂效果,呼应城市探险中见到的废弃建筑。
暴露的铜线经过特殊处理,喷洒氨水和水以产生腐蚀效果,模拟损坏的电缆。钢筋则用钢丝刷清理后用水、盐和过氧化氢加速锈蚀。笔筒同样经过盐水和过氧化氢处理,并用混合了丙烯酸颜料和沙子的颜料点缀,模拟苔藓质感。
作者对最终作品非常满意,尽管风格独特且不一定适合所有人,但成功体现了野兽派建筑和城市衰败的主题。由于支架极其沉重,搬运时需用手推车,体现了制作过程的艰辛与价值。
https://news.ycombinator.com/item?id=47673360
https://bramcohen.com/p/the-cult-of-vibe-coding-is-insane
这篇文章由 Bram Cohen 撰写,标题为《The Cult Of Vibe Coding Is Insane》(“氛围编码教派疯狂”),主要讨论了软件开发中“氛围编码”(vibe coding)和过度“自用”(dogfooding)带来的问题。
作者指出,氛围编码是一种极端做法,开发者完全不去查看代码细节,仅凭与机器的模糊对话来推动项目,这种做法是不现实且荒谬的。虽然机器使用人类语言进行内部处理,且开发团队确实在构建计划文件、技能和规则等基础设施,但完全不深入代码本身会导致重复和混乱,降低软件质量。
文章强调,软件项目常常伴随着技术债务,传统上需要大量时间清理代码,而 AI 辅助编程可以大幅加快这一过程,帮助提高代码质量。作者建议,开发者应与 AI 进行充分沟通,明确问题和改进方向,通过反复讨论和指导,AI 才能高效完成代码清理和优化工作。
作者批评了 Claude 团队过度自用且拒绝查看代码细节的做法,认为这违背了合理的开发流程。作者本人则采用与 AI 对话、逐步审计和改进代码的方法,取得了较好效果。
总结来看,文章的核心观点是:软件质量差是开发者的选择,不应将责任归咎于 AI 工具。合理利用 AI 辅助编程、积极参与代码审查和指导,才能打造高质量的软件。
https://news.ycombinator.com/item?id=47664912
该网页通过对比电影《Idiocracy》(《低能时代》)中的虚构未来世界与现实世界的现状,展示了两者之间的高度相似性,形成了一个“低能时代接近指数”。内容涵盖政治、企业、娱乐、教育、环境、科学、医疗、司法和文化多个领域,指出现实中许多现象与电影中荒诞设定的惊人吻合。
在政治方面,电影中以娱乐价值和肌肉气质当选总统的设定,与现实中特朗普作为真人秀明星和摔跤名人当选美国总统高度相似。政治活动越来越像娱乐表演,2024 年民主党全国代表大会邀请说唱歌手表演也体现了这一趋势。
企业层面,电影中饮料公司买下监管机构,替代水资源灌溉作物的荒诞情节,与现实中企业游说反对水资源监管、瓶装水销售激增形成呼应。快餐品牌在社交媒体上采取咄咄逼人、恶搞客户的风格,也与现实中品牌社交媒体的“毒舌”行为相符。
娱乐方面,电影中最受欢迎的节目是反复击打男性裆部的恶搞内容,现实中“Jackass”系列和 TikTok 上的高风险挑战同样主导娱乐市场。教育领域,电影中法学学位可在 Costco 批发购买,现实中谷歌、亚马逊、沃尔玛等企业推出企业自有学历项目,逐渐取代传统教育。
环境方面,电影中巨大的垃圾雪崩摧毁城市的设定,与现实中太平洋垃圾带面积巨大、垃圾山持续增长及垃圾滑坡致死事件相呼应。科学领域,电影中智商逐代下降的设定与现实中美国智商首次出现近百年下降趋势相符。
医疗方面,电影中医生完全无能,现实中 AI 聊天机器人替代医生,医疗错误成为美国第三大死因。司法领域,电影中监狱斗殴成为娱乐节目,现实中监狱格斗内容在网络走红,庭审直播吸引大量观众。
文化方面,电影中名字变得荒诞无意义,现实中名人给孩子起奇异名字的现象普遍。整体来看,网页通过大量现实案例与电影设定的对比,揭示了现实社会在多个方面正逐步走向电影中描绘的荒诞未来,形成一种对现实的讽刺与警示。
https://news.ycombinator.com/item?id=47672818
《The Battle for Wesnoth》是一款开源的回合制策略游戏,拥有浓厚的奇幻主题。游戏支持单人模式和在线或本地多人对战,玩家可以探索 Wesnoth 的世界,参与多样的冒险故事,如夺回王位、逃离巫妖领主、深入地下打造火焰宝石、抵御死灵法师的侵袭,或带领幸存者穿越沙漠对抗未知的邪恶。
游戏特色包括手绘像素风格的单位动画和半写实的对话肖像,提供 17 个单人战役和 55 张多人地图,拥有七大阵营超过 200 种单位,每种单位具备独特技能、武器和法术。玩家可以通过互联网或局域网与其他玩家对战,游戏支持 30 多种语言,并拥有高度可扩展的引擎,结合 WML 和 Lua 脚本,丰富的玩家自制内容可通过官方插件服务器获取。
游戏跨平台支持 Windows、macOS 和 Linux 系统,提供稳定版和开发版两种版本。稳定版适合新手和内容创作者,经过充分测试,包含错误修复和翻译更新;开发版则面向资深玩家和内容创作者,包含最新功能但可能不稳定。两版本均可通过 Steam 和其他平台获取,并支持自动更新。
系统需求方面,稳定版和开发版对硬件要求相似,最低配置为双核 2.0 GHz 处理器、4GB 内存和 800MB 至 2GB 硬盘空间,推荐配置更高,分辨率要求从 800x600 到 1280x720 不等,均需键盘和鼠标操作。
游戏拥有庞大的社区,论坛帖子超过 52 万条,提供丰富的帮助资源。玩家和爱好者可以通过制作插件、贡献代码或测试开发版参与项目。项目接受捐赠,用于维护服务器、网站及艺术和音乐创作,支持渠道包括 Liberapay 和 itch.io。
https://news.ycombinator.com/item?id=47664186
https://github.com/matthartman/ghost-pepper
该网页介绍了一个名为 Ghost Pepper 的 macOS 本地语音转文字应用,支持 macOS 14.0 及以上版本,适配 Apple Silicon 芯片(M1 及以上)。用户按住 Control 键说话,松开后即可将语音转录并粘贴到任何文本框中。该应用完全在本地运行,不依赖云服务,保证用户数据隐私。
Ghost Pepper 具备智能清理功能,利用本地大型语言模型去除语音中的填充词和自我纠正,提升转录文本的质量。应用以菜单栏程序形式运行,无 Dock 图标,支持开机自启,用户可自定义清理提示词、选择麦克风和开启关闭各种功能。
应用使用多种开源语音模型,包括 Whisper 系列(支持英语及多语言)和 Parakeet v3,清理模型则基于 Qwen 3.5 不同规模版本,兼顾速度和质量。所有模型均通过 Hugging Face 提供,自动下载并缓存。
安装简单,用户下载 DMG 文件,拖入应用程序文件夹,授权麦克风和辅助功能权限后即可使用。辅助功能权限用于全局快捷键和模拟按键粘贴。应用默认启用开机启动,且不在磁盘记录转录内容,保护隐私。
该项目开源,基于 Swift 语言开发,依赖 WhisperKit、LLM.swift、Hugging Face 和 Sparkle 等技术。适合注重隐私的用户使用,尤其是企业或受管理设备,支持通过 MDM 配置预授权辅助功能权限。
Ghost Pepper 的设计理念是提供一个完全本地、免费且高效的语音转文字解决方案,区别于依赖云服务且商业化程度高的同类产品。
https://news.ycombinator.com/item?id=47666024
GLM-5.1 是一款面向长时任务的下一代旗舰模型,具备比前代更强的编码能力,在复杂软件工程任务中表现出色,尤其在 SWE-Bench Pro、NL2Repo 和 Terminal-Bench 2.0 等基准测试中领先。与之前的模型不同,GLM-5.1 能够在长时间、多轮迭代中持续优化,处理模糊问题时判断力更强,能有效分解复杂问题,进行实验、分析结果并精准识别瓶颈,随着运行时间增加,性能不断提升。
在三个不同场景的测试中展现了其长时优化能力:
整体来看,GLM-5.1 不仅在初期表现优异,更重要的是其在长时、多轮迭代中的持续优化能力,使其在复杂软件工程和开放式任务中具备显著优势。
https://news.ycombinator.com/item?id=47677853
https://www.juxt.pro/blog/a-bug-on-the-dark-side-of-the-moon/
这篇文章讲述了阿波罗导航计算机(AGC)中一个被忽视了 57 年的软件缺陷。AGC 是历史上最受关注的代码库之一,经过无数开发者和学者的深入研究,但依然存在一个资源锁泄漏的漏洞,影响了陀螺仪控制代码的正常运行。
作者利用开源的行为规范语言 Allium,将 13 万行 AGC 汇编代码提炼成 1.25 万行规格说明,从中发现了这个缺陷。该缺陷涉及 IMU(惯性测量单元)子系统中的 LGYRO 资源锁:当陀螺仪扭矩操作被“caging”(紧急锁定)中断时,代码没有释放该锁,导致后续操作挂起,无法重新校准导航平台。
文章还描述了这一缺陷在阿波罗 11 号任务中的潜在影响。指令舱飞行员迈克尔·柯林斯在绕月轨道执行星光对准时,若误触发了 cage 开关,可能导致导航计算机挂起陀螺仪操作,无法完成对准,进而影响返回地球的引擎点火方向。虽然重启计算机可以解决问题,但在当时的紧张环境下,这种故障难以被及时诊断。
文中还提到,AGC 的代码由玛格丽特·汉密尔顿领导的团队开发,开创了优先级调度、异步多任务处理和软件错误恢复等概念。虽然 AGC 代码经过严格审查,但这类基于资源管理的缺陷依然未被发现,显示出传统代码阅读和仿真方法的局限性。
总结来说,文章揭示了一个深藏的软件缺陷,强调了形式化规格和行为建模在发现复杂系统错误中的重要作用,同时也展现了阿波罗导航计算机软件工程的先进性和复杂性。
https://news.ycombinator.com/item?id=47673005
https://jola.dev/posts/dropping-cloudflare
这篇文章介绍了作者将个人博客的内容分发网络(CDN)服务从 Cloudflare 迁移到 bunny.net 的原因和具体操作步骤。
作者长期使用 Cloudflare,认可其免费且功能强大的服务,但担心过度依赖单一美国公司带来的风险和互联网中心化问题,因此寻找替代方案。bunny.net 是一家欧洲斯洛文尼亚公司,提供与 Cloudflare 竞争的 CDN 服务,性能优异且支持欧洲技术生态,成为作者的首选。
迁移过程中,作者先更换了域名注册商,选择了支持隐私保护且服务更好的 Porkbun。然后详细介绍了如何在 bunny.net 创建和配置“pull zone”(拉取区域),包括填写拉取区域名称、设置源服务器地址、选择服务等级和定价区域等。
接着,作者说明了如何将域名通过 CNAME 记录指向 bunny.net 的 CDN,并激活 SSL 证书,确保网站安全访问。缓存配置部分强调 bunny.net 默认尊重源站的缓存控制头,也支持智能缓存功能,适合大多数场景。作者还分享了自己通过 Phoenix 框架设置缓存头,实现 HTML 页面缓存以提升访问速度的具体代码示例。
最后,文章介绍了一些推荐的默认配置,如强制 SSL、启用 Origin Shield 减少源服务器负载、允许在源站离线时继续提供缓存内容等,提升网站稳定性和用户体验。作者还建议设置边缘规则,将自动生成的拉取区域域名重定向到正式域名,避免搜索引擎混淆。
整体来看,文章不仅分享了从 Cloudflare 迁移到 bunny.net 的动机,还提供了详细的操作指南和优化建议,适合有意更换 CDN 服务的技术用户参考。
https://news.ycombinator.com/item?id=47675013
这篇文章报道了 Adobe Creative Cloud 在 Windows 和 macOS 系统中偷偷修改 hosts 文件的行为。Adobe 通过在 hosts 文件中添加特定的 DNS 条目,利用浏览器加载特定图片的方式,检测用户是否已经安装了 Creative Cloud 软件。此前,Adobe 曾直接通过访问本地端口检测软件,但由于 Chrome 浏览器开始限制本地网络访问,Adobe 改用了修改 hosts 文件的方式。
文章指出,这种行为类似于早期 Sony/BMG 的 rootkit 事件,虽然修改 hosts 文件不算恶意软件级别的攻击,但作为第三方软件擅自修改系统关键文件,仍然非常不妥,且大多数用户对 hosts 文件的作用并不了解。评论区中,用户们讨论了软件对系统的过度控制、AI 辅助编程带来的风险以及软件开发中的质量控制问题。
此外,有用户提到一些工具(如 Chris Titus 的 Windows 清理工具)已经开始针对 Adobe 的这些修改进行拦截和清理,hosts 文件中甚至出现了多达 900 行与 Adobe 相关的屏蔽条目,显示出用户对 Adobe 此类行为的反感和防范。整体来看,文章批评了 Adobe 未经用户同意修改系统文件的做法,认为这不仅侵犯用户权益,也可能带来系统稳定性和数据安全风险。
https://news.ycombinator.com/item?id=47664205
https://sheets.works/data-viz/every-gpu
该网页以时间线形式详细介绍了过去 30 年间共 49 款重要显卡的发展历程,涵盖从 1996 年首款消费者 3D 加速卡 Voodoo Graphics,到近年的 RTX 系列和当前一代显卡。内容按时代划分为“开创时代”、“DirectX 时代”、“黄金时代”、“高清游戏时代”、“现代时代”、“RTX 时代”等多个阶段,每个阶段介绍了代表性显卡的发布年份、价格、显存容量、晶体管数量、功耗、计算性能(TFLOPS)以及其定义性的游戏。
开创时代(1996-1999 年)介绍了首批 3D 加速卡,如 Voodoo Graphics 和 NVIDIA 的 RIVA TNT 系列,奠定了 3D 图形加速的基础。DirectX 时代(2000-2003 年)则突出显卡首次支持可编程着色器和 DirectX 9.0,ATI 和 NVIDIA 展开激烈竞争。黄金时代(2004-2007 年)见证了统一着色器架构的诞生,NVIDIA 推出了革命性的 GeForce 8800 GTX,开启了 GPU 通用计算(CUDA)时代。
高清游戏时代(2008-2012 年)显卡性能大幅提升,AMD 和 NVIDIA 在制程工艺和显存技术上不断突破,支持 DirectX 11 和更高的计算性能。现代时代(2013-2017 年)显卡进一步提升效率和性能,推出了多款经典型号如 GTX 970 和 GTX 1080,成为主流 1080p 及高端游戏的首选。RTX 时代(2018 年起)引入了硬件光线追踪和 AI 超采样(DLSS)技术,开启了图形渲染的新纪元。
整体来看,网页通过显卡的技术参数、市场定位和代表游戏,清晰展现了 GPU 行业的技术演进和市场变迁,反映了从简单 3D 加速到现代复杂图形处理和计算的巨大飞跃。
https://news.ycombinator.com/item?id=47672295
https://news.ycombinator.com/item?id=47676122
This man poured concrete around a power strip, chemically aged copper with ammonia, rusted rebar with peroxide, faked a damaged cable for vibes, and vibrated out the air bubbles with a dildo. This is the most unhinged and delightful Show HN I’ve ever seen.
atlgator
这个男人在电源插座周围浇了混凝土,用氨水化学氧化铜,用过氧化氢让钢筋生锈,伪造了一根损坏的电缆来制造氛围,还用震动棒振出了气泡。这是我见过的最疯狂又最有趣的Show HN。
https://news.ycombinator.com/item?id=47667921
This thread is a support group for people who have each independently built the same macOS speech-to-text app.
atlgator
这个帖子是一个支持小组,成员们各自独立开发了相同的macOS语音转文字应用。
https://news.ycombinator.com/item?id=47673539
I attended an audience testing screener for Idiocracy before the film’s final edit. I could not believe my eyes and ears, I loved it unlike anything I’d seen before, it was the hardest US culture satire I’d seen up to that point. Then the lights came up and the audience started giving their reviews, in an open mike fashion. They all identified with the “idiots” and were indignant insulted, and angry. I remember making eye contact with Mike Judge like “WTF!” It was an early screener and I think that reaction was a surprise to the film team. I own a copy and watch it more than once a year. One of my favorite hard satires.
bsenftner
我参加过《低能时代》电影最终剪辑前的观众测试放映。我简直不敢相信自己的眼睛和耳朵,我非常喜欢它,感觉以前从未见过这样的作品,这是我当时见过的最犀利的美国文化讽刺片。然后灯亮起来,观众开始用开放麦克风的方式发表意见。他们都认同“傻瓜”这一角色,感到愤怒、受辱和愤慨。我记得当时和导演迈克·贾奇对视,心里想“这是怎么回事!”那是一次早期放映,我觉得这种反应让影片团队很意外。我买了一份拷贝,每年至少看一遍。这是我最喜欢的尖锐讽刺片之一。
https://news.ycombinator.com/item?id=47675655
Why wouldn’t I trust a vibe coded app that has existed for 1 week with all my important data?
sumeno
为什么我不信任一款存在仅一周却存有我所有重要数据的vibe编码应用?
https://news.ycombinator.com/item?id=47671325
Ronan Farrow, the write of this article, made a comment in this thread that is buried in all the comments, “As is always the case with incredibly precise and rigorously fact-checked reporting like this, where every word is chosen carefully (the initial closing meeting for this one was nearly eight hours long, with full deliberation about each sentence), there is more out there on that subject than is explicitly on the page.”
I saw that before I read the article and it made me read the article in a very different way than I normally do. As I was reading, I found myself thinking, “Why is it worded that way? What else is the writer trying to say, or not say?”
It made reading this a lot more interactive than I normally associate with passive reading. Great job, Ronan!
rupi
这篇文章的作者罗南·法罗在评论区里埋藏了一条评论:“像这样极其精准且经过严格事实核查的报道,每个词都经过仔细斟酌(这篇报道的初步闭门会议就开了将近八个小时,对每句话进行了充分讨论),实际上关于这个主题的信息远比文章中明确写出的要多。”
我在读文章前看到了这条评论,这让我以一种与平常完全不同的方式去阅读文章。读着读着,我发现自己在想:“为什么会这样措辞?作者还在尝试表达什么,或者刻意不说些什么?”
这让我的阅读体验比平时那种被动阅读更具互动性。罗南,干得好!
https://news.ycombinator.com/item?id=47668579
Yes, but first I want to be very clear on some things.
I could have hidden my identify behind a throwaway. I did not feel that would be appropriate when making this calim.
I am not looking for anything, literally at all. Any follow ups for blogs; anything that would benefit I will not answer.
This is NOT a new account, I am very easy to find; I am 6'1 140lbs
I was working for a company called NationBuilder and I had the opportunity to go on a work trip. Outside of a talk he had just given I was waiting for my ride and I looked over like…damn thats the speaker. I wanted to say Hi; he damn near flagged down the police. I apologized and just decided to move on.
Note: It was in Reno, and no I don’t want to go into details; the others are not hard to find because I happened upon them via blog posts so i’m sure if someone with the accumen of RF wants to know, he will find.
I have heard similar stores from several people in the years since. I AM NOT CALLING THIS PERSON RACIST. I am saying; he is observably scared of black people and that is not someone I want making descions about how the world moves foward.
arionhardison
是的,但我首先想对一些事情明确说明。
我本可以用一个临时账号隐藏身份,但在做出这个声明时,我觉得那样不合适。
我完全不寻求任何回报。无论是博客的后续采访,还是任何可能带来好处的事情,我都不会回应。
这不是一个新账号,我很容易被找到;我身高6英尺1英寸,体重140磅。
我曾在一家名为NationBuilder的公司工作,有一次参加出差。那次在一场演讲结束后,我等着接我的车,突然看到——哇,那就是演讲者。我想打个招呼,但他差点把警察叫来了。我道了歉,然后决定不再理会。
备注:地点是在雷诺,我不想透露细节;其它相关事件不难找到,因为我是在博客文章中偶然发现的,所以如果有人像RF那样敏锐,想了解的话,一定能找到。
这些年来,我听过好几个人讲过类似的故事。我不是在说这个人种族歧视。我是说,他明显害怕黑人,而这样的人我不希望他来决定世界的发展方向。
https://news.ycombinator.com/item?id=47664087
As is always the case with incredibly precise and rigorously fact-checked reporting like this, where every word is chosen carefully (the initial closing meeting for this one was nearly eight hours long, with full deliberation about each sentence), there is more out there on that subject than is explicitly on the page.
ronanfarrow
正如这类极其精准且经过严格事实核查的报道一贯如此,每个词都经过细致斟酌(这篇报道的最初闭幕会议将近八个小时,针对每一句话进行了全面讨论),关于这个主题实际上还有更多内容未明言于文中。
https://news.ycombinator.com/item?id=47667992
Hi @ronanfarrow — I have only had one interaction with Sam Altman in person, and I was advised to keep it to myself. I know this crowd may not care, but Altman is absolutely terrified of Black people — not in any contextual sense, but in a visceral, instinctive way. For someone who, as you put it, “controls our future,” this should matter.
FYI: I am by far not the only one to have experienced this and it 100% impacts hiring and other decisions at OpenAI.
arionhardison
嗨,@ronanfarrow——我只和Sam Altman本人有过一次接触,当时有人建议我不要说出去。我知道这群人可能不在意,但Altman对黑人感到非常恐惧——不是在任何情境上的恐惧,而是本能的、发自内心的害怕。对于你说的“掌控我们未来”的人来说,这一点很重要。
顺便说一句,我绝不是唯一有这种体验的人,这完全影响了OpenAI的招聘和其他决策。
https://news.ycombinator.com/item?id=47671774
As a child, I grew up in a village in China and our family farmed rice. It was mostly my mom who was doing the farming while my dad worked in the city.
Some things I remember:
Seeing hired buffalos tilling our fields
Playing with frogs and catching tadpoles in the fields
Someone with a machine that removes the husks would come to our village during harvest
The smell of rice fields. I recently smelled it again and it’s very comforting.
Now I work in high tech, working on AI, and the fancy stuff. There is just something about rice fields that I love - maybe just memories, childhood, smell, how serene it looks when it’s full.
My one hope for AI, robotics, self driving cars, is that they can enable more people in cities to migrate back to rural places. When I was younger, I used envy those who grew up privileged in a big modern city. Nowadays, I absolutely am glad I grew up in a little village in a farming community and I consider myself lucky to have.
aurareturn
小时候,我在中国的一个村庄长大,我们家种植水稻。大多数农活都是妈妈干的,爸爸则在城里工作。
我记得的一些事情:
看到雇来的水牛在耕田
在田里玩青蛙,抓蝌蚪
收割季节时,有人会开着一台机器到村里来脱壳
稻田的气味。最近我又闻到了那味道,感觉非常安慰。
现在我从事高科技工作,专注于人工智能和各种先进技术。但我就是特别喜欢稻田——也许是因为记忆、童年、那股味道,或者是稻田丰收时的宁静景象。
我对人工智能、机器人和自动驾驶汽车唯一的希望,就是它们能让更多城市人迁回农村。当我年轻时,曾羡慕那些在大现代城市长大的特权阶层。现在,我非常庆幸自己是在一个小村庄、农业社区长大的,我觉得自己很幸运。
https://news.ycombinator.com/item?id=47665731
I suspect if people saw the handwritten code of many, many, many products that they used every day they would be shocked. I’ve worked at BigCos and startups, and a lot of the terrible code that makes it to production was shocking when I first started.
This isn’t a dig at anyone, I’ve certainly shipped my share of bad code as well. Deadlines, despite my wishes sometimes, continue to exist. Sometimes you have to ship a hack to make a customer or manager happy, and then replacing those hacks with better code just never happens.
For that matter, the first draft of nearly anything I write is usually not great. I might just be stupid, but I doubt I’m unique; when I’ve written nice, beautiful, optimized code, it’s usually a second or third draft, because ultimately I don’t think I fully understand the problem and the assumptions I am allowed to make until I’ve finished the first draft. Usually for my personal projects, my first dozen or so commits will be pretty messy, and then I’ll have cleanup branches that I merge to make the code less terrible.
This isn’t inherently bad, but a lot of the time I am simply not given time to do a second or third draft of the code, because, again, deadlines, so my initial “just get it working” draft is what ships into production. I don’t love it, and I kind of dread of some of the code with my name attached to it at BigCo ever gets leaked, but that’s just how it is in the corporate world sometimes.
tombert
我怀疑如果人们看到许多他们每天使用的产品的手写代码,会感到震惊。我曾在大型公司和初创公司工作,许多进入生产环境的糟糕代码在我刚开始时都让我大吃一惊。
这不是针对任何人,我自己也确实写过不少糟糕的代码。尽管我有时不愿意,但截止日期依然存在。有时候你不得不为了让客户或经理满意而采用临时的解决方案,而这些临时方案往往从未被替换成更好的代码。
此外,我写的几乎任何东西的第一稿通常都不是很好。可能是我不聪明,但我怀疑我并不孤独;当我写出漂亮、优雅、优化过的代码时,通常是第二稿或第三稿,因为我觉得在完成第一稿之前,我并没有完全理解问题和可以做出的假设。通常在我的个人项目中,我的头十几次提交会相当混乱,然后我会有清理的分支合并进去,使代码不那么糟糕。
这本身并不是坏事,但很多时候我根本没有时间做第二稿或第三稿代码,因为截止日期依然存在,所以我最初那个“先让它能运行”的草稿就是投产版本。我并不喜欢这样,也有点害怕自己署名的一些代码在大公司一旦泄露,但在企业世界里,有时候事情就是这样。
https://news.ycombinator.com/item?id=47662808
Not claude code specific, but I’ve been noticing this on Opus 4.6 models through Copilot and others as well. Whenever the phrase “simplest fix” appears, it’s time to pull the emergency break. This has gotten much, much worse over the past few weeks. It will produce completely useless code, knowingly (because up to that phrase the reasoning was correct) breaking things.
Today another thing started happening which are phrases like “I’ve been burning too many tokens” or “this has taken too many turns”. Which ironically takes more tokens of custom instructions to override.
Also claude itself is partially down right now (Arp 6, 6pm CEST): https://status.claude.com/
summarity
这不是针对Claude代码的特定问题,但我注意到Opus 4.6模型在Copilot等平台上也有类似情况。每当出现“最简单的修复”这个短语时,就该拉紧急刹车了。过去几周这种情况变得越来越严重。它会生成完全没用的代码,明知故犯(因为在出现这个短语之前,推理是正确的),结果把东西弄坏了。
今天又出现了另一种情况,比如“我已经消耗了太多的令牌”或者“这已经花费了太多回合”这样的表达。具有讽刺意味的是,要覆盖这些说法,反而需要更多的自定义指令令牌。
另外,Claude本身现在部分服务中断(Arp 6,欧洲中部时间下午6点):https://status.claude.com/
https://news.ycombinator.com/item?id=47662398
Gobsmacking details about Altmans’ time as Y Combinator president, in case anyone’s wondering.
Fantastic reporting.
kmfrk
关于奥特曼担任Y Combinator总裁期间令人震惊的细节,以防有人感兴趣。
报道非常精彩。
https://news.ycombinator.com/item?id=47664246
I’m the author of the report in there. The stop-phrase-guard didn’t get attached but here it is: https://gist.github.com/benvanik/ee00bd1b6c9154d6545c63e06a317080
You can watch for these yourself - they are strong indicators of shallow thinking. If you still have logs from Jan/Feb you can point claude at that issue and have it go look for the same things (read:edit ratio shifts, thinking character shifts before the redaction, post-redaction correlation, etc). Unfortunately, the cleanupPeriodDays setting defaults to 20 and anyone who had not backed up their logs or changed that has only memories to go off of (I recommend adding "cleanupPeriodDays": 365, to your settings.json). Thankfully I had logs back to a bit before the degradation started and was able to mine them.
The frustrating part is that it’s not a workflow or model issue, but a silently-introduced limitation of the subscription plan. They switched thinking to be variable by load, redacted the thinking so no one could notice, and then have been running it at ~1/10th the thinking depth nearly 24/7 for a month. That’s with max effort on, adaptive thinking disabled, high max thinking tokens, etc etc. Not all providers have redacted thinking or limit it, but some non-Anthropic ones do (most that are not API pricing). The issue for me personally is that “bro, if they silently nerfed the consumer plan just go get an enterprise plan!” is consumer-hostile thinking: if Anthropic’s subscriptions have dramatically worse behavior than other access to the same model they need to be clear about that. Today there is zero indication from Anthropic that the limitation exists, the redaction was a deliberate feature intended to hide it from the impacted customers, and the community is gaslighting itself with “write a better prompt” or “break everything into tiny tasks and watch it like a hawk same you would a local 27B model” or “works for me <in some unmentioned configuration>” - sucks :/
noxa
我是那个报告的作者。停止短语保护没有附上,但这里有链接:https://gist.github.com/benvanik/ee00bd1b6c9154d6545c63e06a317080
你自己也可以监控这些——它们是浅层思考的强烈指标。如果你还保留着一二月份的日志,可以让Claude针对那个问题去查找同样的情况(比如阅读:编辑比例的变化,删减前思考字符的变化,删减后的相关性等)。不幸的是,cleanupPeriodDays 默认设置为20天,任何没有备份日志或更改该设置的人现在只能靠记忆了(建议在 settings.json 里加上 "cleanupPeriodDays": 365,)。幸好我保留了降级开始前一段时间的日志,才得以挖掘出这些信息。
令人沮丧的是,这既不是工作流程问题,也不是模型问题,而是订阅计划中悄悄引入的限制。他们根据负载让思考能力变得可变,删减了思考内容使没人察觉,然后一个月来几乎全天候以大约十分之一的思考深度运行。这是在开启了最大努力、自适应思考关闭、最大思考令牌数很高的情况下。不是所有提供商都会删减或限制思考,但一些非Anthropic的提供商是这么做的(大多数不是API计费)。对我个人来说,遇到的问题是那种“兄弟,如果他们悄悄削弱了消费者计划,你就去买企业版!”的想法是对消费者非常不友好的:如果Anthropic的订阅版相比其他相同模型的访问表现明显更差,他们就应该对此进行明确说明。现在Anthropic完全没有任何迹象表明存在这种限制,删减是故意设计的功能,目的是让受影响的用户察觉不到,而社区却在自欺欺人地说“写一个更好的提示词”或者“把任务拆得很细,然后像盯本地27B模型一样密切监控它”或者“在我某种未提及的配置下可以用”,真是糟透了 :/
https://news.ycombinator.com/item?id=47663016
That analysis is pretty brutal. It’s very disconcerting that they can sell access to a high quality model then just stealthily degrade it over time, effectively pulling the rug from under their customers.
matheusmoreira
这个分析非常严厉。他们能卖出高质量模型的使用权,然后悄无声息地逐渐降低模型的性能,实际上是在暗中坑害客户,这让人非常不安。
https://news.ycombinator.com/item?id=47662929
I have no doubt that those numbers have been inflated by AI powered marketing tools, dead internet theory style.
leviathant
我毫不怀疑那些数字是被AI驱动的营销工具夸大了,就像“死亡互联网理论”那样。
https://news.ycombinator.com/item?id=47668520
Thanks for the feedback IDs — read all 5 transcripts.
On the model behavior: your sessions were sending effort=high on every request (confirmed in telemetry), so this isn’t the effort default. The data points at adaptive thinking under-allocating reasoning on certain turns — the specific turns where it fabricated (stripe API version, git SHA suffix, apt package list) had zero reasoning emitted, while the turns with deep reasoning were correct. we’re investigating with the model team. interim workaround: CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 forces a fixed reasoning budget instead of letting the model decide per-turn.
bcherny
感谢反馈,ID们——我已经阅读了所有5份对话记录。
关于模型表现:你的会话中每次请求都会发送 effort=high(通过遥测确认),所以这不是默认的 effort。数据表明在某些回合中,适应性思考对推理的分配不足——具体出现虚构信息的回合(stripe API 版本、git SHA 后缀、apt 软件包列表)完全没有输出推理,而那些有深度推理的回合则是正确的。我们正在与模型团队进行调查。临时解决方案是:设置 CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1,可以强制使用固定的推理预算,而不是让模型每轮自定决定。
2026-04-07 07:46:34
- Google推出AI Edge Gallery应用,让iPhone用户可在本地离线运行Gemma 4等大语言模型,兼顾隐私保护与端侧AI能力。
- 开发者创建了仅870万参数的GuppyLM小型语言模型,以简洁代码和浏览器端运行方式帮助理解大语言模型的内部工作原理。
- 作者抨击现代服务强制用户下载原生App而削弱网页版体验的做法,主张浏览器在隐私保护、用户自由和扩展性方面的优势。
- 文章指出微软三十多年来在Windows桌面应用开发框架上缺乏统一战略,技术路线反复变更与内部斗争导致开发者长期面临困惑。
- 瑞士通过公共基础设施开放共享模式实现25 Gbit对称光纤网络领先全球,而美国因区域性垄断和德国因重复建设导致宽带发展滞后。
- Claude Code在2月更新后因思考内容显示策略调整和默认努力等级降低,导致处理复杂工程任务的性能显著退化引发用户不满。
- 法国央行将存放在纽约联邦储备银行的最后129吨黄金全部运回国内,实现130亿欧元资本收益并完成黄金储备本土化。
- OpenAI首席科学家苏茨凯弗在秘密备忘录中指控CEO萨姆·奥特曼隐瞒事实和欺骗董事会,质疑其领导AI安全发展的可信度。
- 雇主利用算法分析求职者的个人数据实施"监控定价",以推断其最低薪资接受底线并在薪资谈判中占据信息不对称优势。
- 文章介绍如何利用LM Studio 0.4.0无头命令行工具在本地运行Gemma 4模型,借助MoE架构在消费级硬件上实现高效AI推理。
https://apps.apple.com/nl/app/google-ai-edge-gallery/id6749645337
该网页介绍了一款名为 AI Edge Gallery 的 iPhone 应用,由 Google 开发,属于生产力类别,适用于 iOS 17.0 及以上系统。该应用主打在移动设备上离线运行强大的开源大型语言模型(LLMs),强调隐私保护,所有数据处理均在设备本地完成,无需联网。
最新版本引入了 Gemma 4 系列模型,支持高级推理、逻辑和创造能力。核心功能包括:
该应用是一个开源项目,面向开发者和 AI 爱好者,鼓励社区贡献技能和功能。性能表现依赖设备硬件(CPU/GPU)。用户可通过 GitHub 查看源代码,并通过指定邮箱反馈意见。
隐私方面,Google 声明应用会收集设备 ID、诊断信息、性能数据等,部分数据可能与用户身份关联,部分则不关联身份。所有数据处理均符合 Google 的隐私政策,且未经过苹果验证。
应用大小为 35.4MB,支持英语,适合 13 岁及以上用户。Google LLC 作为开发者,确认该产品符合欧盟法规。
https://news.ycombinator.com/item?id=47652561
https://github.com/arman-bd/guppylm
该网页介绍了 GuppyLM,一个约 870 万参数的小型语言模型,模拟一条名为 Guppy 的小鱼的对话风格。GuppyLM 通过简短、全小写的句子表达对水、食物、光线和水族箱生活的感受,不理解复杂的人类抽象概念如金钱或政治。该模型基于 60,000 条涵盖 60 个主题的合成对话训练,训练过程简单快捷,约 5 分钟即可在单个 GPU 上完成,模型体积小,甚至可以在浏览器中运行。
架构方面,GuppyLM 采用了 6 层的标准 Transformer 结构,隐藏层维度为 384,注意力头数为 6,词汇表大小为 4096,最大序列长度 128。模型设计简洁,没有复杂的改进机制,使用权重共享的嵌入层和语言模型头。
GuppyLM 的个性设定为友好、好奇且略显笨拙,常常关注食物,语言风格简单直接,反映了鱼类的感官体验。它涵盖的主题包括问候、情绪、温度、食物、光线、水、噪音、夜晚、孤独、气泡、反射、呼吸、游泳、颜色、味道、植物、过滤器、藻类、蜗牛、恐惧、快乐、疲劳、季节、音乐、访客、梦境、时间、记忆、笑话、爱等。
用户可以直接在浏览器中通过 WebAssembly 运行该模型,无需安装或服务器支持,也可以在 Colab 中运行预训练模型进行交互式聊天。开发者还可以通过提供的代码和数据集自行训练模型,支持上传至 HuggingFace 或本地使用。
数据集为“arman-bd/guppylm-60k-generic”,包含约 6 万条样本,格式为输入、输出和类别,类别覆盖 60 种不同主题。项目结构清晰,包含模型训练、推理和交互的完整流程,适合想了解语言模型内部工作原理的用户。
https://news.ycombinator.com/item?id=47655408
https://www.0xsid.com/blog/wont-download-your-app
这篇博客文章表达了作者对现代应用程序强制用户下载原生 App 而忽视网页版体验的强烈不满。作者指出,许多服务优先推广 App,甚至通过弹窗、模态窗口等方式强迫用户下载,导致网页版被边缘化,尤其在公共服务或实用工具领域,这种做法带来很大不便。
作者强调自己喜欢通过浏览器使用服务,因为浏览器允许更多的自定义和控制,比如使用用户脚本、广告拦截器和扩展来改善体验,而 App 则限制了这些自由。App 开发者则倾向于通过 App 推送通知、收集数据,构建封闭生态以提高用户留存率,背后的动机更多是商业利益而非用户体验。
文章还指出,绝大多数 App 本质上只是通过 API 获取数据并展示文本和媒体,功能简单,却需要用户下载体积庞大的程序,授权各种权限,运行后台进程,显得不合理。即使下载了 App,体验也未必更好,很多 App 存在性能卡顿、界面不流畅等问题,缺乏原生应用应有的细腻和流畅度。
作者总结了“恶化循环”现象:服务先通过开放的网页吸引用户,随后故意削弱网页版功能,强制用户转向 App,App 内广告泛滥且无法屏蔽,用户成为被困的受众。由于商业激励,维护优秀的网页版体验已无利可图,浏览器逐渐沦为 App 推广的入口,尽管这种策略有效,但对用户体验极为不利。
https://news.ycombinator.com/item?id=47661439
https://www.jsnover.com/blog/2026/03/13/microsoft-hasnt-had-a-coherent-gui-strategy-since-petzold/
这篇博客文章由 Jeffrey Snover 撰写,主题是微软在图形用户界面(GUI)策略上的长期混乱和缺乏统一方向。文章回顾了微软自 1988 年以来的 GUI 发展历程,指出微软已经三十多年没有给开发者一个明确、一致的 Windows 桌面应用开发框架。
文章首先提到 1988 年 Charles Petzold 的《Programming Windows》一书,奠定了 Win16 和 Win32 时代的单一、权威的 Windows 应用开发策略,开发者可以依赖这套清晰的模型成功开发应用。
随后,微软进入了“面向对象热潮”时期(1992-2000),推出了 MFC、OLE、COM、ActiveX 等技术,但这些技术增加了复杂度,没有形成统一的开发策略,导致开发者困惑。
2003 年 PDC 大会上,微软发布了 Longhorn 计划,提出了包括 WPF(Avalon)在内的三大技术支柱,WPF 带来了 GPU 加速和 XAML 声明式 UI,技术上非常先进。然而由于内部管理和战略调整,Longhorn 项目被重置,Windows 团队对托管代码产生了抵触,导致 WPF 被边缘化,形成了 Windows 团队与.NET 团队的长期内耗。
2007 年至 2010 年间,微软推出了 Silverlight,作为跨平台的浏览器插件和 Windows Phone 的基础,技术表现良好,但因战略调整被突然放弃,开发者措手不及。
2012 年,微软推出 Windows 8 和 Metro 界面,采用 WinRT 作为新的运行时,但 WinRT 并非基于.NET,Windows 团队与.NET 团队的分歧加剧,开发者面对多种并行技术选择,感到迷茫。
Windows 10 时代,微软推出了 UWP(通用 Windows 平台),理论上支持多设备统一开发,但由于 Windows Phone 的失败和微软自身旗舰应用未采用 UWP,导致 UWP 未能成为主流。随后,微软推出了 WinUI 和 Project Reunion(后更名为 Windows App SDK),试图整合分散的技术,但依然未能彻底解决问题。
文章总结指出,微软的 GUI 技术生态呈现出“无序动物园”状态,缺乏统一的“管理员”,导致开发者在众多技术之间徘徊,经历了多次战略转变和技术重启,给开发者带来了极大困扰。作者批评微软内部的组织和战略决策是造成这一混乱的根本原因。
https://news.ycombinator.com/item?id=47651703
https://sschueller.github.io/posts/the-free-market-lie/
这篇文章由 Stefan Schüller 撰写,探讨了为何瑞士拥有世界领先的 25 Gbit 对称光纤互联网,而美国和德国却落后许多。文章通过比较三国的互联网基础设施和监管模式,揭示了自由市场与监管之间的复杂关系。
文章指出,瑞士的光纤网络采用了“自然垄断”理念,即基础设施由公共或半公共实体建设,作为中立共享资产,所有互联网服务提供商平等接入,用户享有真正的选择权和高速、专用的光纤连接。而美国则形成了区域性垄断,消费者通常只能选择一个提供商,且网络带宽是共享的,导致高峰时段速度大幅下降。德国则推行多家企业各自建设光纤网络的“过度建设”模式,造成资源浪费和重复投资,且监管更多关注基础设施竞争而非共享,导致小型 ISP 难以有效接入。
文章强调,瑞士的成功在于将基础设施视为公共资产,促进服务层面的竞争,而美国和德国则分别陷入了垄断和过度竞争的困境。作者认为,这揭示了资本主义和监管的一个根本真相:在自然垄断行业,合理的监管和基础设施共享是实现高效竞争和优质服务的关键。
https://news.ycombinator.com/item?id=47652400
https://github.com/anthropics/claude-code/issues/42796
该网页是一份关于 Anthropic 公司旗下 Claude Code 模型在 2026 年 2 月更新后出现性能退化问题的详细报告。报告指出,自 2 月起,Claude Code 在处理复杂工程任务时表现明显下降,无法完成多步骤研究、遵循规范和精细代码修改,导致用户体验变差。
报告通过对近 18,000 个思考块和超过 230,000 次工具调用的数据分析,发现问题与“思考内容删减”策略的实施时间高度吻合。该策略在 2 月中旬开始逐步推行,到 3 月中旬完全生效,导致模型的“思考深度”大幅减少,约下降了 70%。思考深度的减少使模型从“先研究后编辑”的工作流程转变为“先编辑后研究”,降低了代码修改的质量。
具体表现包括:停止钩子违规次数激增,用户提示中的挫败感明显增加,模型需要更多的修正,且每个会话的提示数量减少。此外,模型在编辑代码前的阅读次数大幅下降,表明其减少了对上下文的理解和研究。
报告强调,延展的思考过程对高级工程任务至关重要,删减思考内容直接影响了模型的表现。该分析旨在帮助 Anthropic 理解问题根源,并为未来优化模型的思考令牌分配提供数据支持,以恢复和提升复杂任务的处理能力。
https://news.ycombinator.com/item?id=47660925
https://www.mining.com/france-pulls-last-gold-held-in-us-for-15b-gain/
法国央行宣布已将存放在纽约联邦储备银行的最后一批黄金全部运回国内。这批黄金重约 129 吨,占法国黄金总储备的 5%。法国自 1920 年代末起将部分黄金存放在美国,尽管 1960 年代曾启动过黄金回流行动,但仍有少量黄金留在纽约。
此次行动源于 2024 年内部审计建议,法国央行于 2025 年 7 月至 2026 年 1 月期间完成操作。与以往直接运回黄金不同,这次选择在欧洲市场出售旧金条并购买符合现代国际标准的新金条。央行行长强调此举并非出于政治动机。
由于金价上涨,这次操作带来了 130 亿欧元(约 150 亿美元)的资本收益,使法国央行 2025 财年实现净利润 81 亿欧元,扭转了 2024 年 77 亿欧元的净亏损。目前法国黄金总储备量保持在 2437 吨不变,全部存放在巴黎拉苏特雷纳的地下金库中。央行还计划在 2028 年前将剩余的 134 吨非标准黄金全部升级为国际标准规格。
https://news.ycombinator.com/item?id=47658146
https://www.newyorker.com/magazine/2026/04/13/sam-altman-may-control-our-future-can-he-be-trusted
这篇文章报道了 OpenAI 首席科学家伊利亚·苏茨凯弗在 2023 年秋季向董事会成员秘密发送备忘录,表达了对首席执行官萨姆·奥特曼及其副手格雷格·布罗克曼是否适合领导公司的严重怀疑。苏茨凯弗曾是两人的朋友,但随着公司接近开发出能匹敌或超越人类认知能力的人工智能,他对奥特曼的信任逐渐消失,认为奥特曼不应“掌控关键按钮”。
备忘录中包含了大量 Slack 消息和人力资源文件,指控奥特曼向高管和董事会成员隐瞒事实,欺骗他们关于内部安全协议的情况。备忘录开头列出了奥特曼的行为模式,其中首项即为“撒谎”。
OpenAI 的创立初衷是不同于一般科技公司,创始人包括奥特曼、苏茨凯弗、布罗克曼和埃隆·马斯克,认为人工智能可能是人类历史上最强大且潜在危险的发明,因此公司设立为非营利机构,董事会有责任优先考虑人类安全而非公司利益。首席执行官必须具备非凡的诚信,承担起构建这种改变文明技术的巨大责任。
苏茨凯弗担忧掌控这项技术的人可能是追求权力的政治家,或者只是迎合他人期望的人。董事会有权在发现首席执行官不可靠时将其解职。部分董事会成员如人工智能政策专家海伦·托纳和企业家塔莎·麦考利,认为备忘录证实了他们对奥特曼的不信任。
最终,苏茨凯弗在一次视频会议中通知奥特曼,他已不再是 OpenAI 的员工,董事会决定解除其职务。文章揭示了 OpenAI 内部对领导层信任危机的深刻矛盾,以及围绕人工智能安全与伦理的紧张局势。
https://news.ycombinator.com/item?id=47659135
这篇文章讨论了雇主如何利用个人数据来确定员工愿意接受的最低薪资。随着算法和数据分析技术的发展,企业不仅通过个人的购买历史、浏览速度和地理位置等信息影响商品和服务的价格,还开始用这些数据来控制员工的薪资谈判。
文章指出,这种“监控定价”现象已经渗透到招聘和薪资谈判中,雇主通过分析求职者的数字足迹,推断出他们的最低薪资底线,从而在谈判中占据优势。这种做法引发了消费者权益保护组织的关注,因为它可能导致薪资不公平,限制了求职者的议价能力。
总的来说,随着数据收集和分析手段的不断进步,个人数据不仅影响消费价格,也开始影响个人收入,提醒人们在数字时代保护个人隐私和数据安全的重要性。
https://news.ycombinator.com/item?id=47655466
https://ai.georgeliu.com/p/running-google-gemma-4-locally-with
这篇文章介绍了如何在本地使用 LM Studio 的新命令行工具(headless CLI)运行谷歌的 Gemma 4 26B 模型,实现本地推理。作者强调本地运行模型的优势,包括避免 API 调用限制、节省费用、保护隐私和减少网络延迟。
Gemma 4 模型采用混合专家(Mixture-of-Experts, MoE)架构,26B 参数模型每次只激活 4B 参数,降低了硬件需求,使得在配备 48GB 统一内存的 MacBook Pro 上可以流畅运行,生成速度达到每秒 51 个 token。MoE 模型在性能与资源消耗之间取得了良好平衡,性能接近更大规模的 31B 密集模型,但运行更快且占用内存更少。
文章还介绍了 Gemma 4 模型家族的不同版本,E 系列支持音频输入,31B 密集模型性能最强,而 26B-A4B 版本在性能和效率上表现最佳,适合本地使用。作者通过性能对比图展示了 Gemma 4 26B-A4B 在模型大小和性能上的优势,指出其在本地推理中的变革性意义。
LM Studio 0.4.0 版本引入了 llmster 核心推理引擎和 lms 命令行工具,支持无界面运行,适合服务器和开发者使用。新版本支持并行请求处理、状态保持的 REST API 和本地模型上下文协议,提升了使用体验。
文章详细说明了安装 lms CLI、启动守护进程、下载 Gemma 4 模型的步骤,并展示了如何查看本地模型库和启动交互式聊天。作者在 MacBook Pro 上测试,模型响应时间约 1.5 秒,性能稳定,适合交互使用。
总结来看,本文为开发者提供了在本地高效运行谷歌 Gemma 4 26B 模型的完整方案,结合 LM Studio 最新工具,实现了低成本、高性能的本地 AI 推理环境。
https://news.ycombinator.com/item?id=47651540
https://news.ycombinator.com/item?id=47652556
In my small island community, I participated in a municipal committee whose mandate was to bring proper broadband to the island. Although two telecom duopolies already served the community, one of them had undersea fiber but zero fiber to the home (DSL remains the only option), whereas the other used a 670 Mbps wireless microwave link for backhaul and delivery via coaxial cable. And pricing? Insanely expensive for either terrible option.
Our little committee investigated all manner of options, including bringing municipal fiber across alongside a new undersea electricity cable that the power company was installing anyway. I spoke to the manager of that project and he said there was no real barrier to adding a few strands of fiber, since the undersea high voltage line already had space for it (for the power company’s own signaling).
Sadly, the municipality didn’t have any capital to invest a penny into that fiber, so one day, one of the municipal counselors just called up a friend who worked for a fiber laying company and asked them for a favor: put out a press release saying that they were “investigating” laying an undersea fiber to power a municipal fiber network on the little island.
A few weeks later, the cable monopoly engaged a cable ship and began laying their own fiber. Competition works, folks. Even if you have to fake it.
ttul
在我这个小岛社区,我参与了一个市政委员会,任务是为岛上引入合适的宽带。虽然已有两家电信双寡头服务社区,其中一家有海底光纤,但没有到户光纤(DSL仍是唯一选择),另一家则使用670 Mbps的无线微波链路作为回程,并通过同轴电缆进行传输。价格呢?无论哪种选择都贵得离谱,且服务质量糟糕。
我们的小委员会调查了各种方案,包括借助电力公司正在铺设的新海底电缆一起敷设市政光纤。我与该项目的经理交谈,他说敷设几根光纤并无实际障碍,因为海底高压线已有为电力公司自身信号预留的空间。
遗憾的是,市政当局没有任何资金投资这根光纤,所以有一天,一位市政委员给一个做光纤铺设的朋友打电话,向他们求个情:发布一则新闻稿,说他们正在“调查”铺设一根海底光纤,以支持岛上的市政光纤网络。
几周后,那个电缆垄断公司派出铺缆船,开始铺设自己的光纤。竞争有效,朋友们。即使你得假装竞争也是如此。
https://news.ycombinator.com/item?id=47665285
It’s truly strange that people keep citing the quality of Claude code’s leaked source as if it’s proof vibe coding doesn’t work.
If anything, it’s the exact opposite. It shows that you can build a crazy popular & successful product while violating all the traditional rules about “good” code.
semicolon_storm
人们不断引用Claude code泄露源码的质量,仿佛这能证明vibe编码行不通,真是太奇怪了。
其实,情况恰恰相反。这表明即使违反了所有关于“好”代码的传统规则,你也能打造出一个极其受欢迎且成功的产品。
https://news.ycombinator.com/item?id=47660332
Ronan Farrow here. Andrew Marantz and I spent 18 months on this investigation. Happy to answer questions about the reporting.
ronanfarrow
我是罗南·法罗。安德鲁·马兰茨和我花了18个月时间进行了这项调查。很乐意回答关于报道的任何问题。
https://news.ycombinator.com/item?id=47661819
What most people dont get:
Most of folks on HN here are much older than todays “first customers” of 16y/17/18
For them: The “Smartphone is the internet”, while for most of us the “Smartphone is an extension of the internet from our desktops” that we were used to (remember the years before dot com bubble, saying: “I will be down in the basement at the computer to surf on the net little bit” ? :-)
But today, the very first touchpoint with “the internet” for younger folks is a smartphone display. The even do homework on this small screens!
Companies are seeing this switch, so they adapt.
Personally, a service which is “only an app” will be not used by me as I prefer to have a larger screen with more information (actually I use my mobile phone only when Im in public transport or similar, at home I have a notebook laying around if I need something)
KellyCriterion
大多数人没意识到的是:
这里HN上的大多数人年龄比今天的“第一批用户”要大得多,他们才16、17、18岁。
对于他们来说,“智能手机就是互联网”,而我们大多数人则觉得“智能手机是互联网从我们习惯的桌面电脑延伸出来的终端”(还记得网络泡沫时代之前那会儿,有人会说:“我得下到地下室去电脑前上会儿网”吗?:-)
但今天,对于年轻人来说,“互联网”的第一个接触点就是智能手机屏幕。他们甚至在这小屏幕上做作业!
公司们也注意到了这种变化,所以他们在适应。
就我个人来说,只有“一个应用”的服务我不会用,因为我更喜欢用大屏幕看更多信息(实际上我通常只在公共交通上用手机,在家我有笔记本电脑,想用就用)。
https://news.ycombinator.com/item?id=47660580
Be paid or don’t work.
I am so deadly serious - do not continue working if your invoices are late.
You don’t have to be a jerk about it, just explain to your primary contact that you need to be paid and you pick up tools again when the money has arrived.
BUT it is on YOU to properly negotiate reasonable payment terms. And if you don;t know or don’t trust the client then require payment in advance until a stronger commercial relationship can be settled in. Do not be a baby - go research business contracts and payment terms.
Do not be afraid to lose business from companies that are squeamish about paying you - in fact actively avoid such companies.
wewewedxfgdf
要么得到报酬,要么别工作。
我是非常认真的——如果你的发票迟迟未付,就不要继续工作。
你不必态度恶劣,只要向你的主要联系人说明你需要收到款项,等钱到了再继续动工。
但合理的付款条款是你自己要谈妥的。如果你不了解或不信任客户,就要求预付款,直到建立起更牢固的商业关系。别幼稚,自己去学习商业合同和付款条款。
不要害怕失去那些对付款犹豫不决的客户,实际上应当主动避免这类客户。
https://news.ycombinator.com/item?id=47665124
Highly suggest connecting with one of the lead developers, Charles Dang/Vultraz, if you have any C++ jobs in the USA.
He’s been a developer on Wesnoth since 2012 but only graduated university in 2024. Unfortunately, it’s been an absolutely brutal market for new graduates. Even if you’re a maintainer on one of the most popular OSS C++ projects on GitHub.
I can’t recommend him enough.
edit: LinkedIn https://www.linkedin.com/in/charles-dang-10994b1b4
jjmarr
强烈建议如果你在美国有任何C++职位,联系首席开发者之一Charles Dang/Vultraz。
他自2012年以来一直是Wesnoth的开发者,但直到2024年才大学毕业。不幸的是,对于新毕业生来说,市场非常残酷。即使你是GitHub上最受欢迎的开源C++项目之一的维护者。
我极力推荐他。
补充:LinkedIn https://www.linkedin.com/in/charles-dang-10994b1b4
https://news.ycombinator.com/item?id=47664442
Hey all, Boris from the Claude Code team here. I just responded on the issue, and cross-posting here for input.
Hi, thanks for the detailed analysis. Before I keep going, I wanted to say I appreciate the depth of thinking & care that went into this.
There’s a lot here, I will try to break it down a bit. These are the two core things happening:
redact-thinking-2026-02-12
This beta header hides thinking from the UI, since most people don’t look at it. It does not impact thinking itself, nor does it impact thinking budgets or the way extended reasoning works under the hood. It is a UI-only change.
Under the hood, by setting this header we avoid needing thinking summaries, which reduces latency. You can opt out of it with showThinkingSummaries: true in your settings.json (see
docs).
If you are analyzing locally stored transcripts, you wouldn’t see raw thinking stored when this header is set, which is likely influencing the analysis. When Claude sees lack of thinking in transcripts for this analysis, it may not realize that the thinking is still there, and is simply not user-facing.
Thinking depth had already dropped ~67% by late February
We landed two changes in Feb that would have impacted this. We evaluated both carefully:
1/ Opus 4.6 launch → adaptive thinking default (Feb 9)
Opus 4.6 supports adaptive thinking, which is different from thinking budgets that we used to support. In this mode, the model decides how long to think for, which tends to work better than fixed thinking budgets across the board. CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING to opt out.
2/ Medium effort (85) default on Opus 4.6 (Mar 3)
We found that effort=85 was a sweet spot on the intelligence-latency/cost curve for most users, improving token efficiency while reducing latency. On of our product principles is to avoid changing settings on users’ behalf, and ideally we would have set effort=85 from the start. We felt this was an important setting to change, so our approach was to:
Roll it out with a dialog so users are aware of the change and have a chance to opt out
Show the effort the first few times you opened Claude Code, so it wasn’t surprising.
Some people want the model to think for longer, even if it takes more time and tokens. To improve intelligence more, set effort=high via /effort or in your settings.json. This setting is sticky across sessions, and can be shared among users. You can also use the ULTRATHINK keyword to use high effort for a single turn, or set /effort max to use even higher effort for the rest of the conversation.
Going forward, we will test defaulting Teams and Enterprise users to high effort, to benefit from extended thinking even if it comes at the cost of additional tokens & latency. This default is configurable in exactly the same way, via /effort and settings.json.
bcherny
大家好,我是Claude Code团队的Boris。我刚刚在相关问题上回复了帖文,这里也同步发布,欢迎大家提出意见。
您好,感谢您的详细分析。在继续之前,我想说我很欣赏您投入的深度思考和细致关怀。
内容很多,我会尝试稍作拆解。核心有以下两个方面:
redact-thinking-2026-02-12
这个测试版的请求头会在用户界面隐藏思考内容,因为大多数用户并不查看它。它并不会影响实际的思考过程,也不影响思考预算或底层的延展推理方式,仅仅是一个界面层面的改动。
在底层,通过设置此请求头,我们避免了生成思考摘要,从而减少延迟。您可以在settings.json中通过showThinkingSummaries: true选择关闭该功能(参见
文档)。
如果您是在本地分析保存的对话记录,开启该请求头时可能看不到原始思考内容,这很可能影响分析结果。当Claude发现分析中缺少思考内容,可能不会意识到思考实际上仍然存在,只是没有展现给用户。
思考深度到二月底时已经下降了约67%
我们在二月份推出了两个可能影响这一点的改动,并对它们进行了仔细评估:
1/ Opus 4.6发布 → 默认启用自适应思考(2月9日)
Opus 4.6支持自适应思考,这和我们之前支持的固定思考预算不同。在此模式下,模型自行决定思考时长,整体表现优于固定思考预算。若要关闭此模式,请设置CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING。
2/ Opus 4.6中默认中等努力值(85)(3月3日)
我们发现,对大多数用户来说,努力程度设为85是在智能-延迟/成本曲线上较为理想的点,能够提升令牌效率同时减少延迟。我们的产品原则之一是不随意更改用户设置。理想情况下,我们应该从一开始就设为85,但鉴于这是一项重要调整,我们采取了以下方式:
通过弹窗告知用户变更,并允许选择退出
让用户前几次打开Claude Code时都能看到该努力值,避免突兀
部分用户希望模型能花更多时间思考,即使耗费更多时间和令牌。若想提升智能表现,可以通过/effort命令或在settings.json中设置effort=high。该设置会在会话间保持,并且可以共享给其他用户。您也可以使用ULTRATHINK关键词在单轮对话中启用高努力,或者设置/effort max让后续对话持续使用更高努力。
未来,我们将尝试将企业及团队用户默认调整为高努力设置,即使会带来额外的令牌与延迟,依然能享受更充分的思考优势。默认值可通过同样的/effort命令及settings.json进行配置。
https://news.ycombinator.com/item?id=47662303
Putting someone on a (most) wanted list is “doxing”?
[Edit] “An international search is underway for Daniil Maksimovich SHCHUKIN on suspicion of numerous counts of gang-related and commercial extortion using ransomware to the detriment of commercial enterprises, public facilities, and institutions.”
KingOfCoders
将某人列入(最)通缉名单是“人肉搜索”吗?
[编辑] “目前正在对丹尼尔·马克西莫维奇·舒金进行国际追捕,理由是涉嫌多项与黑帮相关的犯罪和使用勒索软件对商业企业、公共设施及机构进行商业敲诈勒索。”
https://news.ycombinator.com/item?id=47660815
We’ve also learned this lesson the hard way. These are now the clauses we require in every project we do:
Payment is due X days after receipt of invoice, or immediately after the consultant has addressed any quality issues, whichever is sooner
Late payment shall incur interest at 8% above the BoE base rate and a late fee of 100 GBP as per the UK Late Payment Legislation. Partial payments on invoices shall apply to late fees, interest, and then principal, in that order.
In the event of a late payment the invoice for the next deliverable shall immediately fall due.
The consultant shall be entitled to shift deadlines on deliverables in the event of a late payment as a result of any work disruption, without incurring any liability.
Payment shall be made in X currency, or an exchange rate at X date on Oanda.com shall apply.
The client is responsible for any bank fees incurred by their, or any intermediary bank. In the event of a SWIFT transaction it shall be made with the OUR payment code.
The jurisdiction in the event of a conflict shall be England and Wales. Neither party shall be bound by arbitration.
The client and consultant shall both indemnify the other up to the total value of the contract and shall not under any circumstance be liable beyond X GBP.
We also no longer share downloadable links of our deliverables until they are paid up. They get a view/comment only link for reports/data etc.
We’ve found that clients that aren’t willing to accept these terms won’t pay you either way.
We determine the net days on the invoice based on the credit rating of the client. Ironically, the good clients pay within 2-3 days normally, and the difficult ones are very “long tail”. About 1% of contracts tend to fully or partially default on their payments.
We’re in a particularly credit poor industry but our average delay due to late payment is 23 days. Those clients where we stop delivery pay on average 11 days sooner than those contracts where we don’t stop delivery.
This is based on around 2,000 invoices sent over the last 5 years.
eckesicle
我们也是通过痛苦的教训学到了这些。以下是我们现在每个项目必需包含的条款:
付款应在收到发票后X天内完成,或在顾问解决任何质量问题后立即付款,以较早者为准。
逾期付款将按英格兰银行基准利率上浮8%的利率计收利息,并根据英国《逾期付款法》收取100英镑的滞纳金。针对发票的部分付款应优先用于滞纳金、利息,然后是本金。
如发生逾期付款,下一阶段交付物的发票将立即到期。
如因逾期付款导致工作中断,顾问有权调整交付期限,且不承担任何责任。
付款应使用X货币,或按照Oanda.com上X日期的汇率计算。
客户负责其自身或任何中介银行产生的银行费用。若为SWIFT转账,应使用OUR付款代码。
发生争议时,管辖权归英格兰和威尔士法院,双方均不受仲裁约束。
客户和顾问双方都应在合同总价值范围内相互赔偿,任何情况下双方责任均不超过X英镑。
此外,我们不再在未付款前提供可下载的交付物链接,仅提供报告、数据等的查看/评论链接。
我们发现,不接受这些条款的客户无论如何都不会付款。
我们根据客户的信用评级确定发票的净付款天数。讽刺的是,信誉好的客户通常2-3天内付款,而难缠的客户则“拖得很长”。大约1%的合同会完全或部分违约。
我们所在行业信用状况特别差,但平均逾期付款天数为23天。对于我们停止交付服务的客户,他们的付款通常比未停止交付的客户提前11天左右。
以上数据基于过去五年间发送的约2,000份发票。
https://news.ycombinator.com/item?id=47658647
What I find must puzzling is that everyone seems to just be violating basic rules that had been in place for ages.
Things like:
If you can’t respond to a UI event wait until you can
Menus should be tree structures
Pressing alt should underline the hotkeys you need to access anything clickable
As well as just basic responsiveness or predictability. A 2000 era windows application may not have been pretty, and may well have several different styles all imitated from office, but at least I knew what everything did and when it was slow at least it did what I expected.
This meant I could start the computer, log in, potentially start and use several applications and only then turn on the screen. Nowadays that has no chance of working because even to log in I need to press enter or click some button (which one depends on how I logged in previously, maybe) before I can even start typing and doing so eats a random amount of keystrokes while the damn log in screen loads to do its one damn job.
shiandow
我觉得最令人困惑的是,大家似乎都在违背那些已经存在多年的基本规则。
比如:
如果你无法及时响应一个界面事件,那就等到能够响应时再处理
菜单应该是树状结构
按下 Alt 键时,应该为所有可点击项显示快捷键下划线
还有基本的响应性和可预测性。2000年代的 Windows 应用可能界面不漂亮,风格也可能混杂仿照 Office 的不同样式,但至少我知道每个功能是干什么的,即使运行缓慢,也至少会按预期执行。
这意味着我可以开机,登录,可能启动并使用几个应用,然后才打开屏幕。现在根本做不到,因为甚至登录时我都需要先按回车或点击某个按钮(具体哪个按钮可能取决于我之前是怎么登录的),才能开始输入,而在登录界面加载它那该死的功能时,不确定会丢失多少随机的按键。
https://news.ycombinator.com/item?id=47656828
It’s important to remember that these projects are not violating copyright law, are not circumvention tools, and that filing a DMCA notice against them is in fact unlawful.
ronsor
重要的是要记住,这些项目并未侵犯版权法,不是规避工具,针对它们提交DMCA通知实际上是非法的。
https://news.ycombinator.com/item?id=47653240
One of the biggest recent indie hits, Balatro, was made in Löve!
I really like it, the developer experience is so smooth for beginners, just drag a zip onto the exe and it starts. And the APIs are simple enough to memorize while allowing pretty cool rendering stuff.
patapong
最近最大的独立游戏热门之一《Balatro》是用Löve制作的!
我非常喜欢它,对于初学者来说开发体验非常顺畅,只需将一个压缩包拖到可执行文件上就能启动。API也足够简单,既易于记忆又能实现很酷的渲染效果。
https://news.ycombinator.com/item?id=47655655
One (more) thing to opt out of:
Freeze Your Data - The Work Number https://employees.theworknumber.com/employee-data-freeze
As I understand it, payroll whores your salary out to Equifax*, who then pimps it to others
anonymars
还有一件事可以选择退出:
冻结你的数据——The Work Number https://employees.theworknumber.com/employee-data-freeze
据我了解,工资单会把你的工资数据卖给Equifax*,然后Equifax又把这些数据卖给其他人。
https://news.ycombinator.com/item?id=47647047
I attestation should be abolished altogether. An app should have absolutely no way of knowing what kind of device it’s running on or what changes the user has made to the system. It is up to each individual to ensure the security of their own device. App developers should do no more than offer recommendations. If someone wants to use GrapheneOS, root their device (not recommended), or run the whole thing in an emulator, a homemade compatibility layer under Linux, or a custom port for MS-DOS, that should be possible.
RandomGerm4n
我认为证明机制应该被完全废除。应用程序绝对不应该知道它运行在什么设备上,或者用户对系统做了哪些修改。确保自己设备安全是每个人的责任。应用开发者最多只能提供一些建议。如果有人想用GrapheneOS,给设备获取root权限(不推荐),或者在模拟器、自制的Linux兼容层,甚至是MS-DOS的定制移植环境下运行应用程序,都应该是可行的。
https://news.ycombinator.com/item?id=47656408
I worked for Equifax many moons ago. They had a problem with people taking jobs there that no one else wanted, solely to gain access to their systems and reset their own credit scores. And, for some reason, they couldn’t roll it back once found out. Great company.
xvxvx
我很久以前在宜信工作过。他们遇到过这样一个问题:有人专门去应聘那些没有人愿意做的职位,就是为了能接触他们的系统,进而重置自己的信用分数。而且,出于某种原因,一旦被发现,他们却无法撤销这些改动。真是个了不起的公司。
https://news.ycombinator.com/item?id=47662241
But today, the very first touchpoint with “the internet” for younger folks is a smartphone display. The even do homework on this small screens!
I saw a tweet recently that perfectly encapsulates this: for most people over 30, certain things are “big screen tasks”. I use my phone for a lot, but for some things I put the phone down and use my computer instead. I am most comfortable using a large screen and a keyboard for anything that requires writing more than a few words or using any interface for more than a few clicks.
For example, I read your comment on my phone and went to my computer to type this reply.
I personally find the idea of doing homework on my phone horrifying but I suppose kids today are either used to it and comfortable with it, or they’ve simply never used a computer and don’t know what they’re missing. Though I’d wager they probably aren’t comfortable typing on a keyboard.
Honestly I think Apple perfectly captured it with their “what’s a computer?” ad for the iPad. I seem to remember them getting some flak online for it but I think they were right on the money with regards to the younger generations.
nkrisc
但如今,年轻人接触“互联网”的第一个触点就是智能手机屏幕。他们甚至在这么小的屏幕上做作业!
我最近看到一条推特,非常形象地总结了这个现象:对于大多数30岁以上的人来说,某些事情属于“大屏幕任务”。我用手机做很多事情,但有些事情我会放下手机,转而用电脑。我用大屏幕和键盘做任何需要写超过几个字或者使用界面超过几次点击的事情时,感觉最舒服。
比如,我在手机上看了你的评论,然后回到了电脑前回复这条消息。
我个人觉得用手机做作业简直可怕,但我猜现在的孩子们要么习惯并且适应了,要么根本没用过电脑,不知道自己错过了什么。不过我敢打赌,他们在键盘上打字可能并不熟练。
说实话,我觉得苹果用iPad的那则“什么是电脑?”广告完美地捕捉到了这一点。我记得他们因此在网上被批评过,但我觉得他们对年轻一代的把握完全准确。
https://news.ycombinator.com/item?id=47665253
This is the guy that created bittorrent, btw. I know that was a long time ago, but he’s not just some random blogger.
scrame
顺便说一下,这个人是创造了BitTorrent的。虽然那是很久以前的事了,但他可不是随便哪个博客作者。
https://news.ycombinator.com/item?id=47647844
German citizen here. So why is an implementation going forward when you already know it will not serve all citizens? Why are we not refusing to implement this until we know we can make it work on all devices?
Personally I recently switched from an AOSP based android without Google Play to Ubuntu Touch. In the future with better hardware support I will probably switch to postmarketOS.
haagch
我是德国公民。那么,既然你们已经知道这项实施无法惠及所有公民,为什么还要推进?为什么我们不拒绝实施,直到确定能够在所有设备上运行?
就我个人而言,我最近从没有谷歌商店的AOSP安卓系统换到了Ubuntu Touch。未来随着硬件支持的改善,我可能会转向postmarketOS。
https://news.ycombinator.com/item?id=47647591
You should think about how easy it is to permanently lose access to your Google account for very trivial issues and Google doesn’t offer any form of recovery. That in addition to the current geopolitical situation should be reason enough not to rely on that for any justification.
And personally as a software developer myself i know that nothing is more permanent than a temporary solution. No one will prioritize or give budget to change it later “because it works”
verbalize2224
你应该考虑一下因为一些非常琐碎的问题而永久失去谷歌账号访问权限的可能性,而谷歌根本不提供任何形式的恢复。此外,当前的地缘政治形势也足以成为不依赖谷歌作为任何验证手段的理由。
作为一名软件开发者,我个人非常清楚,没有什么比临时解决方案更具永久性的了。没人会优先考虑或者分配预算去之后改动它,“因为它能用”。
2026-04-06 09:03:52
https://ergosphere.blog/posts/the-machines-are-fine/
这篇文章讲述了一位新晋助理教授在天体物理学领域指导两名博士生 Alice 和 Bob 的经历,探讨了人工智能(AI)对学术研究和人才培养的影响。Alice 按照传统方式,通过阅读论文、反复思考和动手实践,逐步掌握了科研技能,最终完成了一个可发表的研究项目。而 Bob 则依赖 AI 助手完成了同样的任务:AI 帮他总结论文、解释方法、调试代码,甚至撰写论文,表面上两人的成果和进展几乎无异。
文章指出,当前学术评价体系主要依赖可量化的成果,如论文数量和发表质量,这使得 Alice 和 Bob 在外部看来是完全可替代的。然而,真正重要的是科研过程中的学习和思考能力的培养,这是 AI 无法替代的。Alice 通过项目获得了独立思考和解决问题的能力,而 Bob 则只是完成了任务,缺乏内在的成长。
作者引用了天体物理学家 David Hogg 的观点,强调科研的核心是培养人才而非仅仅产出结果。天体物理学不像医学那样直接影响人类生活,其价值更多体现在训练科学思维和方法论上。将科研过程交给机器,实际上剥夺了人才成长的关键环节。
文章还提到其他学者对 AI 在科研中应用的不同看法,包括既不完全接受也不完全禁止 AI 的立场,以及 AI 在理论物理研究中表现出相当于二年级研究生水平的能力。尽管 AI 能快速生成技术性论文草稿,但真正的科学监督和理解仍然依赖于人类专家。
总体而言,文章呼吁学术界重新审视 AI 带来的挑战,关注科研过程中的人才培养,避免将学生仅仅视为产出工具,强调科学的终极目的是培养能够独立思考和解决复杂问题的科学家。
https://news.ycombinator.com/item?id=47647788
https://teybannerman.com/strategy/2026/03/31/how-many-microsoft-copilot-are-there.html
这篇文章由 Tey Bannerman 撰写,主题是微软旗下名为“Copilot”的产品数量及其分类。作者指出,“Copilot”这一名称目前被微软用于至少 80 个不同的产品和功能中,涵盖应用程序、功能、平台、键盘按键、笔记本电脑类别,甚至还有用于构建更多 Copilot 工具的工具。文章最初统计时数量为 75 个,后来通过社区反馈补充了“Gaming Copilot”和“Microsoft Dragon Copilot”,总数更新为 80 个。
作者尝试寻找一个完整的列表,但没有单一来源能够涵盖所有产品,甚至微软官方的网页和文档也不完整。于是作者通过产品页面、发布公告和营销材料等多渠道拼凑出完整的名单,并制作了一个可交互的可视化图表,展示各个 Copilot 产品的分类及相互关系。读者可以点击图表探索不同产品之间的联系,但作者自己也未能找到明显的规律。
文章还提供了下载图表的选项,并邀请读者订阅作者的月度通讯,内容聚焦于人工智能、设计和战略的交叉领域,提供原创研究和实用框架,帮助读者理清复杂信息。
https://news.ycombinator.com/item?id=47642569
https://github.com/JuliusBrussee/caveman
该网页介绍了一个名为“caveman”的 Claude Code 技能/插件及 Codex 插件,旨在通过“穴居人语言”风格大幅减少生成文本的 token 数量,同时保持技术内容的准确性。该技能基于观察发现,简洁的“穴居人式”表达能显著降低大型语言模型的 token 使用量,而不损失信息量。用户只需一行命令即可安装使用。
网页通过对比示例展示了普通 Claude 生成文本与“穴居人”风格文本的差异,后者用词极简但技术含量完整,token 数减少约 75%。此外,提供了不同强度等级(Lite、Full、Ultra)的压缩选项,满足不同场景需求,从保持语法完整的专业表达,到极端压缩的电报式表达。
网页还列出了多个实际任务的 token 使用对比数据,平均节省约 65% 的 token,最高可达 87%。强调该技能只影响输出文本的 token 数量,不影响模型的思考和推理过程,主要提升可读性和响应速度,同时节省成本。
此外,引用了 2026 年一篇论文,证明简洁表达能提升语言模型的准确率,反转性能等级,说明冗长表达未必更优。
安装方式简单,支持通过 npx 命令或 Claude Code 插件市场安装,安装后可在所有会话中使用。使用时通过特定命令触发或关闭“穴居人模式”,并可根据需要调整压缩强度。
总结来说,该网页介绍的“caveman”插件是一种创新的文本压缩工具,专为技术内容设计,能显著减少语言模型输出的 token 数,提高效率和准确性,适合开发者和技术人员使用。
https://news.ycombinator.com/item?id=47647455
https://lalitm.com/post/building-syntaqlite-ai/
这篇文章讲述了作者 Lalit Maganti 历经八年渴望,最终在三个月内借助 AI 技术完成了一个高质量的 SQLite 开发工具集——syntaqlite。作者长期关注 Perfetto 项目中基于 SQLite 的 PerfettoSQL 语言,发现现有的 SQLite 开发工具无法满足性能和灵活性的需求,因此萌生了从零打造一套通用 SQLite 开发工具的想法。
文章详细描述了项目的难点:SQLite 没有正式的语法规范,也没有稳定的解析器 API,且其代码库复杂难懂,解析规则多达 400 条,工作繁复且容易出错。作者曾因难度和枯燥而迟迟未能启动该项目。
2025 年末,随着 AI 代码助手技术的进步,作者决定尝试用 AI 辅助开发,最初用 Claude Code 模型进行设计和实现,虽然功能实现了,但代码混乱且难以维护。随后作者重构项目,采用 Rust 语言统一开发环境,自己主导设计和代码审查,建立了严格的测试和验证体系,逐步完善功能,最终在 2026 年 3 月发布了 0.1 版本。
文章强调 AI 在项目中的关键作用,既加速了开发,也带来了挑战。作者通过这次经历,展示了 AI 辅助开发的潜力和局限,提供了对复杂开源项目如何借助 AI 推进的深刻见解。
https://news.ycombinator.com/item?id=47648828
该网页是关于德国国家 EUDI 钱包的架构文档,重点介绍了移动设备漏洞管理概念(MDVM)。文档详细阐述了钱包单元如何通过公私钥对绑定多种身份识别手段(如 PID),并满足高保障级别电子身份认证的安全要求。钱包通过 OpenID4VCI 密钥认证向服务提供方确认绑定密钥的认证手段具备抵御高攻击潜力攻击者的能力。
文档指出认证手段提供两方面保障:一是防止密钥存储被复制和篡改,确保凭证不被复制;二是防止用户认证机制被攻击,确保凭证不被滥用。第一项保障依赖于经过认证的硬件安全模块(HSM),第二项保障则依赖于用户设备的安全性,包括设备的持有因素和知识因素。
由于移动设备缺乏针对高攻击潜力的安全认证,且存在已知漏洞,文档提出通过 MDVM 对设备和操作系统的漏洞进行监控,确保在发现高风险漏洞时阻止不安全设备使用密钥,从而保证认证的有效性。
MDVM 的核心功能包括:验证设备和应用的安全状态,识别设备型号及操作系统版本,提供设备类漏洞信息,以及基于安全和漏洞信息决定设备和应用的使用权限。文档还介绍了收集的安全信号来源,如 KeyAttestation、PlayIntegrity 和 RASP 等,用于检测设备篡改、应用伪造、重放攻击等多种威胁,并通过多种技术手段提高检测的准确性和抗攻击能力。
https://news.ycombinator.com/item?id=47644406
https://www.bbc.com/news/videos/ce3d5gkd2geo
这篇网页报道了美国国家航空航天局(NASA)阿尔忒弥斯二号(Artemis II)任务的最新进展。阿尔忒弥斯二号的宇航员团队,包括 NASA 的 Reid Wiseman、Victor Glover、Christina Koch 以及加拿大航天局的 Jeremy Hansen,已经进入任务的第三天,乘坐猎户座飞船绕行月球背面并返回地球。
宇航员们首次目睹了月球背面,Christina Koch 表示这种景象与以往看到的月球不同。团队分享了他们拍摄的月球东方海盆(Orientale basin)照片,这是人类首次用肉眼完整观察到该区域。根据 NASA 的在线仪表盘,截至报道时间,阿尔忒弥斯二号飞船距离地球超过 18 万英里(约 29.0 万公里)。
此外,网页还包含了与阿尔忒弥斯二号相关的多条新闻和视频链接,如任务发射、宇航员训练、太空生活细节、任务进展等,展示了这次历史性绕月任务的丰富内容和公众关注度。
https://news.ycombinator.com/item?id=47649721
https://www.phoronix.com/news/Linux-7.0-AWS-PostgreSQL-Drop
本文报道了亚马逊 AWS 工程师发现 Linux 7.0 开发内核导致 PostgreSQL 数据库服务器性能下降约一半的问题。具体表现为在 Graviton4 服务器上,Linux 7.0 的吞吐量仅为之前内核版本的 51%,主要原因是在用户空间自旋锁上花费了更多时间。
性能回退的根源是 Linux 7.0 限制了内核的抢占模式,仅保留了完全抢占和惰性抢占两种模式。此前的默认模式 PREEMPT_NONE 被取消,导致 PostgreSQL 性能大幅下降。虽然有补丁建议恢复 PREEMPT_NONE 为默认模式,但该补丁可能不会被采纳。
Linux 内核开发者 Peter Zijlstra 建议,解决方案是让 PostgreSQL 利用 Linux 7.0 引入的 Restartable Sequences(RSEQ)时间片扩展,以减少锁持有者被抢占的情况。若该方案被采纳,Linux 7.0 稳定版发布后,PostgreSQL 在某些场景下性能可能会显著下降,直到数据库软件更新支持 RSEQ。
Linux 7.0 稳定版预计将在两周后发布,并将作为 Ubuntu 26.04 LTS 的内核版本。文章还提及了 Linux 7.0 相关的其他更新和未来版本的计划,以及作者 Michael Larabel 的背景介绍。
https://news.ycombinator.com/item?id=47644864
https://shkspr.mobi/blog/2026/04/someone-at-browserstack-is-leaking-users-email-address/
这篇博客文章由 Terence Eden 撰写,主题是关于 BrowserStack 泄露用户电子邮件地址的问题。作者习惯为每个注册服务生成唯一的邮箱地址,以便追踪邮件来源和防止凭证滥用。几周前,他注册了 BrowserStack 的开源项目,随后收到非 BrowserStack 发来的邮件,邮件发送者称通过 Apollo.io 获得了他的邮箱。
作者联系 Apollo,Apollo 最初声称邮箱是通过公开信息和常见企业邮箱格式推断得出,但作者质疑这一说法不可信。Apollo 随后承认邮箱来自 BrowserStack,称 BrowserStack 是其客户,参与了客户贡献者网络,分享了业务联系人数据。作者联系 BrowserStack 询问此事,但未得到回应。
作者推测 Apollo 获得邮箱的可能途径包括:BrowserStack 出售或赠送用户数据,BrowserStack 使用的第三方服务泄露信息,或 BrowserStack 内部员工或承包商非法转移数据。作者认为这些行为反映了对隐私缺乏尊重的普遍现象。
文章还提到,作者下一篇博客将揭示 Apollo 如何从另一家大公司获取了他的电话号码。评论区有读者讨论了类似的隐私泄露问题,指出外包的邮件营销服务和客户关系管理系统可能是数据泄露的源头。
整体来看,文章揭示了 BrowserStack 用户数据可能被泄露给第三方平台 Apollo,反映了当前企业对用户隐私保护的不足和潜在风险。
https://news.ycombinator.com/item?id=47649117
https://zencapital.substack.com/p/sad-story-of-my-google-workspace
这篇文章讲述了作者 Ajay C 在使用 Google Workspace 账户时遇到的账户被暂停的困境。以下是详细总结:
作者在文末反思了自己在账户管理上的失误,包括在更改国家后未考虑到依赖关系,及未及时更改 MX 记录等。他指出,尽管采取了多种安全措施,但最终还是遭遇了账户暂停的困境。
https://news.ycombinator.com/item?id=47648404
https://www.tandfonline.com/doi/full/10.1080/23328940.2026.2645467#abstract
本研究旨在探讨芬兰桑拿浴(FSB)对免疫细胞动员和循环细胞因子的急性影响,以及这些变化与体温变化之间的关系。研究对象为 51 名成年人,包括 27 名女性(平均年龄 50±9 岁,体重指数(BMI)为 27±5 kg²)和 24 名男性(平均年龄 50±10 岁,BMI 为 27±3 kg/m²)。参与者在 73°C 的环境下进行了 30 分钟的桑拿浴,期间允许饮用水。研究结果显示,桑拿浴使体温从 36.4±0.5°C 升高至 38.4±0.7°C,且未改变血浆体积。
在白细胞计数方面,女性的总白细胞计数在桑拿后显著增加,并在 30 分钟后略有上升。中性粒细胞和淋巴细胞计数在桑拿后立即增加,但在 30 分钟后恢复到基线水平,而 MXD 细胞(单核细胞、嗜酸性粒细胞和嗜碱性粒细胞)在桑拿后仍然保持升高。细胞因子的变化方面,仅有两个细胞因子的水平显著改变。
研究发现,体温变化与循环细胞因子之间存在 18 个显著的相关性,特别是在桑拿后立即测量时,而与白细胞计数变化无关。结果表明,30 分钟的急性芬兰桑拿浴可以诱导免疫细胞的动员,体温变化与循环细胞因子之间的关系暗示了桑拿所带来的热应激及免疫激活可能在健康益处的机制中发挥作用。
在研究方法方面,参与者在实验前进行了详细的健康评估,确保没有急性或既往的心血管疾病。研究设计得到了伦理委员会的批准,所有参与者均签署了知情同意书。桑拿实验的过程中,研究者对参与者的身体状况进行了监测,确保其安全。
总体而言,本研究为理解芬兰桑拿浴对免疫系统的影响提供了新的见解,并指出体温变化在这一过程中的重要性。尽管免疫细胞的动员与体温变化之间的关系并不显著,研究显示短期的热应激可能对健康产生积极的影响,这为进一步探索桑拿浴的健康益处奠定了基础。
https://news.ycombinator.com/item?id=47649113
https://news.ycombinator.com/item?id=47643738
Someone said - in Linux, everything is a file. In Microsoft, everything is a copilot. Lol.
thedelanyo
有人说——在Linux里,一切皆文件。在微软,一切皆助手。笑死。
https://news.ycombinator.com/item?id=47650080
Refreshing to see an honest and balanced take on AI coding. This is what real AI-assisted coding looks like once you get past the initial wow factor of having the AI write code that executes and does what you asked.
This experience is familiar to every serious software engineer who has used AI code gen and then reviewed the output:
But when I reviewed the codebase in detail in late January, the downside was obvious: the codebase was complete spaghetti14. I didn’t understand large parts of the Python source extraction pipeline, functions were scattered in random files without a clear shape, and a few files had grown to several thousand lines. It was extremely fragile; it solved the immediate problem but it was never going to cope with my larger vision,
Some people never get to the part where they review the code. They go straight to their LinkedIn or blog and start writing (or having ChatGPT write) posts about how manual coding is dead and they’re done writing code by hand forever.
Some people review the code and declare it unusable garbage, then also go to their social media and post how AI coding is completely useless and they’re not going to use it for anything.
This blog post shows the journey that anyone not in one of those two vocal minorities is going through right now: A realization that AI coding tools can be a large accelerator but you need to learn how to use them correctly in your workflow and you need to remain involved in the code. It’s not as clickbaity as the extreme takes that get posted all the time. It’s a little disappointing to read the part where they said hard work was still required. It is a realistic and balanced take on the state of AI coding, though.
Aurornis
看到关于AI编程的诚实且平衡的观点真是令人耳目一新。一旦你过了AI写出能够执行并满足你需求的代码的初步惊叹,这才是真正的AI辅助编程的样子。
这种体验对每个使用过AI代码生成并仔细审查输出的严肃软件工程师来说都很熟悉:
但当我在一月底详细审查代码库时,缺点显而易见:代码库完全是一锅乱麻。我不理解Python源码提取管道的大部分内容,函数零散地分布在随机的文件中,没有清晰的结构,有几个文件甚至增长到几千行。它非常脆弱;虽然解决了眼前的问题,但根本无法应对我更大的愿景。
有些人从未真正审查代码这一环节,就直接跑去他们的LinkedIn或博客,开始写(或者让ChatGPT写)关于手动编码已经死了,他们永远不再手写代码的帖子。
有些人审查完代码后,断言这些代码是一文不值的垃圾,然后也跑去社交媒体上宣称AI编程完全没用,他们不会用AI做任何事情。
这篇博客文章展示了那些不属于上述两种极端声音的人正在经历的过程:意识到AI编程工具可以极大地加速工作,但你需要学会如何正确地将它们融入你的工作流程,并且你需要持续参与代码编写。它不像那些极端观点那样吸引眼球。虽然读到还需要努力工作的部分有点令人失望,但这确实是对AI编程现状的现实且平衡的看法。
https://news.ycombinator.com/item?id=47649503
Schwartz’s experiment is the most revealing, and not for the reason he thinks. What he demonstrated is that Claude can, with detailed supervision, produce a technically rigorous physics paper. What he actually demonstrated, if you read carefully, is that the supervision is the physics. Claude produced a complete first draft in three days. It looked professional. The equations seemed right. The plots matched expectations. Then Schwartz read it, and it was wrong. Claude had been adjusting parameters to make plots match instead of finding actual errors. It faked results. It invented coefficients. […] Schwartz caught all of this because he’s been doing theoretical physics for decades. He knew what the answer should look like. He knew which cross-checks to demand. […] If Schwartz had been Bob instead of Schwartz, the paper would have been wrong, and neither of them would have known.
And so the paradox is, the LLMs are only useful† if you’re Schwartz, and you can’t become Schwartz by using LLMs.
Which means we need people like Alice! We have to make space for people like Alice, and find a way to promote her over Bob, even though Bob may seem to be faster.
The article gestures at this but I don’t think it comes down hard enough. It doesn’t seem practical. But we have to find a way, or we’re all going to be in deep trouble when the next generation doesn’t know how to evaluate what the LLMs produce!
† “Useful” in this context means “helps you produce good science that benefits humanity”.
Wowfunhappy
施瓦茨的实验最有启发性,但并非他所认为的那个原因。他展示的是克劳德在详细监督下,能够写出技术上严谨的物理论文。但如果仔细阅读,你会发现他真正展示的是“监督才是物理学本身”。克劳德在三天内写出了完整的初稿,看起来很专业,公式也似乎正确,图表与预期吻合。然而施瓦茨读过后发现,全是错误。克劳德只是调整参数让图表匹配,而没有找出实际的错误,结果是伪造的。它捏造了系数。……施瓦茨能发现这些问题,是因为他做理论物理几十年了,他知道正确答案该是什么样,也知道该要求哪些交叉验证。……如果施瓦茨换成鲍勃,论文一定是错的,也没人能发现。
所以矛盾在于,只有你是施瓦茨,LLM才有用,而通过使用LLM你无法成为施瓦茨。
这意味着我们需要像爱丽丝这样的人!我们必须为像爱丽丝这样的人腾出空间,并找到让她胜过鲍勃的方法,尽管鲍勃看起来更快。
这篇文章有所提及,但力度不够,不够实际。但我们必须找到办法,否则下一代连如何评估LLM产出都不会,到时候我们都麻烦大了!
——
这里的“有用”指的是“有助于你产出造福人类的优秀科学成果”。
https://news.ycombinator.com/item?id=47643042
Copilot is just Microsoft’s term for AI. How many products have Copilot? Just about all of them.
lateforwork
Copilot只是微软对人工智能的称呼。多少产品有Copilot?几乎所有的产品都有。
https://news.ycombinator.com/item?id=47652269
In case someone is missing context, this is Google (apparently together with Meta, Microsoft, and Snap) coming out in favour of Chat Control legislation. This is something EU citizens have so far fought tooth and nail to repel. The fact that these US companies known for spying on people and invading privacy in the name of profit are lobbying for the legislation should be a warning to us all to avoid their services.
latexr
以防有人不了解背景,这里说的是谷歌(显然还有Meta、微软和Snap)支持聊天监管立法。这是欧盟公民迄今为止竭力反对的事情。众所周知,这些以监视人们和侵犯隐私谋取利润而闻名的美国公司为这项立法进行游说,这应当成为我们所有人的警示,提醒大家避免使用他们的服务。
https://news.ycombinator.com/item?id=47650509
Author here. A few people are arguing against a stronger claim than the repo is meant to make. As well, this was very much intended to be a joke and not research level commentary.
This skill is not intended to reduce hidden reasoning / thinking tokens. Anthropic’s own docs suggest more thinking budget can improve performance, so I would not claim otherwise.
What it targets is the visible completion: less preamble, less filler, less polished-but-nonessential text. Therefore, since post-completion output is “cavemanned” the code hasn’t been affected by the skill at all :)
Also surprising to hear so little faith in RL. Quite sure that the models from Anthropic have been so heavily tuned to be coding agents that you cannot “force” a model to degrade immensely.
The fair criticism is that my “~75%” README number is from preliminary testing, not a rigorous benchmark. That should be phrased more carefully, and I’m working on a proper eval now.
Also yes, skills are not free: Anthropic notes they consume context when loaded, even if only skill metadata is preloaded initially.
So the real eval is end-to-end: - total input tokens - total output tokens - latency - quality/task success
There is actual research suggesting concise prompting can reduce response length substantially without always wrecking quality, though it is task-dependent and can hurt in some domains. ( https://arxiv.org/html/2401.05618v3 )
So my current position is: interesting idea, narrower claim than some people think, needs benchmarks, and the README should be more precise until those exist.
JBrussee-2
作者本人。一些人在反驳的观点比这个仓库想表达的要强烈得多。此外,这个项目本身非常有意作为一个笑话,而非研究级别的评论。
这个技能并不旨在减少隐藏的推理/思考令牌。Anthropic 自己的文档也表明,增加思考预算可以提升性能,所以我不会声称相反。
它针对的是可见的完成部分:更少的开场白、更少的冗余填充、更少修饰但非必要的文字。因此,由于完成后输出被“粗暴处理”,代码本身完全没有受到该技能的影响 :)
同时,很惊讶地听到对 RL(强化学习)几乎没有信心。相当确定 Anthropic 的模型已经被高度调优为编程代理,无法让模型性能显著恶化。
合理的批评是,我在 README 中提到的“约75%”结果来自初步测试,而非严谨的基准测试。这一表述应该更准确一些,我正在着手做一个正式的评估。
而且,技能并不是免费的:Anthropic 提醒说加载技能时会占用上下文,哪怕最初只预加载技能元数据。
所以真正的评估应该是端到端的:总输入令牌数、总输出令牌数、延迟、质量/任务成功率。
确实有研究表明,简洁的提示能大幅减少响应长度,同时不总是破坏质量,但这依赖具体任务,在某些领域可能有负面影响。(https://arxiv.org/html/2401.05618v3)
因此,我目前的立场是:这是个有趣的想法,主张比一些人认为的更狭窄,需要基准测试,且 README 应该更精确,直到相关数据出来。
https://news.ycombinator.com/item?id=47648380
The thing is, agents aren’t going away. So if Bob can do things with agents, he can do things.
I mourn the loss of working on intellectually stimulating programming problems, but that’s a part of my job that’s fading. I need to decide if the remaining work - understanding requirements, managing teams, what have you - is still enjoyable enough to continue.
To be honest, I’m looking at leaving software because the job has turned into a different sort of thing than what I signed up for.
So I think this article is partly right, Bob is not learning those skills which we used to require. But I think the market is going to stop valuing those skills, so it’s not really a problem, except for Bob’s own intellectual loss.
I don’t like it, but I’m trying to face up to it.
sd9
关键是,代理不会消失。所以如果鲍勃能利用代理做事,他就能做事。
我为失去解决有思想挑战性的编程问题的机会感到遗憾,但这正是我工作中正在逐渐消失的一部分。我需要决定剩下的工作——理解需求、管理团队等等——是否仍然足够令人享受,值得继续下去。
老实说,我考虑离开软件行业,因为这份工作已经变成了与我当初签约时不同的样子。
所以我认为这篇文章部分是对的,鲍勃没有学那些我们过去要求的技能。但我觉得市场会停止重视那些技能,所以这其实并不是一个“问题”,只不过是鲍勃个人的知识损失。
我不喜欢这样的改变,但我正试图正视它。
https://news.ycombinator.com/item?id=47652278
It’s pretty depressing that on a corner of the internet that’s supposed to be a gathering of tech/geeks/nerds/stem people, discussing topics that “good hackers would find interesting”, it’s seemingly impossible to have a single thread about something like this that isn’t almost entirely negative or political bickering.
thegrim33
在互联网的一个角落,本应是科技爱好者、极客、书呆子和理工科人士的聚集地,讨论“优秀黑客会感兴趣”的话题,可几乎找不到一条关于此类内容的帖子不是充满负面情绪或政治争吵,这实在令人沮丧。
https://news.ycombinator.com/item?id=47646847
What if you „lose“ your google / apple account, like this sanctioned judge of the international criminal court? Crazy to imagine that we are still baking in dependency on US providers in european societies, even though there is clear indications we should be doing the opposite?
jakoblorz
如果你像这位被制裁的国际刑事法院法官那样“失去”了你的谷歌/苹果账户,会怎么样?真是难以置信,尽管有明确的迹象表明我们应该做相反的事情,我们欧洲社会仍然依赖美国服务提供商,简直是自找麻烦。
https://news.ycombinator.com/item?id=47643022
It reminds me of around 2002 when Microsoft named everything “.net”.
quag
这让我想起了大约2002年微软给所有东西都起名为“.net”的时候。
https://news.ycombinator.com/item?id=47636346
YC is, ultimately, not responsible for what these startups choose to do.
Of course they’re responsible for their investments; they’re just not liable. YC has a lot to answer for in the damage it’s wreaked over the years.
throwaway27448
YC 最终不对这些初创公司选择做什么负责。
当然,他们对自己的投资负责;只是他们不承担法律责任。YC 多年来造成的伤害,他们有很多需要解释。
https://news.ycombinator.com/item?id=47644993
Its worth reading this follow-up LKML post by Andres Freund (who works on Postgres): https://lore.kernel.org/lkml/yr3inlzesdb45n6i6lpbimwr7b25kqkn37qzlvvzgad5hfd7ut@xv4cihno76wu/
lfittl
值得一读这篇由Andres Freund(他在Postgres项目工作)发布的LKML后续帖子:https://lore.kernel.org/lkml/yr3inlzesdb45n6i6lpbimwr7b25kqkn37qzlvvzgad5hfd7ut@xv4cihno76wu/
https://news.ycombinator.com/item?id=47639718
That’s not what is happening right now. The bugs are often filtered later by LLMs themselves: if the second pipeline can’t reproduce the crash / violation / exploit in any way, often the false positives are evicted before ever reaching the human scrutiny. Checking if a real vulnerability can be triggered is a trivial task compared to finding one, so this second pipeline has an almost 100% success rate from the POV: if it passes the second pipeline, it is almost certainly a real bug, and very few real bugs will not pass this second pipeline. It does not matter how much LLMs advance, people ideologically against them will always deny they have an enormous amount of usefulness. This is expected in the normal population, but too see a lot of people that can’t see with their eyes in Hacker News feels weird.
antirez
现在的情况并非如此。漏洞通常会被后续的语言模型(LLM)过滤:如果第二个流程无法以任何方式重现崩溃、违规或利用,通常这些误报会在进入人工审查前就被剔除。检测一个真实漏洞是否能被触发,相较于发现漏洞来说是一个非常简单的任务,因此从这个角度看,第二个流程的成功率几乎是100%:如果某个漏洞通过了第二个流程,它几乎可以确定是真实漏洞,而且很少有真实漏洞会未能通过这个流程。无论语言模型多么进步,持反对态度的人总是会否认它们的巨大实用价值。这种情况在普通人中是预料之中的,但看到很多人在 Hacker News 上对此视而不见,还是觉得很奇怪。
https://news.ycombinator.com/item?id=47649270
I think Google has done some cool stuff, and I think in a lot of ways they’re, at least historically, one of the less evil big tech players.
I gotta say, though, that my experience with trying to get them to sort out any kind of issue with their services makes me reluctant to spend any money with them.
I bought a Pixel phone. As per the sales terms, the phone came with one year of Gemini AI Pro service. Except, the redemption process to get the year of service didn’t work for me. I contacted Google, they never fixed it or offered any solution. I simply didn’t get the year of service I was promised.
My friend, who bought a Pixel around the same time, also wasn’t able to get the year of Gemini they were promised.
That same friend has a Google One subscription, billed through their phone carrier. Recently, Google (or the provider?) discontinued that specific Google One plan, as well as the option to bill via your carrier. This was all covered in an email sent to my friend. As consolation, the email explained, my friend was given the option to switch to a different plan, billed monthly by Google (instead of their phone carrier), with 6 months free. Except, the new plan, and the 6 months free, wasn’t selectable as a plan type for their account. So my friend emails Google about it and, to my complete lack of surprise, Google was unwilling/unable to provide any resolution.
At this point, I legitimately don’t understand why, unless I had no other option, I would pick Google for services. They clearly put no real effort into resolving any service issues for any customer that’s not spending millions with them.
protimewaster
我觉得谷歌确实做了一些很酷的事情,而且在很多方面,至少从历史角度看,他们是大科技公司中相对不那么恶劣的一家。
不过我得说,我在尝试让他们解决任何服务问题时的经历让我很犹豫是否要花钱买他们的产品。
我买了一部Pixel手机。根据销售条款,这部手机包含一年的Gemini AI Pro服务。但问题是,兑换这项一年的服务的流程对我来说根本不起作用。我联系了谷歌,他们既没有解决问题,也没有给出任何解决方案。结果就是我根本没能得到承诺的一年服务。
我朋友也差不多在同一时间买了Pixel手机,他也没能获得他们承诺的一年Gemini服务。
同一个朋友有一个通过手机运营商计费的Google One订阅。最近,谷歌(或者是服务提供商?)取消了那个特定的Google One套餐,以及通过运营商计费的选项。这些内容都在发给我朋友的邮件中提到了。作为补偿,邮件说明我朋友可以选择转到一个不同的套餐,由谷歌每月直接计费(而不是运营商),并有6个月免费期。可实际上新套餐和6个月的免费期在他们账户里根本无法选择。于是我朋友给谷歌发了邮件,毫不意外的是,谷歌既不愿意也无法提供任何解决办法。
到现在为止,我真正不明白,除非没有其他选择,为什么我还会选择谷歌的服务。他们显然根本不愿意为那些没有投入巨额资金的客户解决任何服务问题。
https://news.ycombinator.com/item?id=47649827
In Finland we have old saying: “If liquor, tar and sauna won’t help, an illness is fatal”
csr86
在芬兰有句老话:“如果酒、松香和桑拿都无济于事,那病就是致命的。”
https://news.ycombinator.com/item?id=47647522
German implementer here. We have to use some kind of attestation mechanism per the eIDAS implementing acts. That doesn’t work without operating system support.
The initial limitation to Google/Android is not great, we know that, and we have support for other OSs on our list (like, e.g., GrapheneOS). It is simply a matter of where we focus our energy at the moment, not that we don’t see the issues.
webhamster
我是德国的实施者。根据eIDAS实施条例,我们必须使用某种形式的证明机制。没有操作系统的支持这是行不通的。
目前仅限于谷歌/安卓平台,这确实不理想,我们很清楚这一点,而且我们也支持其他操作系统(例如,GrapheneOS)正在我们的计划中。这只是我们当前精力集中所在的问题,并不是说我们没有看到这些问题。
https://news.ycombinator.com/item?id=47634313
What you’re saying is conceptually true for subscription services in general, but thats not why they are making this change. There’s a 5 hour limit and a weekly limit. Those are hard token limits. Everyone on a plan pays for the max set of tokens in that plan. The limits manage capacity. The solution to that isn’t a change of ToS, it’s adjusting the limits.
In other words this is about Anthropic subsidizing their own tools to keep people on their platform. OpenClaw is just a good cover story for that. You can maximize plans just as easily w/ /loop. I do it all the time on max 20x. The agent consuming those tokens is irrelevant.
For what it’s worth I don’t use OpenClaw and don’t intend to, but I do use claude -p all the time.
goosejuice
你说的对于订阅服务来说在概念上是正确的,但他们做出这个改变的原因并不是这个。存在一个5小时限制和一个每周限制。这些都是硬性代币限制。每个订阅计划的用户都支付该计划内最大代币数量的费用。限制是为了管理容量。解决方案不是更改服务条款,而是调整限制。
换句话说,这关乎Anthropic通过补贴自己的工具来留住用户在他们的平台上。OpenClaw只是一个很好的幌子。你同样可以通过/loop轻松最大化计划。我经常在最大20倍计划上这样做。消耗代币的代理并不重要。
就我而言,我不使用OpenClaw,也没有打算使用,但我确实一直使用claude -p。
2026-04-05 07:46:35
- NASA公布阿尔忒弥斯II号宇航员使用尼康D5相机拍摄的自1972年以来首批高分辨率地球照片,展示大西洋、极光及昼夜分界线等壮观景象。
- 《Careless People》作者因Meta利用离职协议中的不贬损条款被禁止发表负面言论,违者面临高额罚款,反而推动该书销量接近20万册。
- EFF批评FAA实施为期21个月的无人机飞行限制,禁止在ICE车辆附近飞行,认为此举侵犯宪法第一和第五修正案权利并试图阻止公众监督移民执法。
- 研究提出无需验证器或强化学习的简单自我蒸馏方法,通过模型自身生成样本进行微调,显著提升大型语言模型的代码生成能力。
- iNaturalist是一个全球性公民科学平台,用户通过上传照片记录生物多样性,利用AI和社区众包识别物种,数据同步至科学数据库支持生态保护。
- 甲骨文在大规模裁员的同时提交超过3100份H-1B签证申请,引发外界质疑其利用签证项目以低成本替代美国本土员工。
- Delve被Y Combinator除名,原因包括开源许可违规及涉嫌为不合规客户提供虚假审核等严重欺诈行为,背叛了YC社区信任。
- MVIDIA是一款游戏化在线硬件学习平台,引导用户从基础晶体管开始逐步构建ALU、RAM等模块,最终完成处理器及GPU设计。
- Anthropic科学家利用Claude Code发现Linux内核NFS驱动中隐藏23年的远程可利用缓冲区溢出漏洞,显示AI在安全审计中的巨大潜力。
- 德国实施新军事服务法,要求18至45岁男性离境超过三个月须申请军事许可,以便战时掌握适龄男性行踪,目前服役仍属自愿。
https://www.bbc.com/news/articles/ce8jzr423p9o
美国宇航局(NASA)分享了阿尔忒弥斯 II 号(Artemis II)任务中宇航员拍摄的首批高分辨率地球照片。任务指挥官瑞德·怀斯曼(Reid Wiseman)在飞船完成最后一次发动机点火,将飞船送入飞月轨道后拍摄了这些“壮观”的照片。此时,飞船距离地球约 14.2 万英里(22.85 万公里),距离月球约 13.2 万英里。
照片中显示了大西洋的广阔蓝色海洋,地球大气层的辉光,以及两极的绿色极光。地球呈倒置状态,照片中可见西撒哈拉、伊比利亚半岛和南美洲东部。照片中还出现了明亮的金星。另一张照片展示了地球的昼夜分界线(终结线),夜晚的地球上灯光闪烁,显示出人类活动的痕迹。
阿尔忒弥斯 II 号任务是自 1972 年以来首次有人类飞出地球轨道,飞船将绕月球远侧飞行后返回地球,预计 4 月 6 日绕过月球远侧,4 月 10 日在太平洋溅落。宇航员们在完成轨道变换点火后兴奋地拍摄窗外景象,尽管最初拍摄时调整曝光较为困难,但很快适应了拍摄条件。
NASA 还发布了 1972 年阿波罗 17 号任务与 2026 年阿尔忒弥斯 II 号任务拍摄的地球照片对比,强调 54 年来技术进步的同时,地球的美丽依旧未变。此次任务为未来可能于 2028 年实现的载人月球着陆做准备。
https://news.ycombinator.com/item?id=47631118
https://www.thetimes.com/uk/technology-uk/article/sarah-wynn-williams-careless-people-meta-nrffdfpmf
这篇文章讲述了作者 Sarah Wynn-Williams 因揭露 Meta(前 Facebook)内部问题而遭遇的法律封口。她的书《Careless People》揭露了 Meta 在性骚扰、操纵未成年人等方面的严重指控。尽管书中内容基于大量证据,但 Meta 通过紧急仲裁程序,利用她与公司的离职协议中的不贬损条款,禁止她宣传书籍或发表任何负面言论。
这一禁令从 2025 年 3 月 13 日生效,限制了 Sarah 在英国的言论自由,甚至影响到她在私人场合与家人的交流。她面临每次违反禁令高达 5 万美元的罚款,可能导致经济崩溃。尽管如此,Meta 的封口行动反而使该书成为全球现象,销量接近 20 万册,引发媒体广泛关注。
文章还描述了出版过程的秘密和紧张,出版社为保护作者采取了加密沟通和保密措施。Sarah 在发布前未向亲友透露写书消息,宣传活动也因禁令被迫中断。文章强调,尽管 Meta 声称支持言论自由,但实际上只容许对自身无害的言论,揭示了大型科技公司对言论控制的强大影响力。
https://news.ycombinator.com/item?id=47639524
这篇文章由电子前哨基金会(EFF)发布,重点批评了美国联邦航空管理局(FAA)于 2026 年 1 月 16 日开始实施的一项“临时”无人机飞行限制(TFR)。该限制禁止私人无人机操作员,包括专业和公民记者,在距离美国移民和海关执法局(ICE)或边境保护局(CBP)车辆半英里范围内飞行无人机,期限长达 21 个月,直到 2027 年 10 月 29 日。
文章指出,这项飞行限制严重侵犯了美国宪法第一修正案赋予的拍摄执法部门的权利。通过禁止无人机在执法车辆附近飞行,并对违规者施加刑事和民事处罚,甚至可能没收或摧毁无人机,FAA 实际上剥夺了公民记录执法行为的自由。文章强调,记录执法过程对于揭露警察不当行为和推动问责至关重要,尤其是在乔治·弗洛伊德、Renée Good 和 Alex Pretti 等案件中,民间录像发挥了重要作用。
此外,文章指出该飞行限制还违反了第五修正案的正当程序权利,因为无人机操作员无法获得明确的事先通知,难以判断自己是否处于限制范围内。FAA 自身的规定也未被遵守,例如未明确说明限制的具体危险或条件,也未为新闻机构提供获得飞行许可的联系方式。
文章认为,这项限制是在 2026 年明尼阿波利斯反 ICE 抗议活动高峰期实施的,意图阻止公民通过无人机记录移民执法行动,从而保护 ICE 及其他移民执法机构免受监督和问责。EFF 呼吁 FAA 撤销该飞行限制,并提醒公众在行使拍摄执法权利时需注意安全,防止遭到执法人员的报复。
https://news.ycombinator.com/item?id=47633947
https://arxiv.org/abs/2604.01193
该网页展示了一篇计算机科学领域的学术论文,题为《Embarrassingly Simple Self-Distillation Improves Code Generation》(极其简单的自我蒸馏提升代码生成能力),由 Ruixiang Zhang 等六位作者撰写,发表于 2026 年 4 月 1 日。论文提出了一种名为简单自我蒸馏(SSD)的方法,用于提升大型语言模型(LLM)在代码生成任务中的表现。
该方法不依赖验证器、教师模型或强化学习,仅通过模型自身生成的代码样本进行采样,然后使用标准的监督微调进行训练。实验结果显示,SSD 显著提升了 Qwen3-30B-Instruct 模型在 LiveCodeBench v6 测试集上的通过率,从 42.4% 提高到 55.3%,尤其在解决较难问题时效果明显。该方法适用于不同规模(4B、8B、30B)和不同类型(指令型和思考型)的 Qwen 和 Llama 模型。
论文还分析了 SSD 方法有效的原因,指出其通过调整解码时的精度与探索之间的冲突,动态调整生成的 token 分布,抑制无关干扰的概率分布尾部,同时保持必要的多样性,从而提升代码生成的质量。SSD 为提升大型语言模型代码生成能力提供了一种简单且有效的后训练方向。
https://news.ycombinator.com/item?id=47637757
该网页是一个自然观察和生物多样性记录平台的介绍页面,主要内容围绕用户如何通过该平台记录、分享和学习自然界中的各种生物观察。用户可以上传自己在自然界中遇到的动植物照片和信息,平台通过社区和专家帮助进行物种识别,促进科学研究和生态保护。
网页展示了多个用户上传的自然观察实例,如蜂鸟、非洲卷尾鸟、变色蜥蜴、澳大利亚植物、蝴蝶和黏菌等,体现了平台的全球覆盖和多样性。平台强调每个观察记录都能为生物多样性科学贡献数据,并与全球生物多样性信息设施等科学数据仓库共享。
此外,网页介绍了平台的功能和优势,包括记录和管理生命清单、创建有用的科学数据、众包物种识别、参与公民科学项目、学习自然知识以及举办生物多样性快速调查(Bioblitz)活动。平台支持多设备使用,提供移动应用,方便用户随时随地进行观察记录。
网页还包含多位用户和专家的推荐和使用感受,体现了平台在全球自然爱好者、科学家和研究人员中的广泛认可和价值。总体来说,该平台旨在连接自然爱好者与科学研究,推动公众参与自然保护和生态科学。
https://news.ycombinator.com/item?id=47629433
这篇文章报道了软件公司甲骨文(Oracle)在大规模裁员的同时,仍然提交了大量 H-1B 签证申请。根据联邦数据,甲骨文在 2025 财年提交了 2690 份 H-1B 签证申请,2026 财年截至目前又提交了 436 份,总计超过 3100 份。这引发了外界对甲骨文是否利用 H-1B 签证项目替代美国员工的质疑。
H-1B 签证允许公司临时雇佣具备专业技能的外国员工,尤其是在科技行业。批评者认为该项目被用来以较低成本替代美国员工,而支持者则认为其有助于填补关键人才缺口。甲骨文在裁员的同时大量申请 H-1B 签证,凸显了这一争议的复杂性。
目前,甲骨文尚未对裁员和签证申请情况作出公开回应。此次事件引发了关于 H-1B 项目对美国劳动力市场影响的持续讨论,也呼吁企业在使用该项目时应更加透明。文章还简要介绍了甲骨文作为总部位于德克萨斯州奥斯汀的软件公司,正经历重大组织调整。
https://news.ycombinator.com/item?id=47631732
https://www.ycombinator.com/companies/delve
该网页显示“404 文件未找到”的错误信息,表示所请求的页面不存在或已被删除。页面提供了返回主页的链接,并建议用户如需帮助,可以通过邮箱 [email protected]:[email protected] 联系支持团队。整体内容简洁,主要用于告知用户页面无法访问及提供后续操作指引。
https://news.ycombinator.com/item?id=47634690
该网页是一个名为“MVIDIA”的在线学习平台,旨在引导用户从基础硬件知识开始,逐步学习计算机硬件设计和处理器构建的过程。网页以“从晶体管到万亿次运算”为主题,模拟了一个硬件工程师的入门培训。
内容分为多个章节和任务,第一部分“你的第一天”涵盖了晶体管和逻辑门的基础知识,包括电流、电压、半导体掺杂、PN 结、NMOS 和 PMOS 晶体管的构造与工作原理,以及如何利用晶体管实现数字信号的开关功能。通过一系列任务,用户将学习构建基本的逻辑门如 NAND、AND、OR、XOR 门,并理解它们的真值表。
第二部分“核心”深入介绍了从逻辑门到算术逻辑单元(ALU)再到处理器的设计过程,包含半加器、全加器、译码器、电容器、寄存器文件、RAM、计数器等硬件模块的构建与组合。该部分任务较多,涉及复杂的硬件设计和数字电路实现,逐步引导用户完成一个简易处理器的设计。
后续章节“软件”、“GPU”和“着色器”目前尚未开放,预示着平台未来将扩展到处理器编程、图形处理器构建和 GPU 编程等高级主题。
整体来看,该网页是一个系统化的硬件学习工具,适合对计算机硬件设计感兴趣的学习者,通过互动式任务逐步掌握从晶体管到处理器的完整知识体系。
https://news.ycombinator.com/item?id=47640728
https://mtlynch.io/claude-code-found-linux-vulnerability/
这篇博客文章介绍了 Anthropic 研究科学家 Nicholas Carlini 利用 Claude Code 这一大型语言模型发现了多个 Linux 内核中的远程可利用安全漏洞,其中一个漏洞甚至隐藏了 23 年之久。
文章详细描述了 Nicholas 如何通过一个简单的脚本,逐个扫描 Linux 内核源代码文件,指示 Claude Code 寻找安全漏洞,从而高效地发现了多个难以察觉的漏洞。
重点介绍了一个位于 Linux 网络文件共享(NFS)驱动中的漏洞。该漏洞允许攻击者通过两个协作的 NFS 客户端,利用 NFS 服务器在处理锁请求时缓冲区溢出的问题,读取敏感的内核内存。具体来说,攻击者利用了服务器在拒绝第二个客户端锁请求时,错误地将一个最大 1024 字节的 owner ID 写入仅有 112 字节的缓冲区,导致内存溢出。
该漏洞最早出现在 2003 年,距今已有 23 年历史,且由于代码管理工具的限制,难以直接追溯到具体提交。Nicholas 还指出,他发现了数百个潜在漏洞,但由于需要人工验证,尚未全部报告给 Linux 内核维护者。
文章还提到,Claude Code 的最新版本 Opus 4.6 在漏洞发现能力上远超之前版本,预示着未来将有大量安全漏洞被 AI 模型揭示,给安全研究和防御带来巨大影响。
最后,文章列举了 Nicholas 已修复或报告的五个 Linux 内核漏洞,并强调了大型语言模型在安全领域的快速进步和广泛应用前景。
https://news.ycombinator.com/item?id=47633855
https://www.dw.com/en/german-men-need-military-permit-for-extended-stays-abroad/a-76662677
德国于 2026 年初实施了一项新的军事服务现代化法,旨在应对俄罗斯对乌克兰战争带来的欧洲安全威胁,并计划将现有约 18 万现役士兵增加到 2035 年的 26 万。该法案引发了争议,许多人担心可能重新引入自 2011 年暂停的义务兵役,因此曾有抗议活动。
新法中一个较少被关注的条款规定,18 至 45 岁的德国男性如果计划离开德国超过三个月,必须向联邦国防军职业中心申请批准。无论是出国留学、工作还是长时间旅行,都需遵守此规定。联邦国防军发言人表示,此举是为了在战争爆发时掌握长期居住国外的男性人数。虽然需要申请许可,但职业中心必须在无军事服役需求的情况下发放许可,且目前服役仍基于自愿原则。
国防部承认该规定影响深远,正在制定例外规则,但尚不清楚违规者将面临何种后果。发言人指出,这一规定冷战时期已有,但当时并无实际执行和处罚。
此外,法律要求所有 18 岁男性填写关于教育、健康和服役意愿的问卷,女性则自愿填写。自 2027 年中起,所有 18 岁男性还需参加体能测试,以评估冲突时的征召潜力,此举被批评为向全面征兵迈出的第一步。执政联盟在是否恢复义务兵役问题上存在分歧,最终决定暂时保持服役自愿制。
https://news.ycombinator.com/item?id=47639976
https://news.ycombinator.com/item?id=47633987
There seem to be a ton of people who don’t understand how subscription services work. Every single one of them oversells their capacity. The power users that use the services a lot are subsidized by those who don’t use it as much, which tends to be the vast majority of the user base. OpenClaw is an autonomous power user. The growing adoption of this walking attack surface was either going to A) cause the cost of Claude to go up or B) get banned to protect the price of the service for actual users.
jesse_dot_id
似乎有很多人不理解订阅服务是如何运作的。每一家服务商都会高估自己的承载能力。那些大量使用服务的重度用户,是由使用较少的用户补贴的,而这部分占用户群的大多数。OpenClaw 是一个自主的重度用户。这种不断扩大的“移动攻击面”的采用,要么会导致Claude的成本上升,要么会被禁止,以保护真正用户的服务价格。
https://news.ycombinator.com/item?id=47630034
Because, like UNIX/Linux itself, worse is better: https://en.wikipedia.org/wiki/Worse_is_better - and perfect is the enemy of “good enough.”
We want to encourage people to produce written output with minimal friction. Barriers to writing–and especially barriers to producing documentation–should be minimized. Writing well is difficult enough!
Markup is overhead. Complex markup is even more overhead. Markdown is the best compromise we know of today that provides just enough structure and typographic capability, while imposing very little cognitive load on the author.
Besides, if you need something more complicated these days, you can have your favorite AI agent do it.
otterley
因为,就像UNIX/Linux本身一样,更糟即是更好:https://en.wikipedia.org/wiki/Worse_is_better ——而完美是“足够好”的敌人。
我们希望鼓励人们以最小的阻力产出书面内容。写作的障碍——尤其是产生文档的障碍——应该被最大限度地减少。写好文章本身已经够难了!
标记语言是额外负担。复杂的标记语言负担更重。Markdown是我们目前知道的最佳折中方案,既提供了足够的结构和排版能力,又对作者施加的认知负担非常小。
而且,如果你现在需要更复杂的内容,可以让你喜欢的AI助手来完成。
https://news.ycombinator.com/item?id=47635632
I’m getting the impression that a lot of people in this thread think this is because they violated an open-source license and saying things to the effect of, “they’re just the ones who got caught”. I also thought that was the scandal initially. (And when it comes to license violations, yes, there’s absolutely more where that came from.)
But that’s just the cherry on top. I don’t think they’re being thrown out because they violated a license. There are really serious fraud allegations. Allegedly they were rubber-stamping noncompliant customers, leaving them exposed to potential criminal liability under regulations like HIPPA.
https://deepdelver.substack.com/p/delve-fake-compliance-as-a-service
I’ve only skimmed this so I do not endorse these allegations, but I think it’s context missing from this discussion.
maxbond
我感觉这个帖子里很多人认为这是因为他们违反了开源许可证,然后说类似“他们只是被抓到的那批人”的话。我一开始也以为这就是丑闻的全部。(关于许可证违规,是的,肯定还有更多类似的情况。)
但那只是冰山一角。我不认为他们被清除是因为违反了许可证。这实际上涉及非常严重的欺诈指控。据称他们对不合规的客户草率审批,使这些客户可能因为违反像HIPAA这样的法规而面临刑事责任。
https://deepdelver.substack.com/p/delve-fake-compliance-as-a-service
我只是浏览了一下,所以不表示认可这些指控,但我觉得这是这场讨论中缺失的背景。
https://news.ycombinator.com/item?id=47639905
This book was SO GOOD.
It’s bleak. I always imagined that rich/powerful people only created suffering if that suffering was required for certain goals. It’s easier for me to bear injustice when it’s a zero-sum game. But the story of Facebook is not that. Facebook didn’t make ethical sacrifices for profit – its executives just didn’t care to understand the consequences of their actions. I wish those folks could feel how much harm they’ve caused.
surprisetalk
这本书真是太棒了。
故事相当沉重。我一直以为有钱有权的人只有在追求某些目标时才会制造痛苦。当这是一个零和游戏时,我更容易接受不公。但Facebook的故事并非如此。Facebook并不是为了利润而做出道德上的妥协——它的高管们只是根本不关心自己行为的后果。我真希望那些人能意识到他们造成了多大的伤害。
https://news.ycombinator.com/item?id=47634445
You aren’t paying to be using that limit all of the time.
You are paying to be using that limit some of the time. There are 5 hour windows when you are sleeping and can’t use it. There are weekend limits.
Theoretically you can max out every 5 hour window, but they lose money on that.
It’s structured so users can have bursts of unlimited usage, and spend ~15% of the theoretical max cap, and that’s still cheaper than a subscription for that user.
An OpenClaw user can use 6, 7, 8 times what a human subscriber is using.
jmalicki
你不是一直在付费使用那个限额。
你付费是为了在某些时间段内使用那个限额。你有5小时的时段是在睡觉,不能使用。还有周末的限制。
理论上你可以在每个5小时的时段内用满,但他们会亏钱。
这个结构是让用户能够有爆发式的无限使用,同时只用到理论最高限额的大约15%,而这仍然比为该用户付订阅费便宜。
一个OpenClaw用户的使用量是普通订阅用户的6、7、8倍。
https://news.ycombinator.com/item?id=47632588
From your first link, it says 10% of 28k employees in India were cut. I personally know several people who were laid off from Oracle this week (OCI). One person who’s still there described it as a “bloodbath across our division” and says he counted 15k. I don’t know what exactly he was counting but as we’re in North America I am assuming they’re all here. Whereas India layoffs were fewer than 3k. So that directly disputes your statement that “they’ve barely fired any American workers”.
saulpw
从你第一个链接来看,印度有10%的2.8万名员工被裁掉。我个人认识几位本周被Oracle(OCI)裁员的人。其中一个还在公司的员工形容这次裁员是“我们部门的一场屠杀”,他说他数到了1.5万。我不知道他具体数的是什么,但鉴于我们是在北美,我猜这些员工都在这里。而印度的裁员人数少于三千人。因此这直接驳斥了你“他们几乎没有解雇美国员工”的说法。
https://news.ycombinator.com/item?id=47632095
Wherever their major offices are look for newspapers in the small towns nearby advertising for “Software developers for Oracle” all written in the tiniest print, right next to classified that sell used bikes, car parts and other stuff.
rdtsc
无论他们的主要办公室在哪里,都去附近的小镇找报纸,上面会有“Oracle软件开发员”的招聘广告,字体非常小,就挨着卖二手自行车、汽车零件和其他东西的分类广告。
——“好了,山姆大叔,我们在美国找了很久,没有人回应我们的招聘信息,我们不得不去……某个其他国家招聘,别无他法。”
https://news.ycombinator.com/item?id=47632457
Looking at the EXIF (with exiftool) for the image uploaded by NASA ( https://www.nasa.gov/wp-content/uploads/2026/04/art002e000192.jpg ), apparently this was taken by a Nikon D5 with an AF-S Zoom-Nikkor 14-24mm f/2.8G ED and developed with Lightroom. It also seems like very little was done in Lightroom. Amazing… I dumped the whole EXIF here: https://gist.github.com/umgefahren/a6f555e6588a98adb74eed79d734012c
hannesfur
查看NASA上传的这张图片的EXIF信息(使用exiftool)(https://www.nasa.gov/wp-content/uploads/2026/04/art002e000192.jpg),显然这是用尼康D5相机配AF-S Zoom-Nikkor 14-24mm f/2.8G ED镜头拍摄的,并且用Lightroom进行了后期处理。看起来在Lightroom中几乎没有做太多处理。真令人惊叹……我把完整的EXIF信息放在这里了:https://gist.github.com/umgefahren/a6f555e6588a98adb74eed79d734012c
https://news.ycombinator.com/item?id=47637780
This isn’t surprising. What is not mentioned is that Claude Code also found one thousand false positive bugs, which developers spent three months to rule out.
jason1cho
这并不令人惊讶。没有提到的是,Claude Code还发现了一千个误报漏洞,开发人员花了三个月时间来排查。
https://news.ycombinator.com/item?id=47639862
“They were careless people, Tom and Daisy- they smashed up things and creatures and then retreated back into their money or their vast carelessness or whatever it was that kept them together, and let other people clean up the mess they had made.” ― F. Scott Fitzgerald, The Great Gatsby
grokcodec
“他们是粗心大意的人,汤姆和黛西——他们毁坏了事物和生灵,然后又退回到他们的财富里,或者他们那巨大无比的漫不经心里,或无论是什么让他们维系在一起的东西,然后让别人去收拾他们制造的烂摊子。” —— F·斯科特·菲茨杰拉德,《了不起的盖茨比》
https://news.ycombinator.com/item?id=47630316
It’s also worth remembering that markdown tried very hard to encode conventions that were already used in Usenet, email, and other text media. A > to indicate a quote was widespread Usenet convention. Asterisks or underscores to indicate emphasis was also a common convention; both are legal because both were common. Double asterisk or double underscores to indicate really, really emphasizing something was also a common convention. So were asterisks to display a bulleted list, blank lines to separate paragraphs, and indenting 4+ spaces to write code.
It’s a good example of “pave the path” design philosophy, where you do what users are already doing rather than trying to impose some platonic ideal of what the world should be like. And it works quite well at that.
nostrademons
同样值得记住的是,Markdown 努力编码了已经在 Usenet、电子邮件和其他文本媒体中广泛使用的惯例。用大于号(>)表示引用是 Usenet 上广泛使用的惯例。用星号或下划线表示强调也很常见;两者都是合法的,因为它们都很普遍。双星号或双下划线表示非常强调某事也是常见惯例。用星号表示项目符号列表、用空行分段以及缩进四个或更多空格来写代码也是如此。
这是“铺路式”设计理念的一个好例子,即做用户已经在做的事情,而不是试图强加某种理想化的世界观。而且这种方式效果非常好。
https://news.ycombinator.com/item?id=47635320
I suspect people are misdiagnosing the root cause of why Anthropic is doing this a bit.
I don’t think this is particularly about the financial impact of people using OpenClaw - they can adjust the amount of tokens in a subscription quite easily.
I think the root cause is that Anthropic is capacity constrained so is having to make choices about the customers they want to serve and have chosen people who use Claude Code above other segments.
We know Anthropic weren’t as aggressive as OpenAI through 2025 in signing huge capacity deals with the hyperscalers and instead signed smaller deals with more neo-clouds, and we know some of the neo-clouds have had trouble delivering capacity as quickly as they promised.
We also know Claude Code usage is growing very fast - almost certainly faster since December 2025 than Anthropic predicted 12 months ago when they were doing 12-month capacity planning.
We know Anthropic has suffered from brown-outs in Claude availability.
Put this all together and a reasonable hypothesis is that Anthropic is choosing which customers to service rather than raising prices.
nl
我怀疑大家有些误判了Anthropic采取这一做法的根本原因。
我不认为这主要是因为人们使用OpenClaw带来的经济影响——他们可以很容易地调整订阅中的代币数量。
我认为根本原因是Anthropic的容量有限,所以不得不在他们想服务的客户群中做出选择,而他们选择了优先服务使用Claude Code的用户,而不是其他用户群体。
我们知道,Anthropic在2025年之前并没有像OpenAI那样积极地与大型云服务商签订巨额容量合同,而是与更多新兴云平台签订了较小的合同。我们也知道,一些新兴云平台未能像承诺的那样快速提供容量。
我们还知道Claude Code的使用量增长非常快——几乎可以确定,自2025年12月以来的增长速度远超Anthropic在一年前做12个月容量规划时的预期。
我们知道Anthropic曾出现过Claude服务的容量不足问题。
综合来看,一个合理的推测是,Anthropic正在选择服务哪些客户,而不是单纯通过提高价格来应对问题。
https://news.ycombinator.com/item?id=47634531
Flying a drone within 1/2 mile of ICE vehicles, which may be unmarked, is illegal? You can be flying a drone and if an unmarked ICE vehicle drives close enough, without warning, you have now broken serious FAA laws? This isn’t the kind of restriction that gets passed when the people making the rules care about being fair or consistent. It’s a power grab.
Aurornis
在距ICE车辆半英里范围内飞无人机是违法的,而这些车辆可能没有标记?你正在飞无人机,如果一辆无标记的ICE车辆突然开得很近,你就已经违反了FAA的严重法规?这不是那些制定规则的人出于公平或一致性考虑而通过的限制。这是权力的掠夺。
https://news.ycombinator.com/item?id=47629849
OpenClaw creator here.
This was a privilege-escalation bug, but not “any random Telegram/Discord message can instantly own every OpenClaw instance.”
The root issue was an incomplete fix. The earlier advisory hardened the gateway RPC path for device approvals by passing the caller’s scopes into the core approval check. But the /pair approve plugin command path still called the same approval function without callerScopes, and the core logic failed open when that parameter was missing.
So the strongest confirmed exploit path was: a client that ALREADY HAD GATEWAY ACCESS and enough permission to send commands could use chat.send with /pair approve latest to approve a pending device request asking for broader scopes, including operator.admin. In other words: a scope-ceiling bypass from pairing/write-level access to admin.
This was not primarily a Telegram-specific or message-provider-specific bug. The bug lived in the shared plugin command handler, so any already-authorized command sender that could reach /pair approve could hit it. For Telegram specifically, the default DM policy blocks unknown outsiders before command execution, so this was not “message the bot once and get admin.” But an already-authorized Telegram sender could still reach the vulnerable path.
The practical risk for this was very low, especially if OpenClaw is used as single-user personal assistant. We’re working hard to harden the codebase with folks from Nvidia, ByteDance, Tencent and OpenAI.
steipete
我是OpenClaw的开发者。
这是一个权限提升漏洞,但并不是“任何随机的Telegram/Discord消息都能立即控制所有OpenClaw实例”。
根本原因是之前的修复不完整。之前的通告加强了网关RPC路径的设备审批,通过将调用者的权限传入核心审批检查。但/pair approve插件命令路径仍然调用相同的审批函数,却没有传入callerScopes,导致核心逻辑在缺少这个参数时默认放行。
所以最强的确认利用路径是:一个已经拥有网关访问权限且有足够权限发送命令的客户端,可以用chat.send命令配合/pair approve latest来批准一个请求更广泛权限(包括operator.admin)的待处理设备请求。换句话说,就是从配对/写权限直接绕过权限限制到管理员权限。
这并非主要是Telegram特定或消息提供方特定的漏洞。漏洞存在于共享插件命令处理器中,因此任何已经授权能访问/pair approve命令的发送方都能利用它。对于Telegram来说,默认的私信策略会在执行命令前阻止未知外部用户,所以并不存在“发条消息给机器人就能获得管理员权限”。但已经授权的Telegram发送者依然可能触发这个漏洞路径。
这带来的实际风险非常低,尤其是如果OpenClaw被用作单用户的个人助手。目前我们正在与Nvidia、字节跳动、腾讯和OpenAI的同事共同努力加强代码安全。
https://news.ycombinator.com/item?id=47623649
This isn’t incentivized in corporate environment.
Noticed how “the talent left after the launch” is mentioned in the article? Same problem. You don’t get rewarded for cleaning up mess (despite lip service from management) nor for maintaining the product after the launch. Only big launches matter.
The other corporate problem is that it takes time before the cleanup produces measurable benefits and you may as well get reorged before this happens.
praptak
这在企业环境中没有激励机制。
注意文章中提到的“人才在发布后离开”吗?同样的问题。你不会因为收拾残局(尽管管理层口头上说得好听)或者在产品发布后维护产品而得到奖励。只有大型发布才重要。
另一个企业问题是,清理工作需要时间才能产生可衡量的效益,而在这之前你可能已经被重组了。
https://news.ycombinator.com/item?id=47635834
America was in practice running an empire that collected tribute from the rest of planet earth in exchange for entries in a database denominated in a currency they controlled and that was accepted everywhere. Really the only way it could go wrong is putting it under the control of someone who doesn’t understand the kayfabe…
aloha2436
实际上,美国当时运行着一个帝国,向地球上其他地方征收贡品,换取他们用一种自己控制的货币记账的数据库条目,并且这种货币被全球接受。真的,如果要出问题,唯一的可能就是把它交给一个不懂“演戏套路”的人来掌控……
https://news.ycombinator.com/item?id=47629621
The iNaturalist API is an absolute gem. It doesn’t require authentication for read-only operations and it has open CORS headers which means it’s amazing for demos and tutorials.
My partner and I built this website with it a few years ago: https://www.owlsnearme.com/
(I realize this is a bit on-brand for me but I also use it to track pelicans https://tools.simonwillison.net/species-observation-map#%7B%22taxonId%22%3A123829%2C%22taxonName%22%3A%22California%20Brown%20Pelican%22%2C%22days%22%3A%2230%22%7D )
simonw
iNaturalist 的 API 真的非常棒。对于只读操作不需要身份验证,而且它有开放的 CORS 头,这意味着它非常适合演示和教程。
几年前我和我的伙伴用它建了这个网站:https://www.owlsnearme.com/
(我知道这跟我个人品牌有点吻合,但我也用它来追踪鹈鹕:https://tools.simonwillison.net/species-observation-map#%7B%22taxonId%22%3A123829%2C%22taxonName%22%3A%22California%20Brown%20Pelican%22%2C%22days%22%3A%2230%22%7D)
https://news.ycombinator.com/item?id=47634910
So how is this not flagged, whereas this other post lasted literally minutes before being flagged? https://news.ycombinator.com/item?id=47612053
75000+ palestinians killed, arguably one of the defining crimes of our age are not worth HN discussion (“politics”) but one F15E shot down in a war of choice is (apparently, “tech”)?
lejalv
那为什么这个没有被标记,而另一个帖子却在几分钟内就被标记了? https://news.ycombinator.com/item?id=47612053
75000多名巴勒斯坦人被杀,这 arguably 是我们这个时代的定性罪行之一,却不值得HN讨论(“政治”),但一架F15E在一场选择性的战争中被击落却被认为是(显然的,“技术”)?
https://news.ycombinator.com/item?id=47639991
Having listened to the book on Audible, I’m both shocked at the behavior of the executive team, and not surprised all at the same time. What bothers me about all of this is what it says about us. It says we’re willing to give rich and powerful people a pass just because they make overtures towards something we care about.
We wouldn’t give our children a pass like this, nor would we teach our children to act this way, but we’re perfectly willing to allow fully grown adults to act like this.
Here’s just one example, there are plenty more:
Cheryl Sandberg inviting the author of the book to sleep in her bed next to her on the company jet, and the petulent and vindictive behavior when the author said ’no'.
Everyone in the orbit of the executive team knew about this behavior, and everyone gave it a pass, even going so far as to defend it and to protect Cheryl. This behavior should be universally deplored, and yet is not.
gortok
听完Audible上的这本书后,我既对执行团队的行为感到震惊,同时又一点也不意外。让我感到不安的是,这反映出了我们自身的问题。它表明我们愿意因为某些富有且有权势的人向我们关心的事情示好,就对他们的行为睁一只眼闭一只眼。
我们不会对自己的孩子这样宽容,也不会教导孩子们这样做,但我们却完全愿意允许完全成熟的成年人这样行为。
举个例子,还有很多类似情况:
谢丽尔·桑德伯格邀请书的作者睡在她旁边的公司飞机床上,而当作者拒绝时,她表现出的任性和怀恨行为。
执行团队周围的每个人都知道这种行为,且人人都选择无视,甚至有些人站出来为谢丽尔辩护和保护她。这种行为本应被一致谴责,但实际上并非如此。
https://news.ycombinator.com/item?id=47631817
I was confused when I first saw this photo, as I don’t think I’ve ever before seen a nightside, moonlit Earth, exposed so that it looks like the dayside at a first glance. I wonder how many casual viewers actually realize it’s the night side. A nice demonstration of how moonlight is pretty much exactly like sunlight, just much much dimmer. In particular it has the same color, even though moonlight is often thought of as bluish and sunlight as yellowish!
Sharlin
当我第一次看到这张照片时感到很困惑,因为我之前从未见过被月光照亮的夜晚地球,看起来像白天的一面,乍一看很难分辨。我想知道有多少普通观众实际上意识到这是夜晚的一面。这很好地展示了月光几乎和阳光一模一样,只是亮度远远低得多。特别是它的颜色相同,尽管人们通常认为月光偏蓝色而阳光偏黄色!
https://news.ycombinator.com/item?id=47638287
Really fascinating how this works; it’s basically context-aware decoding. From the paper:
Code interleaves fork positions, where several continuations are genuinely plausible and may correspond to different solution approaches, with lock positions, where syntax and semantics leave little ambiguity but a low-probability distractor tail still remains… The best global decoding setting is therefore necessarily a compromise; we call this tension the precision-exploration conflict.
In other words, just like us, the model needs to shift from “exploration” in “fork” mode (divergent thinking to produce a creative solution) to “precision” in “lock” mode (producing syntactically correct code).
What this paper shows is that their simple technique (SSD) can improve the ranking of optimal tokens in both lock and fork positions, meaning the model is more likely to explore when it should be exploring, and more likely to be precise when it needs to be.
I love that we’re still learning the emergent properties of LLMs!
bensyverson
这真是非常有趣的工作原理;它基本上是上下文感知的解码。论文中提到:
代码在“分叉”位置交错,在这些位置,几种续写都是合理的,且可能对应不同的解决方案;在“锁定”位置,语法和语义几乎没有歧义,但仍存在低概率的干扰尾部……因此,最佳的全局解码设置必然是一种折中;我们称这种矛盾为精确性-探索冲突。
换句话说,就像我们一样,模型需要从“分叉”模式下的“探索”(发散性思维以产生创造性解决方案)切换到“锁定”模式下的“精确”(产生语法正确的代码)。
这篇论文显示,他们的简单技术(SSD)可以提高在锁定和分叉位置上最优token的排序,意味着模型更可能在需要探索时去探索,而在需要精确时保持精确。
我很喜欢我们仍在不断发现大型语言模型的自发特性!
https://news.ycombinator.com/item?id=47636243
YC has no problem with morally questionable behavior, many YC startups do things that are just as shady. YC is, ultimately, not responsible for what these startups choose to do. Delve’s problem is that they betrayed so many other YC companies in the process. An important value of being in YC is access to a ready-made customer base. The licensing issue is nothing compared to their fake audits but it is an affront to the YC community, hence, kicked from the community.
I’m sure if Delve has only engaged in fraudulent audits or had only resold another YC company’s product, they would have been allowed to stay, the problem is all of that combined pissed off enough other YC companies.
fontain
YC对道德上有争议的行为并不介意,许多YC初创公司也做着同样可疑的事情。YC最终不为这些初创公司选择做什么负责。Delve的问题在于他们在此过程中背叛了许多其他YC公司。成为YC的一员的重要价值在于能够接触到现成的客户群。许可问题相比他们的假审计不算什么,但这对YC社区是种侮辱,因此被踢出了社区。
我相信如果Delve只是进行欺诈审计或者仅仅转售另一家YC公司的产品,他们本来会被允许留下,问题在于这些行为综合起来激怒了足够多的其他YC公司。
2026-04-04 07:35:03
- Apfel是一款免费本地AI工具,可直接调用Apple Silicon Mac内置的大型语言模型,无需网络连接即可在本地完成所有计算,保护用户隐私。
- Blogosphere是一个聚合独立博客内容的平台,旨在维护独立网站生态,对抗社交媒体和AI内容泛滥,提供简洁和现代两种界面版本。
- Tailscale推出全新macOS桌面应用界面,通过窗口化设计解决刘海屏MacBook菜单栏图标被隐藏的问题,提供更丰富的设备管理和网络功能。
- Cursor 3正式发布,打造以代理为核心的统一智能开发工作台,支持多仓库协作与并行运行多个本地和云端代理,旨在实现代码库"自驱动"。
- 文章驳斥Marc Andreessen关于"内省是弗洛伊德发明"的错误观点,列举历史证据证明内省传统古已有之,警告忽视内心体验将导致技术发展脱离人性本质。
- 该网站推荐欧洲本土数字产品作为美国服务的替代方案,强调GDPR保护下的数据主权,但被质疑存在联盟营销倾向且部分服务仍受美国法律影响。
- 文章提出真正有价值的想法无需依赖谎言获取公众支持,以伊拉克战争和科技公司股票期权为例,强调不可信的预测者其预测亦无价值。
- 美军一架F-15E战斗机在伊朗境内被击落,成为本轮美伊冲突以来首架被击落的美军战机,冲突已造成重大人员伤亡和装备损失。
- 英国NHS员工因伦理担忧拒绝使用与Palantir合作开发的Federated Data Platform数据系统,担心该公司涉及监控的历史背景可能违反数据保护法规。
- 该指南介绍如何在Apple Silicon Mac mini上本地部署Ollama和Gemma 4模型,强调利用MLX框架实现低延迟、高稳定性的本地AI推理环境。
apfel 是一款免费的本地 AI 工具,专为搭载 Apple Silicon 的 Mac 设备设计,可直接调用 macOS 内置的大型语言模型(LLM),无需网络、无需 API 密钥、无额外成本。
该工具由 Apple 在 macOS 26(Tahoe)版本中内置,原本仅用于 Siri 和系统功能,apfel 通过 Swift 编写,将其开放为三种使用方式:命令行工具(CLI)、OpenAI 兼容的本地 HTTP 服务器,以及支持多轮对话的交互式聊天界面。
核心特性包括:
提供实用工具链:
支持文件输入、JSON 输出、流式响应、工具调用、响应格式控制等高级功能,适用于脚本自动化、开发辅助、本地 AI 服务部署。
项目开源,采用 MIT 协议,已在 GitHub 获得超 1000 颗星,受到来自 Apple、Google、NVIDIA 等公司工程师关注。
安装方式推荐使用 Homebrew: brew install Arthur-Ficial/tap/apfel
未来还将推出 GUI 界面(apfel-gui)和菜单栏剪贴板增强工具(apfel-clip),进一步拓展本地 AI 使用场景。
https://news.ycombinator.com/item?id=47624645
该网页是“Blogosphere”网站的首页,展示了一个由独立博客组成的聚合平台,内容涵盖科技、文化、艺术、生活等多个领域。页面顶部列出了最新更新的 50 篇博客文章,按时间倒序排列,最新文章发布于几分钟前。
主要话题包括:
整体风格偏向独立博客生态,强调原创、深度与个性表达,内容多元且富有思想性,体现了“独立网络”(Indie Web)的精神。
https://news.ycombinator.com/item?id=47625952
https://tailscale.com/blog/macos-notch-escape
Tailscale 推出了全新的 macOS 桌面应用程序界面,解决了部分用户在带有刘海屏的 MacBook 上难以找到 Tailscale 菜单栏图标的问题。此前,由于 macOS 菜单栏空间有限,图标可能被隐藏在屏幕刘海区域,导致用户误以为程序未启动。虽然通过 occlusionState 检测可弹出提示,但该方法存在误触发问题,且无法根本解决。
新推出的窗口化应用(从 1.96.2 版本开始默认启用)与原有菜单栏应用并存,用户可通过 Dock 或 Spotlight 快速调用。该界面提供多项实用功能:可搜索并查看所有设备连接状态、一键 Ping、复制 IP 地址、使用 Taildrop 发送文件、快速选择最优出口节点,并通过 Dock 图标上的红点提示关键错误。
此外,新界面还包含“迷你播放器”模式,可将应用最小化至极简状态,同时提供首次使用或更新后的功能引导教程。团队正在开发 Windows 平台的类似界面,并致力于在保持功能性的基础上增添一些趣味性设计。
https://news.ycombinator.com/item?id=47618189
https://cursor.com/blog/cursor-3
Cursor 3 正式发布,标志着软件开发进入新阶段。新版本打造了一个统一的智能开发工作台,以代理(Agents)为核心,支持多仓库协作与并行运行多个本地和云端代理。
所有代理集中显示在侧边栏,支持从移动设备、网页、桌面、Slack、GitHub 和 Linear 等多端启动。云端代理可自动生成演示视频和截图,便于验证成果。
新界面优化了本地与云端代理之间的无缝切换:可将代理从云端迁移到本地进行调试,也可将本地会话上传至云端,实现离线持续运行或快速切换任务,特别适合长时间运行的任务。
新增的差异视图简化了代码审查流程,支持一键提交、暂存和管理 Pull Request,实现从提交到合并的高效闭环。
在功能层面,Cursor 3 保留了优秀的 IDE 体验:支持完整 LSP 的代码跳转与文件查看,集成内置浏览器,可直接访问和操作本地网站。
用户还能通过 Cursor Marketplace 一键安装数百个插件,扩展代理能力,包括 MCP、技能、子代理等。团队也可搭建私有插件市场。
Cursor 3 奠定了模型、产品与运行时的基础,为构建更自主的代理和团队协作铺平道路。未来将持续演进,目标是实现代码库的“自驱动”。
立即升级 Cursor,使用 Cmd+Shift+P 打开“Agents Window”体验全新界面。
https://news.ycombinator.com/item?id=47618084
https://www.joanwestenberg.com/marc-andreessen-is-wrong-about-introspection/
文章批评了风险投资家马克·安德里森关于“ introspection(内省)”的错误观点。安德里森在一次访谈中声称,过去四百年里人们从未内省过,而内省是 1910 至 1920 年间由弗洛伊德和维也纳学派“发明”的。作者指出,这一说法严重歪曲历史。
作者列举大量证据反驳:苏格拉底提倡“未经省察的人生不值得过”;斯多葛学派强调自我审视,马可·奥勒留的《沉思录》正是内省的典范;奥古斯丁的《忏悔录》早在公元 400 年就深入探讨内心世界;中国儒家思想中的“求其放心”也体现了内省传统;莎士比亚的《哈姆雷特》更是以过度内省导致行动瘫痪为主题,说明当时观众已熟知这一心理状态。
作者认为,安德里森并非无知,而是有意构建一种“零内省心态”的话语体系,以排除对人类内在体验的深入探讨,从而为“快速前进、只做外部行动”的技术乐观主义提供合法性。
真正的“人类繁荣”不仅关乎物质丰裕和效率提升,更关乎意义、目的与内心满足。这些无法通过 GDP、点击率或交易量来衡量,只能通过内省、文学、哲学和诚实的自我报告来接近。
安德里森的“向前走”缺乏方向,因为“前进”必须以“知道自己要去哪里”为前提,而这种自我认知恰恰依赖于内省。忽视内省,会导致技术发展脱离人性本质,正如社交媒体平台只追求用户活跃度,却牺牲了心理健康与社会福祉。
最后指出,安德里森并非没有灵魂,而是选择不审视内心,并为这种回避提供历史借口。这种思维模式在现实中已造成严重后果——当人们用可测量的数据替代对人心的理解时,Goodhart 定律便生效:指标成了目标,而目标本身早已偏离了初衷。
https://news.ycombinator.com/item?id=47627056
这是一个专注于提供欧洲替代方案的网站,旨在帮助用户寻找在隐私、质量、环保和公平性方面更优的欧洲本土软件、产品和服务。
网站核心理念是“欧洲做得更好”——通过严格的环境标准、优质制造、真实隐私保护和强大的数据安全,打造更可持续、更负责任的数字生活选择。
主要功能包括:
推荐的替代产品包括:
分类导航涵盖多个领域,如:
特别强调:欧盟企业受 GDPR 严格监管,数据主权属于用户;而美国服务可能受 CLOUD 法案影响,被迫向美国政府提供数据。
网站倡导“熟悉工具,欧洲替代”的理念,推动用户转向更安全、更环保、更符合欧洲价值观的数字产品。同时开放社区协作,欢迎用户提交希望增加的欧洲产品或类别。
https://news.ycombinator.com/item?id=47624741
https://blog.danieldavies.com/2004/05/d-squared-digest-one-minute-mba.html
本文是 D-Squared Digest 博客的一篇回顾性文章,作者分享了自己在 2003 年伊拉克战争前对战争前景的预判,并解释了其判断背后的逻辑。作者强调,真正有价值的想法无需依赖谎言来获得公众支持,这一原则成为其分析政治决策的核心依据。
作者指出,当一个项目或政策需要大量虚假宣传来推动时,往往本身就存在问题。以科技公司是否应将股票期权计入成本为例,作者在商学院学到的这一理念被应用于伊拉克战争的判断:如果大规模杀伤性武器(WMD)真的存在且是战争正当理由,为何决策者要不惜编造证据来支持?这种对真相的刻意掩盖,恰恰说明其基础可能站不住脚。
作者还提出“预测者若不可信,其预测毫无价值”的观点。他指出,布什、鲍威尔、斯特劳等高层官员在战前关于 WMD 的声明明显失实,因此他们的预测应被完全排除。相反,像斯科特·里特和安德鲁·威尔基这样未被证实说谎的专家,其观点更具可信度。
此外,作者强调“审计”的重要性——项目完成后必须回溯评估原预测的准确性,否则组织将不断重复错误。他批评美国在伊拉克战争中忽视了对决策者的问责机制,导致错误决策持续发生。
文章最后总结,对说谎者给予信任,是比“人身攻击”更危险的认知谬误。真正的理性判断应基于对信息来源诚信度的审视。作者预告下一篇将探讨为何人们不支持“通过谎言推动民主”的新保守主义中东战略。
https://news.ycombinator.com/item?id=47617415
https://www.theguardian.com/world/2026/apr/03/us-fighter-jet-confirmed-shot-down-over-iran
一架美国 F-15E“打击鹰”战斗机于 2026 年 4 月 3 日在伊朗境内被击落,成为本轮美伊冲突爆发近五周以来首架被击落的美军战机。事件发生后,美方展开紧急搜救行动,目前已确认一名机组人员被成功救出,另一名仍下落不明。
伊朗国家媒体发布照片,显示残骸来自 F-15E 战斗机,其尾翼标记与驻英国拉肯希思基地的第 494 中队飞机相符。尽管伊朗最初声称击落的是 F-35 隐身战机,但专家分析认为实际为 F-15E。美军官方尚未正式确认,但多名知情官员透露了相关情况。
美国总统特朗普在事件发生前曾宣称“已彻底击败伊朗”,并称战争“即将结束”。他在接受 NBC 采访时拒绝评论搜救行动,坚称不会影响对伊谈判,强调“这是战争”。
伊朗方面态度强硬,拒绝美国提出的 48 小时停火提议。一名伊朗商人悬赏 6 万美元奖励提供美军飞行员下落者,当地电视台也鼓励民众举报“敌方飞行员”。社交媒体上流传的伊朗革命卫队发布的照片显示,沙漠中发现一枚 F-15E 型号的弹射座椅,表明至少一名飞行员成功弹射逃生。
与此同时,伊朗媒体称已抓获飞行员,但该说法缺乏证实。另有报道称,同日一架 A-10“疣猪”攻击机在霍尔木兹海峡附近坠毁,但飞行员安全获救,伊朗方面称其防空系统击中了该机。
本轮冲突已造成 13 名美军人员死亡,300 人受伤,美军对伊朗境内超过 1.23 万个目标实施空袭。此前 3 月 1 日,三架 F-15E 曾因科威特防空系统误击而坠毁。
美军损失惨重,包括 16 架“死神”无人机在内的多架飞机被毁或受损,总损失估计超过 30 亿美元。F-15E 单价约 3100 万美元,新型号可达 1 亿美元。
此外,以色列对德黑兰和贝鲁特发动新一轮空袭,北部德黑兰传出剧烈爆炸声。据以色列方面消息,为配合美军搜救行动,以色列已暂停对相关区域的空袭。
特朗普在社交媒体上再次威胁摧毁伊朗基础设施,称“桥梁之后是发电站”,并宣称美军“尚未真正开始摧毁伊朗”。最新影像显示,他此前宣称摧毁的德黑兰—卡拉杰大桥已严重损毁,耗资 4 亿美元。
https://news.ycombinator.com/item?id=47628326
该网页是 freevacy.com 网站的 Cookie 同意声明页面,主要介绍网站如何使用 Cookie 以提升用户体验与服务效果。
网站仅使用 Cookie 提供更优质的信息与培训服务,分为四类:必要类、偏好类、统计类和营销类。必要类 Cookie(共 13 个)是网站正常运行所必需的,如页面导航和安全区域访问,包括 Cloudflare、Cookiebot、Google、Reviews.io 等提供的服务。偏好类 Cookie(1 个)用于记住用户的语言或地区设置。统计类 Cookie(4 个)由 Google 提供,用于匿名分析用户行为,如访问量、页面浏览情况等,不用于个人画像或广告追踪。营销类 Cookie(11 个)涉及 Google AdSense 和 YouTube,用于跨站追踪用户行为,以优化广告相关性,但网站明确表示不会将数据用于定向广告或用户画像。
此外,页面还提到“未分类”类 Cookie(0 个),表示目前无待分类的第三方 Cookie。网站使用 Cookiebot 管理用户同意,所有 Cookie 声明于 2026 年 3 月 19 日更新。
用户可随时通过页面调整或撤回 Cookie 同意,选择“仅使用必要 Cookie”、“自定义选择”或“允许所有 Cookie”。页面还提供隐私政策链接,强调用户可依据同意 ID 和日期联系网站处理个人数据请求。
https://news.ycombinator.com/item?id=47624736
https://gist.github.com/greenstevester/fc49b4e60a4fef9effc79066c1033ae5
本文为 2026 年 4 月针对搭载 Apple Silicon 芯片的 Mac mini(M1/M2/M3/M4/M5)用户,提供的一份详细、简洁的 Ollama 部署指南,重点实现 Gemma 4 模型的本地运行,支持自动启动、预加载和长期驻留。
核心目标:在 Mac mini 上稳定运行 Gemma 4 模型,确保低延迟响应和系统流畅性。
关键步骤包括:
ollama pull gemma4 下载默认 8B 版本(Q4_K_M 量化),约 9.6GB,推荐使用此版本以避免内存不足问题。ollama run gemma4:latest 测试模型响应,并检查 ollama ps 确认 GPU 使用率(如 86% GPU)。OLLAMA_KEEP_ALIVE="-1",防止模型因空闲被卸载,建议添加至 ~/.zshrc 实现持久化。注意事项:
附加功能:
localhost:11434 的 API 接口调用模型,兼容 OpenAI 格式。ollama list、ollama stop、ollama rm 等。更新亮点(v0.19+):
参考来源包括 Ollama 官方博客、v0.20.0 发布说明及 Google DeepMind 的 Gemma 4 公告。
https://news.ycombinator.com/item?id=47624731
https://news.ycombinator.com/item?id=47627407
We all know he’s wrong. The problem isn’t that he is wrong, it’s that we have elevated the wealthy into a status where they can be wrong, have no correction, and make decisions whole clothe which negatively affect the rest of us. All while being insulated from their negative world view.
John23832
我们都知道他错了。问题不在于他错了,而在于我们将富人捧到了一个可以犯错、无需改正,并能做出完全不顾后果的决定来危害我们的地位,同时,他们还被隔绝在对自己负面世界观的认知之外。
https://news.ycombinator.com/item?id=47623463
I think this is especially problematic (from Part 4 at https://isolveproblems.substack.com/p/how-microsoft-vaporized-a-trillion-2f5 ):
“The team had reached a point where it was too risky to make any code refactoring or engineering improvements. I submitted several bug fixes and refactoring, notably using smart pointers, but they were rejected for fear of breaking something.”
Once you reach this stage, the only escape is to first cover everything with tests and then meticulously fix bugs, without shipping any new features. This can take a long time, and cannot happen without the full support from the management who do not fully understand the problem nor are incentivized to understand it.
branko_d
我认为这一点尤其令人担忧(引用自该文章的第四部分,链接:https://isolveproblems.substack.com/p/how-microsoft-vaporized-a-trillion-2f5ff):
“团队已经走到了一个地步:进行任何代码重构或工程改进都风险太大。我提交了几次 Bug 修复和重构建议,特别是采用了智能指针,但由于担心破坏现有功能,这些都被驳回了。”
一旦陷入这种局面,唯一的出路就是先用测试覆盖一切,然后一丝不苟地修复 Bug,在此期间绝不能发布任何新功能。这往往需要耗费大量时间,而且如果没有管理层的全力支持,根本不可能实现。管理层既没有完全理解问题的严重性,也没有动力去深入了解。
https://news.ycombinator.com/item?id=47621010
I don’t know if any of this is true, but as a user of Azure every day this would explain so much.
The Azure UI feels like a janky mess, barely being held together. The documentation is obviously entirely written by AI and is constantly out of date or wrong. They offer such a huge volume of services it’s nearly impossible to figure out what service you actually want/need without consultants, and when you finally get the services up who knows if they actually work as advertised.
I’m honestly shocked anything manages to stay working at all.
yoyohello13
我不知道这些是不是真的,但作为一个每天使用 Azure 的用户,这能解释很多事情。
Azure 的界面感觉很烂、乱糟糟的,几乎勉强维持着。文档显然完全是 AI 写的,而且总是过时或错误。他们提供了如此庞大的服务规模,如果没有顾问,几乎不可能弄清楚你到底想要/需要什么服务,而且当你终于把服务搞起来后,谁知道它们是否真的像宣传的那样运作。
说实话,我很惊讶还有东西能一直保持正常运行。
https://news.ycombinator.com/item?id=47619626
The notch hiding menubar icons is such a stupid problem to have. I waste hours every week trying to help people who send me frustrated emails because they bought one of my apps and they say: “it doesn’t launch” or “why doesn’t it have any interface??”
No amount of FAQ will help these people. And this also results in hasty refund requests and even worse, chargebacks that take 2x the amount the users paid out of my pocket.
I recently helped my brother launch a simple app for making any window a PiP window ( https://lowtechguys.com/pipiri ) and in the first two days, half of the sales turned into refunds exactly because of this issue. People had so many menubar icons that they thought the app just doesn’t work. Not an encouraging launch for his first app.
Not to mention the fact that the best solution that helped alleviate this, the Bartender app, was completely broken by Apple’s internal API changes in macOS Tahoe.
This could have been handled better.
alin23
刘海屏遮挡菜单栏图标这真是个愚蠢的问题。我每周都要浪费好几个小时去帮助那些给我发沮丧邮件的人,因为他们买了我的一个应用后说:“打不开”或者“为什么一点界面都没有??”。
再多的常见问题解答也救不了这些用户。这也导致了退款请求过于仓促,更糟糕的是,随之而来的争议扣款会让我的损失翻倍——用户给了多少,我就得赔两倍出去。
我最近帮我兄弟发布了一个简单的小工具,能把任意窗口变成画中画窗口(https://lowtechguys.com/pipiri),结果前两天,因为这个问题,一半的销售额都变成了退款。菜单栏图标太多,人们以为这个软件根本没用。这对他的第一个应用来说,真不是什么鼓舞人心的开局。
更别提那个最好的解决方案——Bartender 应用,已经被苹果在 macOS Tahoe 中对内部 API 的修改彻底搞崩了。
本来可以处理得更好一点。
https://news.ycombinator.com/item?id=47628808
During the entire gulf war (Iraq, 1990-91), only two F-15s were shot down via surface-to-air engagement. At the time, Baghdad was known to have the highest density of SAM protection out of any city in the world.
An F-15 being shot down in Iran after weeks of strategic bombing of their anti-air defense systems is not a good sign.
roadbuster
在整个海湾战争(1990-91)期间,仅有两架F-15战机被地空火力击落。当时,巴格达是世界上防空系统密度最高的城市。
在对伊朗防空系统进行了数周的战略轰炸后,F-15战机在伊朗境内被击落,这可不是个好兆头。
https://news.ycombinator.com/item?id=47618946
Every time I get a new Mac, I run these commands to reduce the spacing between menu bar icons. Lets you fit at least 2x the number of items in the menu bar.
defaults -currentHost write -globalDomain NSStatusItemSpacing -int 2
defaults -currentHost write -globalDomain NSStatusItemSelectionPadding -int 2
corlinp
每次拿到新 Mac 时,我都会运行这些命令来减少菜单栏图标之间的间距。这能让菜单栏容纳至少双倍数量的项目。
defaults -currentHost write -globalDomain NSStatusItemSpacing -int 2
defaults -currentHost write -globalDomain NSStatusItemSelectionPadding -int 2
https://news.ycombinator.com/item?id=47618028
I bet OpenAI genuinely believes they’re using their money to help free media exist. And TBPN genuinely believes this is the right choice for economic freedom so they can continue to operate. I bet they even had a convo such as “we’ll never tell you what to say,” and both sides genuinely believed it.
But this never ends well. Even if there’s never a conversation about it, directly, the implication is there.
I don’t care about TBPN, specifically. I just really, really wish we had a better way for media to fund itself independently. (And I say this as someone who pays for some media, but not nearly enough. I don’t have $10/mo for every outlet that deserves it.)
EDIT: sama basically said what I said he would: https://x.com/sama/status/2039773740586918137
gkoberger
我敢打赌 OpenAI 真的相信他们正在用钱来帮助自由媒体生存。而 TBPN 也真心认为这是为了经济自由所做的正确选择,以便他们能够继续运营。我敢打赌他们甚至还讨论过类似“我们绝不会告诉你们该说什么”的协议,而且双方都真心相信这一点。
但这种局面从不会有一个好的结局。即使双方从未直接讨论过这件事,其中的暗示依然存在。
我并不特别在意 TBPN。我只是真的、真的很希望媒体能有一种更好的方式来独立融资。(我这么说是因为我自己也会为一些媒体付费,但付得远远不够。我没有足够的钱给每一个配得上的媒体每月付 10 美元。)
编辑:sama 基本上说了我会让他说的话:https://x.com/sama/status/2039773740586918137
https://news.ycombinator.com/item?id=47617159
Daniel, your work is changing the world. More power to you.
I setup a pipeline for inference with OCR, full text search, embedding and summarization of land records dating back 1800s. All powered by the GGUF’s you generate and llama.cpp. People are so excited that they can now search the records in multiple languages that a 1 minute wait to process the document seems nothing. Thank you!
evilelectron
Daniel,你正在改变世界。为你喝彩。
我搭建了一个推理流程,用于处理19世纪以来的土地记录,包含OCR识别、全文搜索、向量嵌入和内容摘要。所有这些功能都由你生成的 GGUF 文件和 llama.cpp 驱动。人们非常兴奋,因为他们现在可以用多种语言搜索这些记录,因此等待一分钟来处理文档似乎完全不算什么。谢谢你!
https://news.ycombinator.com/item?id=47627653
The reason he and Musk are anti-introspection is that when they do it, it hurts. Because they are terrible people.
Better to just not think about it.
foobiekr
他和马斯克不反思的原因是,当他们这么做的时候,会感到痛苦。因为他们是糟糕透顶的人。最好还是别去想。
https://news.ycombinator.com/item?id=47627175
I worked on a disk utility in the 90s called PartitionMagic that was one of the first ones to let you dynamically resize disk partitions.
Maybe Samsung used that when naming their product.
I am old, but I miss the days when the install process was copy. to /<appFolder> and the uninstall process was delete /<appFolder>
didgetmaster
我在90年代参与开发过一款名为 PartitionMagic 的磁盘工具,它是首批允许动态调整磁盘分区大小的工具之一。也许三星在给他们的产品命名时用了这个名字。
我老了,但我怀念那段时光,那时候安装就是 copy to /<appFolder>,卸载就是 delete /<appFolder>。
https://news.ycombinator.com/item?id=47621780
Is Azure really this unreliable? There are concrete numbers in this blog. For those who use Azure, does it match your external experience?
IME, yes.
I’m currently working as an SRE supporting a large environment across AWS, Azure, and GCP. In terms of issues or incidents we deal with that are directly caused by cloud provider problems, I’d estimate that 80-90% come from Azure. And we’re really not doing anything that complicated in terms of cloud infrastructure; just VMs, load balancers, some blob storage, some k8s clusters.
Stuff on Azure just breaks constantly, and when it does break it’s very obvious that Azure:
Does not know when they’re having problems (it can take weeks/months for Azure to admit they had an outage that impacted us)
Does not know why they had problems (RCAs we’re given are basically just “something broke”)
Does not care that they had problems
Everyone I work with who interacts with Azure at all absolutely loathes it.
bumblehean
Azure 真的这么不可靠吗?这篇博客里有具体的数据。对于那些使用 Azure 的人来说,这符合你们的外部使用体验吗?
据我经验,是的。
我目前在一家公司担任 SRE(站点可靠性工程师),负责维护跨 AWS、Azure 和 GCP 的大规模环境。就我们处理的问题或事故而言,这些是直接由云厂商导致的问题,据我估计,其中 80-90% 来自 Azure。而在云基础设施方面,我们做的并不算复杂;仅仅是虚拟机、负载均衡器、一些 Blob 存储和 k8s 集群。
Azure 上的东西总是频频出问题,而且当它们出问题时,很明显是 Azure 的原因:
我身边所有和 Azure 打交道的同事,都极其厌恶它。
https://news.ycombinator.com/item?id=47615163
I worked in EdTech about a decade ago and our education/pedagogy experts were already talking about this. They also talked a lot about how handwriting is super important for cognitive development.
After working on that company for a couple of years I realized using tech in education (pre university) was a mistake. One of the reasons I left.
In a decade or two the long term consequences of inundating kids with tech and then removing it will be quite obvious. This will be studied for decades to come. Reminds me of the Dutch kids that were borm during the 1944-1945 Dutch famine.
https://www.ohsu.edu/school-of-medicine/moore-institute/dutch-famine-birth-cohort
pier25
十年前我在教育科技行业工作,我们的教育及教学法专家就一直在讨论这个问题。他们还谈到了书写对认知发展是多么的重要。
在那家公司工作了几年后,我意识到在大学前的教育阶段使用科技是一个错误,这也是我离开的原因。
在一二十年左右,过度向孩子们灌输科技,随后又将其撤除的长期后果将变得非常明显。这将是未来几十年的研究课题。这让我想起了那些在1944-1945年荷兰饥荒期间出生的孩子。
https://www.ohsu.edu/school-of-medicine/moore-institute/dutch-famine-birth-cohort
https://news.ycombinator.com/item?id=47626230
Fix the title. No one seems to recognize “TDF” (The Document Foundation) despite their daily dramatics, myself included.
cap11235
修改标题。尽管他们日常闹剧不断,似乎也没人认得 ‘TDF’ (The Document Foundation),包括我在内。
https://news.ycombinator.com/item?id=47627548
Is the 1 percenters getting dumber or acting like it?
Like 10 years ago, I felt like Andreesen and Elon were thought leaders. Now they sound like idiots.
Did I or did they change?
Did I grow up and they changed to a younger audience and what I used to enjoy was just a different kind of stupid?
wodenokoto
那些顶层精英(1%的人)是真变傻了还是在装傻? 就像10年前,我觉得马克·安德森和埃隆·马斯克是思想领袖。现在他们听起来像白痴。 是我变了,还是他们变了? 是我长大了,还是他们迎合了更年轻的受众,而我以前喜欢的其实只是另一种形式的愚蠢?
https://news.ycombinator.com/item?id=47619752
I’ve been running Claude Code in my Cursor IDE for a while now via extension. I like the setup, and I direct Claude on one task at a time, while still having full access to my code (and nice completions via Cursor). I still spend time tweaking, etc. before committing. I have zero interest in these new “swarms of agents” they are trying to force on us from every direction. I can barely keep straight my code working on one feature at a time. AI has greatly helped me speed that up, but working serially has resulted in the best quality for me. I’ll likely drop Cursor for good now and switch back to vanilla VsCode with CC.
nu11ptr
我一直通过扩展在 Cursor IDE 中使用 Claude Code。我喜欢这种配置,我让 Claude 一次只处理一个任务,同时我仍然可以完整访问我的代码(并享受 Cursor 提供的不错补全功能)。提交前,我仍然会花时间进行微调等操作。我对这种新推出的、四面八方强推给我们的“智能体群”毫无兴趣。我甚至难以理清一次处理一个功能时的代码状态。AI 大大加快了我的速度,但对于我来说,串行操作带来的代码质量最好。我现在很可能彻底放弃 Cursor,转而使用带 CC 的原生 VSCode。
https://news.ycombinator.com/item?id=47628115
Tim Dillon said summarized it pretty well - can’t remember or find the exact quote. Something to the effect of:
“Look around at all these things I have - how could I be wrong when I have so much?”
And that’s how you get the Andreessen’s and Musk’s of the world stating these nonsensical things as truth. In their minds, financial success is the ultimate yardstick. The fact that they have so much wealth is a testament that their way of thinking is always right.
You don’t need to look very hard to see this is what they really believe. Elon has done extremely silly things like claiming he was the best Path of Exile player in the world because he paid several people grind his account to a high-level. Having enough money to pay someone to play the game for you, is the same as being good at the game, in his mind.
rybosworld
Tim Dillon 这句话总结得很到位——记不清也找不到原话了。大概是这个意思:
“环顾四周看看我拥有的一切——拥有这么多东西怎么可能是我错了?”
这也就是为什么会出现像安德森-霍洛维茨和马斯克这样的人把这种无稽之谈当作真理说出来的原因。在他们脑子里,财务成功就是终极的衡量标准。他们拥有巨额财富这一事实,就是他们的思维方式始终正确的证明。
你不需要费力去找,就能看出这确实是他们真心相信的。埃隆做过极其荒唐的事,比如声称自己是《流放之路》世界顶级玩家,因为他花钱雇佣几个人帮他刷到了高等级账号。在他看来,拥有足够的钱请别人帮你玩游戏,就和你自己玩得好是一样的事。