2026-03-07 07:42:56
- OpenAI 发布面向专业工作的 GPT-5.4,具备可中途调整的 Thinking 模式、原生跨应用操作能力、百万 token 上下文窗口并推出 ChatGPT for Excel,提升事实准确性与工具调用效率。
- 一篇未经同行评审的研究在去除自然变率后发现自2015年以来全球变暖速率显著加快,进一步指向人为活动为主要驱动力。
- System76 创始人批评拟议的年龄验证法会侵害隐私、集中化控制并威胁开源与计算探索自由,主张以数字素养教育替代强制技术验证。
- Anthropic CEO 对国防部将其列为供应链安全风险的决定发表声明并道歉,称将通过法律途径抗争,同时反对 AI 用于完全自主武器与大规模监控。
- 美国 2 月非农意外减少 9.2 万就业、失业率上升,显示劳动力市场降温并使美联储在降息与防通胀间左右为难。
- 康奈尔研究开发的“企业废话接受度量表”表明偏好抽象商业术语的员工在分析思维与决策测试中表现较差,建议在招聘中警惕此类特征。
- 回顾石英危机时期瑞士钟表业的变迁,少数品牌通过品牌叙事、稀缺性与身份象征将产品从工具化转为奢侈品实现复兴,凸显品牌价值。
- Anthropic 与 Mozilla 合作用 Claude 在两周内发现并提交多处 Firefox 漏洞并促成修复,表明 AI 可低成本辅助漏洞发现但仍需人工验证与多层防护。
- 美国国防部正式将 Anthropic 列为供应链安全风险企业,激化公司与政府关系并引发对创新与国家安全平衡的担忧。
- 调查称 Proton Mail 在司法要求下向瑞士当局提供与匿名抗议者相关的支付标识符并被转交给 FBI,凸显隐私服务在法律压力下可能泄露非加密数据。
https://openai.com/index/introducing-gpt-5-4/
OpenAI 于 2026 年 3 月 5 日发布 GPT-5.4,这是专为专业工作设计的前沿模型,已在 ChatGPT、API 和 Codex 中上线。GPT-5.4 Thinking 版本支持在回答过程中提供初步计划,用户可中途调整,提升输出与需求的契合度。其在深度网络研究方面表现更优,尤其擅长处理高度具体的问题,并保持长时上下文连贯性。
在编程与工具使用方面,GPT-5.4 是首个具备原生计算机操作能力的通用模型,支持高达 100 万 token 的上下文,可跨应用执行复杂工作流。它能通过 Playwright 编写代码,响应截图并操作鼠标键盘,具备开发者可配置的可调节行为与安全策略,适用于不同风险场景。
GPT-5.4 Pro 版本面向对性能要求更高的复杂任务用户。模型在多个基准测试中表现领先:在 GDPval(专业工作能力评估)中达到 83.0%,超越 GPT-5.2 的 70.9%;在 SWE-Bench Pro 中达 57.7%;OSWorld-Verified 成功率达 75.0%,显著高于 GPT-5.2 的 47.3%;在 WebArena-Verified 和 Online-Mind2Web 测试中也取得领先表现。
在知识工作方面,GPT-5.4 在电子表格、文档和演示文稿生成方面大幅提升。在投行级建模任务中平均得分 87.3%,远超 GPT-5.2 的 68.4%;在演示文稿评估中,68% 的人类评审更偏好 GPT-5.4 的输出,因其视觉效果更佳、图像运用更优。
该模型在事实准确性方面也取得突破,相比 GPT-5.2,其单个陈述错误率降低 33%,完整响应中含错误的概率降低 18%。法律领域应用中,GPT-5.4 在 BigLaw Bench 评测中得分 91%,在复杂合同分析和长文本准确性方面表现突出。
此外,OpenAI 推出 ChatGPT for Excel 插件,助力企业用户高效处理数据。GPT-5.4 还优化了工具搜索与调用效率,支持多工具并行执行,减少延迟。整体上,GPT-5.4 在推理效率、任务完成质量与成本控制方面均实现显著提升,是目前最高效、最可靠的前沿模型之一。
https://news.ycombinator.com/item?id=47265045
https://www.researchsquare.com/article/rs-6079807/v1
本文为一篇尚未经过同行评审的预印本,由 Stefan Rahmstorf 与 Grant Foster 撰写,探讨全球变暖是否已显著加速。文章指出,尽管近年来创纪录的高温引发了关于变暖加速的讨论,但早期分析因未充分考虑自然气候变率,未能在 95% 置信水平上确认加速趋势。
研究团队引入了三个主要自然变率因素进行修正:厄尔尼诺现象、火山活动和太阳辐射变化。经过调整后的全球气温数据表明,自 2015 年以来,全球气温上升速度显著快于 1945 年以来的任何其他 10 年期。
该研究强调,排除自然波动影响后,全球变暖的加速趋势已变得明显,进一步支持人类活动导致气候变化的科学共识。文章发布于 Research Square 平台,供学术界早期分享与反馈,有助于推动后续正式期刊发表前的讨论与完善。
https://news.ycombinator.com/item?id=47275088
https://blog.system76.com/post/system76-on-age-verification/
本文由 System76 创始人 Carl Richell 撰写,探讨了美国部分州推行的年龄验证法律对计算机使用自由的影响。作者以自身童年经历为引,回忆了 1990 年代对知识和科技的渴望,对比今日孩子通过互联网轻松获取信息的能力,强调当代儿童在数字世界中的学习与探索能力远超过去。
文章指出,科罗拉多州和加利福尼亚州的法案要求操作系统向应用商店和网站报告用户年龄,限制未成年人独立创建账户。然而,这些规定在实践中形同虚设——儿童可通过虚拟机、重装系统或谎报年龄轻松绕过限制。作者以孩子用 ChatGPT“添加 El Mencho”到合照为例,说明孩子们不仅聪明,而且能迅速找到规避规则的方法。
更令人担忧的是纽约州拟议的 S8102A 法案,要求所有联网设备用户必须通过第三方验证身份,甚至可能将下载 Linux 系统的个人视为“设备制造商”,这严重威胁隐私与自由。作者认为,这种集中化控制的平台模式,最终会将用户置于更大权力的控制之下。
作者强调,计算机是人类最强大、最灵活的技术工具,其开放性是推动创新与个人自由的关键。许多顶尖程序员都是在童年时期通过自由探索计算机而成长起来的。限制儿童接触技术,等于限制了他们未来的可能性。
最后,作者呼吁社会应重视数字素养教育,而非通过技术手段封锁信息。真正的解决方案不是加强审查,而是教会孩子如何在数字世界中安全、理性地行动。他相信,无论法律如何限制,孩子们总会找到出路——正如他们能轻松“请来”El Mencho 一样。
https://news.ycombinator.com/item?id=47270784
https://www.anthropic.com/news/where-stand-department-war
Anthropic CEO Dario Amodei 发布声明,回应美国国防部(Department of War)于 2026 年 3 月 4 日发函,将 Anthropic 列为供应链安全风险企业。公司认为该决定在法律上站不住脚,已决定通过法律途径挑战。
声明指出,该认定仅适用于客户在与国防部合同中直接使用 Claude 的情况,不影响其他业务关系或非合同用途。相关法律(10 USC 3252)旨在保护政府供应链,而非惩罚供应商,且要求采取最少限制的措施。
Anthropic 强调,其与国防部已有积极合作,支持前线作战人员在情报分析、作战规划、网络行动等关键领域的应用。公司始终认为,AI 不应介入军事操作决策,其唯一关切是完全自主武器和大规模国内监控,这些属于高阶使用范畴,而非日常作战支持。
针对内部泄密邮件引发的争议,Amodei 致歉,称该邮件情绪化,反映的是事发当天(3 月 4 日)的即时反应,不代表公司正式立场,且内容已过时。
目前,Anthropic 承诺以象征性成本向国防部及国家安全机构持续提供模型支持,确保过渡平稳,保障作战行动不受影响。
公司重申,与国防部在维护美国国家安全和加速 AI 在政府应用方面有共同目标,未来所有决策都将基于这一共识。
https://news.ycombinator.com/item?id=47269263
https://www.bbc.com/news/articles/cjd98091g28o
美国 2025 年 2 月经济数据意外显示,就业市场出现显著下滑,非农就业人数减少 9.2 万人, unemployment rate 上升至 4.4%,超出市场预期。这是自 2024 年 10 月政府停摆以来最大的单月就业降幅,引发对劳动力市场是否正在走弱的担忧。
多个行业均出现裁员,包括以往表现稳健的医疗保健行业,该行业受罢工影响严重。联邦政府雇员数量继续减少,2024 年 10 月达到峰值以来已减少 33 万人,降幅达 11%。同时,去年 12 月和 1 月的就业增长数据也被下调。
分析人士认为,这一数据打击了市场对就业市场复苏的乐观预期。Pantheon Macroeconomics 首席美国经济学家萨缪尔·托姆斯指出,所谓“就业市场触底反弹”的说法已不成立。
股市因此走低,政治层面也迅速反应。民主党批评白宫经济政策导致就业市场恶化,而白宫方面则表示仍对经济前景保持信心,称未来将有大量就业机会。国家经济委员会主任凯文·哈塞特表示,经济活动将推动就业增长。
该数据也给美联储带来政策困境:若经济放缓,通常需降息刺激;但近期因美以冲突引发油价上涨,可能加剧通胀压力,使美联储在降息决策上更加谨慎。摩根士丹利首席经济策略师艾伦·赞特纳表示,当前数据使美联储陷入“两难境地”。
https://news.ycombinator.com/item?id=47275035
一项由康奈尔大学心理学家肖恩·利特雷尔(Shane Littrell)主导的新研究发现,对职场中空洞抽象的“企业废话”(如“协同领导力”“增长黑客范式”)表现出高度兴趣的员工,往往在实际工作决策能力上表现较差。
研究团队开发了“企业废话接受度量表”(CBSR),用于衡量个体对这类模糊但听起来高大上的商业术语的敏感程度。通过超过 1000 名办公人员的测试,研究发现:
研究指出,企业废话虽常被用作包装,但会掩盖真实信息,导致组织效率下降。例如,2009 年百事可乐的营销提案因充斥“边界振荡”“引力拉力”等术语而遭媒体嘲讽;2014 年微软一封长达十段的冗长邮件,将裁员 1.25 万人的重大消息藏在最后,引发广泛批评。
研究强调,企业废话的泛滥可能带来声誉和财务风险。建议员工在面对复杂术语时保持警惕,多问一句:“这到底在说什么?是否合理?” 该量表未来或可用于招聘评估,帮助识别具备批判性思维的候选人。
https://news.ycombinator.com/item?id=47274676
https://paulgraham.com/brandage.html
20 世纪 70 年代初,瑞士钟表业遭遇了被称为“石英危机”的三重打击:日本的竞争、布雷顿森林体系崩溃导致法郎升值,以及石英机芯的出现。日本在 1968 年 Geneva Observatory 测试中包揽机械表前三名,标志着其在精度和成本上的全面超越。布雷顿森林体系瓦解后,瑞士法郎大幅升值,使瑞士手表对美国消费者而言价格飙升至原来的 2.7 倍。而石英机芯的出现则彻底改变了游戏规则——精准计时从稀缺技术变为廉价商品。
在此背景下,瑞士钟表业的单位销量在 1970 至 1980 年间下降近三分之二,多数品牌破产或被收购。但少数幸存者,如百达翡丽、江诗丹顿和爱彼,成功转型为奢侈品牌。他们不再以技术精度为核心卖点,而是转向品牌价值、稀缺性营销和身份象征。这种转变使瑞士钟表业的收入并未崩溃,反而在 1980 年代后期迎来爆发式增长。
这一转型揭示了现代经济中一个核心趋势:当技术使产品同质化时,品牌成为唯一差异化的手段。瑞士钟表业的“黄金时代”(1945–1970)以极致的薄度与精准为核心追求,而如今的高端手表已不再强调功能,而是强调文化、历史与地位。百达翡丽等品牌通过重新设计表壳、强化品牌叙事,完成了从精密仪器制造商到奢侈品品牌的蜕变。
相比之下,欧米茄等坚持技术路线的品牌未能适应变化,最终陷入困境。这说明在技术快速迭代的时代,仅靠性能优势已不足以维系竞争力。瑞士钟表业的兴衰,正是品牌力量战胜技术同质化的经典案例。
https://news.ycombinator.com/item?id=47264756
https://www.anthropic.com/news/mozilla-firefox-security
Anthropic 与 Mozilla 合作,利用 Claude Opus 4.6 模型在两周内发现 22 个 Firefox 安全漏洞,其中 14 个被 Mozilla 认定为高严重性漏洞,占 2025 年所有高危漏洞修复数的近五分之一。这一成果远超 2025 年任何单月报告的漏洞数量,标志着 AI 在安全漏洞发现方面实现显著提速。
研究团队首先在旧版 Firefox 代码中验证了 Claude 对已知 CVE 的复现能力,随后转向当前版本,重点分析 JavaScript 引擎。仅 20 分钟后,Claude 便发现首个“使用后释放”(Use After Free)漏洞,经多方验证后提交至 Mozilla 的 Bugzilla 系统,并附带由 AI 生成的修复方案。在后续扫描中,团队共提交 112 份报告,涵盖近 6000 个 C++ 文件,大部分漏洞已在 Firefox 148 版本中修复。
Mozilla 积极协作,允许团队批量提交未经逐个验证的漏洞报告,显著提升效率。同时,团队探索了 AI 在漏洞利用方面的能力,测试 Claude 是否能将发现的漏洞转化为真实攻击。尽管在约 4000 美元的 API 成本下仅成功构建出两个可运行的粗略攻击,但已能实现本地文件读写,证明 AI 具备初步的自动化攻击潜力。
研究显示,AI 在漏洞发现上的成本远低于漏洞利用,且当前攻击仅在移除沙箱等安全机制的测试环境中有效。这表明现代浏览器的“纵深防御”机制仍具有效性,但 AI 生成攻击的潜力不容忽视。
该合作为 AI 与安全维护者协同工作提供了可复制的模式,未来将推动 AI 在漏洞检测、修复验证及安全研究中的深度应用。
https://news.ycombinator.com/item?id=47273854
美国国防部正式将人工智能公司 Anthropic 列为供应链安全风险企业,此举加剧了该公司与美国政府之间的紧张关系。这一决定被认为是对 Anthropic 在特朗普政府时期未能积极迎合其政策立场的回应。
Anthropic 首席执行官达里奥·阿莫迪(Dario Amodei)对此公开道歉,承认公司内部曾泄露一份批评政府政策的备忘录,但强调该举动并非出于政治动机,而是出于对技术伦理和国家安全的担忧。
公司表示将采取法律手段应对这一认定,认为该标签缺乏充分证据支持,且可能对美国 AI 产业的创新环境造成负面影响。Anthropic 指出,其与国防部的合作项目仍在推进,但此次事件暴露了政府在监管 AI 企业时的潜在政治化倾向。
分析认为,此次事件反映出美国在 AI 治理领域日益加剧的政商矛盾,也凸显了技术公司如何在国家安全与创新自由之间寻求平衡的挑战。
https://news.ycombinator.com/item?id=47266084
https://www.404media.co/proton-mail-helped-fbi-unmask-anonymous-stop-cop-city-protestor/
一篇由 404 Media 发布的调查文章指出,隐私导向的电子邮件服务 Proton Mail 向瑞士政府提供了与“阻止警察城市”(Stop Cop City)运动相关的匿名邮箱账户的支付数据,该数据随后被瑞士政府转交给了美国联邦调查局(FBI)。
文章援引一份法院文件,揭示了 Proton Mail 虽以端到端加密和遵守瑞士隐私法为宣传重点,但在特定情况下仍会配合执法机构提供用户信息。此次涉及的账户与亚特兰大的“保卫亚特兰大森林”(DTAF)组织及 Stop Cop City 抗议运动有关,该运动因涉嫌纵火、破坏和网络人肉等行为受到调查。目前,针对超过 60 名相关人员的指控已被撤销。
文章强调,这一事件暴露了即使在号称最注重隐私的加密服务中,用户数据仍可能在法律压力下被披露,尤其涉及支付信息这类非加密数据。这也引发了对“隐私承诺”真实性的广泛讨论。
该报道由记者约瑟夫·考克斯撰写,发布于 2026 年 3 月 5 日,属于 404 Media 的付费订阅内容,其平台致力于独立、深度的科技与社会议题调查报道。
https://news.ycombinator.com/item?id=47267628
https://news.ycombinator.com/item?id=47269515
It is incredible how far the overton window has moved on this issue.
When I graduated in 2007, it was common for tech companies to refuse to let their systems be used for war, and it was an ordinary thing when some of my graduating classmates refused to work at companies that did let their systems be used for war. Those refusals were on moral grounds.
Now Anthropic wants to have two narrow exceptions, on pragmatic and not moral grounds. To do so, they have to couch it in language clarifying that they would love to support war, actually, except for these two narrow exceptions. And their careful word choice suggests that they are either navigating or expect to navigate significant blowback for asking for two narrow exceptions.
My, the world has changed.
hglaser
关于这个问题,奥尔顿窗口的移动范围之大,真是难以置信。
2007年我毕业时,科技公司拒绝让他们的系统被用于战争是很常见的事,而且我的一些同学也理所当然地拒绝在那些允许其系统被用于战争的公司工作。这些拒绝都是基于道德立场。
而现在,Anthropic想要有两个特定的例外,这是出于务实而非道德的考虑。为此,他们必须用一种特定的措辞来表达,即他们其实非常乐意支持战争,只是除了这两个有限的例外。他们谨慎的措辞表明,他们正在处理,或者预料到会因为提出这两个例外而面临巨大的反弹。
唉,世界已经变了。
https://news.ycombinator.com/item?id=47275199
I do not see the tourism industry mentioned here but I have to imagine that is a huge loss right now.
Most of the world is not visiting the US right now which means projects and planning that was made in anticipation for summer has probably been halted or heavily reduced.
testfrequency
虽然这里没有提到旅游业,但我相信目前这必定是一个巨大的损失。
现在世界上大多数人没有来美国旅游,这意味着那些为了夏季旅游而规划和启动的项目可能已经暂停或大幅削减了。
https://news.ycombinator.com/item?id=47278863
In my experience, tech employment is incredibly bimodal right now. Top candidates are commanding higher salaries than ever, but an “average” developer is going to have an extremely hard time finding a position.
Contrary to what many say, I don’t think it’s simple as seniors are getting hired and juniors aren’t. Juniors are still getting hired because they’re still way cheaper and they’re just as capable as using AI as anyone. The people getting pushed out are the intermediates and seniors who aren’t high performers.
mjr00
根据我的经验,目前科技行业的就业情况呈现出极其明显的双峰分布。顶尖人才能拿到比以往任何时候都高的薪水,但一位“普通”的开发者将会非常艰难地找到一份工作。
与许多人的看法不同,我并不认为事情只是资深人士被雇佣,而初级人员找不到工作那么简单。初级人员仍然在被雇佣,因为他们仍然便宜得多,而且在使用AI方面和任何人一样有能力。被淘汰的是那些表现不佳的中级和高级开发人员。
https://news.ycombinator.com/item?id=47271273
I don’t like to shill for companies, but I’m glad System76 made a statement. The addendum does feel like their legal team made them add it though:
Some of these laws impose requirements on System76 and Linux distributions in general. The California law, and Colorado law modeled after it, were agreed in concert with major operating system providers. Should this method of age attestation become the standard, apps and websites will not assume liability when a signal is not provided and assume the lowest age bracket. Any Linux distribution that does not provide an age bracket signal will result in a nerfed internet for their users.
We are accustomed to adding operating system features to comply with laws. Accessibility features for ADA, and power efficiency settings for Energy Star regulations are two examples. We are a part of this world and we believe in the rule of law. We still hope these laws will be recognized for the folly they are and removed from the books or found unconstitutional.
Anyways, it feels like all sides of the political spectrum are trying to strip away any semblance of anonymity or privacy online both in the US and abroad. No one should have to provide any personal details to use any general computing device. Otherwise, given the pervasive tracking done by corporations and the rise of constant surveillance outdoors, there will be nowhere for people to safely gather and express themselves freely and privately.
Tyrubias
我不喜欢为公司站台,但很高兴看到 System76 发表了声明。不过,这份补充说明确实感觉像是他们的法律团队让他们加上的:
这些法律中有些对 System76 以及通用的 Linux 发行版提出了要求。加州法律以及仿效其制定的科罗拉多州法律,是与主要操作系统提供商共同商定的。如果这种年龄认证方式成为标准,那么当应用程序和网站没有收到信号时,将不会承担责任,并默认用户处于最低年龄段。任何不提供年龄段信号的 Linux 发行版,都将导致其用户的互联网体验受到限制。
我们习惯于通过添加操作系统功能来遵守法律。例如,为遵守《美国残疾人法案》而添加的无障碍功能,以及为遵守能源之星法规而添加的能效设置,就是两个例子。我们是这个社会的一份子,我们信奉法治。我们仍然希望这些法律能被认识到其本质上的愚蠢,从而被废除,或者在法庭上被裁定为违宪。
话说回来,感觉在美国乃至全球,政治光谱的各方势力都在试图剥离网络上任何形式的匿名或隐私。没有人需要为了使用任何通用计算设备而提供个人信息。否则,在各大企业无处不在的追踪以及户外持续监控日益普及的情况下,人们将无处可以安全、自由且私密地聚集和表达自我。
https://news.ycombinator.com/item?id=47262991
Ignore feature requests — don’t build what users ask for; understand the underlying problem instead
not quite in the same area, but this advice reminds me of blizzard and world of warcraft. for years and years, people requested a “classic” WoW (for non-players, the classic version is an almost bug-for-bug copy of the original 2004-2005 version of the game).
for years and years, the reply from blizzard was “you think you want that, but you dont. trust us, you dont want that.”
they eventually caved and launched classic WoW to overwhelming success. some time later, in an interview, ion hazzikostas (the game director) and holly longdale (vice president & executive producer), admitted that they got WoW classic very wrong and that the people “really did know what they want”.
anyways, point being that sometimes the person putting in the feature request knows exactly what they want and they have a good idea. while your default mode might be (and perhaps should be) to ignore feature requests, it is worth recognizing that you may be doing so at your own loss. after all, you might not not be able to fully understand every underlying problem of every user of your product – but you might understand how to code the feature that they asked for.
john_strinlai
忽视用户的功能请求——不要去建造用户所要求的;而是去理解其背后的根本问题。
虽然不完全在同一领域,但这条建议让我想起了暴雪和《魔兽世界》。多年来,玩家们一直要求推出“经典版”《魔兽世界》(对于非玩家来说,经典版是对2004至2005年原版游戏几乎一模一样的复刻)。
多年来,暴雪的回应始终是:“你们以为你们想要,但你们并不想要。相信我们,你们不想要那个。”
他们最终还是在巨大的成功压力下妥协,并推出了经典版《魔兽世界》。后来,在一次采访中,游戏总监Ion Hazzikostas和副总裁兼执行制作人Holly Longdale承认,他们对《魔兽世界:经典版》的看法完全错了,并且那些人“确实知道自己想要什么”。
总之,重点是,有时提出功能请求的人完全清楚自己想要什么,而且他们有很好的想法。虽然你的默认模式(或许也理应如此)是忽视功能请求,但你必须认识到,你可能会因此错失良机。毕竟,你可能无法完全理解你产品每一位用户的所有潜在问题——但也许你恰好懂得如何实现他们所要求的功能。
https://news.ycombinator.com/item?id=47275588
This is open access. No need to post a researchgate link.
Here’s the original: https://doi.org/10.21203/rs.3.rs-6079807/v1
afandian
这是开放获取,无需发布 ResearchGate 的链接。原文链接如下:https://doi.org/10.21203/rs.3.rs-6079807/v1
https://news.ycombinator.com/item?id=47275201
Unexpectedly, if you’ve been in a coma for the past year.
Let’s raise tariffs again.
ChoGGi
意外的是,如果你在过去一年里一直处于昏迷状态。 让我们再次提高关税吧。
https://news.ycombinator.com/item?id=47261834
Here’s a gift link to access it if you don’t have a subscription:
SyneRyder
https://news.ycombinator.com/item?id=47275439
Last year we cancelled a planned US vacation, this year we didn’t even think about it. Going back to Europe two years in a row. I don’t give a fuck about tariff policy of our supposed “friends” but when our “friend” repeatedly threatens our independence and sovereignty, no thanks. Not going to step into the USA for a long time.
TwoNineA
去年我们取消了计划好的美国假期,今年我们甚至都没有考虑过。连续两年重返欧洲。我才不在乎我们所谓“朋友”的关税政策,但当我们的“朋友”一再威胁我们的独立和主权时,免了。很长一段时间内我不会踏入美国。
https://news.ycombinator.com/item?id=47270015
Around 10 years ago, in college, in Calculus class I had a very ambitious classmate, wanted to go to DARPA and work on Robotics. I asked if he was thinking it through solely from technical perspective or considering ethics side as well. Clearly, he didn’t understand the question and I directly inquired - what if the code you write or autonomous machine you contribute to used for killing? His response - that’s not my problem.
After spending couple of years studying in the US, I came to conclusion that executives and board members in industry doesn’t care about society or humans, even universities don’t push students towards critical thinking and ethics, and all has turned into a vocational training, turning humans into crafting tools.
The same time, at Harvard, I attended VR innovation week and the last panel discussion of the day was Ethics and Law, which was discussed by Law Professor, a journalist and a moderator and was attended a handful of people. I inquired why founders, CEOs or developers weren’t in part of the discussion or in attendance? Moderator responded that they couldn’t find them qualified enough to take part in the discussion. The discussion basically was - how product companies build affects the society? Laws aren’t founders problem, that’s what lawyers are for, and ethics - who cares, right?
This frenzy, this rat race towards next billion dollar company at any cost, has tore down the fabric of the society to the individual thinking level; or more like not thinking, just wanting and needing.
agigao
大约十年前,我在大学上微积分课时,有个雄心勃勃的同学,想去DARPA工作,投身机器人领域。我问他,他是否从纯技术角度考虑过,还是也兼顾了伦理层面。显然,他没明白我的问题,于是我直接问——如果你写的代码或你参与研发的自主机器被用于杀人,那该怎么办?他的回答——那不关我的事。
在美国学习了几年后,我得出结论:行业里的高管和董事会成员根本不在乎社会或人类,甚至连大学都不鼓励学生进行批判性思考和伦理探讨,一切都变成了职业培训,把人变成了打造工具的工匠。
与此同时,在哈佛,我参加了一场为期一周的VR创新活动,当天的最后一场讨论是关于伦理与法律的。参与讨论的是一位法学教授、一位记者和一位主持人,但听众寥寥无几。我问为什么没有创始人、CEO或开发者参与讨论或出席?主持人回答说,他们找不到足够有资格参与讨论的人。这场讨论的核心内容是——产品公司的构建方式如何影响社会?法律不是创始人的问题,那是律师该干的,而伦理——谁在乎呢,对吧?
这种狂热,这种不惜一切代价追逐下一个十亿美元公司的竞争,已经从社会层面撕扯到了个体的思想层面;或者说,更像是没有了思考,只剩下欲望和需求。
https://news.ycombinator.com/item?id=47268906
ECC should have become standard around the time memories passed 1GB.
It’s seriously annoying that ECC memory is hard to get and expensive, but memory with useless LEDs attached is cheap.
Animats
内存容量超过 1GB 的时候,ECC 内存本就应该成为标准。
可恼的是,ECC 内存既难买到又贵,而那些 useless LEDs 内存却很便宜。
https://news.ycombinator.com/item?id=47272263
Cline’s (now removed) issue triage workflow ran on the issues event and configured the claude-code action with allowed_non_write_users: “*”, meaning anyone with a GitHub account can trigger it simply by opening an issue. Combined with –allowedTools “Bash,Read,Write,Edit,Glob,Grep,WebFetch,WebSearch”, this gave Claude arbitrary code execution within default-branch workflow.
Has everyone lost their minds? AI agent with full rights running on untrusted input in your repo?
yread
Cline(现已移除)的问题分类工作流在 issues 事件上运行,并通过配置 claude-code action 的 allowed_non_write_users: "*",这意味着任何拥有 GitHub 账户的人只需打开一个问题就能触发它。再结合 --allowedTools "Bash,Read,Write,Edit,Glob,Grep,WebFetch,WebSearch" 参数,这赋予了 Claude 在默认分支工作流中执行任意代码的能力。
大家都疯了吗?在一个项目仓库里,让一个拥有完全权限的 AI 代理处理不受信任的输入?
https://news.ycombinator.com/item?id=47269492
Raised an eyebrow a little at this sentence: “Anthropic has much more in common with the Department of War than we have differences.”
simonw
Anthropic 与 战争部 的共同点远多于我们之间的差异。
https://news.ycombinator.com/item?id=47265249
I’m sure the military and security services will enjoy it.
Chance-Device
军队和安全部门肯定会喜欢它的。
https://news.ycombinator.com/item?id=47260842
I am bit tired of such discussions.
I don’t care if LLMs are good at coding or bad at it (in my experience the answer is “it depends”). I don’t care how good are they at anything else. What matters in the end is that this tech is not to empower a common person (although it could). It is not here to make our lives better, more worthwhile, more satisfying (it could do these as well). It is there to reduce our agency, to make it easier to fire us, to put us in even more precarious position, to suck even more wealth from those that have little to those that have a lot.
Yet what I see are pigs discussing the usefulness of bacon-making machine just because it also happens to be able to produce tasty soybean feed. They forget that it is not soybean feed that their owner bought this machine for, and that their owner expects a return from such investment.
wolvesechoes
我对这类讨论有点厌倦了。
我不在乎大型语言模型(LLM)在编程方面是好是坏(根据我的经验,这得看情况)。我也不在乎它们在其他方面有多出色。最终重要的是,这项技术的目的并非是为了赋能普通人(尽管它有这个潜力)。它的目的也不是为了让我们的生活变得更好、更有价值、更令人满意(同样,它也能做到)。它的目的是为了削弱我们的自主权,让我们更容易被辞退,让我们处于更不稳定的位置,将那些本就不多的财富从少数人手中吸取,转移到更富有的阶层那里。
然而,我所看到的,却是一群猪在讨论一台培根制造机的用处,仅仅因为它恰好还能生产出美味的豆粕饲料。它们忘记了,主人买这台机器不是为了豆粕,而且主人期望从这项投资中获得回报。
https://news.ycombinator.com/item?id=47267579
This is a pretty egregious failure for a staff security engineer
Ferret7446
对于一个安全工程师来说,这是一个相当严重的失误。
https://news.ycombinator.com/item?id=47276332
Nothing will change until developed rich countries are starting to hurt.
And I don’t think it’s going to hurt enough in 10 or 20 years.
The pain will come slowly, people won’t see it.
It’s like going back to the middle age so slowly, that the population don’t realize or feel it.
And honestly, wars and trump are making climate concerns so difficult to think about.
jokoon
直到富裕的发达国家开始感受到切肤之痛,任何改变都无从谈起。而且,我不认为在10年或20年内,这种疼痛会达到足够严重的程度。这种痛苦会缓慢地到来,以至于人们不会察觉到。这就像是如此缓慢地倒退回中世纪,以至于整个社会都没有意识到或感觉到。说实话,战争和特朗普让气候变化问题变得如此难以被关注和思考。
https://news.ycombinator.com/item?id=47271982
The main problem with the “report your age to the website” proposals is that they’re backwards. You shouldn’t be leaking your age to the service.
Instead, the service should be telling your device the nature of the content. Then, if the content is for adults and you’re not one, your parents can configure your device not to display it.
AnthonyMouse
向网站报告年龄的建议,其主要问题是本末倒置。你不应该向服务泄露自己的年龄。相反,服务应该告知你的设备内容的性质。这样一来,如果内容是面向成人的,而你又未满成年,你的父母就可以设置设备不显示这些内容。
https://news.ycombinator.com/item?id=47275618
For those (like me) who don’t know the authors, apparently they are well-published authors in the field of climate science whose work is very highly cited:
https://scholar.google.com/scholar?hl=en&as_sdt=0%2C39&q=grant+foster+climate&btnG=
Not a perfect measure of whether this is a reputable article but at least readers should know this isn’t from some randos in a basement somewhere.
eykanal
对于那些(像我一样)不了解作者的人,他们显然是气候科学领域的知名学者,并且发表了大量被高度引用的论文: https://scholar.google.com/scholar?hl=en&as_sdt=0%2C39&q=grant+foster+climate&btnG=
这并非判断文章是否权威的完美标准,但至少读者应该知道,这并非出自某些躲在地下室里的无名之辈之手。
https://news.ycombinator.com/item?id=47275261
If the government-approved numbers are this bad the real ones must be catastrophic.
paxys
如果官方数据都这么差,那真实情况肯定更触目惊心。
2026-03-06 08:52:09
- gws 是一个开源命令行工具,能动态加载 40+ 个 Google Workspace API 并以结构化 JSON 输出,支持 dry-run、自动分页、NDJSON、AI 代理等功能(非 Google 官方,Apache-2.0 许可)。
- 维基媒体因在生产环境误加载来自 ruwiki 的恶意用户脚本,导致全球 JavaScript 污染、管理员账户受影响并短暂进入只读模式,暴露测试与审计流程不足。
- Anthropic CEO Dario Amodei 指责 OpenAI 关于与美军合作的宣传为“谎言”,批评“所有合法用途”条款与军事伦理上的分歧并引发公众不信任。
- 联邦法官下令政府开始退还超过 1300 亿美元的关税(此前最高法院认定这些关税无效),此案可能影响数千家公司与消费者。
- 开发者用 C#、Avalonia 和 SkiaSharp 重写了现代化的 2D 动画工具“Flash 2026”,实现矢量绘图、时间轴、脚本系统等以期成为跨平台替代。
- DeFlock 的互动地图收集并展示自动车牌识别(ALPR)摄像头位置,鼓励公众补充数据,凸显广泛监控与滥用风险。
- 文章批评当前大语言模型在软件开发中容易“编造”内容、缺乏对需求的深刻理解,助长低质量的“vibe-coding”并损害开源社区信任。
- chardet 在发布 v7.0.0 改为 MIT 许可引发争议,原作者称新版仍大量基于 LGPL 代码因而无权重新许可,触及开源许可合规性问题。
- 关于使用 AI 辅助重写并改许可的讨论指出 chardet 案件带来三重法律困境:训练数据中含受限代码、AI 输出是否为衍生作品以及“人类作者”原则不明。
- 在 Apple Silicon 上用 PersonaPlex 7B 实现了端到端全双工语音对话,显著降低延迟与显存占用,适合本地化实时语音助手部署。
https://github.com/googleworkspace/cli
这是一个名为 gws 的 Google Workspace 命令行工具(CLI)的项目主页,旨在为开发者和 AI 代理提供统一、智能的 Google Workspace API 操作入口。
项目核心特点:
安装方式多样:
认证支持多场景:
项目还内置 AI 代理技能(Agent Skills),可让大模型直接操作 Google Workspace,无需额外工具开发。
重要提示:
文档完整,包含快速入门、高级用法、环境变量说明、架构设计和故障排查指南。项目采用 Apache-2.0 开源协议,欢迎贡献。
https://news.ycombinator.com/item?id=47255881
https://www.wikimediastatus.net
该网页是维基媒体基金会(Wikimedia)的系统状态页面,用于实时展示其旗下服务(如 Wikipedia 等维基项目)的运行状况。
当前所有系统均处于“正常运行”状态,但部分服务性能略有下降。具体指标显示:
近期历史事件回顾:
页面支持多种通知方式,包括邮件、Slack 和 Webhook,用户可订阅获取实时更新。同时提供 Atom 或 RSS 订阅,便于集成到其他系统中。
页面由 Atlassian Statuspage 提供支持,数据按日、周、月展示,包含多维度系统指标图表,帮助用户直观了解系统健康状况。
https://news.ycombinator.com/item?id=47263323
Anthropic CEO Dario Amodei 在内部备忘录中严厉批评 OpenAI 与美国国防部(DoD)的军事合作,称其宣传为“彻头彻尾的谎言”。Amodei 指出,OpenAI 接受该合同的主要动机是安抚员工,而 Anthropic 则出于防止技术滥用的考虑拒绝了类似条件。
此前,Anthropic 与国防部未能就技术使用权限达成一致。Anthropic 要求国防部承诺不将 AI 用于国内大规模监控或自主武器系统,但遭拒绝。随后,国防部转而与 OpenAI 签署协议,后者声称其合同已明确排除非法用途。
Amodei 认为 OpenAI 的说法具有误导性,尤其在“合法用途”这一条款上存在漏洞,因为法律可能随时间变化,当前非法的用途未来可能被允许。他担忧这种宣传会影响 OpenAI 内部员工的认知。
公众反应倾向支持 Anthropic。数据显示,OpenAI 的 ChatGPT 在宣布该合作后,应用卸载量激增 295%。与此同时,Anthropic 的 Claude 在 App Store 排名升至第二,Amodei 认为这反映出公众对 OpenAI 战略的不信任。
该事件凸显了 AI 公司在军事合作中对伦理与透明度的不同立场,也反映出公众对 AI 技术被用于军事目的的深切关注。
https://news.ycombinator.com/item?id=47255662
根据《华尔街日报》的报道,一位联邦贸易法院法官于周三命令特朗普政府开始退还超过 1300 亿美元的关税,这些关税在上个月被最高法院判定为无效。此判决是在涉及一家过滤器公司的退款诉讼后作出的,法官理查德・伊顿在位于曼哈顿的国际贸易法院下达了书面命令,要求政府开始退款程序。他还安排了在周五举行的听证会,以便对退款进程进行更新。
此案件引发了超过 2000 起公司提起的诉讼,这些公司希望追讨因无效关税而支付的款项。这些事件标志着一个重要的法律里程碑,可能会对贸易政策和经济产生深远的影响。
https://news.ycombinator.com/item?id=47261688
https://bill.newgrounds.com/news/post/1607118
这是一个由用户 Bill 在 Newgrounds 平台发布的项目更新博客,内容围绕他正在开发的一款名为“Flash 2026”的全新 2D 动画创作工具。
该工具基于 C# 构建,使用 Avalonia 和 SkiaSharp 技术栈,旨在打造一个功能完整的现代版 Flash 作者环境,支持 Windows、macOS 和 Linux 系统。项目并非概念验证,而是已实现多项核心功能。
核心功能包括:
项目已具备完整工作流,支持导出 SWF 文件。作者已启动 Patreon 以寻求支持,计划组建团队进一步完善功能。他承诺将持续在 Newgrounds 发布更新。
https://news.ycombinator.com/item?id=47253177
https://deflock.org/map#map=5/37.125286/-96.284180
DeFlock 是一个基于 OpenStreetMap 社区众包数据的网页地图平台,旨在收集和展示自动车牌识别(ALPR)设备的位置信息。页面强调地图数据目前尚不完整,鼓励用户贡献新数据,补充缺失的 ALPR 设备位置。用户可通过提交数据、添加摄像头、悬挂标识、提供公共记录等方式参与。平台支持与城市议会、本地团体、GitHub 项目及捐赠渠道联动,推动社区协作。地图使用 Leaflet 技术渲染,底图来自 OpenStreetMap,版权归属其贡献者。使用该网站即表示同意其服务条款。
https://news.ycombinator.com/item?id=47252049
https://acko.net/blog/the-l-in-llm-stands-for-lying/
文章标题为《The L in “LLM” Stands for Lying》,作者 Steven Wittens 在 2026 年 3 月 4 日发表,探讨了当前大语言模型(LLM)技术在软件开发中的实际应用与深层问题。
文章指出,尽管 AI 技术被过度炒作,但实际产出的软件质量并未显著提升,仍停留在“勉强可用”的水平。作者认为,这种技术的真正问题不在于“智能”或“效率”,而在于其本质是“伪造”——即通过模仿生成内容,而非真正创造。
作者将 LLM 的运作类比为“伪造”:无论是伪造一幅梵高风格的画作、一份假的法律文件,还是捏造的研究报告,只要其目的被当作真实产物使用,就构成了伪造。LLM 正是让人能快速生成“看起来像”自己或他人产出的内容,但这些内容缺乏真实性和原创性。
在软件开发领域,这种“伪造”表现为“ vibe-coding”——即开发者依赖 AI 生成代码,以快速构建看似完整、详尽的代码提交,实则缺乏深度思考与问题理解。这种行为不仅降低了代码质量,还破坏了开源社区的协作生态,导致维护者拒绝贡献、关闭漏洞奖励,甚至公开嘲讽。
作者强调,真正有价值的软件开发源于对用户需求、现实约束的深刻理解,而非对代码量或复杂度的盲目追求。那些仅靠 AI“加速”产出的工程师,往往忽视了代码背后的逻辑与可维护性,最终导致系统臃肿、成本高昂,甚至违背初衷。
文章最后指出,有经验的开发者仍能识别出 AI 生成代码中的“粗糙感”——如重复、过度复杂、不愿重构等。但即便资深工程师,也可能在依赖 AI 时犯下低级错误,因为其思维已陷入“自动巡航”状态,不再主动思考。
核心观点:LLM 的“L”不是“学习”或“语言”,而是“谎言”(Lying)。它允许人们伪造产出,但若将伪造品当作真实成果,就会损害技术、社区与用户信任。作者呼吁:不使用 AI 并非落后,而是一种清醒与自律。
https://news.ycombinator.com/item?id=47257394
https://github.com/chardet/chardet/issues/327
该网页是 GitHub 上 chardet 项目的一个 issue 页面,标题为“No right to relicense this project”(无权重新许可该项目)。原作者 Mark Pilgrim 发起此问题,指出 chardet 在版本 7.0.0 中被重新许可为 MIT 许可证,这一行为违反了 LGPL 许可协议。
他强调,尽管维护者声称此次更新是“完全重写”,但代码仍大量基于原始 LGPL 许可的代码,不属于“洁净室实现”(clean room implementation),因此不能随意更改许可证。他要求将项目恢复为原始的 LGPL 许可证。
该 issue 引发广泛讨论。部分开发者支持原作者观点,认为修改许可证属于法律违规;也有观点认为,只要 API 兼容且实现方式独立,重新许可可能合法。但多数人认为,当前版本仍与原作高度相关,不具备完全独立性。
有用户建议使用 v7.0.0 之前的版本(如 v6.0.0)作为替代,因为这些版本仍保留 LGPL 许可。同时,有人提出应尝试真正的“洁净室重写”以解决法律争议。
该事件也引发对开源项目许可合规性的深层讨论,涉及版权、衍生作品与公平使用等法律问题。
https://news.ycombinator.com/item?id=47259177
https://tuananh.net/2026/03/05/relicensing-with-ai-assisted-rewrite/
本文讨论了开源项目 chardet 在发布 v7.0.0 版本时因使用 AI 辅助重写代码而引发的版权与许可证争议。该项目原基于 Mozilla 的 LGPL 许可证,长期面临企业用户使用上的法律风险。新版本通过 Claude Code 重写代码,并将许可证改为更宽松的 MIT,引发原作者 a2mark 的质疑。
核心争议在于:AI 重写是否构成“清洁室重写”(clean room rewrite)。传统做法要求两支团队协作,其中一支不得接触原始代码,而 AI 在训练过程中接触了 LGPL 代码,因此其输出可能被视为衍生作品,必须继续遵循 LGPL 许可。
美国最高法院于 2026 年 3 月 2 日拒绝审理关于 AI 生成内容版权的案件,维持了“人类作者”原则。这一裁决带来三重法律困境:一是若 AI 生成内容无法获得版权,那么新版本可能缺乏合法授权基础;二是若 AI 输出被视为衍生作品,则违反 LGPL;三是若代码被视为机器生成的公共领域作品,MIT 许可证将失去效力。
文章指出,若允许 AI 重写作为合法的许可证变更手段,将严重冲击 Copyleft 机制。开发者可能通过 AI 将 GPL 项目“改写”为 MIT 许可,绕过开源义务,从而破坏开源生态的公平性。
该事件成为 AI 与开源法律边界的关键测试案例,凸显当前法律体系在面对 AI 生成内容时的滞后与模糊。
https://news.ycombinator.com/item?id=47257803
本文介绍了一项基于 Apple Silicon 的全双工语音对话技术突破,使用 NVIDIA 的 PersonaPlex 7B 模型实现端到端的语音到语音实时交互,无需文本中间步骤。该系统在本地 Swift 环境下运行,完全基于 MLX 框架,无需 Python 或服务器支持,实现真正的实时语音对话。
项目从语音识别(ASR)起步,逐步扩展至语音合成(TTS)和多语言语音合成,最终整合为单一模型——PersonaPlex 7B,可直接处理音频输入并输出音频响应。与传统三步流程(语音转文字 → 大模型处理 → 文字转语音)相比,该模型跳过文本中间环节,保留语音中的语调、情感等信息,显著提升对话自然度与实时性。
PersonaPlex 7B 原始模型为 16.7 GB,经 4 位量化压缩后仅需约 5.3 GB,可在 M2 Max 芯片上以 68ms/步的速度运行,实时因子(RTF)为 0.87,即运行速度超过实时。系统采用 17 个并行音频流,每 80ms 生成一帧,基于 Mimi 音频编码器实现高效音频压缩与解码。
关键技术亮点包括:
系统支持多种角色提示(system prompts),如客服、教师等,通过预设提示可显著提升响应质量,避免模型随意发散。例如,面对“能否保证明天发货”问题,加入提示后模型能精准回应,而非偏离主题讨论烹饪。
所有功能集成于统一 Swift 库中,支持端到端测试:输入语音 → 生成响应 → 再转回文本进行验证,确保输出语义准确。该库同时支持离线与流式处理,适用于本地部署的智能语音助手场景。
整体技术路径清晰,强调本地化、低延迟、高保真语音交互,是 Apple Silicon 平台实现强大语音智能的重要进展。
https://news.ycombinator.com/item?id=47258801
https://news.ycombinator.com/item?id=47261957
Cantor Fitzgerald, formerly led by Commerce Secretary Howard Lutnick and is now run by his son, went to various companies that were affected by tariffs and bought the rights to their potential tariff refunds for 20% of the value on the expectation that it’d be struck down by the courts.
Now they stand to make huge returns of 3 to 5x for being correct on that bet, while, of course, consumers get nothing. Now if this isn’t insider trading (by the literal Commerce Secretary), I don’t know what is.
satvikpendem
由前商务部长霍华德·卢特尼克领导,现由其子执掌的康拓斐森公司,曾找到多家受关税影响的企业,以潜在关税退款价值20%的价格购买了其追索权。他们打赌法院最终会裁定这些关税违宪,现在看来赌对了。因此,他们有望获得3到5倍的投资回报,而消费者却一无所获。如果这(由商务部长本人主导的)不算内幕交易,那我不知道什么才算了。
https://news.ycombinator.com/item?id=47252471
List of differences from the MacBook Air:
Only supports 8 GB of unified memory
No MagSafe
One of the two USB-C ports is limited to USB 2.0 speeds of just 480 Mb/s
No Thunderbolt support means the Neo cannot drive either of Apple’s new Studio Displays. However, it can push a 4K display with 60Hz refresh rate over USB-C.
“Just” 16 hours of battery life, compared to the 18 hours quoted for the 13-inch MacBook Air
Display supports sRGB, but not P3 Wide Color
No True Tone
1080p webcam doesn’t support Center Stage
No camera notch
Dual side-firing speakers, down from four speakers on the Air
Does not support Spatial Audio with dynamic head tracking on AirPods
Dual-mic system, down from a three-mic system on the Air
The 3.5 mm headphone jack does not have support for high-impedance headphones
No keyboard backlighting
Touch ID not included on base model
Trackpad does not support Force Touch
Supports Wi-Fi 6E, not 7
No fast charging
The Apple on the lid isn’t shiny
https://512pixels.net/2026/03/the-differences-between-the-macbook-neo-and-macbook-air/
theopsimist
与 MacBook Air 的差异列表:
https://news.ycombinator.com/item?id=47255205
Whenever I hear german companies mention digitalisation, I get reminded that they still use pen and pencil in production environments to log data, pass those sheets to secreteries who enter the data into legacy systems so data analysts can enter it into another system that then has an integration with SAP. Data from SAP then flows onwards to some buzzword filled Azure product that costs a few million a month from which someone downloads an xls file and uploads it to Tableau where they run some simple calculations. Someone else downloads it as an xls and manually writes (not copy pastes) the numbers into a power point presentation and makes graphs by drawing shapes. This is then presented at some bi-monthly meeting.
I wish I was making this stuff up.
Maxion
每当听到德国公司谈论数字化,我就会想起他们仍在生产环境中用笔和纸来记录数据。然后把这些表格交给秘书,由她们将数据输入到老旧的系统里,以便数据分析师再将数据输入到另一个系统,而这个系统又与SAP系统对接。数据再从SAP系统流转到一个满是热门词汇的Azure产品上,而这个产品每月要花费数百万。有人会从中下载一个xls文件,再上传到Tableau进行一些简单的计算。另一个人又把它下载成xls文件,然后手动(而不是复制粘贴)把数字写入PowerPoint演示文稿,再通过画图来制作图表。然后这些东西就在某个双月例会上被展示出来。我真希望这些是我编造的。
https://news.ycombinator.com/item?id=47256372
When @sama announced within hours that OAI was replacing Anthropic with the “same conditions “, it was clear that either the DoW or OAI (or both) were fudging. DoW balked at Anthropic’s conditions so OAI’s agreement must have made the “conditions” basically unenforceable.
And sure enough, my reading of it left the impression the OAI conditions were basically “DoW won’t do anything which violates the rules DoW sets for itself.”
mrandish
当@sama宣布OAI将在几小时内以“相同的条件”取代Anthropic时,很明显,要么是DoW,要么是OAI(或两者都在)在糊弄。DoW拒绝了Anthropic的条件,所以OAI的协议必定让这些“条件”形同虚设。果然,我的理解是,OAI的条件基本上就是:“DoW不会做任何违反自己定下的规则的事。”
https://news.ycombinator.com/item?id=47265243
See the public phab ticket: https://phabricator.wikimedia.org/T419143
In short, a Wikimedia Foundation account was doing some sort of test which involved loading a large number of user scripts. They decided to just start loading random user scripts, instead of creating some just for this test.
The user who ran this test is a Staff Security Engineer at WMF, and naturally they decided to do this test under their highly-privileged Wikimedia Foundation staff account, which has permissions to edit the global CSS and JS that runs on every page.
One of those random scripts was a 2 year old malicious script from ruwiki. This script injects itself in the global Javascript on every page, and then in the userscripts of any user that runs into it, so it started spreading and doing damage really fast. This triggered tons of alerts, until the decision was made to turn the Wiki read-only.
tux3
请参阅公共Phabricator工单:https://phabricator.wikimedia.org/T419143
简而言之,一个维基媒体基金会账户在进行某种涉及加载大量用户脚本的测试。他们决定直接开始加载随机用户脚本,而不是为此测试专门创建一些。运行此测试的用户是WMF的员工安全工程师,他们自然决定使用其高权限的维基媒体基金会员工账户进行此测试,该账户有权限编辑在每页运行的全局CSS和JS。其中一个随机脚本来自ruwiki的两年前恶意脚本。该脚本将自己注入到每页的全局Javascript中,然后注入到遇到它的任何用户的用户脚本中,因此它开始快速传播并造成损害。这触发了大量警报,直到决定将Wiki设为只读。
https://news.ycombinator.com/item?id=47252664
You forgot an important difference: the macbook neo has the A18 Pro chip (2 performance cores + 4 efficiency cores) whereas the macbook air has the M5 chip (4 performance cores + 6 efficiency cores)
Also the A18 Pro chip has a 5-core GPU whereas the M5 chip has 8 or 10.
Personally, the only dealbreaker in the list you posted is the amount of RAM. macOS 15 uses ~5GB on startup without any app open. I’d be swapping all the time on 8GB of RAM.
MYEUHD
你忘记了一个重要的区别:MacBook Neo 配备的是 A18 Pro 芯片(2个性能核心 + 4个能效核心),而 MacBook Air 配备的是 M5 芯片(4个性能核心 + 6个能效核心)。
此外,A18 Pro 芯片拥有 5 核 GPU,而 M5 芯片则有 8 核或 10 核。
就我个人而言,你列出的清单里唯一让我无法接受的是内存容量。macOS 15 在启动时即使不打开任何应用程序也会占用大约 5GB 内存。用 8GB 内存的话,我估计会一直频繁地进行内存交换。
https://news.ycombinator.com/item?id=47252716
macOS 15 uses ~5GB on startup without any app open
Sort of? Mac very aggressively caches things into RAM. It should be using all of your RAM on startup. That’s why they’ve changed the Activity Monitor to say “memory pressure” instead of something like “memory usage.”
I’m typing this on an 8 GB MacBook Air and it works just fine. I’ve got ChatGPT, VSCode, XCode, Blender, and PrusaSlicer minimized and I’m not feeling any lag. If I open any of them it’ll take half a second or so as they’re loaded from swap, but when they’re not in the foreground they’re not using up any memory.
post-it
macOS 15在没有任何应用打开的情况下启动时会占用约5GB内存?
算是吧?macOS会非常积极地缓存数据到RAM中。启动时理应会占用你所有的内存。这就是为什么他们把“活动监视器”改成了显示“内存压力”,而不是类似“内存使用量”这样的指标。
我现在就在一台8GB内存的MacBook Air上打这些字,用起来完全没问题。我已经将ChatGPT、VSCode、XCode、Blender和PrusaSlicer最小化,并且没有感到任何卡顿。如果我打开任何一个应用,它们会从交换空间中加载,大概需要半秒钟左右,但当它们不在前台时,就不会占用任何内存。
https://news.ycombinator.com/item?id=47267414
I find it quite funny how this blog post has a big “Ask ChatGPT” box at the bottom. So you might think you could ask a question about the contents of the blog post, so you type the text “summarise this blog post”. And it opens a new chat window with the link to the blog post followed by “summarise this blog post”. Only to be told “I can’t access external URLs directly, but if you can paste the relevant text or describe the content you’re interested in from the page, I can help you summarize it. Feel free to share!”
That’s hilarious. Does OpenAI even know this doesn’t work?
Philip-J-Fry
我觉得这篇博客文章底部那个“询问ChatGPT”的框真是相当好笑。你可能会想,可以就博客内容提问,于是你输入了“总结一下这篇博客文章”。然后它确实打开了一个新的聊天窗口,里面带着博客文章的链接和你的问题。结果却得到回复说:“我无法直接访问外部网址,但如果你能粘贴相关文本或描述页面中你感兴趣的内容,我可以帮你总结。请随时分享!” 这简直太搞笑了。OpenAI难道不知道这根本行不通吗?
https://news.ycombinator.com/item?id=47254184
I made Flash Games back in the day. Here’s my old profile on Newgrounds: https://cableshaft.newgrounds.com/
One thing Flash had that nothing else has really seemed to replicate as well since, is an environment that both coders and artists could use. I’d collaborate with an artist, they’d make their animations within an FLA, send it to me, and then I’d copy+paste into the project file, and it’d just work. I could even tweak their animations if need be to remove a frame here or there to tighten the animations and make it feel more fluid, etc.
That being said, I’m not sure I could go back to it now. I’ve been working with Love2D lately, and I prefer that (especially for the version control). FLA version control was always me going ‘GameName-1.fla’, ‘GameName-2.fla’, or when I got a little smarter ‘GameName-Date.fla’. Eventually they let you split out the actionscript files into its own files, and that was better for version control, but you still had the binary mess of the FLA file.
But all these sprite-based game editors just can’t handle the crazy intricate animations that vector-based Flash games could handle. Porting one of my old games (Clock Legends) that had hundreds of frames of hand drawn animation for a boss that filled the screen would be ridiculously huge nowadays, but the FLA for that was like 23MB, I believe (I’ll need to hunt it down, I have it somewhere), and several MB of that were for the songs in the game.
Excited for this project though. It deserves to come back in some form.
cableshaft
我以前曾制作过Flash游戏。这是我在Newgrounds上的旧个人资料:https://cableshaft.newgrounds.com/
Flash有一点是后来其他东西似乎都未能很好复制的,那就是它提供了一个能让程序员和美术师都能使用的环境。我会与美术师合作,他们在FLA文件中制作动画,然后发给我,我再把它复制粘贴到项目文件里,就能直接运行。如果需要,我甚至可以修改他们的动画,比如删掉一两帧,让动画更紧凑、更流畅等等。
话虽如此,我不确定自己现在还能否回到Flash。我最近一直在用Love2D,我更喜欢那个(尤其是在版本控制方面)。FLA的版本控制总是让我把文件命名为“游戏名-1.fla”、“游戏名-2.fla”,或者稍微聪明点的时候会用“游戏名-日期.fla”。后来他们终于可以把动作脚本拆分成单独的文件,这对版本控制好多了,但FLA文件这个二进制文件依然是一团乱麻。
但是所有这些基于精灵的游戏编辑器都无法处理基于矢量的Flash游戏所能呈现的那种极其复杂的动画。把我以前的一个游戏《Clock Legends》移植过来,其中那个占满屏幕的boss有数百帧的手绘动画,现在光是这一点就会显得异常庞大,但我相信那个FLA文件只有23MB左右(我需要找找看,我 somewhere 有它),而且其中好几MB是游戏里的歌曲。
不过我还是很期待这个项目。它理应以某种形式回归。
https://news.ycombinator.com/item?id=47259150
Video games stand out as one market where consumers have pushed back effectively
No, it’s simply untrue. Players only object against AI art assets. And only when they’re painfully obvious. No one cares about how the code is written.
If you actually read the words used in Steam AI survey you’ll know Steam has completely caved in for AI-gen code as well. It’s specifically worded like this:
content such as artwork, sound, narrative, localization, etc.
No ‘code’ or ‘programming.’
If game players are the most anti-AI group then it’s crystal clear that LLM coding is inevitable.
This stands in stark contrast to code, which generally doesn’t suffer from re-use at all, or may even benefit from it, if it’s infrastructure.
Yeah, exactly. And LLM help developers save time from writing the same thing that has be done by other developers for a thousand times. I don’t know how one can spins this as a bad thing.
Classic procedural generation is noteworthy here as a precedent, which gamers were already familiar with, because by and large it has failed to deliver.
Spore is well acclaimed. Minecraft is literally the most sold game ever. The fact one developer fumbled it doesn’t make the idea of procedural generation bad. This is a perfect example of that a tool isn’t inherently good or bad. It’s up to the tool’s wielder.
raincole
电子游戏是消费者能有效抵制的一个突出市场。 不,这话完全不属实。玩家只反对AI生成的艺术资源,而且只有在这些资源非常明显时才会反对。没有人关心代码是如何编写的。 如果你仔细阅读Steam AI调查中使用的措辞,你就会知道Steam在AI生成代码方面也已经完全让步了。其措辞具体如下:
诸如艺术品、声音、叙事、本地化等内容。 没有提及“代码”或“编程”。 如果游戏玩家是最反AI的群体,那么LLM编程的必然性就再清楚不过了。
这与代码形成鲜明对比,代码通常不会因重复使用而受到丝毫影响,如果是基础设施代码,甚至可能从中受益。 没错,正是如此。LLM帮助开发者省去了编写其他开发者已经重复过上千次的代码的时间。我真不明白怎么能把这件事说成是坏事。
经典程序化生成值得一提,它作为一个先例,游戏玩家早已熟知,因为它在很大程度上未能达到预期效果。 《Spore》广受好评,《Minecraft》也是有史以来最畅销的游戏。仅仅因为一个开发商搞砸了,并不意味着程序化生成的理念就是坏的。这完美地证明了工具本身并无好坏之分,关键在于使用者。
https://news.ycombinator.com/item?id=47258500
I’ve told this story before on HN, but my biz partner at ArenaNet, Mike O’Brien (creator of battle.net) wrote a system in Guild Wars circa 2004 that detected bitflips as part of our bug triage process, because we’d regularly get bug reports from game clients that made no sense.
Every frame (i.e. ~60FPS) Guild Wars would allocate random memory, run math-heavy computations, and compare the results with a table of known values. Around 1 out of 1000 computers would fail this test!
We’d save the test result to the registry and include the result in automated bug reports.
The common causes we discovered for the problem were:
overclocked CPU
bad memory wait-state configuration
underpowered power supply
overheating due to under-specced cooling fans or dusty intakes
These problems occurred because Guild Wars was rendering outdoor terrain, and so pushed a lot of polygons compared to many other 3d games of that era (which can clip extensively using binary-space partitioning, portals, etc. that don’t work so well for outdoor stuff). So the game caused computers to run hot.
Several years later I learned that Dell computers had larger-than-reasonable analog component problems because Dell sourced the absolute cheapest stuff for their computers; I expect that was also a cause.
And then a few more years on I learned about RowHammer attacks on memory, which was likely another cause – the math computations we used were designed to hit a memory row quite frequently.
Sometimes I’m amazed that computers even work at all!
Incidentally, my contribution to all this was to write code to launch the browser upon test-failure, and load up a web page telling players to clean out their dusty computer fan-intakes.
netcoyote
我以前在HN上讲过这个故事,但我在ArenaNet的商业伙伴Mike O’Brien(battle.net的缔造者)在2004年左右为《激战》写了一个系统,用来检测比特翻转,作为我们故障排查流程的一部分,因为我们经常会收到一些来自游戏客户端、完全无法理解的错误报告。
《激战》每一帧(即约60FPS)都会分配随机内存,运行大量密集型数学运算,然后将结果与一个已知值表进行比较。当时,大约每1000台电脑中就有1台会通过不了这个测试!我们会将测试结果保存到Windows注册表中,并把它包含在自动生成的错误报告里。
我们发现这个问题的常见原因有:
这些问题的发生,是因为《激战》需要渲染户外地形,因此与当时许多其他的3D游戏相比,它会渲染多得多的多边形。(那些游戏可以通过二叉空间分割、 portals等技术进行大量裁剪,而这些技术对于户外场景效果不佳)。所以,我们的游戏会导致电脑运行过热。
几年后,我了解到戴尔电脑存在超出合理范围的模拟组件问题,因为戴尔为他们电脑采购了绝对最便宜的材料;我想这也应该是一个原因。
又过了几年,我了解到内存上的RowHammer攻击,这也很可能是另一个原因——我们当时使用的数学计算,在设计上会相当频繁地访问内存的某一行。
有时候,我真觉得电脑能正常工作就已经是个奇迹了!
顺便提一句,我对这一切的贡献,就是写了一段代码:在测试失败时,它会自动启动浏览器,并加载一个网页,告诉玩家去清理他们电脑风扇进风口上的灰尘。
https://news.ycombinator.com/item?id=47266669
Exported all my chats and deleted my ChatGPT account yesterday. The current administration not liking you is the strongest signal I could possibly have to go all in on a particular company.
oompydoompy74
昨天我导出了所有聊天记录并删除了ChatGPT账户。当届政府不喜欢你,这对我而言绝对是全力押注某家公司的最强信号。
https://news.ycombinator.com/item?id=47247748
“Education customers can purchase it for $499.”
That is insane pricing for a brand new apple product. They will sell so many of these!
r0fl
教育客户可以以499美元的价格购买它。对于一款全新的苹果产品来说,这定价太离谱了。他们会卖出好多台!
https://news.ycombinator.com/item?id=47247769
$599, 8 GB RAM, 256 GB, No Touch ID
$699, 8 GB RAM, 512 GB, Touch ID
Honestly pretty fantastic product and price.
This is clearly targeted towards education but I think I will happily replace by MacBook Air M1 with this :)
opjjf
599美元,8GB内存,256GB存储,无 Touch ID 699美元,8GB内存,512GB存储,支持Touch ID 坦白说,这款产品及其价格都相当出色。 这显然是面向教育市场的,但我想我会很乐意用它来替换我的 M1 MacBook Air :)
https://news.ycombinator.com/item?id=47266092
Wow insane improvements in targeting systems for military targets over children
elmean
军事目标瞄准系统的改进相较于针对儿童的系统,真是令人难以置信。
https://news.ycombinator.com/item?id=47262902
Side topic, but this number puts into how crazy it was for trump[0] to go on tariff war against enemies and friends alike. All the propaganda and extortionist language about how all countries will pay up to USA.
Astronomical tariffs in some cases, trade wars and dramas, alienate all allies and from all of this they got only $130B ?
$7T of spending, $1.77T in deficit[1] and they planned to fix this hole with $100B?!
Masterminds!
…and now they need to refund it.
NB: also puts into perspective how numb I became about reading AI and AI related sums of money, and how crazy actually those numbers are.
[0] off course many knew that it’s crazy way before it happened.
[1] https://en.wikipedia.org/wiki/2025_United_States_federal_budget
trymas
顺便一提,这个数字也揭示了特朗普对敌对国家和盟友 alike 发起贸易战的疯狂程度。当时那些所有国家最终都会向美国付钱的宣传和敲诈言论。
在某些情况下征收了天价的关税,挑起了贸易战和各种闹剧,结果疏远了所有盟友,到头来只得到了1300亿美元?
7万亿美元的支出,1.77万亿美元的赤字[1],他们竟然计划用1000亿美元来填补这个窟窇?
大师啊!
……而现在他们又得把钱退回去。
注:这也让我明白,在阅读人工智能及相关领域的资金数额时,我已经变得多么麻木,以及那些数字实际上有多么离谱。 [0] 当然,在这一切发生之前,就有很多人知道这很疯狂。 [1] https://en.wikipedia.org/wiki/2025_United_States_federal_budget
https://news.ycombinator.com/item?id=47266067
Did they say “thank you” and “please”?
akie
他们是说了“谢谢”和“请”吗?
https://news.ycombinator.com/item?id=47246979
AI coding tools are making this problem worse in a subtle way. When an agent can generate a “scalable event-driven architecture” in 5 minutes, the build cost of complexity drops to near zero. But the maintenance cost doesn’t.
So now you get Engineer B’s output even faster, with even more impressive-sounding abstractions, and the promotion packet writes itself in minutes too. Meanwhile the actual cost - debugging, onboarding, incident response at 3am - stays exactly the same or gets worse, because now nobody fully understands what was generated.
The real test for simplicity has always been: can the next person who touches this code understand it without asking you? AI-generated complexity fails that test spectacularly.
Niko901ch
AI编程工具正以某种微妙的方式让这个问题变得更糟。当一个AI代理能在5分钟内生成一个“可扩展的事件驱动架构”时,构建复杂性的成本已降至近零。但维护成本却并未改变。
因此,现在你不仅能更快地得到工程师B的产出,还能听到更令人印象深刻的抽象概念,晋升材料也能在几分钟内自动生成。然而,真正的成本——调试、新员工入职、凌晨三点的应急响应——却依然不变甚至更糟,因为现在没人能完全理解这些生成的内容。
对于简洁性的真正考验始终是:下一个接触这段代码的人能否在你无需解释的情况下看懂它?AI生成的复杂性在这一考验上可谓惨败。
https://news.ycombinator.com/item?id=47263387
Having spent some time in the anti-abuse and Trust & Safety space, I always take these vendor reports with a massive grain of salt. It’s a classic case of comparing apples to vendor-marketing oranges. A headline screaming about an 84% miss rate sounds like a systemic collapse until you look at the radically different constraint envelopes a global default like GSB and a specialized enterprise vendor operate under.
The biggest factor here is the false-positive cliff. Google Safe Browsing is the default safety net for billions of clients across Chrome, Safari, and Firefox. If GSB’s false-positive rate ticks up by even a fraction of a percent, they end up accidentally nuking legitimate small businesses, SaaS platforms, or municipal portals off the internet. Because of that massive blast radius, GSB fundamentally has to be deeply conservative. A boutique security vendor, on the other hand, can afford to be highly aggressive because an over-block in a corporate environment just results in a routine IT support ticket.
You also have to factor in the ephemeral nature of modern phishing infrastructure and basic selection bias. Threat actors heavily rely on automated DGAs and compromised hosts where the time-to-live for a payload is measured in hours, if not minutes. If a specialized vendor detects a zero-day phishing link at 10:00 AM, and GSB hasn’t confidently propagated a global block to billions of edge clients by 10:15 AM, the vendor scores it as a “miss.” Add in the fact that vendors naturally test against the specific subset of threats their proprietary engines are tuned to find, and that 84% number starts to make a lot more sense as a top-of-funnel marketing metric rather than a scientific baseline.
None of this is to say GSB is perfect right now. It has absolutely struggled to keep up with the recent explosion of automated, highly targeted spear-phishing and MFA-bypass proxy kits. But we should read this report for what it really is: a smart marketing push by a security vendor trying to sell a product, not a sign that the internet’s baseline immune system is totally broken.
epicprogrammer
鉴于我在反滥用和信任与安全领域的一些经验,我总是对这些供应商的报告抱有极大的怀疑。这就像经典地将苹果与供应商营销的橙子进行比较一样,根本不具可比性。一个宣称84%漏报率的耸人听闻的头条新闻,听起来像是系统崩溃了,但只要你看看谷歌安全浏览(GSB)这样的全球性默认服务与专业企业供应商所面临的根本不同的约束范围,你就会明白这并非如此。
这里最大的因素是误报悬崖。谷歌安全浏览是Chrome、Safari和Firefox上数十亿客户端的默认安全网。即使GSB的误报率只上升了很小的百分比,也可能导致其意外地将合法的小型企业、SaaS平台或市政门户网站从互联网上彻底清除。由于其巨大的“杀伤范围”,GSB从根本上就必须极其保守。另一方面,一家精品安全供应商则可以采取极具攻击性的策略,因为在企业环境中过度拦截只会导致一个常规的IT支持工单。
你还需要考虑到现代钓鱼基础设施的短暂性和基本的选择偏见。威胁行为者严重依赖自动化DGA(域名生成算法)和被攻陷的主机,在这些主机上,有效载荷的存活时间是以小时甚至分钟来计算的。如果一个专业供应商在上午10点发现了一个零日钓鱼链接,但GSB在上午10:15之前没有自信地将全球拦截传播给数十亿的边缘客户端,那么该供应商就会将其记为一次“未命中”。再加上一个事实是:供应商自然会针对其专有引擎专门用来查找的特定威胁子集进行测试,那么这84%的数字就更容易理解了——它是一个漏斗顶部的营销指标,而不是科学基准。
说这些并不是为了说GSB现在完美无缺。它确实难以跟上近期自动化、高度定向的鱼叉式网络钓鱼和绕过多因素认证的代理工具套件的激增。但我们应该看清这份报告的实质:它是一家安全供应商为了推销产品而进行的一场精明营销,而不是说互联网的“基础免疫系统”已经完全失灵了。
2026-03-05 08:03:03
- Apple 发布面向入门与教育市场的 MacBook Neo,599 美元起、13 英寸 Liquid Retina、A18 Pro、最长 16 小时续航并搭载 macOS Tahoe,但 8GB 统一内存等降配引发用户担忧。
- GrapheneOS 与摩托罗拉达成合作,未来摩托罗拉设备将支持可解锁与可重新锁定的引导加载程序,便于官方或用户安装 GrapheneOS 并支持可信启动与防降级。
- 文章批评工程文化偏好复杂性而非简洁,建议将简单设为默认、为简洁辩护并在绩效评估中奖励判断力。
- 联想最新 ThinkPad 在 iFixit 获得 10/10 修复性满分,得益于模块化设计与易更换部件显著提升可维修性。
- Simon Willison 提出“代理工程模式”,通过 AI 生成代理并配合测试驱动、交互式提示等实践来提高开发效率并展示落地案例。
- Qwen 团队出现核心成员离职与组织调整,但仍快速推出 Qwen 3.5 系列模型,作者对团队动荡可能带来的长期影响表示担忧。
- TikTok 决定不在私信引入端到端加密,称保持平台可审查性有助于打击网络欺凌与儿童性剥削并配合执法。
- OpenAI 推出 GPT-5.3 Instant 更新,旨在提升对话流畅性与实用性并更好地整合外部信息,已面向多场景上线。
- 文章主张纳税人资助的研究不应发表在营利期刊,批评现行“三重付费”并呼吁以非营利或公共平台实现科研公开化。
- Iran War Cost Tracker 显示截至 2026-03-04 累计战争成本约 23 亿美元,项目现暂停更新以核实数据。
https://www.apple.com/newsroom/2026/03/say-hello-to-macbook-neo/
Apple 今日发布全新 MacBook Neo,一款以突破性价格提供卓越性能的笔记本电脑,起售价仅为 599 美元,教育用户可享 499 美元优惠,是 Apple 有史以来最实惠的笔记本。
MacBook Neo 采用坚固耐用的铝金属机身,提供四种时尚配色: blush(粉红)、indigo(靛蓝)、silver(银色)和 citrus(柑橘色),机身轻至 2.7 磅,便于携带。其 13 英寸 Liquid Retina 显示屏拥有 2408×1506 分辨率、500 尼特亮度和 10 亿色显示,呈现清晰锐利的图像与色彩。
搭载 A18 Pro 芯片,MacBook Neo 在日常任务中性能提升最高达 50%,在本地运行 AI 任务时速度最高可达搭载最新 Intel Core Ultra 5 的畅销 PC 的 3 倍。配备长达 16 小时的电池续航,支持全天使用。
设备配备 1080p FaceTime HD 摄像头、双麦克风和双侧发声扬声器,支持空间音频,带来出色的音视频体验。搭载 Apple 精心设计的 Magic 键盘与大型多点触控触控板,操作流畅精准。
运行 macOS Tahoe 系统,支持 Messages、Pages、Calendar、Safari 等原生应用,与 iPhone 无缝衔接,集成 Apple Intelligence 功能,并兼容大量第三方应用。
MacBook Neo 于今日起开放预购,将于 3 月 11 日正式发售,为学生、家庭、小企业主及首次接触 Mac 的用户带来前所未有的高性价比选择。
https://news.ycombinator.com/item?id=47247645
https://grapheneos.social/@GrapheneOS/116160393783585567
GrapheneOS 官方宣布与摩托罗拉建立长期合作伙伴关系,双方将共同开发符合 GrapheneOS 隐私与安全标准的未来设备,并提供官方 GrapheneOS 支持。该合作是摩托罗拉在 MWC 2026 上发布的三项 B2B 解决方案之一,还包括 Moto Analytics 等服务。
在社区讨论中,用户询问摩托罗拉设备是否支持解锁和重新锁定引导加载程序,以及是否允许用户自行构建 GrapheneOS 系统。GrapheneOS 官方回应称,新设备将完全支持安装其他操作系统,包括用户自行构建的 GrapheneOS 版本,这是其硬件支持的硬性要求。
此外,官方强调,设备将具备完整的可信启动(Verified Boot)功能,包括固件和操作系统的加密验证,并具备防降级保护机制。该功能已集成到 A/B 系统更新机制中,支持自动回滚,确保系统在启动失败时能恢复至正常状态。这一机制自 Nexus 5X 时代起逐步完善,目前已成为 GrapheneOS 支持设备的必备条件。
GrapheneOS 还提到,未来可能发布经过强化的官方固件和驱动程序版本,供用户轻松构建系统,无需从官方镜像中提取数据。该功能将提升安全性和可维护性,同时保持与现有设备支持策略的一致性。
https://news.ycombinator.com/item?id=47241551
https://terriblesoftware.org/2026/03/03/nobody-gets-promoted-for-simplicity/
文章探讨了工程团队中一个隐性却普遍存在的问题:简单性往往被忽视,而复杂性反而更容易获得认可和晋升机会。
作者指出,当两位工程师面对相似任务时,一个选择简单实现,另一个则构建复杂的架构。前者虽然工作更高效、更易维护,但其成果在晋升材料中难以讲述出“精彩故事”;后者则因引入了抽象层、事件驱动系统等复杂设计,能写出令人印象深刻的成就描述,从而更易获得晋升。
这种现象源于评估体系的偏差:复杂性被视为“聪明”和“专业”的标志,而简单性常被误认为“不够深入”或“缺乏思考”。这种倾向从面试开始就已形成——面试官常追问“如何应对大规模场景”,促使候选人添加不必要的系统组件,从而强化了“复杂=优秀”的错误认知。
在设计评审中,类似“未来要扩展”的压力也常导致工程师提前引入冗余抽象,牺牲可读性和开发效率。作者强调,真正的技术成熟度不在于掌握多少复杂模式,而在于懂得何时不使用它们。
文章建议工程师主动为简单性“发声”:在总结工作时,不仅要说明“做了什么”,更要展示“为什么没做更多”——比如评估过多种方案、权衡了未来成本与收益,最终选择最简方案。在设计评审中,可提出“若未来需要再添加复杂性,成本是多少”,以理性对抗盲目扩展。
对于管理者,文章呼吁改变激励机制:在评审中应问“最简单的方案是什么?什么信号表明需要更复杂的设计?”让简单成为默认选项,复杂性需自证其必要。同时,要帮助那些做出简洁设计的工程师,把他们的判断力转化为可被认可的成就。
最终,作者提醒:如果团队始终只奖励复杂系统,那说明文化并不真正重视简洁与判断力。此时,工程师需思考自己是否在“玩一个错误的游戏”,并考虑寻找真正尊重智慧与效率的环境。
https://news.ycombinator.com/item?id=47246110
https://www.ifixit.com/News/115827/new-thinkpads-score-perfect-10-repairability
Lenovo 最新推出的 ThinkPad T14 Gen 7 和 T16 Gen 5 在 iFixit 的修复性评分中获得 10/10 的满分,成为该系列首次达到这一顶级评分的机型。这一成绩标志着修复性已从小众特性转变为商业主流笔记本的核心标准。
此次升级源于 Lenovo 与 iFixit 长达两年的深度合作,从产品设计初期便将可维修性纳入核心考量。团队通过打破传统设计思维,将服务性、可持续性与工程设计同步推进,实现了多项关键突破。
主要改进包括:电池可近乎无工具更换;采用行业标准 M.2 SSD 存储;键盘更换极为简便;LPCAMM2 内存模块化设计,支持快速升级;显示屏维修流程简化;冷却系统模块化,风扇可独立更换;Thunderbolt 接口实现完全模块化,支持快速替换。
尽管整体表现卓越,仍存在可优化空间:部分不常用的 I/O 接口仍连接在主板或小型扩展板上,未实现完全模块化;Wi-Fi 模块维修仍较困难;显示屏内部维修需处理一定量胶粘剂。
iFixit 强调,10/10 并非终点,而是新基准。真正的价值在于推动更快维修、更长设备寿命、更低拥有成本和更少电子垃圾。Lenovo 也表示,将以此为基础持续优化,让修复性真正落地为用户可感知的长期效益。
https://news.ycombinator.com/item?id=47240694
https://simonwillison.net/guides/agentic-engineering-patterns/
这是一个名为 Simon Willison’s Weblog 的个人博客页面,内容聚焦于编程、开发工具与人工智能在软件工程中的应用。
博客核心主题是“代理工程模式”(Agentic Engineering Patterns),探讨如何高效利用代码生成代理(如 Claude Code 和 OpenAI Codex)进行开发。文章提出“写代码现在成本很低”这一前提,并强调应积累已掌握的开发技能,避免常见错误模式。
内容涵盖多个实践原则:测试与质量保证方面推荐红绿测试驱动开发(Red/Green TDD),强调先运行测试;在理解代码方面,提倡线性代码浏览、交互式解释和带注释的提示词设计。
文中还介绍了一个使用 WebAssembly 和 Gifsicle 构建的 GIF 优化工具,展示技术落地的实际案例。
附录部分列出了作者常用的提示词模板,以及关于赞助和版权的说明,显示该博客具有一定的商业合作背景。
整体风格专业、技术导向,适合开发者、工程师及对 AI 辅助编程感兴趣的读者。
https://news.ycombinator.com/item?id=47243272
https://simonwillison.net/2026/Mar/4/qwen/
2026 年 3 月 4 日,Simon Willison 在其博客中撰文关注阿里巴巴旗下 Qwen 团队的重大变动。文章指出,Qwen 项目的核心人物、技术负责人林俊阳(Junyang Lin)于当日突然宣布离职,引发业界震动。林俊阳是推动 Qwen 系列开源大模型从 2024 年起持续发布的关键人物,也是阿里巴巴最年轻的 P10 员工之一。
据 36 氪报道,此次离职可能与阿里巴巴内部组织调整有关,一名来自谷歌 Gemini 团队的新研究员被任命为 Qwen 项目负责人,导致林俊阳不满并辞职。当天下午,阿里集团 CEO 吴泳铭亲自出席 Qwen 团队的紧急全员会议,显示出公司对此次人才流失的高度重视。
除林俊阳外,多名核心成员也相继宣布离职,包括:
文章强调,尽管团队动荡,但 Qwen 3.5 系列模型的表现极为出色。该系列从 2 月 17 日发布的 397B 参数模型(807GB)开始,迅速推出 122B、35B、27B、9B、4B、2B、0.8B 等多个版本,覆盖从超大模型到轻量级模型的全谱系。
尤其值得关注的是,27B 和 35B 模型在仅需 32GB 或 64GB 内存的设备上即可运行,且在编码任务中表现优异。而 2B 模型仅 4.57GB,量化后可小至 1.27GB,却具备完整推理与多模态(视觉)能力,展现了极高的效率与性能。
作者感叹,若如此优秀的团队就此解散,将是 AI 领域的一大损失。他期待这些核心成员未来能开启新项目或加入其他研究机构,继续推动大模型小型化与高效化的发展。
https://news.ycombinator.com/item?id=47249343
https://www.bbc.com/news/articles/cly2m5e5ke4o
TikTok 决定不为其私信功能引入端到端加密(E2EE),称此举将有助于保护用户安全,尤其是年轻用户。公司表示,E2EE 会阻碍平台和执法机构在必要时查看私信内容,从而影响对网络欺凌、性剥削等有害内容的监控与干预。
尽管 Facebook、Instagram、WhatsApp、X 等主流社交平台已普遍采用 E2EE 以增强用户隐私,但 TikTok 认为,其选择不启用该技术是一种主动安全策略,旨在优先保障用户安全而非追求“隐私绝对主义”。
TikTok 强调,其私信仍使用标准加密技术,仅在收到合法执法请求或用户举报有害行为时,授权员工才可查看内容。这一立场获得英国儿童保护组织 NSPCC 和互联网观察基金会(IWF)的支持,他们认为 E2EE 可能阻碍对儿童性虐待内容的发现与报告。
分析人士指出,此举也被视为一种政治策略,以争取欧美监管机构和执法部门的信任。
目前,TikTok 已在全球范围内拥有超十亿用户,其英国月活跃用户达 3000 万。公司正通过“Project Clover”等项目加强欧洲用户数据保护,以回应外界对其数据安全的担忧。
https://news.ycombinator.com/item?id=47241817
https://openai.com/index/gpt-5-3-instant/
OpenAI 于 2026 年 3 月 3 日发布 GPT-5.3 Instant 更新,旨在提升日常对话的流畅性与实用性。该版本在多个方面进行了优化,使 ChatGPT 的使用体验更自然、更高效。
在回应敏感或复杂问题时,GPT-5.3 Instant 显著减少了不必要的拒绝和防御性声明。相比前代模型,它能更准确判断何时可提供有用回答,避免冗长的安全提示,直接切入主题,提升对话效率。
在结合网络搜索结果时,GPT-5.3 Instant 能更智能地整合外部信息与自身知识,避免堆砌链接或机械复述搜索内容。它能对新闻事件进行合理背景分析,提供上下文清晰、逻辑连贯的综合回答。
模型在对话风格上更加简洁自然,减少冗余表述和过度正式的语气,使交流更贴近真实对话。同时,回答更具针对性,能更可靠地提供准确信息,尤其在物理计算、轨迹建模等复杂任务中表现更优。
在写作方面,GPT-5.3 Instant 展现出更强的表现力和语言多样性,能根据场景灵活调整文风,适用于教育、创作、模拟等多种用途。
目前该模型已上线,适用于日常对话与多场景应用,是 OpenAI 在提升模型“可用性”与“人性化”方面的重要进展。
https://news.ycombinator.com/item?id=47236169
https://www.experimental-history.com/p/the-one-science-reform-we-can-all
文章探讨了当前科学出版体系中存在的严重问题,指出其本质是一个由纳税人资助、却让私人公司获利的不合理系统。科研人员用政府拨款进行研究,却要向商业出版商支付费用以发表成果,而这些成果又被出版商高价售卖,最终大学和科研人员又要花钱重新购买自己研究成果的访问权。
这种“三重付费”模式——纳税人出钱做研究,再出钱让出版商发表,最后再出钱读自己的论文——在逻辑上完全荒谬。文章强调,尽管这一系统已明显失效,但改革却举步维艰,原因在于既得利益者(如出版商、部分学术机构)的阻挠,以及政策制定者采取的随意削减经费而非系统性改革的做法。
文章追溯了商业出版商的历史:它们最初因承担纸质期刊的印刷与分发工作而被接受,但随着互联网普及,这些成本已大幅降低。如今,出版商的核心服务仅限于排版、校对和存储 PDF,却仍维持着极高的利润率(约 40%),远超微软等科技巨头。
作者引用数据指出,美国高校每年在期刊订阅上支出约 10 亿美元,联邦政府在文章处理费上支出近 4 亿美元,合计可能高达 25 亿美元。如果取消商业出版环节,仅此一项就能每年节省超过 14 亿美元,远超当前政策削减科研经费所“节省”的金额。
文章最后呼吁,尽管改革困难,但有一个共识是明确的:必须终结以盈利为目的的科学出版模式。作者认为,这不仅是经济问题,更是科学伦理问题——科学知识应属于公共领域,而非被少数公司垄断。
https://news.ycombinator.com/item?id=47248341
伊朗战争成本追踪数据显示,截至 2026 年 3 月 4 日,累计战争成本约为 23 亿美元。该项目目前处于暂停状态,团队正在对所有成本数据及更新内容进行核实,以确保信息的准确性和可靠性。
https://news.ycombinator.com/item?id=47237080
https://news.ycombinator.com/item?id=47247552
I had an interview question. What would you do if two different people were emailing a spreadsheet back and forth to track something?
I said I’d move them to google sheets. There was about five minutes of awkwardness after that as I was interviewing for software developer. I was supposed to talk about what kind of tool I’d build.
I found it kind of eye opening but I’m still not sure what the right lesson to learn was.
bilsbie
我遇到了一个面试问题:如果两个人通过来回发邮件来跟踪某个事项的电子表格,你会怎么做? 我说我会让他们改用 Google Sheets。然后就有大约五分钟的尴尬时间,因为我当时应聘的是软件开发工程师,我本应该谈论我会构建什么样的工具。 我觉得这有点启发性的,但我仍然不确定应该吸取什么正确的教训。
https://news.ycombinator.com/item?id=47248588
If this makes people develop stuff under the assumption that the user only has 8 GB of memory, I am happy for where we are going :-)
reacharavindh
如果这能促使开发者在开发时都默认用户只有8GB内存,那我很高兴我们正朝着这个方向发展。
https://news.ycombinator.com/item?id=47248919
This is a major challenge to Microsoft. A 13-inch Surface Laptop costs $899 [1], that’s 50% more than an equivalent MacBook! And even at that higher price the Surface Laptop doesn’t have a good screen: it uses 150% scaling (as opposed to the ideal 200%) which means you have subtle display artifacts.
Other than Microsoft nobody even makes decent laptops in the Windows world. I am typing this on an Lenovo Yoga, it has decent screen and keyboard, but the touchpad is horrible. Samsung makes good laptops but my keyboard gave out after just 2 years. Most other laptop makers have horrible industrial design. Dell XPS 17 was pretty good, but now they have weird keyboard.
The best laptop is now significantly cheaper than the horrible ones. Incredible achievement by Apple, and a major challenge to Windows laptop makers.
[1] https://www.microsoft.com/en-us/store/configure/surface-laptop-13-inch/8mzbmmcjzqv3
lateforwork
这对微软来说是一个巨大的挑战。一款13英寸的Surface笔记本电脑售价899美元[1],这比同等配置的MacBook贵了50%!而且即使价格更高,Surface笔记本的屏幕也不好:它使用150%的缩放比例(而不是理想的200%),这意味着屏幕上会出现细微的显示瑕疵。
在Windows阵营里,除了微软,没人能生产出像样的笔记本电脑。我正在用联想Yoga打字,它的屏幕和键盘还不错,但触摸板糟透了。三星能生产出不错的笔记本电脑,但我的键盘用了两年就坏了。大多数其他笔记本电脑制造商的工业设计都很差劲。戴尔XPS 17曾经相当不错,但现在他们的键盘很奇怪。
现在最好的笔记本电脑比那些糟糕的笔记本电脑便宜多了。苹果取得了了不起的成就,这对Windows笔记本制造商来说是一个巨大的挑战。
[1] https://www.microsoft.com/en-us/store/configure/surface-laptop-13-inch/8mzbmmcjzqv3
https://news.ycombinator.com/item?id=47252471
List of differences from the MacBook Air: * Only supports 8 GB of unified memory
No MagSafe
One of the two USB-C ports is limited to USB 2.0 speeds of just 480 Mb/s
No Thunderbolt support means the Neo cannot drive either of Apple’s new Studio Displays. However, it can push a 4K display with 60Hz refresh rate over USB-C.
“Just” 16 hours of battery life, compared to the 18 hours quoted for the 13-inch MacBook Air
Display supports sRGB, but not P3 Wide Color
No True Tone
1080p webcam doesn’t support Center Stage
No camera notch
Dual side-firing speakers, down from four speakers on the Air
Does not support Spatial Audio with dynamic head tracking on AirPods
Dual-mic system, down from a three-mic system on the Air
The 3.5 mm headphone jack does not have support for high-impedance headphones
No keyboard backlighting
Touch ID not included on base model
Trackpad does not support Force Touch
Supports Wi-Fi 6E, not 7
No fast charging
The Apple on the lid isn’t shiny
https://512pixels.net/2026/03/the-differences-between-the-macbook-neo-and-macbook-air/
theopsimist
与 MacBook Air 的差异列表:
https://news.ycombinator.com/item?id=47233173
I love the following section of their copy:
Even More Value for Upgraders
The new 14- and 16-inch MacBook Pro with M5 Pro and M5 Max mark a major leap for pro users. There’s never been a better time for customers to upgrade from a previous generation of MacBook Pro with Apple silicon or an Intel-based Mac.
I read as “Whoops we made the M1 Macbook Pro too good, please upgrade!”
I think I will get another 2-5 years out my mine.
Apple: If you document the hardware enough for the Asahi team to deliver a polished Linux experiene, I’ll buy one this year!
manofmanysmiles
我很喜欢他们文案中的这一部分:
升级者享更多价值
搭载M5 Pro和M5芯片的新款14英寸和16英寸MacBook Pro,为专业用户带来了巨大的飞跃。对于想要从搭载苹果自研芯片的上一代MacBook Pro或基于Intel的Mac电脑升级的客户来说,现在正是最好的时机。
我读起来感觉就像是:“哎呀,我们把M1 MacBook Pro做得太好了,请你们升级吧!”
我觉得我的这台还能再用2到5年。
苹果:如果你能为硬件提供足够详尽的文档,让Asahi团队能打造出完善的Linux体验,我今年就买一台!
https://news.ycombinator.com/item?id=47249689
Having been both the interviewer and the candidate in this kind of situation, this is really a big interviewer training failure.
The general way to handle this as an interviewer is really simple: acknowledge that the interviewee gave a good answer, but ask that for the purposes of evaluating their technical design skills that you’d like for them to design a new system/code a new implementation to solve this problem.
If the candidate isn’t willing to suspend disbelief for the exercise, then you can consider that alongside all of the other signals your interviewer team gets about the candidate. I generally take it as a negative signal, not because I need conformance, but because I need someone who can work through honest technical disagreements.
As a candidate, what’s worked for me before was to ask the interviewer if they’d prefer that I pretend ____ doesn’t exist and come up with a new design, but it makes me question whether I want to join that team. IMO it’s the systems design equivalent of the interviewer arguing with you about your valid algorithm because it’s not the one the interviewer expects.
munchbunny
作为面试官和候选人,我都经历过这种情况,这确实是一个严重的面试官培训失败。
面试官处理这种情况的标准方式其实很简单:首先承认候选人回答得很好,然后说明,为了评估其技术设计能力,希望他们能针对这个问题设计一个新系统/编写新的实现方案。
如果候选人不愿配合这个“假设性”的练习,那么面试官团队就可以将这一点视为评估候选人的多个信号之一。我个人通常将其视为一个负面信号,这并非因为我需要候选人盲从,而是因为我需要的是能够与同事坦诚技术分歧、共同解决问题的人。
作为候选人,我曾经成功应对过这种情况:我会询问面试官,他们是否更希望我假装“某个特定技术或条件”不存在,然后重新设计方案。但这个经历也让我开始质疑,我是否真的想加入那个团队。在我看来,这就像是系统设计版的“面试官因为你给出的算法不是他预想的那个,就与你争论你算法的有效性”一样。
https://news.ycombinator.com/item?id=47233325
I cannot be alone in feeling that titles (within “tech” in particular) are almost completely arbitrary? What constitutes a “senior”, “lead”, “principal” and “staff” X, respectively, has so much overlap that it really depends on the organisation. I myself have been called all of those things, but have honestly not been able to tell the difference: in some cases, I have had much more responsibility as a “senior backend developer” than a “staff engineer”. I have recently interviewed for a number of roles with titles like CTO, engineering manager, tech lead etc and there is so much overlap that they seem to be one and the same. Have worked at companies on three continents, in organisations ranging from 6 people to 10k+, so have seen a few titles.
halper
我肯定不是唯一一个觉得(尤其是在“科技”行业里)头衔几乎是完全凭感觉来定的人吧?“高级”、“主导”、“首席”和“资深”X(工程师/开发者等)的定义有太多的重叠,以至于完全取决于具体的组织。我自己就曾被冠以所有这些头衔,但老实说,我根本看不出有什么区别:在某些情况下,我作为“高级后端开发人员”承担的责任远多于作为“资深工程师”时。我最近面试了许多职位,比如首席技术官、工程经理、技术主管等等,这些职位的职责范围有太多重叠,看起来简直就像一回事。我曾在三大洲的公司工作,组织规模从6人到一万多人不等,所以也算是见识过不少头衔了。
https://news.ycombinator.com/item?id=47251908
In an alternative timeline, Firefox makes their context menu really short and someone writes a blog post ranting about how it deprives functionality from power users.
In fact, I’ve read several such rants about Firefox removing functionality from other parts of their UI.
It’s sure hard to make everyone happy.
agwa
在另一个时间线里,Firefox把右键菜单做得非常简短,于是有人写了一篇博客文章,猛烈抨击这种做法剥夺了高级用户的功能。 事实上,我读过好几篇类似的抱怨文章,都是在批评Firefox在其他界面部分也移除了功能。 要取悦所有人,可真不容易啊。
https://news.ycombinator.com/item?id=47253395
This is kind of a misleading title. While they “ended” the 30-percent cut, they are keeping a 20-percent cut.
jadar
这个标题有点误导性。他们虽然“结束”了30%的抽成,但保留了20%的抽成。
https://news.ycombinator.com/item?id=47237467
These sorts of core-density increases are how I win cloud debates in an org.
Identify the workloads that haven’t scaled in a year. Your ERPs, your HRIS, your dev/stage/test environments, DBs, Microsoft estate, core infrastructure, etc. (EDIT, from zbentley: also identify any cross-system processing where data will transfer from the cloud back to your private estate to be excluded, so you don’t get murdered with egress charges)
Run the cost analysis of reserved instances in AWS/Azure/GCP for those workloads over three years
Do the same for one of these high-core “pizza boxes”, but amortized over seven years
Realize the savings to be had moving “fixed infra” back on-premises or into a colo versus sticking with a public cloud provider
Seriously, what took a full rack or two of 2U dual-socket servers just a decade ago can be replaced with three 2U boxes with full HA/clustering. It’s insane.
Back in the late ’10s, I made a case to my org at the time that a global hypervisor hardware refresh and accompanying VMware licenses would have an ROI of 2.5yrs versus comparable AWS infrastructure, even assuming a 50% YoY rate of license inflation (this was pre-Broadcom; nowadays, I’d be eyeballing Nutanix, Virtuozzo, Apache Cloudstack, or yes, even Proxmox, assuming we weren’t already a Microsoft shop w/ Hyper-V) - and give us an additional 20% headroom to boot. The only thing giving me pause on that argument today is the current RAM/NAND shortage, but even that’s (hopefully) temporary - and doesn’t hurt the orgs who built around a longer timeline with the option for an additional support runway (like the three-year extended support contracts available through VARs).
If we can’t bill a customer for it, and it’s not scaling regularly, then it shouldn’t be in the public cloud. That’s my take, anyway. It sucks the wind from the sails of folks gung-ho on the “fringe benefits” of public cloud spend (box seats, junkets, conference tickets, etc…), but the finance teams tend to love such clear numbers.
stego-tech
这类核心密度提升,正是我在公司内部赢得云服务辩论的关键。
识别出一年内没有扩容的工作负载。例如您的ERP系统、HRIS系统、开发和测试环境、数据库、微软产品组合、核心基础设施等。(补充说明:同时也要识别出任何需要将数据从云传回私有环境进行处理的情况,以此排除这些工作负载,避免因出口数据传输而产生巨额费用)
为这些工作负载在AWS/Azure/GCP上计算为期三年的预留实例成本
再用同样的方法,为其中一台这样的高核心“披萨盒”式服务器做一次成本分析,但分摊周期为七年
你会发现,将“固定基础设施”迁移回本地机房或放入colo数据中心,相比于继续使用公共云服务提供商,能节省大量成本。
说真的,十年前需要一个或两个整机柜的2U双路服务器才能完成的任务,现在只需要三台带完全高可用/集群功能的2U服务器就能替换了。这简直太疯狂了。
早在2010年代末,我就当时所在的公司论证过:一次全球范围的虚拟化平台硬件升级及其配套的VMware许可证,其投资回报期为2.5年,这比使用相当的AWS基础设施成本更低。这个结论的前提是,我们假设许可证年通胀率为50%(那是在博通收购VMware之前;如果现在做同样的决策,我会认真考虑Nutanix、Virtuozzo、Apache Cloudstack,或者是的,甚至是Proxmox,前提是我们并非已经是使用Hyper-V的微软技术栈环境)——而且还能为我们额外提供20%的容量余量。如今唯一让我对这个论证有所保留的,是当前的内存和NAND闪存短缺,但即便是这样——希望也只是暂时的——对于那些围绕更长时间线进行规划、并拥有额外支持延长期(例如通过增值分销商可获得的三年延长支持合同)的组织来说,这也不是问题。
如果我们无法就此向客户收费,而且这些工作负载也不会定期扩容,那它就不应该放在公共云上。这就是我的看法。虽然这会让那些对公共云“附带好处”(如最佳看台座位、公费旅游、会议门票等)热情高涨的人感到失望,但财务团队通常会爱上这样清晰明了的数字。
https://news.ycombinator.com/item?id=47236877
This is the best laptop for the general consumer around $1k.
std_move
这是千元价位上最适合普通消费者的笔记本电脑。
在Windows笔记本电脑世界里,根本没有可比的产品。你或许可以买到更便宜的Windows笔记本,但它在几乎所有方面都会很糟糕——新款的平价苹果MacBook可能会是更好的选择。而在1000美元左右的价格上,两者根本没有可比性。我真希望情况不是这样。
https://news.ycombinator.com/item?id=47246631
We’re going to do it again, aren’t we? We’re going to take something simple and sensible (“write tests first”, “small composable modules”, etc.), give it a fancy complicated name (“Behavior-Constrained Implementation Lifecycle pattern”, “Boundary-Scoped Processing Constructs pattern”, etc.), and create an entire industry of consultants and experts selling books and enterprise coaching around it, each swearing they have the secret sauce and the right incantations.
The damn thing talks. You can just speak to it. You can just ask it to do what you want.
lbreakjai
我们又会重蹈覆辙,不是吗?我们会把一些简单而明智的做法(比如“先写测试”、“小型可组合的模块”等),冠以一个花哨又复杂的名称(比如“行为约束型实现生命周期模式”、“边界范围处理结构模式”等),然后围绕它打造一整个咨询行业,里面的专家们出售书籍、提供企业培训,每个人都声称自己掌握了独门秘方和正确的咒语。
该死的东西会说话。你直接跟它说话就行。你直接让它做你想做的事情就行。
https://news.ycombinator.com/item?id=47248847
This was pointed out humorously by Douglas Adams:
“..am I alone in finding the expression ‘it turns out’ to be incredibly useful? It allows you to make swift, succinct, and authoritative connections between otherwise randomly unconnected statements without the trouble of explaining what your source or authority actually is. It’s great. It’s hugely better than its predecessors ‘I read somewhere that…’ or the craven ’they say that…’ because it suggests not only that whatever flimsy bit of urban mythology you are passing on is actually based on brand new, ground breaking research, but that it’s research in which you yourself were intimately involved. But again, with no actual authority anywhere in sight.”
gwd
道格拉斯·亚当斯曾幽默地指出:
“……难道只有我一个人觉得‘it turns out’(结果发现)这个表达极其有用吗?它让你能在原本随机无关的陈述之间,快速、简洁且权威地建立联系,而无需费心解释你的信息来源或权威依据是什么。这太棒了。它比它的前身‘我某处读到说……’或怯懦的‘他们说……’好得多,因为它不仅暗示你所传播的任何站不住脚的城市传说实际上基于全新的、突破性研究,还暗示这项研究你本人还深度参与其中。但话说回来,却根本看不到任何实际的权威依据。”
https://news.ycombinator.com/item?id=47235257
Dianna got better sometime last year as well, just in time to fly home to Hawaii for her father’s funeral (yeah …), but she got a lot worse again later. I really hope things will keep going well for Dianna now.
Props for her husband who’s been incredible of taking care of her.
roelschroeven
戴安娜去年也曾好转过,正好赶回夏威夷参加父亲的葬礼(啧啧…),但后来病情又再次恶化。真心希望她现在的情况能越来越好。她丈夫在照顾她方面做得非常出色,真了不起。
https://news.ycombinator.com/item?id=47240567
The single biggest issue for me with ChatGPT right now is how absolutely awful it sounds in every answer. “Why it matters”, “the big picture”, “it’s not jut you”, the awful emphasis, the quotations with rhetorical questions, etc.. I don’t know if it’s intentional so you can easily spot ChatGPT-generated content on the web? The very first GPT-5 version was good but they ruined it immediately afterwards with “making the personality warmer” and making the same mistakes as 4o. I see now that they even ruined Japanese even though it was one of the best languages supported by ChatGPT (under “Limitations” at the end). I don’t use it anymore, immensely disappointed.
sunaookami
目前对我来说,ChatGPT 最大的问题在于它每个回答的语气都糟糕透顶。“为什么这很重要”、“大局观”、“不只是你这样”,还有那种糟糕的强调方式、带修辞问题的引用等等。我不知道这是否是故意的,好让你能轻易地在网络上识别出由 ChatGPT 生成的内容?最初的 GPT-5 版本其实不错,但他们后来立刻搞砸了,用“让个性更温暖”的名义,犯了和 4o 一样的错误。我现在看到他们甚至把日语也搞砸了,尽管日语原本是 ChatGPT 支持得最好的语言之一(在文末的“局限性”部分里)。我已经不再使用了,感到极度失望。
https://news.ycombinator.com/item?id=47234879
I am in my mid forties, been working as a professional software developer for over 20 years.
I click “accept the cookies” almost every time. I just personally don’t feel it’s worth the effort and cost to try to avoid it.
What “dark pattern cookie trick” are you worried about? I just can’t come up with a scenario where it will actually harm me in any way. All the examples I have heard are either completely implausible, don’t actually seem that bad to me, or are things that are trivially easy to do even without any cookies.
Now, I am not going around giving my real email out to random sites, though, although even that doesn’t strike me as particularly dangerous. I already get infinite spam, and I am sure there are millions of other ways to get my email address… it is supposed to be something you give out, after all.
I just don’t think it is something that is worth stressing out about and fighting against. Maybe I am actually naive, but I just have not yet been convinced I should actually care.
cortesoft
我四十多岁,从事专业软件开发工作已有二十多年。我几乎每次都会点击“接受cookies”。我个人只是觉得,为了避开它而付出的努力和代价并不值得。你在担心什么“黑暗模式的饼干把戏”?我就想不出一个场景,能让我在其中真正受到任何伤害。我听过的所有例子,要么是完全不可信的,要么在我看来并没有那么糟糕,要么就是即便没有任何cookies也轻而易举能做到的事情。不过,我不会到处把我的真实邮箱地址随便给那些不认识的网站,虽然即便那样,我也并不觉得有什么特别危险的。我早就已经收到无穷无尽的垃圾邮件了,而且我肯定有无数其他途径能获取到我的邮箱地址……毕竟,它本就是用来被分享的东西。我只是觉得这不值得为此焦虑和抗争。也许我真的很天真,但我还没有被说服我应该真的在乎这些。
https://news.ycombinator.com/item?id=47250860
ICE has been detaining Chinese people in my area (and going door to door in at least one neighborhood where a lot of Chinese and Indians live). I was hearing about this just last week as word spread amongst the Chinese community here (Ohio) to make sure you have some legal documentation beyond just your driver’s license on you at all times for protection. People will hear about this through the grapevine and it has a massive (and rightly so) chilling effect. US labs can try but with US government behaving like it is I don’t think they will have much luck.
*edit: not that it matters, but since MAGA can’t help but assume, these are all US citizens and green card holders that I am referring to.
gaoshan
移民和海关执法局(ICE)正在我所在的地区拘留中国人(并且至少在一个华人印度裔聚居的社区进行挨家挨户的搜查)。上周我还听说,随着消息在我这里(俄亥俄州)的华人社区传开,大家都在互相提醒,为了自保,务必随身携带驾照以外的合法身份证明文件。人们会通过口耳相传了解到这件事,并因此产生了巨大的(而且完全在情理之中的)寒蝉效应。美国的实验室或许可以尝试,但照美国政府现在的行事方式,我看他们不会有什么好结果。
*编辑:虽然这无关紧要,但既然“让美国再次伟大”(MAGA)派忍不住要妄加揣测,我说的这些人全都是美国公民和绿卡持有者。
https://news.ycombinator.com/item?id=47251715
Why do all of the above have …? No clue.
The “…” convention is used when menu options open a dialog box rather than just immediately doing the action.
wvenable
为什么以上所有都有“…”?我不知道。“…”这个惯例是指,当菜单选项会打开一个对话框,而不是直接执行操作时。
https://news.ycombinator.com/item?id=47243038
Brilliant. They’re repackaging the argument governments have long made about E2EE being dangerous to children.
xeckr
太棒了。他们重新包装了政府长期以来一直持有的论点,即端到端加密对儿童有害。
https://news.ycombinator.com/item?id=47236785
I’m a bit confused by this branding (never even noticed that there was a 5.2-Instant), it’s not a super fast 1000tok/s Cerebras based model which they have for codex-spark, it’s just 5.2 w/out the router / “non-thinking” mode?
I feel like openai is going to get right back to where they were pre GPT-5 with a ton of different options and no one knows which model to use for what.
Flux159
我对这个品牌命名有点困惑(我甚至都没注意到有 5.2-Instant 这个版本),它并非像他们为 Codex-Spark 提供的那种基于 Cerebras 的、速度极快的 1000tok/s 模型,它只是 5.2 版本,没有路由器,或者说是一种“非思考”模式?
我感觉 OpenAI 又会回到 GPT-5 之前的状态,提供一大堆不同的选项,结果没人知道该在什么场景下使用哪个模型。
https://news.ycombinator.com/item?id=47234436
I chased down what the “4x faster at AI tasks” was measuring:
Testing conducted by Apple in January 2026 using preproduction 13-inch and 15-inch MacBook Air systems with Apple M5, 10-core CPU, 10-core GPU, 32GB of unified memory, and 4TB SSD, and production 13-inch and 15-inch MacBook Air systems with Apple M4, 10-core CPU, 10-core GPU, 32GB of unified memory, and 2TB SSD. Time to first token measured with an 8K-token prompt using a 14-billion parameter model with 4-bit quantization, and LM Studio 0.4.1 (Build 1). Performance tests are conducted using specific computer systems and reflect the approximate performance of MacBook Air.
jbellis
我查明了“AI任务快4倍”具体指的是什么测试:
苹果于2026年1月进行的测试,使用的是配备Apple M5、10核CPU、10核GPU、32GB统一内存和4TB SSD的13英寸和15英寸MacBook Air工程样机,以及配备Apple M4、10核CPU、10核GPU、32GB统一内存和2TB SSD的13英寸和15英寸MacBook Air量产机型。首次响应时间是通过使用8K token的提示,在4位量化的140亿参数模型上,使用LM Studio 0.4.1(版本1)进行测量的。性能测试是在特定的计算机系统上进行的,并反映了MacBook Air的大致性能。
2026-03-04 08:16:31
- Meta 的 Ray‑Ban AI 眼镜依赖肯尼亚标注员处理高度私密视频并存在无法关闭的数据共享与指示灯设计缺陷,暴露出跨国低薪数据劳动与隐私风险。
- 基于 p5.js 的 SketchXKCD 将 xkcd 的“互联网依赖图”做成交互化可拖拽示例,用于物理模拟与可视化教学并引发对互联网基础设施隐喻的讨论。
- 不列颠哥伦比亚省自 2026 年起永久采用夏令时以减少调时影响,但可能加剧冬季早晨黑暗并给跨境商业与航班协调带来挑战。
- 作者反对普遍的在线身份与年龄验证,宁可放弃服务或转向更隐私友好的替代,警示此类措施的社会与隐私成本。
- Apple 发布搭载 M5 Pro 与 M5 Max 的 14" 与 16" MacBook Pro,强调本地 AI 能力与性能提升,但其 AI 性能宣传可能存在夸大。
- Ars Technica 因记者在报道中引用经 AI 生成的捏造引语撤稿并解雇该记者,凸显新闻机构在 AI 使用与事实核验上的伦理与流程问题。
- 作者自建端到端语音代理通过精确的说话-倾听切换、靠近部署与多模型协同实现约 400ms 延迟,展示低延迟语音交互的可行性与安全隐忧。
- NanoClaw 作者因未及时建站被假站篡夺搜索排名并可能被用于诈骗,呼吁搜索引擎改进识别与排名以保护开源项目。
- Knuth 记录 Anthropic 的 Claude 在求解有向哈密顿循环分解问题中发现适用于奇数 m 的构造并给出证明,讨论大模型在科研中的创造性与局限。
- Physics Girl 回归发布视频,介绍如何通过超级神冈等探测器利用中微子对太阳成像,并分享她从长期新冠康复重返创作的经历。
Meta 公司推出的智能眼镜“Meta Ray-Ban Glasses”被宣传为集实时翻译、人脸识别、旅行导航等功能于一体的 AI 助手,旨在取代智能手机。然而,瑞典《每日新闻报》(Svenska Dagbladet)与哥德堡晚报(Göteborgs-Posten)联合调查发现,这些眼镜背后依赖的 AI 训练数据,大量来自远在非洲肯尼亚的外包员工。
这些员工隶属于 Meta 的外包公司 Sama,位于内罗毕的办公区。他们被称为“数据标注员”,负责人工标注图像和视频中的物体、动作、人物等信息,以训练 AI 系统。工作内容包括框选物体、标记人脸、识别场景,甚至处理敏感内容。
调查揭示,部分标注的视频素材涉及高度私密的场景,如用户在家中上厕所、更衣、亲密行为等。有员工表示,曾看到有人将眼镜放在床头柜上离开房间,随后配偶进入房间换衣服;也有员工描述有人穿着眼镜走出浴室,伴侣正裸身出现。这些画面来自真实用户的日常使用,而用户可能完全 unaware 自己正在被记录。
尽管员工签署保密协议,且面临被解雇的风险,但他们仍感到心理不适。他们坦言,每天面对的不仅是技术任务,更是他人隐私的暴露。这些“活体数据标注员”在低收入国家从事高强度、低透明度的工作,支撑着硅谷巨头的 AI 革命。
调查还指出,Meta 的 AI 系统依赖全球范围内的劳动力,而这些劳动者的存在几乎不为公众所知。技术进步的背后,是跨国数据劳动的隐秘链条。
https://news.ycombinator.com/item?id=47225130
https://editor.p5js.org/isohedral/full/vJa5RiZWs
一个互动式图形创作工具 SketchXKCD,基于 isohedral 项目开发。用户可以操作 XKCD 非常有名的一个静态画作:互联网依赖图,这个作品将其改成了动态交互效果:用户尝试移动某些模块,看看造成什么影响。
https://news.ycombinator.com/item?id=47230704
https://www.cbc.ca/news/canada/british-columbia/b-c-adopting-year-round-daylight-time-9.7111657
British Columbia 省政府宣布将永久采用夏令时,从 2026 年 3 月 8 日起,民众将不再需要每年调整时钟。这是该省最后一次进行时钟调整,此后将不再“春向前、秋向后”。省长尹大伟表示,时钟变动带来诸多问题,包括影响儿童和家长的睡眠、宠物作息紊乱,以及增加交通事故风险。
新时间制度将被称为“太平洋时间”,与育空地区全年保持一致。东部部分原使用山地时间的社区不受此次调整影响。尽管 2019 年已有立法支持该政策,但此前因等待美国邻近州如华盛顿州、俄勒冈州和加州同步推进而延迟。目前美国国会尚未通过相关法案,但尹大伟希望邻近州能跟进。
专家指出,取消时钟变动有助于减少“全民时差”带来的健康影响,尽管此举可能引发跨边境商业和航空运营的协调挑战。部分商业团体和机场方面表示担忧,认为单方面改变时间可能造成混乱,影响跨境业务和航班调度。
2019 年的一项公众咨询显示,93% 的受访者支持全年采用夏令时,其中多数人出于健康和福祉考虑。然而,仍有 54% 的人认为与邻近司法管辖区政策一致至关重要。目前,加拿大联邦独立企业联合会等组织质疑该决策是否真正出于公共利益,怀疑其背后可能有政治动机。
https://news.ycombinator.com/item?id=47223620
作者 Neil 在博客中反思了当前日益流行的在线服务身份与年龄验证政策,指出这些措施往往缺乏清晰的目标和深入的社会考量,更多是追求技术层面的“快速解决方案”。他坦言,自己目前无法想到任何愿意进行身份或年龄验证的在线服务。
他列举了自己常用的各类网络服务,包括 RSS 订阅、视频观看(通过 Jellyfin)、开源项目贡献、维基百科、Signal、Zoom/Teams 等,明确表示在这些场景下,他宁愿放弃使用相关服务,也不愿牺牲隐私和自由。例如,他可以转向离线的 Kiwix 阅读维基百科,用 XMPP 替代 Signal,或通过 Tor 访问受限内容。
对于需要身份验证的平台,如论坛、评论区、视频网站等,他并不依赖,因此影响不大。即便未来某些服务强制验证,他虽会反对,但实际可能选择退出,体现出一种“自我主导的数字孤立主义”。
最后,他承认未来或许会出现某个他极其渴望使用、不得不接受验证的服务,但目前尚无此情况。整体观点强调对隐私保护的坚持,以及对技术治理中忽视社会影响的批判。
https://news.ycombinator.com/item?id=47232768
https://www.apple.com/newsroom/2026/03/apple-introduces-macbook-pro-with-all-new-m5-pro-and-m5-max/
Apple 今日宣布推出搭载全新 M5 Pro 与 M5 Max 芯片的 14 英寸和 16 英寸 MacBook Pro,进一步提升专业级笔记本性能与本地 AI 能力。
新芯片采用苹果自研的 Fusion 架构,将两个芯片整合为单系统,专为 AI 优化。M5 Pro 与 M5 Max 搭载全新 18 核 CPU,包含 6 个超高速核心和 12 个高性能核心,CPU 性能最高提升 30%。GPU 配备每个核心内置的神经加速器,AI 性能相比上一代 M4 系列提升最高达 4 倍,相比 M1 系列提升高达 8 倍。
新 MacBook Pro 支持本地运行大型语言模型(LLM),开发者可在设备上训练定制模型,创意工作者可利用 AI 工具进行视频剪辑、音乐制作与设计。图形性能相比 M4 系列提升最高达 50%,适合复杂 3D 场景实时渲染与视觉特效即时预览。
存储方面,M5 Pro 起始容量为 1TB,M5 Max 起始为 2TB,SSD 速度提升最高达 2 倍。统一内存带宽显著提升,M5 Pro 最高支持 64GB 内存与 307GB/s 带宽,M5 Max 可达 128GB 与 614GB/s。
配备全新 N1 无线芯片,支持 Wi-Fi 7 与蓝牙 6,连接更稳定高效。电池续航最长可达 24 小时,搭载 Liquid Retina XDR 显示屏,支持纳米纹理选项。配备 12MP Center Stage 摄像头、六扬声器沉浸式音响系统,支持 Apple Intelligence 功能与 macOS Tahoe 系统。
新 MacBook Pro 提供空间黑与银色两种配色,将于 3 月 4 日开启预购,3 月 11 日正式发售。
https://news.ycombinator.com/item?id=47232453
https://futurism.com/artificial-intelligence/ars-technica-fires-reporter-ai-quotes
Ars Technica 资深 AI 记者本杰·爱德华兹(Benj Edwards)因一篇包含 AI 伪造引语的报道被解雇。该文章最初于 2026 年 2 月 13 日发布,题为描述一名工程师斯科特·尚巴 ugh 被 AI 代理发布负面文章的事件。文章中引用了尚巴 ugh 的言论,但经核实,这些引语系 AI 生成,本人从未说过。
事件曝光后,Ars Technica 于 2 月 17 日发布撤稿声明,编辑总监肯·费舍尔承认这是“严重违反编辑标准”的失误,并称该错误为“孤立事件”。爱德华兹随后在社交平台 Bluesky 上公开承担责任,表示自己在生病、睡眠不足的情况下,尝试使用实验性 AI 工具(Claude Code)提取原始资料,但工具失效后转用 ChatGPT,误将 AI 生成的转述内容当作真实引语使用。他强调文章主体为人工撰写,公司政策严禁 AI 生成内容,此次事件不代表整体编辑标准。
文章发布后,读者在评论区强烈抗议,引发广泛争议。2 月 27 日,Ars 创意总监奥里奇·劳森宣布已完成内部审查,并采取相应措施。不久后,爱德华兹的个人页面从“现任记者”更新为“曾任记者”,暗示其已离职。
该事件再次凸显当前媒体行业在 AI 应用与伦理规范之间的困境:尽管 AI 被广泛推广,但缺乏清晰的使用准则。同时,新闻机构面临版权纠纷、AI 生成内容泛滥、Google“AI 摘要”功能导致流量下滑等多重挑战。此次事件也反映出,即使熟悉 AI 的从业者,仍可能在高压或疲劳状态下因 AI“幻觉”而犯下严重错误。
爱德华兹在社交平台表示,自己对准确性极为重视,此次失误“令人痛苦”。该事件成为 AI 时代新闻伦理危机的又一典型案例。
https://news.ycombinator.com/item?id=47226608
https://www.ntik.me/posts/voice-agent
作者 Nick Tikhonov 分享了自己在六个月内为一家大型消费品公司开发语音代理原型的经历,并由此萌生了自己构建一个低延迟语音代理系统的念头。尽管市场上已有 Vapi、ElevenLabs 等成熟的语音代理平台,但这些平台隐藏了大量底层复杂性。作者决定深入底层,亲自构建语音代理的核心协调层。
他通过实验发现,仅用约一天时间和 100 美元的 API 费用,就能搭建出一个性能优于 Vapi 的语音代理系统,端到端延迟低至约 400 毫秒,比 Vapi 快两倍。
文章核心在于揭示语音代理的真正难点:实时的“说话-倾听”状态切换。与文本对话不同,语音交互是连续的,系统必须精准判断用户何时停止说话,何时开始回应。判断失误会导致打断、延迟或沉默,严重影响体验。
作者将整个系统简化为一个“说话-倾听”状态机,核心是两个状态和两个关键转换:
他首先用 Silero VAD(语音活动检测)实现基础版本,仅通过播放预录音频验证了状态切换的可行性,建立了最低延迟基准。
但 VAD 只能识别“是否有声音”,无法判断“是否说完”。因此,他引入 Deepgram 的 Flux 流式 API,该模型能结合音频信号与实时转录文本,更准确地识别用户发言结束的时机。
最终,他构建了一个完整的流式处理管道:通过 Twilio 接收 WebSocket 音频流,使用 Silero VAD 进行初步检测,用 Deepgram Flux 进行转录与说话人切换判断,再调用大语言模型生成响应,并通过 ElevenLabs 的 TTS 模型实时合成语音输出。整个过程实现端到端流式传输,确保低延迟与自然对话感。
文章强调,语音代理的成败不在于单个模型,而在于多模型之间的时序协调。作者还指出,地理位置选择(如将服务部署在靠近用户的位置)和模型选型对延迟影响极大。
文中配有音频演示和架构图,帮助读者直观理解系统运作。作者也借此呼吁:在 AI 与语音产品开发中,理解底层机制比依赖黑盒平台更为关键。
https://news.ycombinator.com/item?id=47224295
https://twitter.com/Gavriel_Cohen/status/2028821432759717930
Gavriel Cohen 是开源项目 NanoClaw 的创建者,他在社交平台 X(原 Twitter)上发表了一篇关于谷歌搜索问题的长文,表达了对谷歌搜索结果的不满。他指出,当人们在谷歌搜索 “NanoClaw” 时,排名第二的竟然是一个虚假网站(nanoclaw.net),而他的真实官方网站却没有出现在前几页的搜索结果中。
在文中,Cohen 讲述了 NanoClaw 自 2 月 2 日发布以来的快速成长,项目获得了广泛关注和许多 GitHub 星标,但由于他最初没有建立网站,导致一个人抓取了他的 README 信息并创建了一个虚假网站。尽管这个网站包含错误信息,并且有广告,很多用户却误以为这是官方网站。
为了解决这个问题,Cohen 在两周前建立了一个正式网站,并进行了大量的 SEO 优化工作,包括将网站链接添加到 GitHub 页面、向 Google Search Console 提交、发布博客文章、翻译网站等。但尽管他采取了这些措施,谷歌依然将虚假网站排名靠前,导致他失去了对自己项目的控制。
Cohen 强调这不仅是一个 SEO 问题,更是谷歌搜索的根本问题。他反对仅仅依靠优化技术或购买广告来争夺搜索排名,认为这些都不是解决方案。他担心虚假网站可能会被用来传播恶意软件或进行网络诈骗,而谷歌作为信息的主要入口,却无法识别出哪个网站才是合法的。
他指出,谷歌在处理这种明确的信息时都无法给出正确答案,这让人们对谷歌在提供其他重要信息(如医疗、金融等)时的可靠性产生疑问。Cohen 表达了他希望能专注于代码开发和社区建设,而不是陷入与谷歌的 SEO 战争。他呼吁谷歌提升其搜索算法的准确性,以确保用户能够找到真正可靠的信息。
最后,他提醒用户,如果访问了 nanoclaw.net,那不是他们的官方网站,真实的网站链接是他所提供的。
https://news.ycombinator.com/item?id=47232158
https://www-cs-faculty.stanford.edu/~knuth/papers/claude-cycles.pdf
这篇论文由斯坦福计算机科学系的 Donald Knuth 撰写,记录了他目睹人工智能解决一个长期悬而未决的数学问题的经历。
Knuth 一直在研究一个有向哈密顿循环的分解问题:考虑一个有 m³ 个顶点的有向图,每个顶点标记为 ijk(其中 0≤i,j,k<m),每个顶点有三条出弧分别指向 i+jk、ij+k 和 ijk⁺(这里 i⁺ 表示(i+1) mod m)。问题是能否将所有弧分解为三个有向 m³-循环,适用于所有 m>2 的情况。Knuth 本人只解决了 m=3 的情形,他的朋友 Filip Stappers 通过计算验证了 4 到 16 之间的解存在,但一般构造仍然未知。
Stappers 将这个问题提交给 Anthropic 的混合推理模型 Claude Opus 4.6。Claude 经历了 31 次系统性的探索才找到答案。它首先尝试简单的线性或二次函数方法失败,然后尝试深度优先搜索发现计算量过大,接着研究二维和三维蛇形模式,引入纤维分解概念,尝试模拟退火算法寻找规律。最终 Claude 发现对于奇数 m,存在一种简洁的构造方法:根据 s=(i+j+k) mod m 的值以及 i、j 是否处于边界(0 或 m-1)来决定状态转移方向。
Knuth 随后为这个构造提供了严格的数学证明,证实三个循环确实都是哈密顿循环且覆盖了所有顶点。他还定义了"可推广循环"的概念,发现在 m=3 时的 11502 个哈密顿循环中,有 996 个可以推广到所有大于 1 的奇数 m。依赖于 i、j、s 边界状态的"Claude-like"分解共有 760 种,其中 Claude 发现的只是其中之一。
对于偶数 m,问题仍然开放。已知 m=2 不可能,Claude 找到了 m=4、6、8 的具体解但无法给出一般构造,后续尝试也未能成功。
整个解题过程历时约一小时,Knuth 认为这展示了自动推理和创造性问题解决的显著进步,尽管 Claude 在偶数情形中最终陷入困境,但这次成功仍然令人印象深刻。
https://news.ycombinator.com/item?id=47230710
https://www.youtube.com/watch?v=B3m3AMRlYfc
这是一个由物理女孩(Physics Girl)发布的 YouTube 视频,标题为《我三年来的第一支科学视频》。视频发布于 2026 年 3 月 3 日,时长约为 14 分 40 秒,已获得 44.4 万次观看。
视频内容围绕一个令人困惑的科学现象展开:一张看似在夜晚拍摄的照片,却呈现出白天的光照效果。Dianna Cowern(物理女孩)作为创作者,以她一贯的探索风格,通过实验和物理原理揭示这一现象背后的科学解释,引发观众对光、时间与视觉感知的思考。
Dianna 是麻省理工学院物理学背景的科学传播者,曾长期与 PBS 数字工作室合作,后回归独立创作。此次视频是她因严重长期新冠(Long COVID)休养三年后的首次回归之作,具有特殊意义。
视频中展示了多个科学图像与实验,包括来自超级神冈探测器(Super-Kamiokande)和 NASA 的影像资料,配乐为 Jingle Punks 的《On the Bach》。视频结尾附有感谢名单,特别鸣谢了“X 射线层级” Patreon 赞助者。
该视频不仅是一次科学知识的分享,也传递了坚持与康复的积极信息,体现了科学探索中的好奇心与韧性。
https://news.ycombinator.com/item?id=47233110
https://news.ycombinator.com/item?id=47233421
I was sitting in a room the other day with a young adult, we were searching for additional algorithm learning materials. They searched in Google, and accept the cookies. They clicked on a website, and accepted those cookies too. They then started entering their email address to access another service. I was completely taken aback.
I’m the sort of person that either rejects the cookies, or will use another site entirely to avoid some weird dark-pattern cookie trickery. I don’t like the idea of any particular service getting more information than they should.
Siting there I realized, we were not the real target. It is the young people that are growing up conditioned to press accept, enter any details asked of them, and to not value their personal data. Sadly, the damage is already done.
bArray
前几天,我和一个年轻人坐在房间里,我们一起在寻找额外的算法学习资料。他们在谷歌上搜索,然后接受了cookies。他们点击了一个网站,又接受了那些cookies。接着,他们开始输入自己的电子邮箱地址来访问另一个服务。我感到非常震惊。
我这种人要么会拒绝cookies,要么会直接换一个网站,以避免那些奇怪的、带有诱导性的cookie小把戏。我不希望任何特定的服务获取超出其应有范围的信息。
坐在那里,我突然意识到,我们(像我这样的人)才是真正的目标。那些从小就习惯于点击“接受”、对任何要求提供的信息都照做、并且不重视自己个人数据的年轻人,才是他们真正的目标。可悲的是,伤害已经造成了。
https://news.ycombinator.com/item?id=47225452
Instinctively, I think morning light is important to our biology for a daily reset
I’d bet people would happily trade away the inkling of light they get during their winter commute before locking themselves into their office for some extra daylight when they leave that office.
Daylight is most enjoyable if you can actually make use of it.
jorvi
直觉上,我认为晨光对我们的生物钟进行每日重置非常重要。 我敢打赌,人们会很乐意把冬天通勤时得到的那一点点微光,换成离开办公室后多一些的日照。 白天的阳光,只有在你能真正利用它的时候,才最让人享受。
https://news.ycombinator.com/item?id=47231471
I would suggest adding the /r/ProgrammerHumor version too: https://www.reddit.com/r/ProgrammerHumor/comments/1p204nx/actuallycompleteversion/
The AI crank always cracks me up.
BoppreH
我也建议加上 /r/ProgrammerHumor 版本的:https://www.reddit.com/r/ProgrammerHumor/comments/1p204nx/actuallycompleteversion/
那个 AI 狂人总是把我逗笑。
https://news.ycombinator.com/item?id=47232961
A couple years back John Reilly posted on HN “How I ruined my SEO” and I helped him fix it for free. He wrote about the whole thing here: https://johnnyreilly.com/how-we-fixed-my-seo
Happy to do the same for you if you want.
The quickest win in your case: map all the backlinks the .net site got (happy to pull this for you), then email every publication that linked to it. “Hey, you covered NanoClaw but linked to a fake site, here’s the real one.” You’d be surprised how many will actually swap the link. That alone could flip things.
Beyond that there’s some technical SEO stuff on nanoclaw.dev that would help - structured data, schema, signals for search engines and LLMs. Happy to walk you through it.
update: ok this is getting more traction than I expected so let me give some practical stuff.
Google Search Console - did you add and verify nanoclaw.dev there? If not, do it now and submit your sitemap. Basic but critical.
I checked the fake site and it actually doesn’t have that many backlinks, so the situation is more winnable than it looks.
Your GitHub repo has tons of high quality backlinks which is great. Outreach to those places, tell the story. I’m sure a few will add a link to your actual site. That alone makes you way more resilient to fakers going forward. This is only happening because everything is so new. Here’s a list with all the backlinks pointing to your repo:
https://docs.google.com/spreadsheets/d/1bBrYsppQuVrktL1lPfNm5GHa2AcmxPpxSurSAnjSXeg/edit?usp=sharing
Open social profiles for the project - Twitter/X, LinkedIn page if you want. This helps search engines build a knowledge graph around NanoClaw. Then add Organization and sameAs schema markup to nanoclaw.dev connecting all the dots (your site, the GitHub repo, the social profiles). This is how you tell Google “these all belong to the same entity.”
One more thing - you had a chance to link to nanoclaw.dev from this HN thread but you linked to your tweet instead. Totally get it, but a strong link from a front page HN post with all this traffic and engagement would do real work for your site’s authority. If it’s not crossing any rule (specific use case here so maybe check with the mods haha) drop a comment here with a link to nanoclaw.dev. I don’t think anyone here would mind if it will get you few steps closer towards winning that fake site
Growtika
几年前 John Reilly 在 Hacker News 上发了一篇名为“我如何搞砸了我的SEO”的文章,我免费帮他修复了。他在这里写了整个事情的经过:https://johnnyreilly.com/how-we-fixed-my-seo
如果你需要,我也很乐意为你效劳。
对你来说,最快见效的办法是:整理出 .net 网站获得的所有反向链接(我可以帮你提取),然后给所有链接到它的出版物发邮件。“嘿,你们报道的是 NanoClaw,但链接到了一个假网站,这里是正确的。” 你会发现,真的会有很多愿意更换链接。仅此一举就可能扭转局势。
除此之外,nanoclaw.dev 上还有一些技术性的SEO优化可以提供帮助——比如结构化数据、模式标记(Schema)、面向搜索引擎和大型语言模型的信号。我也很乐意为你一步步讲解。
更新: 好吧,这比我预想的要火,让我再提供一些实操性建议。
nanoclaw.dev?如果还没有,现在就去操作,并提交你的网站地图。这是基础但至关重要的一步。nanoclaw.dev 上添加 Organization 和 sameAs 模式标记,将所有点连接起来(你的网站、GitHub 仓库、社交资料)。这就是在告诉谷歌:“这些都属于同一个实体。”nanoclaw.dev,但你却链接到了你的推文。我完全理解,但来自首页 HN 帖子、有这么多流量和互动的强力链接,对你网站的权重会很有帮助。如果这不违反任何规定(具体情况特殊,哈哈,最好还是问问版主),可以在下面评论一下,附上 nanoclaw.dev 的链接。我相信这里不会有人介意,如果这能让你在战胜那个假网站的道路上更进一步的话。https://news.ycombinator.com/item?id=47228363
Journalists and bloggers usually write about others’ mess ups and apologies, dissecting which apologies are authentic and which apologies are non-apologies.
In this incident, Aurich Lawson of Ars Technica deleted the original article (which had LLM hallucinated quotes) instead of updating it with the error. He then published a vague non-apology, just like large companies and politicians usually do. And now we learn that this reporter was fired and yet Ars Technica doesn’t publish a snippet of an article about it.
There’s something to be said about the value of owning up to issues and being forthright with actions and consequences. In this age of indignation and fear of being perceived as weak or vulnerable due to honesty, I would’ve thought that Ars would be or could’ve been a beacon for how things should be talked about.
It’s sad to see Ars Technica at this level.
AnonC
记者和博主们通常热衷于报道他人的失误与道歉,剖析哪些是真诚的道歉,哪些又不过是敷衍了事的“伪道歉”。
在此次事件中,Ars Technica 的 Aurich Lawson 删除了那篇包含 LLM(大型语言模型)生成错误引述的原始文章,而不是更正错误。随后,他发布了一份含糊其辞的“伪道歉”,这和大公司、政客们惯用的手段如出一辙。而现在我们得知,这位记者已经被解雇,但 Ars Technica 却对此事只字不提。
坦诚面对问题、坦率地承担行为与后果,其价值不言而喻。在这个充满愤怒、又因害怕被视为软弱或坦率而暴露脆弱的时代,我原以为 Ars Technica 应当,或者说本可以,成为如何正确处理此类事件的典范。
看到 Ars Technica 沦落至此,令人深感遗憾。
https://news.ycombinator.com/item?id=47224234
I’m in BC. The astro-nerd in me would have preferred to see permanent Standard Time instead of a permanent +1 offset. Instinctively, I think morning light is important to our biology for a daily reset and the solar cue of “high noon” is also a real thing. I’m sure I’ve read that sleep health experts have historically supported a change to permanent Standard Time, not DST.
I respect there are economic arguments for permanent DST. But I question the road safety stat I hear with announcements like this. Kids walking, biking, and being driven to school in mornings in darkness … that’s also what permanent DST gives us.
Oh well, I am in the minority it seems. So R.I.P. “high noon” … I’ll never see you again here. And, yes, I understand that depending on where one is within a time zone, a true “high noon” is only in theory. But it’s a nice ideal. :-)
emptybits
我在BC省。我内心那个天文爱好者,宁愿看到永久性的标准时间,而不是永久性的+1小时时差。凭直觉,我认为晨光对我们的生物钟重置很重要,而“正午”的太阳信号也是真实存在的。我敢肯定我读到过,睡眠健康专家历来都支持改为永久标准时间,而不是夏令时。
我尊重支持永久夏令时的经济论点。但我对听到的这类公告中的道路安全统计数据表示质疑。孩子们在清晨的黑暗中步行、骑车或乘车上学……这也是永久夏令时带给我们的。
唉,看来我是少数派了。所以,“正午”就此安息吧……我再也见不到你了。而且,是的,我明白,在一个时区内,真正的“正午”理论上只存在于一个点。但这是一个美好的理想。
https://news.ycombinator.com/item?id=47226535
Oh, this is really interesting to me. This is what I worked on at Amazon Alexa (and have patents on).
An interesting fact I learned at the time: The median delay between human speakers during a conversation is 0ms (zero). In other words, in many cases, the listener starts speaking before the speaker is done. You’ve probably experienced this, and you talk about how you “finish each other’s sentences”.
It’s because your brain is predicting what they will say while they speak, and processing an answer at the same time. It’s also why when they say what you didn’t expect, you say, “what?” and then answer half a second later, when your brain corrects.
Fact 2: Humans expect a delay on their voice assistants, for two reasons. One reason is because they know it’s a computer that has to think. And secondly, cell phones. Cell phones have a built in delay that breaks human to human speech, and your brain thinks of a voice assistant like a cell phone.
Fact 3: Almost no response from Alexa is under 500ms. Even the ones that are served locally, like “what time is it”.
Semantic end-of-turn is the key here. It’s something we were working on years ago, but didn’t have the compute power to do it. So at least back then, end-of-turn was just 300ms of silence.
This is pretty awesome. It’s been a few years since I worked on Alexa (and everything I wrote has been talked about publicly). But I do wonder if they’ve made progress on semantic detection of end-of-turn.
Edit: Oh yeah, you are totally right about geography too. That was a huge unlock for Alexa. Getting the processing closer to the user.
jedberg
哦,这对我来说真的很有趣。这正是我在亚马逊Alexa上做的工作(而且我为此申请了专利)。
我当时学到的一个有趣事实是:对话中人类说话者之间的中位数延迟是0毫秒(零)。换句话说,在许多情况下,听者在说话者说完之前就开始发言了。你可能经历过这种情况,并谈论过你们如何“异口同声地接话”。
这是因为在你听对方说话时,你的大脑正在预测他们会说什么,并同时处理一个回答。这也是为什么当他们说出你没有预料到的话时,你会说“什么?”,然后在大脑修正信息后,过半秒才回答。
事实二:人类期望他们的语音助手有延迟,有两个原因。一个原因是他们知道这是一台需要思考的电脑。第二个原因是手机。手机有内置延迟,这种延迟会打断人与人之间的对话,你的大脑会把语音助手看作像手机一样。
事实三:Alexa几乎没有任何响应时间低于500毫秒。即使像“现在几点了”这种在本地服务的响应也是如此。
语义性的对话轮次结束是这里的关键。这是我们在几年前就在研究的东西,但当时没有足够的计算能力来实现它。所以至少在当时,对话轮次的结束就是300毫秒的沉默。
这太棒了。我离开Alexa项目已经有一段时间了(我所做的所有工作也都公开讨论过)。但我确实想知道他们在对话轮次结束的语义检测方面是否取得了进展。
编辑:哦,是的,关于你说的地理因素,你说的完全正确。这对Alexa来说是一个巨大的突破。将处理过程更靠近用户。
https://news.ycombinator.com/item?id=47228598
I don’t understand how a parent can be OK non-consenually uploading pictures of their children’s real faces to an ad driven AI company famous for abusing people’s data and manipulating children on their platforms.
greentea23
我不明白为什么父母会同意未经同意就上传他们孩子的真实照片给一个以广告驱动的AI公司,这家公司以滥用人们的数据和在其平台上操控儿童而闻名。
https://news.ycombinator.com/item?id=47238238
“it has no annoying fans”
I beg to differ ;)
noman-land
它没有烦人的风扇 恕我不同意;)
https://news.ycombinator.com/item?id=47223667
People make fun of me but I’ll never skip a chance to complain about how large these phones are. I hate it so much. I have a standard iPhone, not a max, and it causes real pain in my wrist if I use it too much. Was honestly thinking about downgrading to the last SE model even though it’s several years out of date.
danielvaughn
虽然人们总拿我开玩笑,但我绝不会放过任何机会抱怨这些手机太大了。我真的太讨厌了。我用的是标准版iPhone,不是Max版,用得太多的话手腕真的会疼。我真的在考虑要不要换成上一代的SE型号,即便它已经好几年没更新了。
https://news.ycombinator.com/item?id=47217165
What community is there to house around Microsoft Copilot? Seriously, why does Microsoft Copilot need a Discord Server? What do I talk about when I join the Microsoft Copilot server? What are we doing here?
quadruple
Microsoft Copilot 还需要一个什么样的社区?说真的,Microsoft Copilot 要 Discord 服务器做什么?我加入了 Microsoft Copilot 的服务器能聊什么?我们在这里做什么?
2026-03-03 08:37:01
- 摩托罗拉与 GrapheneOS 基金会建立长期合作,在新一代设备上推进基于 AOSP 的强化系统与企业隐私功能,并推出 Moto Analytics 与可自动清除照片敏感元数据的私有图像数据等 ThinkShield 服务。
- 微软在 Copilot 官方 Discord 启用关键词过滤屏蔽“Microslop”等变体并临时锁服以应对垃圾信息攻击,引发用户强烈反弹并暴露社区管理与品牌沟通矛盾。
- /e/OS 基于 AOSP 完全去谷歌化,提供替代服务、隐私评分、开源应用与端到端加密云存储,面向注重隐私的用户与开发者。
- 文章指出现代人因手机、耳机和社交软件等减少与陌生人面对面交流,从而削弱共情与社交“肌肉”,呼吁重建公共空间的简单人际互动以维护心理健康。
- git-memento 等实践建议将与 AI 的编码会话记录并作为清理后的文档附加到 Git 提交中,以保留可追溯的开发过程并提高可维护性。
- 在法官裁定 Flock 车牌识别摄像影像为公共记录后,埃弗雷特市关闭全部摄像头,引发关于公共安全、隐私与政府透明度的争论。
- Jolla 推出限量预售的全栈欧洲主导 Linux 智能手机,主打用户共建、隐私取向与稀缺性,计划 2026 年交付。
- WebMCP 发布早期预览,提供声明式与命令式 API,旨在让网站以结构化方式与 AI 代理交互,提高自动化操作的速度和可靠性。
- Anthropic 的 Claude Cowork 在 macOS 用户目录下无提示下载并持续重建高达 10GB 的虚拟机镜像,导致性能下降并需用户手动清理作为临时解决。
- NIST 拟议规则限制外籍研究人员在其实验室的访问时间与条件(含三年期限与夜间需联邦员工陪同),引发人才流失与科研开放性担忧。
https://motorolanews.com/motorola-three-new-b2b-solutions-at-mwc-2026/
Motorola 宣布与 GrapheneOS 基金会建立长期合作伙伴关系,标志着智能手机安全领域进入新阶段。双方将共同推动基于 Android 开源项目打造的强化操作系统 GrapheneOS 在摩托罗拉新一代设备中的兼容与应用,致力于提升全球用户的隐私与安全保护水平。
作为合作的一部分,Motorola 推出全新企业级功能 Moto Analytics,为 IT 管理员提供设备性能的实时洞察,涵盖应用稳定性、电池健康和网络连接等关键指标,助力企业提前发现并解决潜在问题,保障员工工作效率。
同时,Motorola 在 Moto Secure 平台中新增“私有图像数据”功能,可自动清除新拍摄照片中的敏感元数据(如位置信息、设备信息等),在不改变图像内容的前提下增强用户隐私保护。该功能将逐步推送至摩托罗拉旗舰设备。
上述创新均融入 Motorola 的 ThinkShield 安全生态系统,强化了其在企业市场的安全解决方案能力,彰显公司致力于提供安全、可靠、面向未来的智能技术承诺。
https://news.ycombinator.com/item?id=47214645
微软因在官方 Copilot Discord 服务器中屏蔽“Microslop”一词引发争议。该词是用户对微软 AI 战略的讽刺性称呼,源于其在 Windows 11 中过度推进 AI 功能而忽视系统稳定性。该屏蔽措施触发了社区强烈反弹,用户迅速尝试变体绕过过滤,如“Microsl0p”等。
随着用户持续测试和发布相关变体,服务器出现大规模异常行为,部分账号被禁言,随后微软宣布临时锁定整个服务器,限制消息发送与历史记录查看。这一举措被外界解读为对社区情绪失控的应对。
事后微软回应称,服务器实则遭受了有组织的垃圾信息攻击,表现为大量重复、无关内容刷屏,为遏制混乱,临时启用了关键词过滤。屏蔽“Microslop”等词仅为短期应急措施,并非长期政策。公司表示正加强防护机制,以保障社区安全与可用性。
该事件反映出微软在 AI 推广过程中面临的公众舆论压力,也揭示了其在社区管理与品牌沟通上的挑战。尽管 Copilot 在部分功能上具备优势,如集成 Google Contacts、Gmail 等服务,但整体用户满意度仍在下降。
https://news.ycombinator.com/item?id=47216047
/e/OS 是一个完全“去谷歌化”的开源移动操作系统,致力于为用户提供高度隐私保护的智能手机生态。它基于开源 Android 核心,移除了所有谷歌应用和服务,包括默认搜索引擎、网络时间协议和域名解析服务,并采用替代方案如 Murena Find 搜索引擎和 BeaconDB 地理定位服务,确保用户数据不被谷歌收集。
/e/OS 兼容所有主流 Android 应用,同时提供一套精心挑选的开源默认应用,涵盖邮件、日历、通讯、浏览器、天气等日常使用场景,界面设计简洁美观。所有应用均支持隐私评分,可实时查看应用中包含的追踪器数量及所需权限,帮助用户识别并避免高风险应用。
系统内置高级隐私功能,如可自定义的隐私控制面板、默认启用的广告拦截器、IP 地址和位置隐藏功能,有效抵御数字监控。用户可通过 Murena Workspace 账户(@murena.io)统一管理数据,享受 1GB 免费云存储、端到端加密的 Murena Vault 文件夹、在线文档协作等功能,替代传统云服务。
针对家庭用户,/e/OS 提供家长控制功能,支持内容过滤、应用安装限制和屏幕使用时间管理,并可通过“查找我的设备”功能定位儿童手机。
系统还配备“账户管理器”应用,可同步来自不同服务商的账户数据(如邮件、日历、联系人),所有数据本地存储,仅在必要时通过加密方式与第三方同步,保障隐私安全。
用户可通过三种方式获取 /e/OS:购买预装系统的 Murena 智能手机、使用网页版 /e/OS 安装器一键刷机(支持 WebUSB),或从 GitLab 下载源码自行安装。项目提供详尽的用户文档、社区论坛和 Telegram 技术支持渠道,适合新手与开发者使用。
/e/OS 项目获得爱丁堡大学与都柏林三一学院等学术机构认可,强调开源透明带来的可审计性与可信度。e.foundation 作为非营利组织,持续推动去中心化、隐私优先的数字未来。
https://news.ycombinator.com/item?id=47215489
文章探讨了现代社会中人与人之间面对面交流的逐渐消失,尤其是与陌生人交谈这一行为的式微。作者以自身经历为引,讲述在火车上与一位年长女性的短暂对话,以及在餐厅与服务员的轻松交流,这些看似平常的互动,如今却显得格外珍贵。
作者指出,如今许多人已不再主动与陌生人交谈,原因包括手机依赖、耳机使用、社交软件的普及、远程办公的兴起,以及疫情后形成的社交回避习惯。这种现象背后,是一种“社交规范的自我强化”:既然别人不说话,我也不说话,于是公共空间中的互动逐渐消失。
文章进一步分析,这种退缩不仅影响社交能力,更深层地削弱了人类基本的沟通与共情能力。心理学家和神经科学家警告,年轻一代在认知和社交技能上表现下滑,出现“全球关系衰退”的趋势。作者引用专家观点强调,与陌生人交谈并非为了深度连接,而是一种“社交肌肉”的日常锻炼,是维持心理健康与社会联结的重要方式。
最后,文章提到社交媒体上兴起的“与陌生人对话”实验视频,反映出人们对这种基本社交行为的怀念与渴望。作者呼吁人们重新尝试与陌生人交流,哪怕只是简单的一句问候,这不仅是对自我的挑战,也是对社会连接的重建。
https://news.ycombinator.com/item?id=47214864
https://github.com/mandel-macaque/memento
git-memento 是一个 Git 扩展工具,用于记录 AI 编码会话并将其作为注释附加到 Git 提交中。它在执行提交后,将清理后的 Markdown 格式对话记录以 Git 注释的形式保存在提交上,便于后续追溯。
该工具支持多种 AI 服务(如 Codex、Claude),可通过 git memento init 命令初始化配置,配置信息保存在本地 Git 元数据中。用户可通过 git memento commit 命令提交代码,并关联特定的 AI 会话 ID,支持多行 -m 参数或使用编辑器输入提交信息。
支持提交修订(amend)操作,可保留原提交的注释并添加新的会话内容。若提供新的会话 ID,会自动合并多个 AI 会话记录到同一提交注释中。
新增 –summary-skill 参数,允许使用预设的摘要技能生成简洁的会话摘要。默认摘要会存储在 refs/notes/commits,完整会话则保存在 refs/notes/memento-full-audit,支持双版本查看与验证。
支持团队协作功能,可通过 git memento share-notes 推送注释到远程仓库,并自动配置 fetch 规则,确保团队成员可获取注释。git memento push 命令可一键推送分支和注释。
git memento notes-sync 可安全同步远程注释,支持多种合并策略(如 cat_sort_uniq、union),并自动备份原始注释,防止冲突。
项目提供完整的 CI/CD 工作流、安装脚本、TypeScript 重构支持及安全审计机制,强调可扩展性与安全性,适用于需要可追溯 AI 编码过程的开发团队。
https://news.ycombinator.com/item?id=47212355
https://www.wltx.com/article/news/nation-world/281-53d8693e-77a4-42ad-86e4-3426a30d25ae
华盛顿州埃弗雷特市因法院裁定而暂停其 Flock 车牌识别摄像头网络。一名来自瓦拉瓦拉的男子何塞·罗德里格斯通过律师蒂姆·霍尔,向多个华盛顿州辖区提出信息公开请求,希望了解 Flock 系统收集的数据。调查发现,这些摄像头持续拍摄数千张车辆图像,即使车辆未涉及犯罪活动。
随后,斯诺霍米什县法官裁定,Flock 摄像头所摄录的影像属于公共记录,公众有权申请获取。对此,埃弗雷特市长卡西·弗兰克林表示强烈反对,认为该裁定可能使罪犯、家庭暴力施暴者或跟踪者轻易获取监控数据,造成安全隐患。
在判决后,埃弗雷特市临时关闭了全部 68 个 Flock 摄像头。市长表示,若州议会通过法案,允许城市将此类数据排除在信息公开范围之外,该市将考虑重新启用摄像头系统。目前,相关法案已在州参议院通过,正在进一步审议中。
此案引发关于公共安全、隐私保护与政府透明度之间平衡的广泛讨论。
https://news.ycombinator.com/item?id=47213764
https://commerce.jolla.com/products/jolla-phone-sept-26
这是一个关于 Jolla Phone(2026 年 9 月版)的限量预售页面,主打独立欧洲 Linux 智能手机,强调由用户共同参与设计与开发的“Do It Together”理念。
产品核心信息:
页面展示:
页面底部附有 Cookie 同意弹窗,涉及 Necessary、Preferences、Statistics、Marketing 等类别,包含 Cookiebot、PayPal、Shopify、Meta 等第三方服务,用户可自定义同意选项。
整体风格简洁,突出产品稀缺性与用户参与感,强调独立开发与用户共建的定位。
https://news.ycombinator.com/item?id=47216037
https://developer.chrome.com/blog/webmcp-epp
WebMCP 是一项面向代理网络(agentic web)的新技术,旨在让网站能够以结构化方式与 AI 代理进行交互。通过提供标准化的工具接口,网站可以明确告诉 AI 代理如何与其互动,从而提升操作的速度、可靠性和准确性。
该技术包含两个核心 API:
应用场景包括:
目前 WebMCP 处于早期预览阶段,开发者可通过参与预览计划获取文档、示例和最新更新,用于原型设计与测试。
https://news.ycombinator.com/item?id=47211249
https://github.com/anthropics/claude-code/issues/22543
Claude Desktop 的 Cowork 功能存在严重性能问题,主要表现为启动缓慢、界面卡顿和响应迟滞。问题根源在于该功能会生成一个高达 10GB 的虚拟机镜像文件(rootfs.img),位于用户目录下的 vm_bundles 文件夹中,且该文件在删除后会迅速自动重建。
尽管清理缓存和虚拟机镜像可带来约 75% 的性能提升,但系统性能仍会在使用几分钟后持续下降,表现为 CPU 占用率从 24% 升至 55%,并伴随显著的内存交换(swap)活动增加,表明存在内存泄漏或资源累积问题。
用户反馈指出,即使未使用 Cowork 功能,该虚拟机镜像仍会自动创建并持续占用资源,部分用户报告镜像大小已达到 21GB。此外,压缩后的镜像文件(.zst)与解压后的文件并存,造成存储浪费,且无自动清理机制。
问题影响广泛,涉及 macOS 和 Windows 平台,且在低内存设备(如 8GB RAM)上尤为严重,可能导致系统卡顿甚至应用崩溃。目前官方已将此问题标记为高优先级,但尚未提供永久解决方案。用户建议通过手动删除相关缓存目录来临时缓解问题,但需频繁重启以维持可用性。
https://news.ycombinator.com/item?id=47218288
<name> 标签简化为 <n>,存在严重 bug。https://www.science.org/content/article/nist-moves-restrict-foreign-scientists-its-labs
近期,美国国家标准与技术研究院(NIST)针对外籍科学家的实验室访问进行了严格限制,导致数百名在科罗拉多州博尔德和马里兰州盖瑟斯堡的外籍研究人员在晚上和周末无法进入实验室,除非有联邦员工陪同。某些国家的研究人员可能在下个月末前完全失去访问权限。这些变化是基于一项提议的规则,旨在提高安全性,并限制国际访问研究人员在 NIST 工作的最大时间为 3 年。
研究人员和观察者担心,这些新规则可能会使 NIST 失去多达 500 名高素质的研究人员,并阻碍外籍研究生和博士后完成他们的学位或其他项目。一位与 NIST 关系密切的科罗拉多大学物理学家表示:“这绝对是个灾难。” 来自科罗拉多大学的物理博士生 Maya Miklos 也表达了对 NIST 当前气氛的担忧,认为这些新规则将对科学造成极大损害。
NIST 内部消息人士称,他们尚未看到任何正式的提议文件,相关信息仅在会议中传达。前 NIST 主任 Patrick Gallagher 指出,缺乏明确的沟通和对外籍科学家的短期通知正导致混乱。他呼吁 NIST 至少应该向公众解释这些政策的合理性。
NIST 在 2 月 17 日的声明中表示,提议的规则尚未最终确定,正在开发的标准旨在确保 NIST 的外籍研究人员项目支持其使命需求,增加组织价值并最小化国家风险。新的政策可能是基于 NIST 于 2025 年更新的研究安全规则,明确了外籍研究人员的风险等级。来自中国、俄罗斯、伊朗、朝鲜、古巴、委内瑞拉和叙利亚的科学家被视为 “高风险” 群体。这些国家的许多研究人员已被告知,若在 NIST 工作超过 3 年或因参与敏感项目而被认为风险过高,他们的实验室访问权限将在 3 月 31 日之前被审核并可能终止。
通常,研究生需要大约两倍于此的时间来完成他们的研究,而这些学生并非直接由 NIST 雇佣,而是通过 NIST 的专业研究经验项目与 17 所大学签订协议进行研究。NIST 不进行机密研究,Gallagher 对此表示,这种安全政策的好处难以看出。
目前,NIST 由代理主任 Craig Burkhardt 领导,而前普渡大学工程学院院长 Arvind Raman 于 2025 年被提名为正式主任,但尚未获得参议院的确认听证。加州众议员 Zoe Lofgren 和马里兰州众议员 April McClain Delaney 于 219 日向 Burkhardt 发信,表达了对新政策的关切,并指出该委员会对进一步澄清的多次请求未得到回应,认为这种情况不可接受,特别是在此政策可能严重影响 NIST 履行其使命的情况下。
报告还指出,NIST 的政策变化超出了近期政府问责局对确保 NIST 实验室安全的建议,并且不合理。NIST 成立于 1901 年,旨在帮助设定国际科学标准以促进美国商业,至今已在计算机芯片、纳米医学、原子钟和电网等领域取得了重要进展,并获得过五项诺贝尔奖。
根据 NIST 网站的信息,NIST 在盖瑟斯堡的校园有 2800 名员工,博尔德有 560 人。此外,两处校园还有 4140 名承包商和访问研究人员,其中约一半为科学人员。NIST 内部人士指出,约有 500 名外籍研究生、博士后和研究科学家受此政策影响,甚至持有美国绿卡的研究人员也将受到限制。
Duke Quantum Center 的 Chris Monroe 指出,这种人才流失的影响将远超 NIST,因其实验室为美国公司提供了孵化器。他表示,NIST 的研究人员几乎单独推动了美国在量子科学和技术方面的领先地位,新规则将 “确保美国在此领域落后。” 马里兰大学的物理学家 Steve Rolston 也同意这种看法,认为国家从世界各地优秀人才中受益匪浅,限制这条人才渠道是极为愚蠢的做法。
https://news.ycombinator.com/item?id=47215565
https://news.ycombinator.com/item?id=47215464
If anyone from Motorola reads this thread; the market is beyond ripe for a good shake up. Going full open source and pushing updates & openness, user control and freedom, you will gobble up a good chunk of market share. Make MDM easy & first class (no third parties…), and a ton of corp will roll it out too. We need you more than you think.
BatteryMountain
如果摩托罗拉有相关人员看到这个帖子;市场已经完全准备好迎接一次彻底的变革了。全面拥抱开源,大力推动更新与开放、用户掌控和自由,你们将能攫取可观的市场份额。让MDM(设备管理)变得简单易用且成为核心功能(无需第三方…),届时大批企业也会随之采用。我们对你们的需求,远超你们的想象。
https://news.ycombinator.com/item?id=47217108
Don’t they have better things to do? Maybe vibecode a taskbar that moves when you try to move away the mouse over it or perhaps a windows 12 installation procedure that requires a fecal sample and iris scan?
Havoc
他们就没别的事可做了吗?或许可以开发一个鼠标移上去就会乱跑的任务栏,又或者设计一个需要粪便样本和虹膜扫描的Windows 12安装程序?
https://news.ycombinator.com/item?id=47216232
This is just developer fantasy. The average consumer doesn’t care even one bit. Is the phone smooth? Does it have a good camera? Does it have a good battery? Does it last more than 2 years?
Go to some developing countries around Asia and you’ll be surprised how people prioritise features when buying a phone vs developed ones. The developing countries account for most of the sales of most phone manufacturers. Phones that are like $150-200 sell like hot cakes.
This is evident even in the laptop segment. What developers want and what the average consumer wants/needs are two different things. Eg. Framework laptops. Macbook Pro vs Air.
neya
这只是开发者的幻想。普通消费者根本不在乎。手机流畅吗?拍照好吗?电池耐用吗?能用超过两年吗?去亚洲的一些发展中国家看看,你会惊讶于人们在买手机时对功能的优先级,与发达国家的人相比。大多数手机厂商的大部分销量都来自发展中国家,150到200美元左右的手机卖得特别火。这在笔记本电脑市场同样显而易见。开发者想要什么,与普通消费者的需求是两回事。例如,Framework笔记本电脑;MacBook Pro与Air的对比。
https://news.ycombinator.com/item?id=47221909
The iPad would go from a never-buy to a buy-right-away for me, if they added user profiles. It’d be a nice thing to have on your coffee table, where anyone in the household can pick it up and be logged into all of their stuff.
Windows XP had this feature. Chromebooks have this feature. It’s inexcusable that such an expensive gadget can only have one user.
moolcool
如果 iPad 能增加用户配置功能,那它就会从我绝对不会买的清单,一跃成为我立刻就想买的对象。它本可以成为一件非常适合放在客厅茶几上的设备,家里的任何人拿起它,都能登录到自己的专属内容。
Windows XP 拥有这个功能,Chromebooks 也拥有这个功能。如此昂贵的一款设备却只能支持一个用户,这是说不过去的。
https://news.ycombinator.com/item?id=47219358
Still holding onto my 13 mini. Dreaming of another small form factor release one of these announcements.. :'}
thoughtpalette
我还在用着我的13 mini。真希望这些发布会中能再次推出小尺寸的手机版本。 :'}
https://news.ycombinator.com/item?id=47214392
I think the person requesting to access the data was doing the right thing and I agree with the judge’s ruling.
The fact that they’re gonna shut it down, implies the scale of indiscriminate nature of data capture and the volume of data being captured.
These cameras are popping up all over the nation and if people realize how much data is being captured and where that data is going (or who it’s being sold to) and how it’s being used by government and private entities they would be appalled.
There’s been exposés about these cameras, everything from AI misidentification of “stolen” (not) vehicles and erroneous arrests and police encounters, to analysis of shopping patterns being sold back to private entities for better ad targeting. It’s wild.
neverkn0wsb357
我认为请求数据访问的人做得对,我也同意法官的裁决。
他们要关掉这个系统,这本身就暗示了数据捕获的无差别性质和捕获数据的规模。
这种摄像头在全国各地如雨后春笋般涌现,如果人们意识到被捕获了海量数据,以及这些数据流向了哪里(或被卖给了谁),以及政府和私人实体如何使用这些数据,他们会感到震惊。
已经有关于这些摄像头的深度报道,从车辆被AI错误识别为被盗(其实并非被盗)以及因此导致的错误逮捕和警方接警,到购物模式被分析后卖给私人实体,以便实现更精准的广告投放,真是触目惊心。
https://news.ycombinator.com/item?id=47210619
My recently deceased mother had a talent for talking to anyone at any time in any language. She’s always been incredibly social and could establish connections with strangers very rapidly. One time she brought in a school teacher/sheep farmer from Dagestan selling yarn from his sheep’s wool, she met him at the market and bought all yarn and asked if he had somewhere to stay before going back, and he didn’t. He stayed in our house for a couple of nights, and then we visited him in that little village in mountains of Dagestan on a summer vacation, talk about going back a few centuries in time, an incredible and unusual experience.
I’ve had to spend week and a half battling Gmail daily email account limits sending batches of 500 emails just to notify people in her address book, receiving hundreds of responses. Her memorial was attended by hundreds of people.
It served her very well in her chosen career of real estate sales, although I think she’d might have done really well in community organizing or even politics where those skills are also very useful.
On the flip side, it was sometimes difficult to be there as family wanting some attention, since her bright light was always shining in many directions.
I’ve inherited just some of that talent, and I think it is a talent, but trainable.
I miss her already.
danielodievich
我最近去世的母亲有一种天赋,无论何时何地,无论用何种语言,她都能和任何人交谈。她一直非常善于社交,能迅速与陌生人建立联系。有一次,她带回来一个来自达吉斯坦的中学老师兼牧羊人,他在卖自己羊群的毛线。母亲是在市场上遇到他的,买下了他所有的毛线,然后问他回去之前有没有地方住,结果他没有。于是他在我们家住了几个晚上,后来我们还在暑假期间去了达吉斯坦的那个小山村拜访他,那感觉就像是时光倒流了好几个世纪,是一次不可思议又非比寻常的经历。
我花了一个半星期的时间,每天都要和谷歌邮箱的每日邮件发送限额作斗争,每次只能发送500封邮件,只为通知她通讯录里的每一个人,结果收到了数百封回复。她的追悼会有数百人参加。
在她选择的房地产销售事业中,这种天赋让她受益匪浅,不过我觉得,如果她投身于社区组织,甚至政界,也同样会非常成功,因为那些技能在那里也同样非常有用。
但从另一方面来说,作为家人,我们有时很难得到她的关注,因为她那耀眼的光芒总是洒向四面八方。
我从她那里继承了一部分这种天赋,我认为这是一种天赋,而且是可以后天培养的。
我已经开始想念她了。
https://news.ycombinator.com/item?id=47216960
“What am I missing?”
That nationalism is the new state doctrin? Foreigners are inferior by definition, so they cannot really help with research anyway, all they want to do is steal secrets. If you think like that, then it makes sense.
lukan
我错过了什么吗?
民族主义是新的国家信条吗?按定义,外国人就是低人一等的,所以他们根本无法在研究上提供真正帮助,他们只会想方设法窃取机密。如果你那样想,那就说得通了。
https://news.ycombinator.com/item?id=47220118
Hi, Felix from Anthropic here. I work on Claude Cowork and Claude Code.
Claude Cowork uses the Claude Code agent harness running inside a Linux VM (with additional sandboxing, network controls, and filesystem mounts). We run that through Apple’s virtualization framework or Microsoft’s Host Compute System. This buys us three things we like a lot:
(1) A computer for Claude to write software in, because so many user problems can be solved really well by first writing custom-tailored scripts against whatever task you throw at it. We’d like that computer to not be your computer so that Claude is free to configure it in the moment.
(2) Hard guarantees at the boundary: Other sandboxing solutions exist, but for a few reasons, none of them satisfy as much and allow us to make similarly sound guarantees about what Claude will be able to do and not to.
(3) As a product of 1+2, more safety for non-technical users. If you’re reading this, you’re probably equipped to evaluate whether or not a particular script or command is safe to run - but most humans aren’t, and even the ones who are so often experience “approval fatigue”. Not having to ask for approval is valuable.
It’s a real trade-off though and I’m thankful for any feedback, including this one. We’re reading all the comments and have some ideas on how to maybe make this better - for people who don’t want to use Cowork at all, who don’t want it inside a VM, or who just want a little bit more control. Thank you!
felixrieseberg
你好,我是来自 Anthropic 的 Felix。我负责 Claude Cowork 和 Claude Code 的开发工作。
Claude Cowork 在一个 Linux 虚拟机内部署了 Claude Code 代理框架(并附加了沙盒、网络控制和文件系统挂载功能)。我们通过苹果的虚拟化框架或微软的主机计算系统来运行它。这为我们带来了三个我们非常重视的优势:
(1) 为 Claude 提供了一台可以编写软件的计算机,因为对于许多用户问题,最好的解决方案是先针对用户提出的任务编写量身定制的脚本。我们希望这台计算机不是 您 的个人电脑,这样 Claude 就可以随时自由地进行配置。
(2) 在边界上提供硬性保证:虽然存在其他沙盒解决方案,但由于一些原因,它们都无法达到我们同样满意的水平,也无法让我们对 Claude 能做什么和不能做什么做出同样可靠的保证。
(3) 作为 (1) 和 (2) 结合的产物,它为非技术用户提供了更高的安全性。如果你正在阅读这篇文章,你可能具备评估某个脚本或命令是否安全运行的能力——但大多数人没有,即使那些有能力的人也常常会感到“审批疲劳”。而无需请求批准这一点,是很有价值的。
不过,这确实是一种权衡,我很感谢任何形式的反馈,也包括这条。我们会阅读所有评论,并有一些关于如何改进的想法——例如,针对那些完全不想使用 Cowork、不希望它在虚拟机内运行,或者只是想要更多控制权的用户。谢谢!
https://news.ycombinator.com/item?id=47222062
Tim Cook’s fear of people not buying a full set of Apple devices for each person is the driving force behind not just the lack of multiuser support, but also the overall nerfing of iPadOS.
For the past 5+ years it’s been, “This will be the year of real work on the iPad,” but they keep circling around it, trying not to make iPads accidentally powerful enough for someone to skip buying a MacBook.
tomaskafka
蒂姆·库克对人们不为每个人购买全套苹果设备的担忧,不仅是iPadOS缺乏多用户支持的根本原因,也是其整体性能受限的驱动力。
过去五年多来,我们总听人说“今年将是iPad真正能干活的一年”,但他们却总是在这个问题上绕圈子,试图避免iPad意外地强大到让某人可以跳过购买MacBook的程度。
https://news.ycombinator.com/item?id=47218753
I don’t believe the activity on this repo is legitimate by any means.
root_axis
我绝不相信这个仓库的活动是正当的。
https://news.ycombinator.com/item?id=47215885
Tweaking user-hostile OSes into user-friendly ones is impressive, but not sustainable. Even worse, it slowing us down from leaving Android entirely.
Look at the AdBlocker crackdown of Google Chrome. Every single chrome-fork has shut down MV2 extensions, even Brave is about to do it, because it is impossible to maintain features that complex on a browser that Google spends >$1B/year to develop.
Same story for /e/ and GrapheneOS, the day Google pulls the plug on source code releases, god knows how long they will last. We should focus our efforts on truly open platforms.
goldenarm
将敌对用户的操作系统调整为用户友好的系统令人印象深刻,但并不可持续。更糟糕的是,这延缓了我们完全摆脱Android的进程。
看看谷歌Chrome对广告拦截器的打压。所有Chrome的分支都已停止支持MV2扩展,就连Brave浏览器也即将跟进,因为在谷歌每年投入超过10亿美元开发的浏览器上,维护如此复杂的功能是不可能实现的。
/e/和GrapheneOS也是如此,一旦谷歌停止发布源代码,谁知道它们还能存活多久。我们应该将精力集中在真正开放的平台上。
https://news.ycombinator.com/item?id=47216469
As always, copyright is a supressor of creativity, not an enabler. Copyright terms should be 10-20 years max, or up to death of an author. Even current regime is ridiculous.
theragra
一如既往,版权是创造力的压制者,而非促进者。版权期限最多应为10-20年,或延续至作者去世。现行制度已经荒谬至极。
https://news.ycombinator.com/item?id=47210295
I tried to avoid writing this for a long time, but I’m convinced MCP provides no real-world benefit
IMO this is 100% correct and I’m glad someone finally said it. I run AI agents that control my entire dev workflow through shell commands and they are shockingly good at it. the agent figures out CLI flags it has never seen before just from –help output. meanwhile every MCP server i’ve used has been a flaky process that needs babysitting.
the composability argument is the one that should end this debate tbh. you can pipe CLI output through jq, grep it, redirect to files - try doing that with MCP. you can’t. you’re stuck with whatever the MCP server decided to return and if it’s too verbose you’re burning tokens for nothing.
companies scrambled to ship MCP servers as proof they were “AI first”
FWIW this is the real story. MCP adoption is a marketing signal not a technical one. 242% growth in MCP servers means nothing if most of them are worse than the CLI that already existed
umairnadeem123
我一直尽量避免写下这段话,但我现在坚信MCP(模型上下文协议)在现实中没有任何好处。依我之见,这100%正确,很高兴终于有人说出来了。我运行着一些通过shell命令控制整个开发工作流的AI代理,它们在这方面做得非常出色。代理仅通过–help输出就能弄清楚它从未见过的CLI标志。与此同时,我用过的每一个MCP服务器都是一个不稳定的过程,需要不断看管。
说实话,可组合性这个论点应该终结这场辩论了。你可以把CLI的输出通过jq管道,用grep搜索,重定向到文件——试着用MCP做这些。你做不到。你被困在MCP服务器决定返回的内容里,如果它过于冗长,你就在白白浪费token。
公司们争先恐后地推出MCP服务器,以此证明他们是"AI优先"的。 顺便说一句,这才是真正的情况。MCP的采用是一个营销信号,而不是技术信号。如果大多数MCP服务器比已有的CLI还差,那么MCP服务器242%的增长就毫无意义。
https://news.ycombinator.com/item?id=47214629
The way I write code with AI is that I start with a project.md file, where I describe what I want done. I then ask it to make a plan.md file from that project.md to describe the changes it will make (or what it will create if Greenfield).
I then iterate on that plan.md with the AI until it’s what I want. I then ask it to make a detailed todo list from the plan.md and attach it to the end of plan.md.
Once I’m fully satisfied, I tell it to execute the todo list at the end of the plan.md, and don’t do anything else, don’t ask me any questions, and work until it’s complete.
I then commit the project.md and plan.md along with the code.
So my back and forth on getting the plan.md correct isn’t in the logs, but that is much like intermediate commits before a merge/squash. The plan.md is basically the artifact an AI or another engineer can use to figure out what happened and repeat the process.
The main reason I do this is so that when the models get a lot better in a year, I can go back and ask them to modify plan.md based on project.md and the existing code, on the assumption it might find it’s own mistakes.
jedberg
我用AI写代码的方式是,先从一个project.md文件开始,描述我想要完成什么。然后我让它根据这个project.md文件生成一个plan.md文件,来描述它将进行的改动(如果是全新开发,则描述它将创建的内容)。
接着,我会与AI共同迭代修改plan.md,直到它完全符合我的要求。然后我让它根据plan.md生成一个详细的待办事项列表,并将其附加在plan.md的末尾。
当我完全满意后,我会告诉它执行plan.md末尾的待办事项,并且不要做任何其他事情,不要问我任何问题,直到完成工作。
之后,我会将project.md、plan.md以及代码一同提交。
因此,为了让plan.md正确而进行的来回沟通,并不会出现在日志里,但这很像合并/压缩(merge/squash)之前的中间提交记录。plan.md这个文件,基本上是AI或其他工程师可以用来了解发生了什么并重复这一过程的产物。
我这样做的主要原因是,当一年后模型能力变得更强时,我可以回去让它们根据project.md和现有代码来修改plan.md,前提是模型可能会发现自身的错误。
https://news.ycombinator.com/item?id=47217523
installation procedure that requires a fecal sample and iris scan
Do you work for Microsoft or something? Please do do not give them ideas.
bartread
需要粪便样本和虹膜扫描的安装程序。你是微软的人吗?求求你别给他们提供灵感了。
https://news.ycombinator.com/item?id=47225454
Meta aims to introduce facial recognition to its smart glasses while its biggest critics are distracted, according to a report from The New York Times. In an internal document reviewed by The Times, Meta says it will launch the feature “during a dynamic political environment where many civil society groups that we would expect to attack us would have their resources focused on other concerns.”
https://www.theverge.com/tech/878725/meta-facial-recognition-smart-glasses-name-tag-privacy-advoates
blakesterz
据《纽约时报》报道,一份该报审查的内部文件显示,Meta计划在其智能眼镜中引入面部识别功能,并选择在“一个动态的政治环境”中推出,届时许多本会攻击他们的公民社会团体,其资源将集中于其他事务。
https://news.ycombinator.com/item?id=47216833
Hehe, this reminds me of 30 years ago when people used to stylise it as Micro$oft or creatively misspell it as Microshaft, etc. Even on the Amiga, there was the filesystem that could read PC format disks that was called MessyDos. It just seems like the next generation has discovered what an easy name it is to make puns from.
ralferoo
哈哈,这让我想起30年前,人们爱把它写成 Micro$oft 或故意拼错成 Microshaft 之类的。就连在 Amiga 上,那个能读取 PC 格式磁盘的文件系统都叫 MessyDos。感觉新一代人才发现这名字原来这么容易玩谐音梗。
https://news.ycombinator.com/item?id=47202878
The problem with “Any Lawful Use” is that the DoD can essentially make that up. They can have an attorney draft a memo and put it in a drawer. The memo can say pretty much anything is legal - there is no judicial or external review outside the executive. If they are caught doing $illegal_thing, they then just need to point the memo. And we’ve seen this happen numerous times.
siliconc0w
“任何合法用途”的问题在于,国防部基本上可以随意解释这一点。他们可以让一名律师起草一份备忘录,然后将其束之高阁。这份备忘录可以宣称几乎所有事情都是合法的——在行政部门之外,不存在司法或外部审查。如果他们被发现做了违法之事,他们只需要拿出那份备忘录来指证。而我们已经看到这种情况屡次发生。
https://news.ycombinator.com/item?id=47219250
I keep reading folks saying OpenClaw has completely changed their life while posting a picture of 58 mac minis on their desk.
But every single use case I’ve read so far could be done with a pretty affordable SaaS product, Zapier, Automator (app on a mac that’s existed for over a decade), or something simple you could make yourself.
It also feels like people are automating things that don’t really need to be automated at all (do you really need to be reminded to make coffee?)
I fully realize this is probably me being a curmudgeon, however, I have yet to see someone make an actual, practical use case for it. (I would genuinely like to know one, I just haven’t seen it)
SunshineTheCat
我总看到有人说 OpenClaw 彻底改变了他们的生活,同时他们书桌上还摆着 58 台 Mac mini。
但迄今为止我读到的每一个用例,用一个相当实惠的 SaaS 产品、Zapier、Automator(一个在 Mac 上存在了十多年的应用)或者一些你自己就能轻松做出的简单东西,就都能完成。
而且感觉人们似乎在把一些根本没必要自动化的事情也自动化了(你真的需要一个提醒来让你去冲咖啡吗?)
我完全明白这可能是我自己爱唱反调,但至今为止,我还是没看到有人为它提出一个真正实用的用例。(我真的很想知道一个,只是还没看到过)
https://news.ycombinator.com/item?id=47214868
GrapheneOS is finally decoupling itself from Google Pixel phones. This is great news. Motorola makes great hardware too. Looking forward to see what comes out of this.
anon5739483
GrapheneOS终于脱离了Google Pixel手机。这真是个好消息。摩托罗拉的硬件也很棒。很期待后续会怎样。
https://news.ycombinator.com/item?id=47201788
Steve Jobs is famous for his 1996 quote about Microsoft not having taste ( https://www.youtube.com/watch?v=UiOzGI4MqSU ). I disagree; as much as I love the classic Mac OS and Jobs-era Mac OS X, and despite my feelings about Microsoft’s monopolistic behavior, 1995-2000 Microsoft’s user interfaces were quite tasteful, in my opinion, and this was Microsoft’s most tasteful period. I have fond memories of Windows 95/NT 4/98/2000, Office 97, and Visual Basic 6. I even liked Internet Explorer 5. These were well-made products when it came to the user interface. Yes, Windows 95 crashed a lot, but so did Macintosh System 7.
Things started going downhill, in my opinion, with the Windows XP “Fisher-Price” Luna interface and the Microsoft Office 2007 ribbon.
linguae
史蒂夫·乔布斯以其1996年关于微软“没有品位”的言论而闻名(https://www.youtube.com/watch?v=UiOzGI4MqSU)。我并不同意;尽管我热爱经典的Mac OS系统和乔布斯时代的Mac OS X,并且尽管我对微软的垄断行为持保留看法,但在我看来,1995年至2000年间微软的用户界面相当有品位,而这正是微软最有品位的时期。我对Windows 95/NT 4/98/2000、Office 97以及Visual Basic 6都怀有美好的回忆。我甚至喜欢Internet Explorer 5。在用户界面方面,这些都是制作精良的产品。是的,Windows 95经常崩溃,但Macintosh System 7也是如此。
在我看来,从Windows XP的“费雪玩具”Luna界面和Microsoft Office 2007的功能区开始,一切都走下坡路了。
https://news.ycombinator.com/item?id=47214939
This was figured out a while ago based on the hints given.
That said, I’m pretty excited. Motorola of the last decade or so has made really good hardware with basically stock firmware and a terrible update policy, which is why many avoid them. Seriously, they just offer quarterly updates on flagships, which is incredibly unsecure. Punting software to Graphene solves the biggest gripe many have.
silisili
根据给出的线索,这件事早就被猜出来了。
话虽如此,我还是非常兴奋。过去十年左右的摩托罗拉硬件其实做得相当不错,系统基本是原生的,但更新政策糟糕,这也是很多人避开它的原因。说真的,他们的旗舰机型只提供季度更新,这简直太不安全了。把软件部分交给 GrapheneOS 解决了很多人最大的怨言。