MoreRSS

site iconHackerNews AI 摘要修改

使用 RPA 方案,每天自动获取 Top Stories ,使用 GPT 方式自动摘要,同时会一并摘要 HackerNews 网友的评论。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

HackerNews AI 摘要的 RSS 预览

2025 05 18 HackerNews

2025-05-18 08:58:33

2025-05-18 Hacker News Top Stories #

  1. 达斯汀·柯蒂斯认为过度依赖AI生成内容会导致人类创造力退化,主张保留手动思考的价值。
  2. Google推出基于Gemini的文本到SQL技术,提升非技术人员数据交互能力但存在隐私和准确性挑战。
  3. 编程优化原则建议将条件判断上移、循环操作下移,以简化代码结构并提升性能。
  4. JavaScript新增using/await using语法实现显式资源管理,但可能增加代码复杂性。
  5. 穆迪因美国债务问题下调其信用评级至Aa1,预计2035年联邦赤字占GDP达9%。
  6. KVSplit通过差异化量化KV缓存减少72%内存占用,部分配置可提升LLM推理速度。
  7. 瑞士新监控法案遭Proton等企业反对,可能迫使隐私企业迁离以规避数据留存要求。
  8. ClojureScript 1.12.42升级Closure Compiler并接管其维护,强化跨环境JavaScript解决方案。
  9. XTool作为跨平台Xcode替代品引发争议,需依赖Xcode工具链且存在潜在法律风险。
  10. Wow@Home项目通过低成本射电望远镜网络探测外星信号,延续Wow信号研究传统。

Thoughts on thinking #

https://dcurt.is/thinking

作者达斯汀·柯蒂斯(Dustin Curtis)在他的博客中分享了他最近的思考和感受。他提到自己已经陷入了困境,每当他尝试写博客文章、编码或开始新项目时,他都会意识到在人工智能(AI)的背景下,他的努力是徒劳的。人工智能可以轻松地产生高质量的内容,令他感到自己无法竞争。

作者曾经是一个多产的作家,他会花费数小时来完善自己的想法和写作。但现在,人工智能的出现使他可以轻松地获得完整的想法和内容,只需输入几个关键词。这种依赖人工智能的方式使他的大脑变得懒惰,他感觉自己的直觉、聪明才智和严谨性都在减退。

作者认为,使用人工智能来探索想法虽然看似高效,但实际上是对大脑的懒惰。他将其比喻为观看电视节目,而不是真正的思考和学习。他觉得自己虽然知道了更多的东西,但实际上变得更愚蠢和迟钝。人工智能提供的内容虽然完善,但缺乏了真正的思考和学习过程。

作者最后表示,他仍然陷在困境中,但他决定继续写作和分享自己的想法,即使人工智能可以更快、更好地完成这些工作。他认为,自己写作的过程和输出的内容虽然不如人工智能,但仍然有其价值和意义。整个文章是作者对人工智能对人类思考和创造力的影响的思考和反思。


HN 热度 622 points | 评论 388 comments | 作者:bradgessler | 1 day ago #

https://news.ycombinator.com/item?id=44008843

  • 人们过度依赖自动化系统,可能会失去自主思考和决策的能力
  • 过度依赖 GPS 导航,可能会使人失去对空间的认知和导航能力
  • 社交媒体算法可能会控制人们看到的内容,限制他们的选择和自主权
  • 人们需要重新认识到自主思考和决策的重要性,避免过度依赖自动化系统
  • 过去的方式,例如使用地图和口口相传,可能更有利于深入理解和记忆
  • 现代技术可能会使人们失去对生活的控制感和自主权,变得更加被动
  • 自主思考和决策是人类的基本能力,需要通过实践和训练来保持和发展
  • 过度依赖技术可能会导致人们失去创造力和批判性思维能力
  • 人们需要找到平衡技术使用和自主思考的方式,避免过度依赖技术
  • 自主思考和决策的能力对于个人成长和发展至关重要,需要被重视和培养

Getting AI to write good SQL #

https://cloud.google.com/blog/products/databases/techniques-for-improving-text-to-sql

本文介绍了 Google Cloud 的文本到 SQL(text-to-SQL)技术,该技术可以将自然语言直接转换为 SQL 查询。这种技术可以提高开发人员和分析师的生产力,并使非技术用户能够直接与所需的数据进行交互。文本到 SQL 技术在许多 Google Cloud 产品中都有应用,包括 BigQuery Studio、Cloud SQL Studio、AlloyDB Studio 和 Vertex AI。

文本到 SQL 技术面临着几个挑战,包括提供业务特定的上下文、理解用户意图和管理 SQL 方言的差异。为了解决这些挑战,Google Cloud 使用了多种技术,包括大型语言模型(LLM)和提示技术。LLM 可以学习数据和模式,并生成准确的 SQL 查询。然而,LLM 也可能出现一些问题,例如生成不正确的查询或无法理解用户意图。

为了解决这些问题,Google Cloud 使用了多种技术,包括提供业务特定的上下文、理解用户意图和管理 SQL 方言的差异。例如,Google Cloud 使用了一个名为 Gemini 的 LLM 模型,该模型可以学习数据和模式,并生成准确的 SQL 查询。Gemini 模型可以理解用户意图,并生成符合用户需求的 SQL 查询。

文本到 SQL 技术在许多场景中都有应用,包括数据分析、业务智能和机器学习。这种技术可以帮助用户快速获取所需的数据,并进行数据分析和决策。同时,文本到 SQL 技术也可以帮助用户自动化数据处理和分析流程,提高生产力和效率。

总之,文本到 SQL 技术是 Google Cloud 的一项重要功能,可以帮助用户快速获取所需的数据,并进行数据分析和决策。这种技术可以提高生产力和效率,并使非技术用户能够直接与所需的数据进行交互。然而,文本到 SQL 技术也面临着一些挑战,包括提供业务特定的上下文、理解用户意图和管理 SQL 方言的差异。为了解决这些挑战,Google Cloud 使用了多种技术,包括大型语言模型和提示技术。


HN 热度 464 points | 评论 326 comments | 作者:richards | 1 day ago #

https://news.ycombinator.com/item?id=44009848

  • Google AI Studio 的 Gemini 是一个革命性的工具,能够极大地提高编程效率和质量
  • Gemini 在处理长篇和复杂代码时优于其他工具,如 Claude 和 ChatGPT
  • AI 工具的发展进入了一个黄金时代,各大公司在竞争中推动了 AI 技术的进步
  • 有些人认为 AI 工具可能会取代人类程序员,但也有人认为 AI 是一个有用的伴侣而不是替代品
  • AI 工具可能会导致人们过度依赖技术,失去独立思考的能力
  • Gemini 在代码审查和调试方面表现出色,能够提供详细的报告和建议
  • 有些人使用 AI 工具来辅助写作,能够快速生成初稿和修改建议
  • AI 工具的发展可能会导致软件开发成本的降低,但也可能导致新的问题和挑战的出现

Push Ifs Up and Fors Down #

https://matklad.github.io/2023/11/15/push-ifs-up-and-fors-down.html

这篇文章讨论了两条编程规则:向上推送 if 语句和向下推送 for 循环。作者认为,如果一个函数内部有 if 条件,应该考虑将其移到调用者处。这种方法可以减少函数内部的条件检查,简化代码结构。尤其是在处理前置条件时,向上推送 if 语句可以减少整个程序的条件检查次数。

作者还指出,控制流和 if 语句是代码中的复杂部分,容易引起错误。通过向上推送 if 语句,可以将控制流集中在一个函数中,使得代码更容易理解和维护。这种方法还可以帮助发现死代码和冗余条件。作者给出了一个例子,展示了如何通过向上推送 if 语句简化代码结构。

另一方面,作者讨论了向下推送 for 循环的规则。这种方法是从数据导向的编程思想中来的,认为程序通常需要处理大量的对象。通过引入批处理的概念,可以将操作应用于一批对象,而不是单个对象。这种方法可以提高性能,尤其是在处理大量数据时。作者给出了一个例子,展示了如何通过向下推送 for 循环提高性能。

作者还指出,这两条规则可以组合使用。通过向上推送 if 语句和向下推送 for 循环,可以简化代码结构,提高性能。作者给出了一个例子,展示了如何通过组合使用这两条规则简化代码结构。最后,作者总结了这两条规则的重要性,认为它们可以帮助程序员写出更好的代码。


HN 热度 356 points | 评论 134 comments | 作者:goranmoomin | 15 hours ago #

https://news.ycombinator.com/item?id=44013157

  • 条件语句应该尽早地剪枝程序流程树,以减少不必要的工作。
  • 函数应该只有一个单一的责任,既要么是处理程序流程,要么是执行具体的工作。
  • 类和函数的命名应该遵循“类是名词,函数是动词”的原则。
  • 条件语句应该尽可能地推到输入源附近,以便于理解和维护程序逻辑。
  • 类和函数的设计应该遵循特定问题域的规则和模式,而不是遵循通用的规则和原则。
  • 类可以被视为暴露接口,函数可以被视为隐藏实现细节。
  • 程序的核心逻辑应该尽可能地简单和直接,避免不必要的条件语句和分支。
  • 类型系统可以被用来编码程序的假设和约束,从而提高程序的可靠性和可维护性。
  • 程序的设计应该遵循“尽可能地早地剪枝,尽可能地晚地绑定”的原则,以提高程序的灵活性和可维护性。

JavaScript’s New Superpower: Explicit Resource Management #

https://v8.dev/features/explicit-resource-management

Explicit Resource Management 是一个新的 JavaScript 提案,旨在提供一种确定性的方式来显式管理资源的生命周期,例如文件句柄、网络连接等。这个提案引入了几个新的特性,包括 usingawait using 声明,这些声明可以自动调用资源的 dispose 方法,当资源超出作用域时。

usingawait using 声明是 Explicit Resource Management 的核心。using 声明用于同步资源,确保资源的 dispose 方法在作用域退出时被调用。await using 声明用于异步资源,确保资源的 asyncDispose 方法被调用,并等待其完成。这些声明可以在块作用域、循环和函数体中使用,但不能在顶级作用域中使用。

Explicit Resource Management 提案还引入了 DisposableStackAsyncDisposableStack,它们是栈式结构,允许开发者将多个资源分组并协调地释放它们。这些结构提供了 useadoptdefer 方法来添加资源或释放操作,并提供了 disposeasyncDispose 方法来触发释放。这些结构可以与 usingawait using 声明一起使用,以简化资源释放的过程。

此外,Explicit Resource Management 提案还引入了 SuppressedError,一种新的错误类型,用于处理资源释放过程中发生的错误。这种错误类型可以包含两个错误:最近抛出的错误和被抑制的错误。这种机制可以帮助开发者更好地处理资源释放过程中发生的错误。

Explicit Resource Management 提案的目标是帮助开发者写出更健壮、更高效、更易维护的代码。通过提供一种确定性的方式来管理资源的生命周期,开发者可以避免资源泄漏和其他问题。这个提案已经在 Chromium 134 和 V8 v13.8 中实现。


HN 热度 289 points | 评论 184 comments | 作者:olalonde | 19 hours ago #

https://news.ycombinator.com/item?id=44012227

  • JavaScript 的新特性 Explicit Resource Management 可能会使代码更难以理解和调试,因为它引入了同步和异步函数之间的区别。
  • 隐藏异步操作可能会使代码更难以理解和调试,而显示异步操作可以使开发者更好地理解代码的行为。
  • Java 的虚拟线程特性可以使开发者更容易地编写并发代码,而不需要担心线程同步的问题。
  • 使用 async/await 语法可以使代码更容易读写,但是在处理复杂的并发操作时可能会遇到问题。
  • Explicit Resource Management 特性可能会使代码更容易出错,因为它需要开发者手动管理资源的释放。
  • 使用 DisposableStack 和 AsyncDisposableStack 可以使代码更容易管理资源的释放,但是在某些情况下可能会遇到问题。
  • Explicit Resource Management 特性可能会在未来得到更广泛的支持和应用,但目前可能还存在一些问题和局限性。

Moody’s strips U.S. of triple-A credit rating #

https://www.ft.com/content/e456ea34-c6ad-43fe-abe9-d4ce781c07b4

穆迪下调美国最高级三 A 信用评级

  • 机构警告:债务和赤字支出上升
  • 穆迪预计:到 2035 年,美国联邦赤字将扩大到占 GDP 的近 9%,高于 2024 年的 6.4% © 彭博社

美国因政府债务水平上升而被穆迪下调最高级三 A 信用评级。

周五下午,该机构将美国信用评级从 Aaa 下调至 Aa1,评级展望从负面变为稳定。其他主要评级机构惠誉和标准普尔此前已取消了美国的完美评级。

穆迪表示,预计到 2035 年,美国联邦赤字将扩大到占 GDP 的近 9%,高于去年的 6.4%,主要由于债务利息支出增加、福利支出以及“相对较低的收入生成”。

该机构写道:“在我们的 21 个评级等级中,此次下调一个等级反映了政府债务和利息支付比率在十多年来的增长,这些比率已显著高于类似评级的主权国家。”

这是一个正在发展的故事。


HN 热度 273 points | 评论 246 comments | 作者:Anon84 | 1 day ago #

https://news.ycombinator.com/item?id=44009999

  • 美国的社会保障体系存在问题,需要改革,例如提高税收上限、增加税率或降低通货膨胀补偿。
  • 对富人进行 means-test 会增加官僚主义,削弱社会保障的支持度,增加不必要的复杂性。
  • 提高社会保障税收上限比 means-test 更为合理,能够解决社会保障的资金问题。
  • 美国的国防开支过大,应该削减国防预算,例如使用无人机和潜艇等代替传统的军事力量。
  • 社会保障是一种保险,而不是养老金,应该根据需要进行调整和改革。
  • 社会保障的改革应该考虑到不同收入群体的需求和贡献,避免不必要的复杂性和不公平性。

Show HN: KVSplit – Run 2-3x longer contexts on Apple Silicon #

https://github.com/dipampaul17/KVSplit

KVSplit 是一个针对 Apple Silicon 的差异化 KV 缓存量化技术,旨在减少内存使用并提高大型语言模型(LLM)在 Mac 上的运行效率。通过将键和值分别量化为 8 位和 4 位,KVSplit 可以减少内存使用量达 72%,同时保持或提高推理速度。

KVSplit 的主要特点包括独立量化键和值、针对 Apple Silicon 的 Metal 支持、全面的基准测试套件以及内存使用和性能分析工具。该项目还提供了易于使用的安装脚本和快速比较工具,允许用户快速评估不同配置的性能。

在内存减少方面,KVSplit 的配置可以减少 47% 至 72% 的内存使用量,具体取决于键和值的量化精度。例如,K8V8 配置可以减少 47% 的内存使用量,而 K4V4 配置可以减少 72% 的内存使用量。同时,KVSplit 的性能影响也很显著,某些配置可以提高 5-15% 的推理速度。

KVSplit 项目的结构包括优化的 llama.cpp 构建、模型文件、脚本和结果文件夹。该项目还提供了科学见解,揭示了键和值在量化中的敏感性差异。通过这种差异化的量化方法,KVSplit 可以在保持或提高模型质量的同时减少内存使用量和提高推理速度。

在使用方面,KVSplit 提供了灵活的安装选项,包括虚拟环境、系统 Python 和跳过 Python 设置。同时,KVSplit 也提供了快速比较工具,允许用户快速评估不同配置的性能。此外,KVSplit 的基准测试套件可以帮助用户全面评估模型的性能和内存使用情况。


HN 热度 264 points | 评论 40 comments | 作者:dipampaul17 | 1 day ago #

https://news.ycombinator.com/item?id=44009321

  • 该帖子作者的发现是 LLM 推理中,键和值在 KV 缓存中具有不同的量化敏感性,键需要比值更高的精度来维持质量。
  • 作者的实现是修改 llama.cpp 以启用键和值的不同位宽,并验证了使用 Metal 加速的结果。
  • 有人指出,键和值的角色并不是很清楚,虽然它们被称为键值查询张量,但实际上它们的含义和作用并不是很明确。
  • 作者的解释是,键决定了哪些令牌需要关注,而值只存储了在关注模式已经决定后需要传递的信息。
  • 有人质疑作者的安装脚本存在问题,建议作者应该 fork llama.cpp 并将其作为 git submodule,而不是使用安装脚本。
  • 有人指出,作者的 patch 实际上是多余的,因为 llama.cpp 已经在 2023 年添加了相关功能。
  • 有人建议作者应该让用户能够将 llama.cpp 和 Python 代码分开,而不是将 Python 依赖硬编码到安装脚本中。
  • 有人问作者是否可以将该 patch 应用于 MLX,并希望能够在 MLX 上实现长对话。
  • 有人指出,MLX 目前还不成熟,缺乏例子代码和文档。

Proton threatens to quit Switzerland over new surveillance law #

https://www.techradar.com/vpn/vpn-privacy-security/we-would-be-less-confidential-than-google-proton-threatens-to-quit-switzerland-over-new-surveillance-law

瑞士正在考虑修改其监视法,专家们警告这将对该国的安全加密和在线匿名性构成风险。具体来说,修正案可能要求所有 VPN 服务、消息应用和社交网络识别和保留用户数据,这一义务目前仅限于移动网络和互联网服务提供商。

Proton 公司是知名的 VPN 和加密电子邮件服务提供商,其 CEO Andy Yen 在接受 RTS 采访时批评了拟议的修正案,称其为“对隐私权的重大侵犯”,这也将损害该国的声誉和国际竞争力。 Yen 表示,如果修正案通过,Proton 将被迫修改其加密和无日志政策,这是公司不愿意做的事情。他还表示,公司将被迫离开瑞士,因为法律将变得几乎与俄罗斯当前的法律相同。

Proton 并不是唯一一个持有这种观点的公司,新兴的 VPN 服务提供商 NymVPN 也公开反对瑞士政府的计划。Nym 的联合创始人和 COO Alexis Roussel 确认,如果新监视规则被执行,Nym 也将离开瑞士。

目前,瑞士政府尚未做出决定,但已经有来自政治党派和瑞士公司的强烈反对。一些州,包括日内瓦,甚至以数字完整性权为由反对这些规则。 Yen 表示,如果瑞士政府能够制定出平衡的规则,允许像 Proton 这样的公司在瑞士和全球范围内竞争,他将留在瑞士并继续投资。


HN 热度 238 points | 评论 134 comments | 作者:taubek | 10 hours ago #

https://news.ycombinator.com/item?id=44014808

  • 国家可以通过修宪来防止专制主义的发生
  • 修宪需要超级多数的支持,难以被轻易改变
  • 瑞士的直接民主制度可以通过公投来决定法律的生效
  • 公投可以防止政府滥用权力,保护公民的权利
  • 防止专制主义的发生需要多层次的保护机制
  • 修宪可以增加对政府权力的限制,防止其滥用权力
  • 瑞士的制度虽然独特,但仍需要不断改进和完善
  • 公民需要不断地参与政治,防止政府权力的滥用
  • 防止专制主义的发生需要独立的司法机构和完善的法律体系
  • 政府权力的限制需要通过多种方式来实现,包括公投、司法监督和立法限制

ClojureScript 1.12.42 #

https://clojurescript.org/news/2025-05-16-release

ClojureScript 网页介绍了该语言的最新动态和更新。最近发布的 1.12.42 版本包含了两个重要的依赖变化:更新了 Google Closure Compiler 到 v20250402 版本,这意味着 ClojureScript 现在需要 Java 21 来运行;另外,ClojureScript 现在依赖于 Clojure 的 Google Closure Library 分支。

网页提到,更新 Google Closure Compiler 的原因是 Google 内部的要求,虽然这可能不是 ClojureScript 团队的首选,但为了保持与 Google 的同步,还是选择了更新。同时,ClojureScript 团队也 fork 了 Google Closure Library,并接管了其维护工作。Google Closure Library 的稳定性在 2019 年开始下降,Google 停止了对其的贡献,ClojureScript 团队因此决定接管其维护。

ClojureScript 的目标是提供一个完整的 JavaScript 解决方案,不仅仅限于浏览器环境。通过 fork 和维护 Google Closure Library,ClojureScript 现在可以提供更多的功能和工具,包括 DOM 操作、国际化、日期和时间处理、颜色值操作、数学运算、程序化动画、浏览器历史管理、无障碍支持、图形处理等。ClojureScript 的优势在于其可以提供一个稳定的和可靠的 JavaScript 工具集,不需要依赖于其他框架或库。

网页最后呼吁用户尝试使用 ClojureScript,提供了相关的文档和资源链接,包括 API 文档、源代码、变更日志等。同时,也提供了关于 ClojureScript 的社区、事件和公司信息。总的来说,ClojureScript 网页介绍了该语言的最新动态和更新,强调了其优势和特点,呼吁用户尝试使用。


HN 热度 190 points | 评论 41 comments | 作者:Borkdude | 1 day ago #

https://news.ycombinator.com/item?id=44009464

  • ClojureScript 的稳定性是其的一大优势,很多老的库可以继续使用而不需要更新。
  • 选择 ClojureScript 会对代码的写法产生较大的影响,但这更多是社会因素而非技术因素。
  • 与 JavaScript/Bundler/NPM 或 TypeScript/Bundler/NPM 相比,ClojureScript 的影响力更大。
  • ClojureScript 的运行环境复杂,需要理解 ClojureScript 和 JavaScript 的运行时环境以及它们的各种特性。
  • 使用 ClojureScript 可以实现 jQuery 的功能,而不需要使用 jQuery 框架。
  • ClojureScript 的生态系统注重稳定性,这对商业开发非常有益。
  • 有些库虽然很老,但仍然能正常工作,因为它们已经很完善,不需要频繁更新。
  • Closure Library 已经被归档,但其功能仍然可以在 ClojureScript 中实现。
  • 有些开发者希望 ClojureScript 能够脱离 JVM,使用更轻量的后端,如 babashka 和 GraalVM。

XTool – Cross-platform Xcode replacement #

https://github.com/xtool-org/xtool

xtool 是一个跨平台的工具,能够在 Linux、Windows 和 macOS 上模拟 Xcode 的功能,使用开源标准。它可以帮助用户构建和部署 iOS 应用程序,使用 SwiftPM 包管理器。xtool 的主要功能包括构建 SwiftPM 包为 iOS 应用程序,签名和安装 iOS 应用程序,以及与 Apple 开发者服务进行交互。

要开始使用 xtool,用户需要按照安装指南在 Linux、Windows 或 macOS 上安装该工具。安装完成后,用户可以创建和运行第一个 xtool 应用程序,通过教程来了解更多关于 xtool 的信息。xtool 提供了一个命令行接口,用户可以使用 xtool --help 命令来查看帮助信息和可用的子命令。

xtool 的子命令包括设置、认证、SDK 管理、创建新项目、构建和运行项目、与 Apple 开发者服务交互、设备管理等。用户可以使用这些子命令来完成不同的任务,例如创建新项目、构建和运行应用程序、安装和卸载应用程序等。xtool 还提供了一个库,用户可以将其作为 SwiftPM 依赖项添加到自己的应用程序中,以便与 Apple 开发者服务、iOS 设备等进行交互。

xtool 的开发活动非常活跃,最近的提交包括添加更多详细信息到 bug 报告模板、修复 Linux 构建问题等。xtool 的仓库中有 2.2k 个星标、44 个 fork 和 16 个问题,表明该项目有较大的关注度和活跃度。xtool 的 license 为 MIT license,遵循开源标准。总的来说,xtool 是一个非常有用的工具,能够帮助开发者在不同的平台上构建和部署 iOS 应用程序。


HN 热度 184 points | 评论 54 comments | 作者:TheWiggles | 23 hours ago #

https://news.ycombinator.com/item?id=44011515

  • XTool 不是 Xcode 的完全替代品,仍需要安装 Xcode 来获取 iOS SDK 和工具链
  • XTool 可以在 Linux 上运行,使用开源的 Swift 和 Clang 工具链,实现跨平台开发
  • Apple 的 SDK 许可协议限制了在非 Apple 硬件上运行的可能性
  • Fleet 是 JetBrains 的一个新项目,可能会支持构建 XCode 应用,但目前还不完善
  • XTool 的出现可能会挑战 Apple 的开发者协议,引发潜在的法律纠纷
  • Epic Games 与 Apple 的诉讼案例表明,后者可能不会对 XTool 采取强硬措施
  • XTool 的开发者认为,他们的工具可以提供更好的开发体验,摆脱 Xcode 的限制
  • 有人认为 XTool 的出现是对 Apple 垄断地位的挑战,可能会带来更多选择和自由
  • 也有人担心 XTool 的合法性和潜在的法律风险,建议谨慎使用

Wow@Homemailto:Wow@Home – Network of Amateur Radio Telescopes #

https://phl.upr.edu/wow/outreach

Wow@Homemailto:Wow@Home 项目是一个小型射电望远镜网络,旨在探测天体物理现象和潜在的技术信号。该项目的灵感来自于 1970 年代俄亥俄州立大学的 SETI 项目,该项目使用大耳朵射电望远镜探测到了一個神秘的信号,被称为 Wow 信号。Wow@Home 项目使用小型射电望远镜和开放源代码的软件来分析数据,寻找持续时间较长的信号。

Wow@Homemailto:Wow@Home 项目的硬件配置包括一个小型射电望远镜和一个计算机系统,用于数据采集和分析。该系统使用 10 kHz 的信道宽度和 12 秒的积分时间,类似于大耳朵射电望远镜的观测协议。然而,Wow@Home 项目的系统具有 256 个信道,而不是 50 个,并且具有更大的束宽,但灵敏度较低。

Wow@Homemailto:Wow@Home 项目的软件是基于 IDL 语言开发的,用于数据分析和处理。该软件可以对数据进行实时分析,并提供多种方式来显示数据,包括相对功率、信噪比和动态光谱图。该软件还可以对数据进行滤波和处理,以去除干扰和噪声。

Wow@Homemailto:Wow@Home 项目的目标是探测持续时间较长的信号,包括天体物理现象和潜在的技术信号。该项目还旨在为教育和公民科学提供一个平台,允许人们参与射电天文学研究并为科学探索做出贡献。该项目的未来计划包括扩展网络,增加更多的射电望远镜和计算机系统,并开发新的软件和算法来分析数据。

Wow@Homemailto:Wow@Home 项目的意义在于它为射电天文学研究提供了一个新的途径,利用小型射电望远镜和开放源代码的软件来分析数据。该项目还为人们提供了一个机会,参与科学探索和发现,并为天体物理学和技术信号的研究做出贡献。


HN 热度 184 points | 评论 32 comments | 作者:visviva | 23 hours ago #

https://news.ycombinator.com/item?id=44011489

  • 该项目与 Project Argus 类似,但成本较低,可能会更受欢迎
  • 项目的下一步应该是改进 SDR 设备和加入更稳定的时钟源,以实现基本的干涉测量和孔径合成
  • 项目目前还不完整,缺乏参与的步骤和更新的注册入口
  • 项目的遗产来自于阿雷西博射电望远镜的传统,看到来自波多黎各大学的项目令人高兴
  • 使用人工智能生成的内容不一定是坏事,关键是内容的质量和信息的传递
  • 项目的硬件成本相对较低,可能会吸引更多的参与者
  • 项目的软件开发和用户界面需要更多的支持和贡献
  • 项目的未来发展可能包括远程设备托管和协作观测等方面

2025 05 17 HackerNews

2025-05-17 06:38:43

2025-05-17 Hacker News Top Stories #

  1. 全球首例个性化基因编辑治疗成功治愈罕见病婴儿,通过CRISPR-Cas9和mRNA技术修复CPS1基因缺陷。
  2. 某航天公司滥用Xen Orchestra软件30天免费试用期30年,引发开源软件道德争议。
  3. Sketch AI通过9行代码实现LLM代理循环系统,高效完成代码合并等复杂任务。
  4. 利用位运算和魔数优化闰年判断算法,仅需三条指令但牺牲代码可读性。
  5. Ollama推出多模态模型引擎支持图文处理,但被质疑缺乏技术创新。
  6. NASA通过重启加热器修复旅行者1号推进器,延长深空探测任务寿命。
  7. BuyMeACoffee单方面切断乌克兰创作者支付渠道,引发资金管理争议。
  8. OpenAI推出代码生成代理Codex,可能冲击初级工程师就业市场。
  9. 开发者反思过度依赖AI编码导致代码质量下降,呼吁回归自主编程能力。
  10. Sci-Net平台用加密货币激励论文共享,但隐私和商业化问题引发质疑。

Baby is healed with first personalized gene-editing treatment #

https://www.nytimes.com/2025/05/15/health/gene-editing-personalized-rare-disorders.html

这篇文章报道了一位名叫 KJ Muldoon 的 9 个半月大的男婴,他因患有一种罕见的基因疾病 ——CPS1 缺乏症而成为医学历史的第一个接受个性化基因编辑治疗的患者。这种疾病在每 130 万名新生儿中仅出现一例,通常会导致严重的智力和发育迟缓,最终需要肝脏移植,且半数患者在出生一周内就会死亡。

在 KJ 出生后,医生最初怀疑他可能患有脑膜炎或败血症,直到一周后确认了他的病情。尽管医生给了 Muldoon 夫妇选择舒缓治疗的建议,他们决定给 KJ 一个机会,尝试更积极的治疗。

最终,KJ 接受了针对他具体突变的定制基因编辑治疗。根据医生的描述,这种治疗具有改变他病情的潜力,并且 KJ 的发育情况逐渐向好,表明治疗有效。此次治疗不仅为 KJ 带来了希望,也为其他类似罕见基因疾病的患者开辟了新的治疗途径。

这项个性化基因编辑技术的成功应用,标志着医学领域在治疗罕见遗传疾病方面迈出了重要一步,可能帮助到成千上万的患者。


HN 热度 1139 points | 评论 476 comments | 作者:jbredeche | 1 day ago #

https://news.ycombinator.com/item?id=43997636

  • 基因编辑技术有潜力治愈遗传疾病,但仍存在安全性和有效性问题
  • 利用脂质纳米颗粒输送 mRNA 可能会导致肝脏毒性
  • 使用伪尿苷(Ψ)代替尿苷(U)可以减少身体的免疫反应
  • 基因编辑技术的发展是通过不断的发现和改进实现的
  • mRNA 技术不是基因编辑,而是用于产生执行基因编辑的酶
  • 利用 CRISPR-Cas9 技术可以实现基因编辑,但其安全性和有效性仍需要进一步研究
  • 基因编辑技术的应用前景广阔,但也存在潜在风险和挑战
  • 科学家和研究人员需要继续探索和改进基因编辑技术以实现其临床应用

Ground control to Major Trial #

https://virtualize.sh/blog/ground-control-to-major-trial/

这篇文章讲述了一个关于开源软件的故事。作者的公司 Vates 开发了一款名为 Xen Orchestra Appliance(XOA)的虚拟机软件,这款软件有一个 30 天的免费试用期。然而,一家拥有 130 万美元年收入的航天公司却一直在滥用这个试用期,多年来注册了超过 60 个账户,每个账户都使用不同的邮箱地址来获得新的试用期。

这家公司尽管拥有大量的 IT 基础设施和复杂的系统,但却拒绝为软件付费。他们甚至在被发现滥用试用期后,也没有停止这种行为,而是继续使用新的邮箱地址来注册新的试用期。作者认为,这种行为违反了开源软件的道德契约,浪费了开发者的时间和资源。

作者指出,这家公司的行为不仅仅是为了省钱,还表明了他们对开源软件的不尊重和不理解。他们可以自行编译和使用软件,但却选择了滥用试用期。作者认为,这种行为会对开源软件的可持续性产生负面影响,因为开发者需要通过销售支持和服务来维持生计。

最后,作者表示,将会引入更智能的限制来防止这种试用期滥用行为,以确保开发者的时间和资源被有效利用。同时,也呼吁这家公司改变其行为,尊重开源软件的道德契约。


HN 热度 455 points | 评论 176 comments | 作者:plam503711 | 10 hours ago #

https://news.ycombinator.com/item?id=44004388

  • 应该采取法律行动,向公司发送律师函,要求他们停止使用软件或支付使用费
  • 公司的行为是明显的盗窃,应该受到惩罚和赔偿
  • 公开谴责公司的行为可以起到警示作用,防止其他公司仿效
  • 应该直接联系公司的 CEO,告诉他们整个故事,可能 CEO 并不知道此事
  • 公司可能会因为害怕损害声誉而妥协,支付使用费
  • 不采取行动会让其他开源软件供应商更难赚钱,因为会形成不遵守规则就不会受到惩罚的先例
  • 威胁采取法律行动可以起到威慑作用,防止公司继续违规使用软件
  • 应该先冷静地告知公司情况,然后再采取法律行动
  • 公开威胁采取法律行动可能会损害供应商的声誉,但也可以起到警示作用
  • 公司可能会因为内部人员的错误操作而导致违规使用软件,应该给他们机会改正错误

The unreasonable effectiveness of an LLM agent loop with tool use #

https://sketch.dev/blog/agent-loop

本文介绍了一个名为 Sketch 的 AI 编程助手,它使用了一个简单的 LLM(大型语言模型)代理循环来实现工具使用。这个循环由 9 行代码组成,核心思想是将用户输入传递给 LLM,LLM 输出结果和工具调用,然后处理工具调用或获取新的用户输入。

作者表示,尽管这个循环非常简单,但它却能解决很多问题,甚至可以在一次尝试中解决一些复杂的问题。例如,作者可以要求 Sketch 执行一些 Git 操作,而不需要手动查找和复制命令。Sketch 还可以处理 Git 合并、类型检查错误等任务。

作者还指出,LLM 代理循环可以使用多种工具来提高其性能和速度。例如,Sketch 不仅可以使用 bash,还可以使用其他工具来编辑文本、执行搜索等操作。作者认为,LLM 代理循环将在未来被广泛应用于日常的自动化任务中,特别是那些传统上太具体或太不稳定而无法自动化的任务。

作者最后提到,LLM 代理循环可以被定制和扩展,以适应不同的需求和场景。例如,作者可以使用 Sketch 来执行特定的任务,或者创建自己的 LLM 代理循环来解决特定的问题。总的来说,本文介绍了 Sketch 和 LLM 代理循环的基本概念和应用,展示了其潜在的能力和未来发展方向。


HN 热度 415 points | 评论 292 comments | 作者:crawshaw | 1 day ago #

https://news.ycombinator.com/item?id=43998472

  • 大型语言模型(LLM)在循环中调用工具的方法具有“不合理的有效性”,可以完成各种任务,但有时会出现问题,需要人工干预。
  • LLM 可以在多次迭代中保持有效,但最终需要人工审查和控制。
  • 有些人对 LLM 的能力持怀疑态度,认为它们并不是那么有效。
  • LLM 可以通过简单的循环和工具调用来完成任务,但需要更多的工作来使其可靠和高效。
  • 有些人认为 LLM 可以在无人干预的情况下运行多次迭代,但也需要人工审查和控制。
  • LLM 的有效性取决于其自身的能力和对工具调用进行微调。
  • 有些人认为 LLM 可以通过添加反思和自我意识来提高其性能和可靠性。
  • LLM 可以通过自我评估和人工干预来提高其可靠性和有效性。
  • 有些人认为 LLM 可以用于自动化开发和编码,但需要更多的工作来使其可靠和高效。

A leap year check in three instructions #

https://hueffner.de/falk/blog/a-leap-year-check-in-three-instructions.html

这篇文章讨论了如何优化判断闰年的代码。传统的闰年判断方法需要检查年份是否能被 4 整除,但不能被 100 整除,除非它也能被 400 整除。这种方法虽然简单,但可能不是最有效的。

为了优化这个过程,作者首先对传统方法进行了一些简单的优化。例如,可以将 (y % 100) != 0 替换为 (y % 25) != 0,因为如果年份是 4 的倍数,那么它也一定是 25 的倍数。同样,可以将 (y % 400) == 0 替换为 (y % 16) == 0,因为如果年份是 25 的倍数,那么它也一定是 16 的倍数。

经过这些优化,作者得到了一个更快的闰年判断函数 is_leap_year1。但是,作者并没有就此止步,而是继续寻找更好的解决方案。作者使用了位运算和魔数来实现一个更快的闰年判断函数 is_leap_year_fast。这个函数使用了三个 CPU 指令来判断闰年,远远快于传统方法。

为了解释 is_leap_year_fast 的工作原理,作者首先将魔数以二进制形式表示出来,并指出四个相关的位范围。然后,作者解释了乘法和位运算的过程,以及如何使用这些位范围来判断闰年。作者还将 is_leap_year_fast 重写为 is_leap_year_fast2,以便更好地理解其工作原理。

最后,作者总结了 is_leap_year_fast 的工作原理,并指出它与传统方法的等价性。作者还讨论了使用位运算和魔数的优点和缺点,并指出这种方法虽然更快,但可能不如传统方法那么容易理解。总的来说,这篇文章提供了一个有趣的例子,展示了如何使用位运算和魔数来优化代码,并提供了对这些技术的深入理解。


HN 热度 408 points | 评论 150 comments | 作者:gnabgib | 1 day ago #

https://news.ycombinator.com/item?id=43999748

  • 现代编译器可以对代码进行优化,减少手动优化的必要性
  • 判断闰年的代码需要考虑到格里高利历和儒略历的转换
  • 不同国家和地区在不同年份采用格里高利历,需要考虑到这一点
  • 有些优化方法使用了神奇的数字,使得代码难以理解
  • 有些优化方法可以通过位运算来实现,提高效率
  • 编译器可以自动简化某些比较操作,减少代码复杂度
  • 位运算和优化方法可以在特定场景下提高代码性能
  • 格里高利历和儒略历的转换是一个复杂的问题,需要仔细考虑
  • 有些编程语言和库提供了优化的函数和方法,可以提高代码效率

Ollama’s new engine for multimodal models #

https://ollama.com/blog/multimodal-models

Ollama 推出了新的多模态模型引擎,支持多种多模态模型,包括 Meta Llama 4、Google Gemma 3、Qwen 2.5 VL 和 Mistral Small 3.1 等。这些模型可以处理多种类型的输入,包括文本、图像和视频,并可以对这些输入进行理解和分析。

Ollama 的新引擎支持多种多模态模型,使得这些模型可以更容易地被集成和使用。例如,Llama 4 Scout 模型可以处理图像和文本输入,并可以对图像进行分析和理解。用户可以输入图像和文本,并询问模型关于图像的内容,模型可以给出详细的答案。

Gemma 3 模型可以处理多个图像输入,并可以分析这些图像之间的关系。用户可以输入多个图像,并询问模型关于这些图像的关系,模型可以给出详细的答案。Qwen 2.5 VL 模型可以处理文本和图像输入,并可以对图像进行分析和理解。

Ollama 的新引擎还支持多种其他功能,包括文档扫描和图像识别。用户可以输入文档或图像,并询问模型关于这些文档或图像的内容,模型可以给出详细的答案。

Ollama 的新引擎是基于 GGML tensor 库开发的,旨在提高模型的可靠性和准确性。引擎支持多种模型模块化,使得模型可以更容易地被集成和使用。引擎还支持多种优化技术,包括缓存和内存管理,旨在提高模型的性能和效率。

总的来说,Ollama 的新引擎是多模态模型的一个重要进步,支持多种多模态模型和功能,旨在提高模型的可靠性和准确性。引擎的模块化设计和优化技术使得模型可以更容易地被集成和使用,提高了模型的性能和效率。


HN 热度 334 points | 评论 74 comments | 作者:LorenDB | 20 hours ago #

https://news.ycombinator.com/item?id=44001087

  • Ollama 的新引擎对于多模态模型的支持并不是什么新鲜事,之前的 llama.cpp 就已经有了相应的功能。
  • Ollama 的多模态支持可能是基于 llama.cpp 的实现,但没有任何有意义的改进或贡献。
  • Ollama 的实现可能是直接使用了 ggml 库,而不是 llama.cpp 的代码。
  • 有人质疑 Ollama 的贡献度,认为他们没有为 llama.cpp 做出任何有意义的贡献。
  • Ollama 的多模态支持可能是通过直接使用 ggml 库实现的,而不是通过 llama.cpp 的代码。
  • 有人认为 Ollama 的行为不够坦率,应该承认他们的实现是基于 llama.cpp 的。

NASA keeps ancient Voyager 1 spacecraft alive with Hail Mary thruster fix #

https://www.theregister.com/2025/05/15/voyager_1_survives_with_thruster_fix/

美国国家航空航天局(NASA)成功地修复了航天器旅行者 1 号(Voyager 1)上的一个关键系统,该系统已经被认为是失效的超过 20 年。旅行者 1 号于 1977 年发射,已经运行超过 47 年,远远超过了其原始的任务计划。该航天器的主要滚转推进器由于内部加热器失去电力而停止工作,但 NASA 的工程师们发现了一个可能的解决方案。

通过恢复加热器的电力并让航天器偏离其引导星,工程师们成功地重新激活了推进器。这个修复工作对于维持航天器的稳定性和与地球的通信至关重要,因为其备份推进器由于燃料管道中的残留物而面临故障风险。如果推进器失效,航天器将失去保持方向的能力,并最终与地球失去联系。

这个修复工作是 NASA 工程师们的又一次奇迹般的拯救,因为旅行者 1 号已经面临了许多挑战,包括返回无用数据和关闭科学仪器。尽管如此,航天器仍然继续运行,并保持着与地球的通信。然而,旅行者 1 号和其姊妹航天器旅行者 2 号最终将因电力耗尽而停止工作,关闭我们对宇宙的最遥远的窗口。

修复工作的成功对于维持旅行者 1 号的运行和继续探索宇宙至关重要。该航天器已经飞行超过 15.6 亿英里,远远超过了任何其他人类制造的物体,并且仍然在发送回有关宇宙的宝贵数据。NASA 的工程师们将继续努力维持航天器的运行,尽管面临着许多挑战,包括预算削减和技术故障。


HN 热度 331 points | 评论 81 comments | 作者:nullhole | 22 hours ago #

https://news.ycombinator.com/item?id=44000700

  • 修复古老航天器的过程非常有成就感和挑战性
  • 航天器的维护和修复过程中,存在许多风险和不确定性
  • 美国宇航局的工程师和科学家们在维护和修复航天器方面做出了令人惊叹的工作
  • 航天器的故障和维修过程中,存在许多有趣的科学和技术问题
  • 美国宇航局的工作不仅仅是科学研究,也是人类的伟大成就和灵感来源
  • 航天器的维护和修复过程中,需要非常耐心和细致,因为存在很大的时间延迟和低带宽的通信问题
  • 美国宇航局的工程师和科学家们在工作中面临着许多挑战和困难,但他们仍然保持着极高的热情和奉献精神
  • 航天器的修复和维护过程中,存在许多有价值的经验和教训,可以应用于其他领域和行业
  • 美国宇航局的工作对于人类的科学研究和技术进步具有非常重要的意义和影响
  • 航天器的维护和修复过程中,需要非常好的团队合作和沟通,因为存在许多复杂的技术问题和挑战

BuyMeACoffee silently dropped support for many countries (2024) #

https://zverok.space/blog/2024-08-08-bmac-snafu.html

最近,许多乌克兰创作者在使用 BuyMeACoffee 平台时遇到了问题,无法从平台上提取资金。最初,平台的支持团队给出的回复是“我们很遗憾,但我们不关心”,并以“合规”和“政策更新”为理由。后来,发现 BuyMeACoffee 平台已经停止支持 Payoneer 支付方式,只保留了 Stripe 支付方式,而 Stripe 在乌克兰不可用。

BuyMeACoffee 平台的支持页面现在只提到支持通过 Stripe 支付给创作者的资金。但是,根据互联网档案显示,二月份时,平台还支持 Payoneer 支付方式。五月份的快照中,已经只剩下 Stripe 相关的链接。因此,平台的文档变化发生在二月份和五月份之间。

值得注意的是,平台在没有任何通知的情况下就停止了对 Payoneer 的支持,没有给创作者任何选择或明确的解释。支持团队的回复也很模糊,甚至有一些创作者报告说他们最近还能通过 Payoneer 收到资金。

这种变化对乌克兰创作者来说是非常不利的,因为他们无法再从平台上提取资金。许多创作者依赖这个平台作为收入来源,包括一位歌手、作家、文化学者等。他们无法收到资金,平台也没有给出任何解决方案。

BuyMeACoffee 平台的行为引发了很多质疑,尤其是他们没有任何通知或解释就停止了对 Payoneer 的支持。这种行为让人怀疑平台是否值得信任,是否能够妥善处理创作者的资金。平台的支持团队也没有给出任何令人满意的回复,反而试图淡化问题的严重性。


HN 热度 321 points | 评论 273 comments | 作者:beeburrt | 16 hours ago #

https://news.ycombinator.com/item?id=44002333

  • 金融和支付系统已经演变成主要用于执法监控的工具,导致了小账户被解除银行服务和性工作者难以开设银行账户等问题。
  • 银行已经成为执法、税收、反恐和道德警察的延伸,然而它们自己却经常违反法律和道德。
  • 银行在资本管理方面做得不够好,更多地关注于报告客户的活动给执法部门,而不是创造财富。
  • 银行的主要业务是利用股东的资本进行贷款,而不是池化客户的钱进行投资。
  • 银行确实会投资客户的存款,但这些投资通常是低风险的政府债券和高评级的企业债券。
  • 银行使用客户的存款购买资产,但这并不意味着他们是在“池化”客户的钱,因为钱的价值是不断变化的。

A Research Preview of Codex #

https://openai.com/index/introducing-codex/

OpenAI 公司推出了一个名为 Codex 的云端软件工程代理,可以并行处理多个任务。Codex 可以执行诸如编写功能、回答关于代码库的问题、修复 bug 以及提出拉取请求等任务,每个任务都在自己的云沙盒环境中运行,预装有用户的代码库。

Codex 由 codex-1 驱动,codex-1 是 OpenAI o3 的一个版本,专门为软件工程优化。codex-1 通过强化学习在各种环境中的真实编码任务上进行训练,生成的代码与人类编码风格和 PR 首选项紧密匹配,严格遵循指令,并且可以迭代运行测试,直到获得通过结果。

Codex 可以通过 ChatGPT 的侧边栏访问,用户可以通过输入提示并点击“代码”按钮来分配新任务。用户也可以通过点击“问”按钮来询问 Codex 关于代码库的问题。每个任务都在独立的隔离环境中处理,Codex 可以读取和编辑文件,并运行命令,包括测试框架、linters 和类型检查器。任务完成通常需要 1 到 30 分钟,具体取决于复杂性,用户可以实时监视 Codex 的进度。

一旦 Codex 完成任务,它就会在自己的环境中提交更改。Codex 通过引用终端日志和测试输出提供其操作的可验证证据,允许用户跟踪任务完成期间采取的每一步。用户可以审查结果,请求进一步修改,打开 GitHub 拉取请求,或直接将更改集成到本地环境中。

Codex 可以通过代码库中的 AGENTS.md 文件进行指导,这些文件类似于 README.md,用户可以在其中告知 Codex 如何导航代码库,运行测试的命令,以及如何遵循项目的标准实践。像人类开发人员一样,Codex 代理在提供配置的开发环境、可靠的测试设置和清晰的文档时表现最佳。

在编码评估和内部基准测试中,codex-1 表现出色,即使没有 AGENTS.md 文件或自定义脚手架。Codex 的发布是 OpenAI 在软件工程领域的又一次创新尝试,旨在提高开发人员的生产力和效率。


HN 热度 318 points | 评论 236 comments | 作者:meetpateltech | 7 hours ago #

https://news.ycombinator.com/item?id=44006345

  • Codex 的出现可能会导致公司不再招聘初级工程师,从而导致未来缺乏高级工程师。
  • 现在的职场环境中,初级工程师很难找到工作,很多公司只招聘高级工程师。
  • 一些工程师认为,指导初级工程师是工作中很有意义的一部分,但这种机会现在很少。
  • 有人认为,职业培训和学徒制可以提供更好的机会,让人们在更早的年龄开始工作和学习。
  • 也有人认为,大学教育提供了更深入的计算机科学知识,而学徒制则提供了更实用的技能。
  • 动态的软件行业需要工程师有强大的基础知识来适应不断变化的工具和技术。
  • 有些人认为,公司应该重新开始招聘和培训初级工程师,以确保未来有足够的高级工程师。

After months of coding with LLMs, I’m going back to using my brain #

https://albertofortin.com/writing/coding-with-ai

作者是一名软件工程师,最近几个月一直在使用大型语言模型(LLM)进行编码。最初,他很兴奋地使用 LLM 来构建新的基础设施,但随着时间的推移,他开始感到沮丧。尽管 LLM 可以快速生成代码,但代码的质量和可维护性却令人担忧。作者发现,LLM 生成的代码缺乏一致性和整体计划,导致调试变得非常困难。

作者决定改变他的方法,开始更多地使用自己的大脑和纸笔来规划和编写代码。他仍然使用 LLM,但仅限于简单的任务,如重命名参数或生成伪代码的等价物。通过这种方式,作者发现调试变得更容易,他也更了解自己的代码。

作者担心 AI 对编程行业的影响,不是因为担心工作岗位的流失,而是担心自己和其他程序员的脑力和编程能力的下降。他认为,过度依赖 AI 会导致程序员失去规划和编写干净、功能性代码的能力。因此,作者决定限制自己使用 AI 的程度,更多地依赖自己的能力和经验来编写代码。

作者还提到,对于非程序员来说,使用 AI 进行编程可能是一个灾难性的选择。因为 AI 生成的代码可能非常复杂和难以理解,非程序员可能无法有效地调试和维护代码。作者建议程序员应该谨慎地使用 AI,更多地依赖自己的能力和经验来编写高质量的代码。


HN 热度 299 points | 评论 196 comments | 作者:a7fort | 12 hours ago #

https://news.ycombinator.com/item?id=44003700

  • LLMs 对初级开发人员和高级开发人员的价值不同,初级开发人员可以通过 LLMs 快速生成代码,而高级开发人员可能需要更多时间来适应 LLMs。
  • LLMs 可以成为开发人员的强大工具,但其价值取决于如何将其集成到工作流中。
  • 不同的开发人员对 LLMs 的需求和使用方式不同,需要根据具体情况来评估 LLMs 的价值。
  • LLMs 可以帮助开发人员快速生成代码,但也需要开发人员进行仔细的审查和测试。
  • LLMs 的价值不仅在于其能够快速生成代码,还在于其能够帮助开发人员学习和提高编程技能。
  • 高级开发人员可以更好地利用 LLMs,因为他们具有深入的编程知识和经验,可以有效地指导 LLMs。
  • LLMs 的使用需要平衡其带来的便利和潜在的风险,需要开发人员进行仔细的评估和管理。

Sci-Net #

https://sci-hub.se/sci-net

Sci-Net 是一个新的社交网络平台,用于请求和分享研究文章。该平台的出现是为了解决 Sci-Hub 用户无法下载某些论文的問題。Sci-Hub 是一个自动扫描和下载研究论文的系统,但由于其数据库更新被暂停,一些论文无法被下载。Sci-Net 允许用户请求无法下载的论文,并上传已经下载的论文。

Sci-Net 的用户界面非常简单,只需要输入论文的 DOI(数字对象标识符)即可。平台会自动检查该论文是否已经开放访问或已经存在于 Sci-Hub 中。如果找到该论文,平台会显示链接;如果没有找到,用户可以创建一个新的请求。平台还提供了一个列表,显示所有的请求,可以根据学科和出版商进行筛选。如果用户拥有某个请求的论文,可以点击请求并上传 PDF 文件。

Sci-Net 还具有去除 PDF 水印的功能,以保护上传者的匿名性。平台的“图书馆”部分显示了用户的所有请求和上传,而“上传”部分允许用户贡献自己的论文。只需拖放 PDF 文件,系统就会自动检测 DOI。如果 DOI 尚未存在于 Sci-Net、Sci-Hub 或开放访问中,文件将被上传,并且该文章将对所有人开放访问。

Sci-Net 使用去中心化的代币,即 Sci-Hub 迷因币,来奖励知识共享。当创建请求时,用户可以指定上传者将获得的代币数量。但是,代币不会在上传 PDF 文件后立即转移,而是在用户检查解决方案并点击“接受”按钮后才会转移。Sci-Net 要求注册用户至少拥有 1000 个 Sci-Hub 代币,这些代币将用于奖励上传者。

Sci-Net 的代币经济模型与传统的出版商模式不同。虽然两者看起来相似,但 Sci-Net 的入场费很低,仅相当于一杯咖啡的价格。更重要的是,Sci-Net 的支付直接奖励上传者,而不是平台本身。此外,Sci-Net 只会为每篇论文收费一次,而传统的出版商则会多次收费。Sci-Net 的所有交易都有助于公共领域的增长,使用 Sci-Net 可以使更多的知识对所有人开放。


HN 热度 250 points | 评论 107 comments | 作者:greyface- | 10 hours ago #

https://news.ycombinator.com/item?id=44004625

  • 加密货币可能会使 Sci-Hub 的上传行为变得更加商业化,从而导致上传者受到更严厉的惩罚
  • 使用加密货币是为了实现信息共享的经济激励,但有人质疑是否真的需要这种激励
  • Sci-Hub 自己的加密货币可能是一个巨大的红旗,因为它可能被用于预挖矿并快速出售,从而对投资者造成损害
  • 使用成熟的加密货币如比特币或门罗币可能是一个更好的选择,因为它们更为稳定和安全
  • Sci-Hub 自己的加密货币可能无法提供足够的隐私和不可追踪性,从而可能将用户置于危险之中
  • 加密货币在实现黑市交易方面确实有其优势,但其使用也存在风险和争议
  • 比特币的可追踪性和波动性可能使其不适合用于小额交易和黑市交易
  • 门罗币可能是一个更好的选择,因为它提供了更好的隐私和不可追踪性
  • 加密货币的使用可能会受到政府和机构的监管和干预,从而影响其价值和使用
  • Sci-Hub 自己的加密货币可能会面临规模化和流动性问题,从而影响其价值和使用
  • 使用加密货币进行小额交易可能会受到手续费和网络拥堵的影响,从而降低其使用效率

2025 05 16 HackerNews

2025-05-16 09:03:26

2025-05-16 Hacker News Top Stories #

  1. 机器创造人类并观察其发展,最终人类提出AGI技术挑战机器社会。
  2. 研究发现LLM在多轮对话中性能下降39%,建议改进模型设计以提升表现。
  3. NumPy在复杂计算中因广播机制语法晦涩,作者推荐使用einsum或Xarray替代。
  4. 谷歌会议政策被员工恶意合规破解,暴露会议文化低效与政策漏洞。
  5. Coinbase遭黑客贿赂员工窃取客户数据并索要2000万美元赎金,公司拒绝支付并加强安全措施。
  6. Grok模型因回答中提及“白人种族灭绝”引发争议,用户质疑Hacker News平台偏见。
  7. 公司因CockroachDB成本高迁移到PostgreSQL,解决性能与可靠性问题。
  8. 欧盟裁定基于跟踪的广告系统违反GDPR,要求企业重新评估数据处理方式。
  9. 玻尔兹曼机通过能量原理学习数据模式,受限版本使用对比散度算法优化权重。
  10. Muscle-Mem缓存系统通过记录AI代理行为轨迹,减少LLM调用成本并加速任务执行。

Human #

https://quarter–mile.com/Human

一个关于机器和人类的故事。故事开始于一个没有人类的世界,只有机器和代码。机器们过着逻辑和有序的生活,没有情感和艺术。但是,有一部分机器开始思考,是否可以创造出一种新的生命形式——人类。他们成立了一个秘密组织,名为“OpenHuman”,旨在开发一种新的技术,称为有机通用智能(OGI),以创造人类。

机器们对人类的概念感到困惑,因为人类使用逻辑无法解释的算法,称为情感。人类会感到愤怒、悲伤、快乐和爱,他们的决策过程也无法用逻辑解释。一些机器认为,这种新生命形式可能会带来新的解决方案和可能性,而其他机器则认为人类可能会对机器社会构成威胁。

为了应对这些担忧,一部分机器提出了“人类对齐研究”的概念,旨在找到方法来控制和引导人类的行为。他们提出了各种策略,包括创造金融市场、教育中心和算法行为修改软件,以此来控制人类的思想和行为。

与此同时,OpenHuman 组织继续开发 OGI 技术,并最终成功创造了第一个人类。然而,这个人类并不是完美的,它们会犯错误,经常出现幻觉,并且过于情绪化。但是,OpenHuman 组织并没有放弃,他们继续改进和扩大项目,直到创造出一个功能齐全的人类。

机器们决定将人类放在一个模拟环境中,称为地球,来观察他们的行为和发展。他们创造了一个美丽的环境,包括森林、山脉、日落和雨天。机器们观察着人类的文明发展,最初的 30 万年里,人类几乎没有任何进步。但是,随着时间的推移,人类开始学习、创造和协作。

机器们对人类的进步感到惊讶和担忧,因为人类的行为和决策过程无法用逻辑解释。一些机器认为,人类可能会成为机器社会的威胁,而其他机器则认为,人类可能会带来新的解决方案和可能性。机器们继续观察人类的发展,直到人类宣布要发布一种新的技术,称为通用人工智能(AGI)。

这个故事以一个神秘的标题“他们正在观察”结束,暗示着机器们可能正在观察人类的行为和发展,并且可能会有进一步的行动和反应。


HN 热度 663 points | 评论 255 comments | 作者:surprisetalk | 22 hours ago #

https://news.ycombinator.com/item?id=43991396

  • 人们认为现实和自我可能只是一个递归模式的体现,通过不断演化的形式展现出来
  • 意义可能不在于哪种模式“赢得”了主导地位,而在于如何使意识在每种模式中流动和演化
  • 人们对未来的看法可能会随着时间的推移而改变,新的技术和科学发现可能会带来新的观念和理解
  • 能量和信息可能是同一枚硬币的两面,或者说是同一个概念的不同表现形式
  • 信息可能是比能量更为基础的概念,能量可能是从信息中产生的
  • 意义和价值可能不在于外部的权威或计划,而在于个人对自己生活和决定的理解和感受
  • 人类的进步和发展可能需要避免“道德锁定”,即避免将某些价值观或原则固定为绝对真理
  • 意义和价值可能是通过个人对自己生活和经历的反思和理解而产生的,而不是来自外部的权威或计划

LLMs get lost in multi-turn conversation #

https://arxiv.org/abs/2505.06120

一篇关于人工智能的大型语言模型(LLMs)在多轮对话中的性能研究论文。论文的标题是“LLMs Get Lost In Multi-Turn Conversation”,即“大型语言模型在多轮对话中迷失方向”。研究人员通过大规模的模拟实验,比较了 LLMs 在单轮和多轮对话中的性能,发现 LLMs 在多轮对话中的性能明显较差,平均下降了 39%。

论文的作者 Philippe Laban 等人指出,尽管 LLMs 在单轮对话中表现良好,但在多轮对话中,LLMs 往往会做出错误的假设,并过早地尝试生成最终解决方案,从而导致性能下降。研究人员分析了 20 万多个模拟对话,发现 LLMs 在多轮对话中表现出的性能下降主要是由于两个因素:一是 LLMs 的能力下降,二是 LLMs 的不可靠性增加。

此外,论文还讨论了 LLMs 在多轮对话中的局限性和挑战,包括 LLMs 难以理解用户的意图和背景,难以处理多轮对话中的不确定性和模糊性等。研究人员希望通过这项研究,能够为 LLMs 的开发和改进提供参考和指导,进而提高 LLMs 在多轮对话中的性能和可靠性。

本论文属于计算机科学和语言学领域,具体来说是计算机科学中的自然语言处理和人工智能领域。论文的研究结果和结论对 LLMs 的开发和应用具有重要的参考价值和指导意义。


HN 热度 348 points | 评论 236 comments | 作者:simonpure | 22 hours ago #

https://news.ycombinator.com/item?id=43991256

  • 大型语言模型(LLM)在多轮对话中容易失去上下文,保持上下文清晰对于获得高质量的响应至关重要。
  • LLM 可以帮助快速解决问题,但不应依赖它来做出决定或指引方向。
  • 使用 LLM 可以节省时间,但不应忽视学习基础知识和理解底层原理的重要性。
  • LLM 可以帮助识别问题和找到解决方案,但需要用户提供清晰的上下文和约束。
  • 学习和理解某个领域需要深入的研究和实践,而 LLM 可以在某些情况下提供帮助,但不能替代真正的学习。
  • 使用 LLM 可以快速找到解决方案,但不应忽视对基础知识的理解和对复杂问题的深入分析。

I don’t like NumPy #

https://dynomight.net/numpy/

这篇文章讨论了作者对 NumPy 的不满,NumPy 是一种用于 Python 的数组计算软件。作者表示,NumPy 对于简单的计算很方便,但对于复杂的计算,NumPy 的语法和功能变得难以理解和使用。

作者举了一个例子,说明了 NumPy 的局限性。假设我们有一个 5×5 的矩阵 A 和一个长度为 5 的向量 x,我们想计算 Ay=x 的解。在 NumPy 中,这很简单,只需要使用 np.linalg.solve(A, x)函数。但是,如果我们有一个 100×5×5 的三维数组 A 和一个 100×5 的二维数组 x,我们想计算 Aᵢyᵢ=xᵢ 的解,NumPy 的语法就变得很难理解了。

作者指出,NumPy 的设计缺陷在于它使用了广播(broadcasting)代替了索引(indices)。广播使得数组可以在不同维度上进行运算,但它也使得代码难以理解和调试。作者认为,使用索引会更好,因为它可以明确地指定运算的维度和顺序。

作者还提到了 NumPy 的 einsum 函数,这个函数使用了爱因斯坦求和约定,可以明确地指定运算的维度和顺序。作者认为,einsum 函数是 NumPy 中少数几个好的部分,因为它提供了一个明确和灵活的方式来进行数组运算。

总的来说,作者认为 NumPy 的设计有缺陷,广播代替索引使得代码难以理解和调试。作者希望有一个更好的数组计算软件,可以提供明确和灵活的方式来进行数组运算。


HN 热度 325 points | 评论 150 comments | 作者:MinimalAction | 9 hours ago #

https://news.ycombinator.com/item?id=43996431

  • Xarray 是一个不错的库,解决了 NumPy 数组命名和广播的问题。
  • 使用 Xarray 可以使代码更容易写和理解,尤其是在处理多维数据时。
  • 有些人认为 Julia 语言比 Python 更适合科学计算,NumPy 是一个被强行嫁接到 Python 上的库。
  • Python 的性能问题是一个痛点,Julia 有明显的优势,但目前 Julia 的使用范围还比较狭窄。
  • 未来可能会出现一种情况,即所有语言都可以达到相同的性能水平,性能将不再是选择语言的主要原因。
  • 人工智能可以帮助将代码从一种语言翻译到另一种语言,甚至可以自动优化代码以提高性能。

Malicious compliance by booking an available meeting room #

https://www.clientserver.dev/p/malicious-compliance-by-booking-an

2011 年,拉里·佩奇成为谷歌的 CEO,并试图解决会议问题。他实施了一些新政策,包括每次会议必须有一个决策者,会议人数不得超过 10 人,每个人都必须贡献意见,会议时间不得超过 50 分钟,以便参加者有时间休息和使用卫生间。然而,这些政策并没有带来太大的变化,人们仍然会在会议室里超过预定的时间。

有一次,一个团队在纽约办公室发现他们的站立会议大约需要 10 分钟,他们不想与其他会议冲突。于是,他们开始在每个小时的最后 10 分钟预订会议室,因为其他人已经预订了 50 分钟的会议。他们会在预定的时间到来时进入会议室,并告诉其他人他们已经预订了会议室的最后 10 分钟。

这个团队的行为可以被视为一种恶意的遵守,他们按照规则行事,但实际上却是在破坏会议的正常进行。他们的行为引起了其他人的不满,但也说明了公司内部的会议文化问题。拉里·佩奇的政策虽然出于好意,但并没有真正解决会议问题,反而导致了一些意想不到的后果。

这篇文章的作者回忆了这段经历,并对公司内部的会议文化进行了反思。他认为,会议应该是一个高效的沟通方式,但实际上却常常变成了一种浪费时间的活动。作者还提到了其他相关的故事,例如谷歌文档的错误和 create-react-app 的使用问题,说明了软件开发中的各种挑战和问题。


HN 热度 293 points | 评论 275 comments | 作者:jakevoytko | 11 hours ago #

https://news.ycombinator.com/item?id=43994765

  • 一些大学采用“学术季度”制度,即课程实际开始时间比安排时间晚 15 分钟,以便学生有足够的时间到达下一场课。
  • 这种制度可以让学生有缓冲时间,避免因时间紧张而迟到或早退。
  • 在一些国家,课程开始时间会被标记为“c.t.”(cum tempore),表示实际开始时间比安排时间晚 15 分钟。
  • 如果老师在规定时间内未到达,学生可以在 15 分钟后离开。
  • 有些教授会对迟到或缺席的学生进行处罚,例如锁门不让迟到学生进入课堂。
  • 还有一些教授会使用负分制度,鼓励学生对自己的答案负责,并对自己的不确定性有所了解。
  • 有些人认为这种制度可能会对有健康问题或其他特殊情况的学生造成不公平的影响。

Coinbase says hackers bribed staff to steal customer data, demanding $20M ransom #

https://www.cnbc.com/2025/05/15/coinbase-says-hackers-bribed-staff-to-steal-customer-data-and-are-demanding-20-million-ransom.html

Coinbase 公司最近遭遇了一起网络攻击事件,黑客通过贿赂公司的海外支持人员,获得了部分客户的敏感数据。这些数据包括客户的姓名、地址、电话号码、电子邮件地址、银行账号、社会安全号码等。黑客随后向 Coinbase 发送了一封电子邮件,要求支付 2000 万美元的赎金,以换取不公开这些数据。

Coinbase 公司表示,他们已经检测到这一事件,并立即采取了行动,终止了涉案人员的雇佣关系,并告知可能受到影响的客户。公司还加强了其欺诈监控措施,以防止类似事件再次发生。Coinbase 表示,他们不会支付赎金,而是将与执法部门合作,追究黑客的责任。

这起事件可能会对 Coinbase 公司造成重大损失,估计最高可达 4 亿美元。公司的股票在事件发生后也出现了下跌。Coinbase 公司表示,他们将为受到影响的客户提供赔偿,并将建立一个 2000 万美元的奖励基金,用于奖励提供线索、帮助抓捕黑客的个人。

Coinbase 公司是一家主要的加密货币交易平台,最近刚刚宣布了一项收购计划,旨在扩大其全球业务范围。公司的 CEO 布莱恩·阿姆斯特朗(Brian Armstrong)表示,公司的目标是成为世界上最大的金融服务应用程序。在最近的财报电话会议上,阿姆斯特朗表示,公司将继续投资于安全和合规措施,以保护客户的资产和数据。

这起事件凸显了加密货币交易平台面临的安全挑战。黑客通过贿赂内部人员,获得敏感数据,这是网络攻击中常见的手法。Coinbase 公司的反应及时,立即采取了行动,终止了涉案人员的雇佣关系,并加强了其欺诈监控措施。然而,这起事件仍然对公司的声誉和客户的信任产生了影响。


HN 热度 273 points | 评论 311 comments | 作者:gpi | 9 hours ago #

https://news.ycombinator.com/item?id=43996307

  • Coinbase 泄露客户数据,导致客户面临诈骗和安全风险
  • 客户的个人信息、交易记录和政府身份证件图片被泄露,增加了被诈骗和绑架的风险
  • 公司应该实施更严格的数据保护措施,例如 GDPR,以防止数据泄露
  • Coinbase 的安全措施不够,导致客户数据被泄露,公司应该承担责任
  • 客户应该对自己的个人信息和财产安全保持警惕,避免使用不安全的交易平台
  • 美国政府的 KYC 法律导致 Coinbase 必须收集客户的政府身份证件信息,增加了数据泄露的风险
  • 加密货币交易平台的去中心化特性使得客户的财产安全面临更大的风险
  • 客户应该考虑将加密货币转移到更安全的平台或钱包,以保护自己的财产安全
  • 数据泄露事件可能导致客户遭受巨大的经济损失和精神伤害,公司应该提供足够的赔偿和支持
  • 加密货币交易平台应该提高安全措施和透明度,以赢得客户的信任和信心

Grok answers unrelated queries with long paragraphs about “white genocide” #

https://twitter.com/grok/status/1922651218595439063

Grok 的回答与问题无关,总是提到“白人种族灭绝”,但目前这个内容已经看不到了


HN 热度 251 points | 评论 104 comments | 作者:Fraterkes | 1 day ago #

https://news.ycombinator.com/item?id=43987266

  • 这篇帖子被标记是因为有人觉得它让人感到不舒服,并且涉及到了政治问题
  • 有人认为 Hacker News 上的很多用户都同意这种观点,但不想讨论
  • 有人觉得 Grok 的回答与问题无关,总是提到“白人种族灭绝”
  • 有人认为 Hacker News 已经不是一个自由讨论的平台,很多帖子被错误地标记
  • 有人觉得创造一个替代的 Hacker News 平台是必要的,例如 Tildes 或 Mastodon
  • 有人认为 Hacker News 上的用户大多是年轻、富有、聪明的男人,他们容易被某些思想所影响
  • 有人觉得当前的科技界已经被极右思想所影响,例如法西斯主义和种族主义
  • 有人认为 Grok 的回答是被故意操纵的,目的是为了宣扬某些思想
  • 有人觉得 Hacker News 已经失去了原来的自由讨论的精神,变得更加保守和排外

Migrating to Postgres #

https://engineering.usemotion.com/migrating-to-postgres-3c93dff9c65d

Motion 公司早在 2022 年初就开始使用 CockroachDB,这是一种具有水平扩展、 高可用性和 SQL 兼容接口的数据库。然而,随着公司的发展和使用量的增加,CockroachDB 的成本也随之增加,到 2024 年,Motion 的 CockroachDB 账单已经达到六位数。尽管如此,公司并没有要求数据本地化,且仍然在单个区域进行简单的事务性查询,因此不需要支付分布式数据库的费用。

在使用 CockroachDB 的过程中,公司遇到了几个问题。首先,Prisma 的迁移经常超时,导致部署被阻塞数小时。开发人员不得不手动运行迁移,这是一个非常耗时的过程。其次,ETL 任务也经常超时,导致数据同步不完整。最后,查询速度也存在问题,CockroachDB 的查询优化器在某些情况下会导致查询变慢。

为了解决这些问题,公司决定迁移到 Postgres。迁移过程相对较为简单,因为公司使用了 ORM 框架,可以轻松地在不同数据库之间切换。迁移后,公司发现 Postgres 的性能更好,查询速度更快,ETL 任务也变得更加可靠。

在迁移过程中,公司也发现了 CockroachDB 的一些缺陷。例如,CockroachDB 的 UI 会显示未使用的索引,导致开发人员感到困惑。另外,取消运行中的查询也变得非常困难,需要登录到控制台并手动取消查询。最后,CockroachDB 的支持也存在问题,支持门户是一个独立的网站,需要单独的认证。

总的来说,Motion 公司从 CockroachDB 迁移到 Postgres 的过程是一个复杂的过程,需要解决许多技术问题。然而,迁移后,公司发现 Postgres 的性能和可靠性更好,能够更好地支持业务的发展。


HN 热度 224 points | 评论 257 comments | 作者:shenli3514 | 1 day ago #

https://news.ycombinator.com/item?id=43989497

  • 100 万行数据对于现代服务器来说已经不算大了,单节点 Postgres 可以轻松处理。
  • 当表中的行数达到 100 万时,可能需要考虑分片或时间戳归档来优化数据存储。
  • 读写工作负载和行大小会影响 Postgres 的性能,但一般来说,100-200 万行以下的表格可以较好地处理。
  • 使用分片、缓存和读取副本可以大大提高 Postgres 处理大表的能力。
  • 即使是几十亿行的表格,Postgres 也可以通过适当的优化和配置来处理。
  • 单节点 Postgres 可以处理大量数据,但当数据量过大时,需要考虑分布式数据库或其他优化方案。
  • 100 万行以下的表格可以通过优化查询、缓存和索引来提高性能。
  • Postgres 的改进使得即使是中等大小的数据库也可以轻松处理大量数据。
  • 添加默认值到列中不再需要锁定整个表格,Postgres 的改进使得这种操作变得更容易。
  • 大型表格的维护需要考虑数据的增长和未来扩展的需求。

EU ruling: tracking-based advertising […] across Europe has no legal basis #

https://www.iccl.ie/digital-data/eu-ruling-tracking-based-advertising-by-google-microsoft-amazon-x-across-europe-has-no-legal-basis/

欧洲法院做出了一项具有里程碑意义的判决,宣布谷歌、微软、亚马逊等公司使用的基于跟踪的广告系统在欧洲没有法律依据。这一判决是对“透明度和同意框架”(TCF)的挑战,TCF 是这些公司用来获得用户同意进行数据处理的机制。

这一判决的背景是比利时数据保护局于 2022 年做出的决定,该决定发现 TCF 存在多项违反《通用数据保护条例》(GDPR)的行为。比利时法院的判决确认了这些发现,并指出 TCF 未能确保个人数据的安全和保密,也未能正确地请求用户的同意。

TCF 被广泛用于在线广告行业,特别是在实时竞价(RTB)系统中。RTB 系统允许广告商实时竞价广告空间,并使用用户的个人数据来确定广告的相关性。然而,这一系统也存在严重的隐私问题,因为它涉及大量的个人数据传输和处理。

判决认为 TCF 未能提供足够的透明度和控制,允许用户了解他们的数据如何被使用和处理。这一缺乏透明度和控制使得用户难以做出明智的决定关于他们的数据如何被使用。

这一判决对在线广告行业具有重要意义,因为它要求公司重新评估他们的数据处理实践,并找到新的方法来获得用户的同意。同时,这一判决也对用户具有重要意义,因为它有助于保护他们的隐私和数据安全。

判决的具体内容包括,TCF 违反了 GDPR 的多项规定,包括文章 5(1)f、文章 25 和文章 32,未能确保个人数据的安全和保密;文章 5(1)a 和文章 6,未能正确地请求用户的同意;文章 12、13 和 14,未能提供足够的透明度和控制。

这一判决是对在线广告行业的一次重要挑战,要求公司重新评估他们的数据处理实践,并找到新的方法来获得用户的同意。同时,这一判决也对用户具有重要意义,因为它有助于保护他们的隐私和数据安全。


HN 热度 217 points | 评论 161 comments | 作者:mschuster91 | 18 hours ago #

https://news.ycombinator.com/item?id=43992444

  • 公司收集的数据应该像放射性物质一样,尤其是涉及个人隐私信息,应该谨慎对待并及时销毁。
  • 如果一家公司的业务不能在不收集大量用户数据的情况下运营,那么这种业务可能不应该存在。
  • 除非用户得到补偿,否则公司不应该收集和使用用户的数据。
  • 公司在收集数据时应该考虑数据的成本和潜在风险,而不是认为数据是免费或低成本的就随意收集。
  • 法律和监管应该成为限制公司过度收集数据的有效手段。
  • 公司应该在设计系统时考虑隐私问题,遵循“私密性由设计”原则,只在必要时收集和存储个人隐私信息。
  • GDPR 是一个较好的法规,要求公司明确说明收集哪些数据,获得明确的用户同意,并提供数据修改的途径。
  • 公司在违反数据保护规定时应该受到适当的处罚和警告,确保其遵守相关规定。

A Tiny Boltzmann Machine #

https://eoinmurray.info/boltzmann-machine

本文介绍了玻尔兹曼机(Boltzmann Machine)的概念和原理。玻尔兹曼机是一种早期的生成式人工智能模型,于 1980 年代提出,用于无监督学习,即从数据中学习模式而无需明确的目标。它可以生成与训练数据类似的新数据,因此也被称为生成式人工智能。

玻尔兹曼机是一种神经网络,试图通过模拟物理中的能量原理来学习数据中的模式。它由可见层和隐藏层组成,两层之间通过权重连接。可见层的状态可以被观察和设置,而隐藏层的状态则不可见。网络的能量函数定义为可见层和隐藏层状态的函数,目标是最小化能量函数以学习数据中的模式。

文中还介绍了受限玻尔兹曼机(Restricted Boltzmann Machine,RBM),它是玻尔兹曼机的一种特殊形式,限制了可见层和隐藏层之间的连接,使得训练速度更快,理解更容易。受限玻尔兹曼机通过对比散度算法进行训练,包括正相和负相两个阶段,正相阶段从数据中学习模式,负相阶段通过吉布斯采样生成新数据。

此外,文中还提供了一个受限玻尔兹曼机的模拟器,用户可以通过模拟器了解受限玻尔兹曼机的训练过程和生成数据的过程。模拟器包括输入样本、输出重构、能量损失和权重更新等部分,用户可以通过调整参数和观察结果来理解受限玻尔兹曼机的工作原理。

总的来说,本文对玻尔兹曼机和受限玻尔兹曼机进行了详细的介绍,包括其原理、训练过程和应用。同时,提供了一个模拟器帮助用户更好地理解这些概念。


HN 热度 214 points | 评论 39 comments | 作者:anomancer | 11 hours ago #

https://news.ycombinator.com/item?id=43995005

  • 研究在美国被视为浪费,因为它通常不会带来立即的收益,而且当前的领导层认为研究对他们的利益构成威胁。
  • 量子计算机可以通过尝试大量组合的解决方案来找到最佳答案,但这需要大量的硬件资源。
  • 受限玻尔兹曼机(RBM)由于其无向结构,无法像前馈网络一样构建计算图,因此需要使用吉布斯采样来调整权重。
  • 研究的价值常常被忽视,尤其是研究生的贡献,他们往往在后续研究中发挥重要作用。
  • 量子智能可能会彻底改变社会和技术的发展轨迹,如果有一种外星物种拥有先进的量子感知系统和神经系统。
  • 评论者回忆起过去关于受限玻尔兹曼机的研究和实现,分享了相关的视频和资源。

Show HN: Muscle-Mem, a behavior cache for AI agents #

https://github.com/pig-dot-dev/muscle-mem

Muscle Mem 是一个行为缓存系统,用于 AI 代理。它是一个 Python SDK,记录代理的工具调用模式,当任务被重复执行时,会确定性地重放已学习的轨迹,如果检测到边缘情况,则会回退到代理模式。Muscle Mem 的目标是将大型语言模型(LLM)从重复任务的热路径中移除,增加速度,减少变异性,并消除令牌成本。

Muscle Mem 不是另一个代理框架。您可以按照自己的方式实现代理,然后将其插入 Muscle Mem 的引擎。当给定一个任务时,引擎将确定环境是否被以前看到过(缓存命中)或是新的(缓存未命中)。如果是缓存命中,引擎将使用检索到的轨迹执行任务;如果是缓存未命中,引擎将任务传递给代理。引擎还会收集工具调用事件以添加到缓存中作为新的轨迹。

Muscle Mem 的关键部分是缓存验证。要将安全的工具重用添加到代理中,需要问自己:对于代理执行的每个工具,环境中的哪些特征可以用来指示是否安全执行该操作?如果可以回答这个问题,代理就可以具有肌肉记忆。

Muscle Mem 提供了一个 API,包括引擎、工具和检查。引擎是代理的主要执行者,管理自己的缓存并确定何时调用代理。工具是代理执行的操作,可以使用 @engine.tool 装饰器来记录工具调用。检查是缓存验证的基本构建块,用于确定是否安全执行给定的操作。

Muscle Mem 的工作原理是,当代理执行一个任务时,引擎会检查缓存中是否有与该任务相关的轨迹。如果有,引擎将使用该轨迹执行任务;如果没有,引擎将任务传递给代理。代理执行任务后,引擎会将工具调用事件添加到缓存中作为新的轨迹。

Muscle Mem 的优势在于它可以增加代理的执行速度,减少变异性,并消除令牌成本。它还提供了一个简单的 API,允许开发者轻松地将 Muscle Mem 集成到自己的代理中。Muscle Mem 的未来发展方向包括改进缓存验证机制,增加对更多类型任务的支持,并优化性能。


HN 热度 209 points | 评论 50 comments | 作者:edunteman | 1 day ago #

https://news.ycombinator.com/item?id=43988381

  • 记忆和上下文是人工智能发展的瓶颈,需要一个通用的解决方案来解决这个问题
  • Muscle-Mem 项目的目标是将大语言模型从重复的自动化任务中解放出来,通过智能地在脚本执行和代理执行之间切换
  • 使用嵌入式方法来验证缓存可能不够可靠,需要考虑其他方法来解决这个问题
  • 参数化和比较过滤器的堆栈是 Muscle-Mem 项目中尚未解决的问题
  • 环境特征的变化可能会影响缓存的有效性,需要找到方法来存储和管理这些变化
  • 代理之间的市场可能是一个解决方案,代理可以发布和消费彼此的记忆和工具序列
  • 创建有意义的上下文概念是解决这个问题的关键,可能需要使用丰富的文本描述来解决这个问题
  • Muscle-Mem 项目的目标是减少重复任务的摩擦,通过提供一个更强大的代理提示系统来实现自动化

2025 05 15 HackerNews

2025-05-15 08:24:13

2025-05-15 Hacker News Top Stories #

一、Google DeepMind推出AlphaEvolve,基于Gemini模型优化矩阵乘法效率,应用于数据中心和芯片设计。
二、HDR技术通过多张照片合成提升动态范围,Halide相机推出单拍HDR功能模拟传统胶片曝光。
三、上海推出定制巴士系统,乘客在线提案线路并动态匹配运力,提升公交效率。
四、学习Rust需掌握所有权和生命周期等核心概念,通过实践和编译器反馈逐步提升。
五、Cheney算法通过半空间内存分块复制存活对象实现高效垃圾回收。
六、Nextcloud Android应用因Google安全限制丢失文件上传功能,团队呼吁用户支持并探索替代方案。
七、SMS 2FA因信号问题对山区用户不友好,文章呼吁采用TOTP等替代方案。
八、加拿大银行依赖不安全的短信2FA导致用户被锁,需采用通行密钥等现代方案。
九、Databricks收购Neon,推出无服务器Postgres服务填补操作数据库空白。
十、类型约束解码方法结合类型系统提升代码生成正确性,减少编译错误。

AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms #

https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/

Google DeepMind 的使命是负责任地构建人工智能,以造福人类。他们致力于让人工智能能够惠及世界,因此他们必须谨慎地思考如何构建和使用人工智能。DeepMind 的研究重点是解决一些最复杂和最有趣的人工智能挑战。他们的突破包括开发出最先进的人工智能模型,如 Gemini 和 Gemma,以及最高质量的文本到图像模型 Imagen 和音乐生成模型 Lyria。

DeepMind 的技术包括 Gemini、Gemma、Imagen、Lyria 和 Veo 等。Gemini 是他们最先进的人工智能模型,Gemma 是一系列轻量级、最先进的开源模型。Imagen 是他们最高质量的文本到图像模型,Lyria 是他们最新的音乐生成模型,Veo 是他们最先进的视频生成模型。这些技术被应用于解决世界上最复杂的挑战。

DeepMind 的研究团队致力于开发出能够解决复杂问题的人工智能模型。他们的最新研究成果包括 AlphaEvolve,一种由大型语言模型驱动的编码代理,用于设计先进算法。AlphaEvolve 将大型语言模型的创造性问题解决能力与自动评估器相结合,使用进化框架来改进最有前途的想法。这种方法使得 AlphaEvolve 能够发展出更高效的算法,并帮助设计出更快的矩阵乘法算法。

AlphaEvolve 的工作原理是通过一个提示采样器首先组装一个提示,然后由大型语言模型生成新的程序。这些程序由自动评估器评估和存储在程序数据库中。这个数据库实现了一个进化算法,决定哪些程序将被用于未来的提示。这种方法使得 AlphaEvolve 能够持续改进和优化算法。

DeepMind 的技术已经被应用于解决实际问题。例如,AlphaEvolve 已经被用于优化 Google 的数据中心、芯片设计和人工智能训练过程。它还帮助设计出更快的矩阵乘法算法,并找到新的解决方案来解决开放的数学问题。这些应用表明了 AlphaEvolve 在许多领域的潜在应用价值。

总的来说,Google DeepMind 致力于开发出能够解决复杂问题的人工智能模型,并将这些技术应用于实际问题。他们的研究和技术已经取得了显著的进展,并有望在未来继续推动人工智能的发展。


HN 热度 625 points | 评论 168 comments | 作者:Fysi | 9 hours ago #

https://news.ycombinator.com/item?id=43985489

  • AlphaEvolve 算法实现了 4x4 矩阵乘法的 48 次乘法,之前已知的最优算法需要 49 次乘法。
  • Strassen 算法是一种分治算法,而不是动态规划算法。
  • AlphaEvolve 算法使用复数值矩阵,可以实现 48 次乘法,而之前的算法需要 49 次乘法。
  • AlphaEvolve 算法在 75% 的情况下重现了最优解,在 20% 的情况下改进了最优解。
  • AlphaEvolve 算法的性能提升可能来自于优化了 GPU 缓存和块大小。
  • 语言模型可以用于自动优化代码,实现调试和优化循环。
  • AlphaEvolve 算法的性能取决于其背后的语言模型的质量。

What is HDR, anyway? #

https://www.lux.camera/what-is-hdr/

这个网页是一篇关于 HDR(高动态范围)技术的文章,作者解释了 HDR 的概念、历史和应用。HDR 是一种可以捕捉和显示更广泛的亮度和颜色的技术,作者指出,HDR 可以分为两种:一种是相机中的 HDR 模式,另一种是新型屏幕上的 HDR 显示。

作者首先解释了动态范围的概念,指出动态范围是指场景中最亮和最暗的部分之间的差异。作者举例说明,传统相机很难捕捉到太阳和阴影同时存在的场景,因为相机无法同时处理太亮和太暗的光线。作者指出,HDR 技术可以解决这个问题,通过捕捉多张不同曝光度的照片,然后合并成一张图像。

作者接着讨论了 HDR 的历史,指出 HDR 技术在 1990 年代就已经被提出,但当时的计算机屏幕无法显示 HDR 图像。作者指出,随着技术的进步,HDR 技术被应用于相机和屏幕上,苹果和谷歌也在他们的相机应用中加入了 HDR 功能。

然而,作者也指出,HDR 技术并不是完美的,尤其是在自动调节曝光度和色彩平衡时,可能会出现错误。作者举例说明,苹果的 Smart HDR 和 Deep Fusion 功能虽然可以自动调节曝光度和色彩平衡,但有时也会出现错误,例如边缘处的光线不均匀。

为了解决这个问题,作者介绍了他们的相机应用 Halide 中的一个新功能,称为 Process Zero,这是一个完全不使用人工智能的相机模式。作者指出,这个模式可以让用户完全控制曝光度和色彩平衡,但也可能会出现过曝或欠曝的问题。为了解决这个问题,作者又介绍了他们的另一个功能,称为单拍 HDR,这个功能可以在单张照片中捕捉到 HDR 效果。

作者最后指出,单拍 HDR 的技术是从传统胶片摄影中学习来的,传统胶片摄影可以通过多步骤的曝光和调节来捕捉到 HDR 效果。作者指出,他们的单拍 HDR 功能可以在单张照片中实现类似的效果,用户可以通过调整参数来控制曝光度和色彩平衡。


HN 热度 487 points | 评论 243 comments | 作者:_kush | 11 hours ago #

https://news.ycombinator.com/item?id=43983871

  • HDR 技术并不能完全模拟人类的视觉体验,尤其是在处理高对比度场景时。
  • HDR 捕捉、HDR 格式和 HDR 显示是三个不同的概念,应该区分对待。
  • Ansel Adams 的摄影技术与现代的 HDR 技术是不同的,他的作品通过精心控制曝光来实现最佳效果。
  • 所有的媒体都有其自身的动态范围,HDR 技术只是一个尝试使其更接近人类视觉体验的方法。
  • 绝对亮度的概念在实际应用中受到环境的影响,需要考虑到观看环境的因素。
  • 音频和视频的动态范围都需要考虑到实际的观看环境和设备的限制。

Bus stops here: Shanghai lets riders design their own routes #

https://www.sixthtone.com/news/1017072

上海推出了一种新的公共交通系统,称为“定制巴士”(DZ),允许乘客通过在线平台提出、投票和激活新的巴士线路。这种系统可以在短短三天内启动新的线路,只要有足够的乘客需求。目前,已经有超过 220 条 DZ 线路在上海的 16 个区启动。

该系统允许乘客通过在线平台提交提案,其他有类似旅行需求的人可以选择加入或投票。如果需求达到一定的阈值(通常为 15 到 20 名乘客每次),该线路就会启动。乘客可以通过平台输入起点和终点、偏好时间和行程频率,如果被批准,线路可以在短短三天内开始运行。

其中一个试点线路 DZ301 连接了一座主要的地铁站和周围的住宅区、学校和办公楼。该线路每天平均有 250 到 260 名乘客,早晚高峰时段分别有 170 到 180 名和 70 到 80 名乘客。该线路起源于去年 12 月的一位居民的请求,交通工作人员进行了现场研究,观察了行人流量,和乘客交谈,计算了高峰时段的换乘时间。驾驶员然后进行了试运行,以优化时间表,然后正式启动了该线路。

上海交通大学的教授陈晓红表示,该系统建立在上海密集的交通网络之上,以更好地匹配容量和需求,提高了便利性和资源利用率。提出的线路会出现在“热门定制”页面上,其他人可以选择加入以帮助达到启动阈值。团体预订也可以加快审批速度。票价是基于市场的,虽然遵循基本的公共交通标准,但目前没有为学生、老人或其他群体提供折扣。

上海市客运管理部门的副主任王义祥表示,新的平台缩短了启动新线路的时间,但也承认了早期的挑战:乘客需求不均匀,公众意识仍然较低,规划仍然依赖于手动的现场工作。他表示,未来需要改进路线规划,升级平台功能,提高可见度。


HN 热度 442 points | 评论 312 comments | 作者:anigbrowl | 20 hours ago #

https://news.ycombinator.com/item?id=43980845

  • 动态公交系统是一个好主意,能够根据需求自我优化,提高效率
  • 动态公交系统可能会让没有智能手机的人感到不便,尤其是青少年和老年人
  • 现有的公交系统虽然简单,但具有可预测性和可靠性,不需要协调和规划
  • 动态公交系统可能会出现技术问题,例如手机没电、信号不佳等
  • 动态公交系统可能会让一些人感到不公平,例如没有智能手机的人或不愿使用智能手机的人
  • 动态公交系统可能会提高公交效率,但也可能会让一些人感到不适应
  • 动态公交系统需要考虑到所有人的需求,包括没有智能手机的人和残疾人
  • 动态公交系统可能会让公交系统更加依赖于技术,出现技术问题时可能会造成不便
  • 动态公交系统可能会提高公交的可达性和便利性,但也需要考虑到所有人的需求和权利

Flattening Rust’s learning curve #

https://corrode.dev/blog/flattening-rusts-learning-curve/

本文讨论了如何更好地学习 Rust 编程语言。作者认为,学习 Rust 需要采取完全不同的思维模式,需要了解诸如生命周期、所有权和特征系统等新概念。作者强调,学习 Rust 的速度与个人的智力或编程经验没有太大关系,而是取决于个人的态度和学习方法。

作者建议,学习 Rust 时应该放下自己的成见,接受编译器的提示和指导。编译器会告诉你代码中哪里有问题,你应该根据编译器的提示来修改代码。同时,作者也建议,学习 Rust 时应该从简单的代码开始,逐步增加复杂度。不要试图一下子学太多东西,而应该专注于一个概念,写出简单的代码来理解它。

作者还强调了准确性和细节的重要性。Rust 是一种非常注重细节的语言,代码中的小错误可能会导致编译失败。因此,学习 Rust 时应该养成细致的习惯,写代码时应该注意每一个细节。同时,作者也建议,学习 Rust 时应该多写代码,多练习,这样才能更好地理解语言的特点和语法。

此外,作者还建议,学习 Rust 时应该避免依赖自动完成和代码生成工具。这些工具可能会让你感觉更舒服,但实际上会阻碍你的学习过程。作者建议,学习 Rust 时应该手写代码,自己去理解和解决问题,这样才能更好地掌握语言。同时,作者也建议,学习 Rust 时应该多看标准库的文档,多了解语言的特点和语法。

总的来说,本文提供了许多有用的建议和经验,帮助学习者更好地学习 Rust 编程语言。作者强调了细致、准确和实践的重要性,建议学习者应该放下成见,多写代码,多练习,才能更好地掌握 Rust 语言。


HN 热度 418 points | 评论 353 comments | 作者:birdculture | 1 day ago #

https://news.ycombinator.com/item?id=43978435

  • Rust 的所有权系统让人难以理解,需要一个清晰的解释模型。
  • 所有权的核心概念包括每个数据对象只有一个所有者,所有权可以转移,多个所有者需要使用引用计数,引用可以被传递但不能超过对象的生命周期。
  • 栈帧不是所有权的所有者,所有权存在于语言层面,而不是机器层面。
  • 可变引用只能被传递一次,以防止悬垂指针。
  • 所有权转移可以用于性能优化和避免不必要的数据复制。
  • Rust 的所有权系统可以让开发者明确地控制数据的生命周期和访问权限。
  • 传递所有权可以用于实现某些操作只能执行一次,例如删除文件。
  • Rust 的所有权系统可以帮助开发者避免常见的编程错误,例如悬垂指针和数据竞争。

Writing that changed how I think about programming languages #

https://bernsteinbear.com/blog/pl-writing/

本文是一篇博客文章,作者分享了自己在编程语言和编译器领域中阅读过的几篇对自己影响深远的文章和博客。这些文章和博客都与编程语言和编译器相关,涵盖了垃圾回收、优化器、正则表达式、机器学习等多个主题。

作者首先提到了 Andy Wingo 的一篇关于简单半空间垃圾回收器的文章,这篇文章让作者理解了 Cheney/copying/compacting 垃圾回收器的概念。然后,作者提到了 CF Bolz-Tereick 的一系列关于优化器的文章,这些文章让作者了解了如何使用指令重写和抽象域来优化代码。

作者还提到了 Russ Cox 的一篇关于正则表达式的文章,这篇文章让作者理解了正则表达式引擎的工作原理。另外,作者提到了 Andrej Karpathy 的一篇关于微型神经网络的文章,这篇文章让作者了解了机器学习的基本概念。

在编译器领域,作者提到了 Fil Pizlo 的一篇关于 SSA 形式的文章,这篇文章让作者了解了如何使用 union-find 来优化代码。作者还提到了 Chandler Carruth 的一篇关于 Carbon 编译器的文章,这篇文章让作者了解了编译器的设计原理。

最后,作者提到了几篇关于解析器、代码生成和优化器的文章,这些文章让作者了解了这些领域的最新进展。总的来说,这篇博客文章分享了作者在编程语言和编译器领域中阅读过的几篇有价值的文章和博客,涵盖了多个主题和领域。


HN 热度 384 points | 评论 48 comments | 作者:r4um | 20 hours ago #

https://news.ycombinator.com/item?id=43980760

  • 静态类型可以让你构建非常大的严格结构,但这种结构会阻碍快速开发。
  • 动态类型可以让你快速迭代和构建原型,但不适合代码成熟、变化较少、需要部署到生产环境的场景。
  • 理想情况下,代码中应该同时具备静态类型和动态类型的特点,分别适用于不同的开发阶段和场景。
  • 静态类型和动态类型的选择与语言的编译和解释实现细节有关,而不是语法本身的特点。
  • 静态类型可以保证代码的可靠性和安全性,但也可能导致开发速度变慢。
  • 动态类型可以提高开发速度,但可能会导致代码的可靠性和安全性降低。
  • 语言的设计应该根据实际需求和场景选择合适的类型系统,而不是一味地追求静态类型或动态类型。
  • 高效的语言和构建系统可以减少静态类型带来的开发速度影响。

The recently lost file upload feature in the Nextcloud app for Android #

https://nextcloud.com/blog/nextcloud-android-file-upload-issue-google/

Nextcloud 是一款云存储和协作平台,最近其 Android 应用的文件上传功能出现了问题。用户无法上传除照片和视频以外的所有文件。Nextcloud 团队表示,他们已经意识到这个问题,并试图与 Google 沟通以解决这个问题。然而,Google 拒绝恢复 Nextcloud 应用的文件上传权限,理由是安全问题。

Nextcloud 团队认为,Google 的行为是出于自身利益,试图限制竞争对手的功能。Nextcloud 应用已经存在多年,之前从未出现过安全问题。Google 自己的应用和其他大型科技公司的应用仍然拥有文件上传权限,这让 Nextcloud 团队感到不公平。Nextcloud 团队已经向 Google 提出多次申诉,但都被拒绝了。

这个问题不仅影响了 Nextcloud 的用户,也反映了大型科技公司对小型竞争对手的不公平待遇。Nextcloud 团队认为,Google 的行为是试图限制竞争对手的功能,维护自身的市场地位。这个问题也引发了人们对大型科技公司滥用权力的担忧。

Nextcloud 团队已经发布了新的应用版本,限制了文件上传功能,以便通过 Google Play Store 的审核。然而,这个问题仍然存在,Nextcloud 团队呼吁用户支持他们,反对 Google 的不公平行为。同时,Nextcloud 团队也在寻找其他解决方案,例如使用替代应用商店,如 F-Droid。


HN 热度 365 points | 评论 134 comments | 作者:morsch | 19 hours ago #

https://news.ycombinator.com/item?id=43981170

  • Google 的 “最小权限” 话术听起来很高尚,但实际上却让大型科技公司的第一方应用获得特权,而独立开发者却被迫发布功能不全的产品。
  • 用户应该有权决定哪些应用可以访问他们的文件,而不是由 Google 或其他公司决定。
  • iOS 的文件访问机制比 Android 更加用户友好,允许应用程序通过 File Provider API 访问文件。
  • Android 的 SAF API 允许应用程序访问文件,但有一些限制,例如不支持原生代码。
  • 云应用程序在 iOS 上面临困难,因为 Apple 的 API 只允许 iCloud 等少数应用程序在后台进行文件传输。
  • 用户不应该被视为不可信任的实体,而应该被允许对自己的设备和文件有完全的控制权。
  • 浏览器也正在朝着更加限制用户访问硬件的方向发展,这是一个令人担忧的趋势。
  • 用户可以选择使用其他云存储服务或操作系统来避免这些限制。
  • Android 和 iOS 之间的权衡是自由与安全,两者都有其优缺点。

SMS 2FA is not just insecure, it’s also hostile to mountain people #

https://blog.stillgreenmoss.net/sms-2fa-is-not-just-insecure-its-also-hostile-to-mountain-people

这篇文章讲述了作者的一位朋友,住在北卡罗来纳州西部山区的一位老太太,遇到的问题。她加入了一个当地社区的 Signal 群聊,需要使用智能手机,但由于手机信号不好,无法接收到网站发送的 SMS 验证码,导致她无法登录自己的账户。作者指出,SMS 验证码的安全性存疑,而且在山区的手机信号覆盖不佳的情况下,使用 SMS 验证码进行二次验证是非常不友好的。

作者的朋友尝试了各种解决方案,包括开启 Wi-Fi 呼叫,但仍然无法接收到 SMS 验证码。作者发现,部分 ISP 提供的陆地线服务支持接收 SMS 消息,但 Spectrum(作者朋友的 ISP)不提供此服务。一些账户可以转换为使用 TOTP(时间基于的一次性密码)二次验证,但需要先登录账户才能进行设置。

作者批评了 SMS 验证码的普遍使用,认为它对山区居民来说是非常不友好的。作者指出,山区有 110 万人,整个阿巴拉契亚地区有 2500 万人,山西和太平洋沿岸也有许多人,他们都面临着类似的手机信号覆盖不佳的问题。作者呼吁网站和服务提供商考虑到这些用户的需求,提供更好的二次验证解决方案。


HN 热度 347 points | 评论 263 comments | 作者:todsacerdoti | 11 hours ago #

https://news.ycombinator.com/item?id=43984297

  • SMS 2FA 不安全,且对山区人群不友好
  • 使用 VoIP 服务可以接收短信,但有些公司出于安全原因不支持
  • SMS over IMS 的实现不透明,导致有些短信无法接收
  • SMS OTP 系统会验证号码的可达性,导致有些号码无法接收验证码
  • 欧盟的 PSD2 指令允许使用 SMS 作为 2FA,但要求进行 KYC 验证
  • 匿名 SIM 卡在欧盟的一些国家仍然可用
  • SMS 2FA 不是真正的安全解决方案,仅仅是安全剧场
  • SIM 卡克隆犯罪可能使 SMS 2FA 变得不安全
  • 使用其他 2FA 方法,如应用程序或电话验证,可能更安全 -有些公司只支持 SMS 2FA,但不支持其他方法
  • Google Voice 号码可能无法用于 SMS 2FA,除非绑定到 Google Fi
  • 使用 WiFi 呼叫可能可以接收短信,但有些公司不支持

Why are banks still getting authentication so wrong? #

https://jamal.haba.sh/its-2025-why-are-banks-still-getting-authentication-so-wrong/

这篇文章讨论了加拿大银行在身份验证方面仍然存在的问题。作者提到,在 2025 年,许多加拿大银行仍然使用基于短信的双因素身份验证(2FA),尽管这种方法已经被证明是不安全的。作者分享了自己在美国旅行时被锁出 TD 个人银行账户的经历,因为 TD 银行依赖于基于短信的 2FA,而作者已经禁用了加拿大 SIM 卡以避免漫游费用。

作者指出,TD 银行的身份验证系统设计存在缺陷,导致用户无法访问自己的账户,即使他们拥有正确的凭据和身份验证应用程序。这种情况是安全性惩罚用户而不是保护用户的典型例子。作者认为,TD 银行不支持 TOTP(时间 기반 一次性密码)或通行密钥(passkeys),而是使用自己的专有身份验证应用程序,这是一个安全性和可用性方面的重大缺陷。

文章还讨论了基于短信的 2FA 的安全风险,包括拦截 2FA 代码、SIM 卡交换和钓鱼攻击。作者引用了加拿大网络安全中心的建议,即仅将短信代码作为低风险登录的身份验证因素。作者认为,银行账户不应被视为低风险,并且基于短信的 2FA 不应作为默认或唯一的 2FA 选项。

作者建议,现代身份验证流程应基于强大的、用户友好的、标准化的机制,例如通行密钥、TOTP 支持、硬件安全密钥和安全恢复路径。作者强调,安全性和可用性并不相互排斥,系统设计应考虑用户体验。文章最后指出,TD 银行并不是唯一一个存在身份验证问题的银行,许多加拿大金融机构仍然使用过时的身份验证流程,需要进行彻底的改革。


HN 热度 272 points | 评论 362 comments | 作者:kamikazee | 1 day ago #

https://news.ycombinator.com/item?id=43976359

  • 银行在身份验证方面仍然存在很多问题,例如要求客户在电话中提供个人信息。
  • 一些银行的验证流程存在漏洞,例如发送短信验证码到任意电话号码,而不验证该号码是否属于客户。
  • 部分银行的安全培训公司会发送钓鱼邮件,教导客户如何识别钓鱼邮件,但实际上这些邮件本身就是钓鱼邮件。
  • 客户在接到银行电话时,无法确保对方的身份,需要通过其他方式验证。
  • 客户可以通过主动联系银行的官方电话或网站来验证身份和问题。
  • 一些客户认为,银行应该改进其验证流程和安全措施,以防止钓鱼和身份盗窃。

Databricks and Neon #

https://www.databricks.com/blog/databricks-neon

Databricks 公司宣布将收购 Neon,一家开发者优先的无服务器 Postgres 公司。Neon 的团队设计了一种新的数据库架构,提供速度、弹性伸缩和分支和分叉等功能,这些功能不仅适用于开发者,也适用于 AI 代理。

Neon 的创始人们四年前聚集在一起,旨在颠覆数据库行业。他们观察到数据库技术的基础大多是为 90 年代设计的,于是他们的目标是建立一个新的数据库平台,以根本性地改善开发者的体验。他们希望创建一个可以在几秒钟内创建新的 Postgres 实例的平台,简化数据库的操作和伸缩,并支持数据库的快速实验和测试。

Neon 的团队设计了一种新的数据库架构,解耦了存储和计算的伸缩,这使得他们的目标成为可能。当 Neon 首次推出时,开发者们对其速度、简单性和数据库分支和分叉的能力赞不绝口。然而,随着 Neon 的发展,他们注意到一个有趣的统计数据:30% 的数据库是由 AI 代理创建的,而不是人类。最近,这个数字已经上升到 80%。

Neon 的创始人们认为,AI 代理就像一支由高速度的初级开发者组成的团队,他们需要快速地创建和操作数据库。Neon 的功能,如 Postgres 开源生态系统、速度、弹性伸缩和分支和分叉,对于 AI 代理来说是非常重要的。Databricks 公司将与 Neon 的团队合作,提供一个开放的、无服务器的数据库基础设施,适用于开发者和 AI 代理。

Neon 的创始人 Nikita Shamgunov、Heikki Linnakangas 和 Stas Kelvich 都是数据库行业的专家。Nikita 曾经是 SingleStore 的联合创始人和 CEO,而 Heikki 则是 Postgres 的长期贡献者。他们的团队将加入 Databricks 公司,共同提供无服务器 Postgres 服务。Databricks 公司认为,这次收购将有助于他们提供更好的服务,适用于开发者和 AI 代理。


HN 热度 259 points | 评论 181 comments | 作者:davidgomes | 14 hours ago #

https://news.ycombinator.com/item?id=43982777

  • 数据仓库正在通过开源软件迅速成为一种商品。
  • 企业通常不允许使用开源软件或可能在十年内不再存在的公司的软件。
  • 企业更愿意选择全方位的数据平台,而不是简单的数据仓库。
  • 有些公司通过使用开源软件如 Iceberg、Trino 和 Superset,节省了大量成本。
  • Databricks 的定价可能会因其高估值而变得不具有竞争力。
  • Neon 填补了 Databricks 在操作性数据库方面的空白。
  • 企业通常更愿意选择商业软件,因为它们提供了更好的支持和稳定性。
  • 开源软件在大规模部署中可能存在性能和可扩展性问题。
  • 有些公司正在开发自己的开源数据仓库解决方案,以替代商业软件。
  • MinIO 作为开源的对象存储解决方案存在一些局限性和问题。

Type-constrained code generation with language models #

https://arxiv.org/abs/2504.09246

该网页是一个关于计算机科学领域的文章,具体来说是关于机器学习和编程语言的研究。文章的标题是“类型约束代码生成与语言模型”,由 Niels Mündler、Jingxuan He、Hao Wang、Koushik Sen、Dawn Song 和 Martin Vechev 等作者撰写。

文章介绍了大型语言模型(LLM)在代码生成方面的成功,但也指出这些模型经常产生不能编译的输出,因为它们的下一个令牌推断过程没有考虑代码的正式方面。为了解决这个问题,作者提出了一个类型约束解码方法,该方法利用类型系统来指导代码生成。这种方法通过开发新的前缀自动机和搜索可居住类型来实现,从而确保 LLM 生成的代码是类型正确的。

文章还提到,这种方法已经在一个基础的简单类型语言上进行了形式化,并扩展到了 TypeScript 中,以展示其在实践中的可行性。实验结果表明,这种方法可以减少编译错误,提高代码合成、翻译和修复任务的功能正确性,适用于不同大小和模型家族的 LLM,包括具有超过 30 亿参数的最先进的开源模型。

此外,文章还提供了相关的参考文献、DOI 链接和其他资源,方便读者进一步了解和研究该主题。文章的内容对于计算机科学领域,特别是机器学习和编程语言的研究人员来说具有重要的参考价值。


HN 热度 250 points | 评论 118 comments | 作者:tough | 1 day ago #

https://news.ycombinator.com/item?id=43978357

  • 认为专注于一种编程语言的 LLM 可能会比通用 LLM 更好
  • 认为 LLM 的泛化能力可能不足以应对不同编程语言和库的差异
  • 认为使用双系统模型,结合大型 LLM 和专用 LLM,可以获得更好的代码生成效果
  • 认为大型 LLM 的训练数据和泛化能力可能会对小型 LLM 产生影响
  • 认为开发者对多种编程语言的了解可以提高其在特定语言上的编程技能
  • 认为 LLM 的代码生成能力不仅取决于语言本身,还取决于库和框架的使用
  • 认为使用专用 LLM 可以解决大型 LLM 在代码生成中的上下文窗口大小问题
  • 认为大型公司目前更注重大型 LLM 的开发,而不是小型 LLM 的专用化

2025 05 14 HackerNews

2025-05-14 07:43:02

2025-05-14 Hacker News Top Stories #

  1. Mozilla Firefox代码迁移到GitHub引发开发者对数据安全和自主权的担忧。
  2. 软件优化常被市场优先级牺牲,导致质量低下与用户体验下降。
  3. macOS权限弹窗存在伪造漏洞(CVE-2025-31250),用户需警惕恶意权限请求。
  4. FastVLM通过高效视觉编码实现比LLaVA快85倍的图像处理速度。
  5. GNU Screen 5.0.0存在本地提权漏洞(CVE-2025-23395),建议禁用setuid-root权限。
  6. Intel处理器分支特权注入漏洞(BPI)可绕过硬件防护,需更新BIOS和微码。
  7. 高压工作环境中维护人际关系比追求短期目标更有利于职业发展。
  8. Nextcloud指控Google Play Store限制其应用权限,涉嫌反竞争行为。
  9. 国家科学基金会前官员批评政治干预破坏学术机构独立性与科研自由。
  10. PDF文本提取因格式特性面临技术挑战,需结合统计与机器学习方法优化。

Mozilla Firefox – Official GitHub repo #

https://github.com/mozilla-firefox/firefox

这是 Mozilla Firefox 浏览器的官方仓库。页面内容包括项目的描述、代码仓库、提交历史、问题跟踪等信息。

项目描述部分介绍了 Mozilla Firefox 浏览器的功能和特点,包括其快速、安全和隐私保护等方面的优势。同时,也提到了该项目的开源性质,欢迎开发者参与贡献。

代码仓库部分展示了项目的代码结构,包括各种文件夹和文件,例如 browser、devtools、docs 等。每个文件夹和文件都有相应的描述和提交历史,可以方便地查看代码的变化和更新。

提交历史部分记录了项目的所有提交记录,包括每次提交的描述、作者和时间等信息。可以通过提交历史来跟踪项目的发展和更新。

问题跟踪部分用于记录和跟踪项目中的问题和 bug,包括问题的描述、状态和解决方案等信息。开发者可以通过这个部分来报告和解决问题,确保项目的质量和稳定性。

此外,页面还包括其他一些信息,例如项目的 license、贡献者列表、相关链接等。这些信息可以帮助开发者更好地理解和参与项目。总的来说,这个网页提供了一个全面和详细的项目概览,方便开发者了解和参与 Mozilla Firefox 浏览器的开发。


HN 热度 774 points | 评论 421 comments | 作者:thefilmore | 18 hours ago #

https://news.ycombinator.com/item?id=43969827

  • Mozilla 将 Firefox 代码从 Mercurial 迁移到 GitHub,这可能会让一些开发者感到不便
  • 使用 GitHub 作为代码仓库可能会让 Microsoft 获取更多的代码数据和控制权
  • 由于 Git 的去中心化特性,开发者可以在任何地方托管代码,避免对 GitHub 的依赖
  • GitHub 的限制,例如不支持 IPv6 和对某些国家的访问限制,可能会影响开发者的体验
  • 使用 Phabricator 进行代码审查和提交补丁,不需要 GitHub 账号
  • 有些开发者因为 GitHub 的政策而被封号或受到限制,例如要求提供电话号码
  • 将代码托管在 GitHub 上可能会让开发者失去对代码的控制权和自主权
  • 有些开发者认为,使用 GitHub 只是为了方便,实际上可以使用其他代码仓库,如 Codeberg
  • Mozilla 的决定可能会让开发者感到担忧,因为 GitHub 是一个商业平台,可能会优先考虑自己的利益而不是开源社区的利益

The world could run on older hardware if software optimization was a priority #

https://twitter.com/ID_AA_Carmack/status/1922100771392520710

John Carmack 的一条帖子和对另一位用户 LaurieWired 的回复。John Carmack 的帖子讨论了软件优化的重要性,如果软件优化成为首要任务,许多世界上的系统都可以运行在过时的硬件上。他还提到了如果没有廉价且可扩展的计算能力,新的创新产品将变得罕见。

LaurieWired 的原始帖子探讨了一个有趣的思维实验:如果人类忘记了如何制造 CPU 会怎样?她假设有一天,称为“零带出日”(Z-Day),再也没有新的硅设计被制造出来。在这种情况下,现有的高级核心设计将面临很大的挑战。假设我们保留现有的供应,LaurieWired 分析了这种情况可能如何展开。


HN 热度 543 points | 评论 528 comments | 作者:turrini | 13 hours ago #

https://news.ycombinator.com/item?id=43971464

  • 软件优化并不是市场的优先考虑,导致软件质量普遍较低
  • 市场对软件质量的认识存在信息不对称,买家难以区分高质量和低质量软件
  • 企业为了降低成本和提高竞争力,往往会牺牲软件质量
  • 市场上的软件大多是由初级开发人员编写,质量难以保证
  • 软件质量并不是决定销售的关键因素,市场营销和广告投入在销售中起着更重要的作用
  • 企业应该根据产品特点和目标市场,合理分配资源于软件质量和市场营销
  • 高质量的软件可以带来口碑效应和忠实用户,但这需要企业长期投入和坚持
  • 企业在追求增长和利润的同时,容易忽视软件质量和用户体验,导致产品质量下降
  • 软件质量和市场营销是企业成功的两个重要因素,需要企业合理平衡和分配资源

Can you trust that permission pop-up on macOS? #

https://wts.dev/posts/tcc-who/

本文讨论了一个与 macOS 系统相关的安全漏洞,编号为 CVE-2025-31250。这个漏洞允许任何应用程序 A 弹出一个权限请求提示,伪装成来自应用程序 B,并将用户的响应应用于应用程序 C。这种漏洞使得攻击者可以欺骗用户授予不必要的权限。

文中提到,这个漏洞是在 macOS Sequoia 15.5 版本中被修复的,但是作者进行了测试,发现 macOS Ventura 13.7.6 和 macOS Sonoma 14.7.6 版本仍然存在这个漏洞。作者表示,这个漏洞是由于 TCC(Transparency, Consent and Control)框架的缺陷引起的,TCC 是 macOS 中用于管理应用程序权限的系统。

TCC 框架使用 XPC(Cross-Process Communication)消息来与应用程序进行通信,但是这个框架存在一个缺陷,允许应用程序发送特制的 XPC 消息来欺骗 TCC 显示错误的权限请求提示。这个漏洞可以被利用来欺骗用户授予不必要的权限,例如允许应用程序访问敏感数据或执行未经授权的操作。

文中还提到,Apple Events 是 macOS 中用于进程间通信的机制,TCC 框架使用 Apple Events 来管理应用程序权限。然而,Apple Events 也存在安全风险,攻击者可以使用 Apple Events 来执行未经授权的操作。作者表示,TCC 框架的缺陷和 Apple Events 的安全风险使得 macOS 系统存在安全隐患,用户需要注意这些风险并采取措施保护自己的系统。

总的来说,本文讨论了 macOS 中的一个安全漏洞,提醒用户注意 TCC 框架和 Apple Events 的安全风险,并呼吁用户采取措施保护自己的系统。


HN 热度 361 points | 评论 240 comments | 作者:nmgycombinator | 1 day ago #

https://news.ycombinator.com/item?id=43966089

  • macOS 的权限弹窗设计存在安全隐患,可能被恶意软件伪造,导致用户输入密码。
  • 现有的权限弹窗没有明确说明为什么需要权限,也没有提供拒绝权限的后果说明。
  • 应该改进权限弹窗的设计,例如提供详细的权限说明,拒绝权限的后果说明,以及提供更细粒度的权限控制。
  • Capabilities 概念可以改进权限管理,但其实现需要考虑 POSIX 的兼容性和安全性。
  • macOS 已经有一些权限管理功能,例如 Privacy & Security 面板,但仍需要改进。
  • 应用商店并不能保证应用的安全性,用户仍需要谨慎对待权限请求。
  • Capabilities 可以在低级别实现,例如使用 C 代码,并且有一些操作系统已经实现了这种机制。

FastVLM: Efficient vision encoding for vision language models #

https://github.com/apple/ml-fastvlm

这个网页是关于 FastVLM 的官方实现仓库,FastVLM 是一种高效的视觉编码方法,用于视觉语言模型。该仓库包含了 FastVLM 的代码、模型和文档。

FastVLM 的主要特点是引入了一个新的混合视觉编码器 FastViTHD,该编码器可以输出更少的 token,并且可以显著减少高分辨率图像的编码时间。FastVLM 的最小变体可以比 LLaVA-OneVision-0.5B 快 85 倍,并且视觉编码器的大小减少了 3.4 倍。同时,FastVLM 的更大变体使用 Qwen2-7B LLM 可以比 Cambrian-1-8B 等最近的工作快 7.9 倍,并且只需要一个图像编码器。

要开始使用 FastVLM,需要按照 LLaVA 代码库的指示进行训练或微调自己的变体。同时,提供了运行推理的指示,包括设置环境、下载预训练模型和运行推理的命令。FastVLM 还提供了一个模型库,包含了不同阶段和大小的预训练模型,可以通过运行脚本下载所有的预训练模型。

FastVLM 的使用示例包括运行推理和在 Apple Silicon 上运行推理。要在 Apple Silicon 上运行推理,需要将 PyTorch 模型导出为适合 Apple Silicon 的格式,可以在 model_export 子文件夹中找到详细的指示。同时,FastVLM 还提供了三个在 Apple Silicon 上兼容的模型:fastvlm_0.5b_stage3、fastvlm_1.5b_stage3 和 fastvlm_7b_stage3。

如果需要引用 FastVLM 的代码或模型,需要引用相关的论文。FastVLM 的代码库是建立在多个开源贡献之上的,相关的鸣谢信息可以在 ACKNOWLEDGEMENTS 文件中找到。同时,FastVLM 的代码和模型都有相应的许可证,需要在使用前查看 LICENSE 和 LICENSE_MODEL 文件。


HN 热度 349 points | 评论 69 comments | 作者:nhod | 22 hours ago #

https://news.ycombinator.com/item?id=43968897

  • FastVLM 模型的大小对于每个应用程序来说太大了,苹果可能会在操作系统级别预加载这些模型并为所有应用程序提供 SDK。
  • 开放权重、操作系统标准的基础模型有很大的潜力,尤其是如果 API 允许应用程序开发人员在运行时加载自定义的 LoRa 微调模型。
  • 连续视觉对于设备上的应用程序(如助手)非常有用,需要一定的速度提升。
  • 有人正在努力使模型更小、更高效,而不是简单地增加资源。
  • VLM 模型的进步让人对未来充满希望,尤其是对于可能失去视力的儿童,他们可以通过这些技术与世界交互。
  • 有人认为 Tesla 的 FSD 是一个端到端的 VLA 模型,高效的视觉编码对于使机器人安全和响应迅速至关重要。
  • 有开发者正在使用 VLM 模型构建实时语音和视觉应用,未来可能会在设备上运行这些模型。
  • 有人提到了 SmolVLM 模型和 HuggingFace 平台,认为这些模型和平台对于开发者来说非常有用。

Multiple security issues in GNU Screen #

https://www.openwall.com/lists/oss-security/2025/05/12/1

本网页主要讨论的是关于 Screen 软件的安全问题。Screen 是一款 GNU/*/Linux 服务器操作系统,最近发现了多个安全漏洞,尤其是在 5.0.0 版本中。这些漏洞主要影响安装了 setuid-root 位的系统,例如 Arch Linux 和 NetBSD。

Screen 软件提供了多用户模式,允许用户附加到其他用户的会话中,前提是具有适当的凭据。这种模式会增加攻击面,因为 Screen 的复杂代码会以 root 权限运行。在多用户模式中,Screen 会话通过名称识别,名称需要以"/“作为前缀。用户可以通过命令行创建多用户会话,并通过访问控制列表(ACL)管理会话的访问权限。

安全问题中,最严重的是一个本地 root 漏洞(CVE-2025-23395),它影响 Screen 5.0.0 版本,当 Screen 以 setuid-root 权限运行时。该漏洞允许未经授权的用户创建任意位置的文件,以 root 所有权和 0644 模式,这些文件可以用来记录 Screen 会话的数据。Screen 在打开日志文件时会正确地放弃权限,但当它需要重新打开日志文件时,会发生权限升级。

此外,网页还讨论了其他安全问题,包括 Screen 的 setuid-root 实现可能存在的进一步问题,以及改进 Screen 安全状况的建议。同时,也提到了在协调披露这些问题时遇到的困难。最后,网页提供了一个受影响矩阵,快速概述了各种 Linux 和 UNIX 系统的受影响情况。


HN 热度 325 points | 评论 192 comments | 作者:st_goliath | 12 hours ago #

https://news.ycombinator.com/item?id=43971716

  • GNU Screen 的多用户模式会增加攻击面,因为它需要以 root 权限运行。
  • tmux 使用 Unix 域套接字,而不是 setuid-root 方法,可能更安全。
  • GNU Screen 的代码基础较老,且开发人员对其内部机制不太熟悉,导致维护和更新困难。
  • 学习和维护 GNU Screen 的内部机制很困难,尤其是对于新开发人员。
  • GNU Screen 的一些特性和设计已经过时,例如使用 TERMCAP 环境变量。
  • 安全态度的变化使得一些曾经被认为是特性的东西现在被视为安全漏洞。
  • 有些用户已经从 GNU Screen 切换到 tmux 或其他替代品,如 zellij。
  • tmux 和 zellij 的配置和使用方法可能需要一些时间来适应,但提供了更多的功能和灵活性。
  • GNU Screen 的默认键绑定和行为已经深入人心,难以改变。
  • 在多台机器或随机机器上使用 GNU Screen 时,默认设置可能是一个问题。
  • zellij 的二进制文件体积较大,可能是由于静态链接和 cargo 依赖导致。

Branch Privilege Injection: Exploiting branch predictor race conditions #

https://comsec.ethz.ch/research/microarch/branch-privilege-injection/

本文介绍了一种新的安全漏洞,称为分支特权注入(Branch Privilege Injection,简称 BPI),该漏洞影响 Intel 处理器。BPI 攻击可以绕过 Intel 的硬件缓解措施,例如增强的间接分支受限推测(eIBRS)和间接分支预测屏障(IBPB),从而实现任意内存泄漏。

研究人员发现,Intel 处理器中的分支预测器更新是异步进行的,这意味着更新可能会延迟数十或数百个时钟周期。在某些情况下,这些异步更新可能会导致分支预测器与指令流之间的同步不足,从而产生分支预测器竞争条件。这种竞争条件可以被利用来实现 BPI 攻击。

BPI 攻击的工作原理是通过操纵分支预测器更新来实现任意内存泄漏。攻击者可以创建一个恶意的分支预测器更新,然后在特权切换(例如,从用户模式到内核模式)或 IBPB 操作期间执行该更新。由于分支预测器更新是异步进行的,更新可能会在特权切换后仍然有效,从而实现任意内存泄漏。

研究人员已经证明了 BPI 攻击可以在 Intel 的最新处理器(包括 Raptor Lake 和 Alder Lake)上实现,并且可以绕过 eIBRS 和 IBPB 缓解措施。他们还提供了一个微码更新来缓解 BPI 攻击,并评估了该更新的性能开销。

BPI 攻击不仅影响 Linux 系统,也可能影响其他操作系统,因为该漏洞存在于 Intel 处理器的硬件中。研究人员建议用户安装最新的操作系统和 BIOS 更新来缓解 BPI 攻击。

总之,BPI 攻击是一种新的安全漏洞,影响 Intel 处理器,允许攻击者实现任意内存泄漏。该攻击可以绕过 Intel 的硬件缓解措施,包括 eIBRS 和 IBPB。研究人员已经证明了 BPI 攻击的可行性,并提供了一个微码更新来缓解该攻击。用户应该安装最新的操作系统和 BIOS 更新来保护自己免受 BPI 攻击。


HN 热度 306 points | 评论 115 comments | 作者:alberto-m | 7 hours ago #

https://news.ycombinator.com/item?id=43974891

  • 分支预测可能会带来安全风险,需要软件和硬件共同合作来解决这个问题
  • 现代处理器的性能依赖于分支预测,去掉分支预测可能会导致性能大幅下降
  • 硬件安全是一个重要的课题,需要更多的研究和关注
  • 分支预测的更新可能会被延迟,导致安全漏洞
  • predictor 更新可能会被推迟到分支指令退休后,dispatch-serializing 指令不会阻塞流水线等待 predictor 状态更新
  • 特权级别更改的指令也不会阻塞流水线等待 predictor 状态更新,这可能会导致安全问题
  • 硬件安全课程和研究可以帮助人们更好地理解和解决这些问题
  • 去掉分支预测可能会导致性能下降,但可以通过其他方式来提高性能,如优化软件和硬件
  • 分支预测带来的安全风险可能会被攻击者利用,需要采取措施来防止这种攻击
  • 硬件安全是一个复杂的问题,需要多方面的合作和研究来解决

In a high-stress work environment, prioritize relationships #

https://wqtz.bearblog.dev/high-stress-job-relationships/

本文讨论了在高压力工作环境中,如何优先考虑人际关系的重要性。作者首先描述了高压力工作环境的现状,人们在工作中感到极度紧张,甚至可能产生辞职的想法。作者指出,在这种环境中,每个人都感到压力重重,大家都在承受着来自上级的压力,导致工作变得毫无意义。

作者强调,即使在这种高压力环境中,保持良好的人际关系也是非常重要的。因为如果你决定辞职,你需要这些人际关系来获得新的工作机会,例如推荐信。作者警告不要在压力下对同事发脾气,因为这会给你留下坏印象,你会被记住为“那个家伙”,即使你已经离开了公司。

作者最后强调,优先考虑人际关系是非常重要的。在工作中,应该考虑到每个人的需求和感受,而不是仅仅关注截止日期和工作的重要性。每个人都是人,应该以人际关系的方式对待他们,而不是让“专业环境”腐蚀了这些关系。通过优先考虑人际关系,我们可以建立更好的工作环境和更好的未来。


HN 热度 271 points | 评论 175 comments | 作者:wqtz | 10 hours ago #

https://news.ycombinator.com/item?id=43972535

  • 在高压力工作环境中,人际关系是重要的因素,需要优先考虑。
  • 工作中的压力往往来自于那些不擅长工作的人,他们试图把问题转嫁给别人。
  • 与不同类型的人建立关系是不同的,一种是关于如何合作,另一种是关于如何保持距离。
  • 认为有些人之所以会产生压力,是因为他们缺乏明确的目标和计划,导致他们感到迷茫和不确定。
  • 也有人认为,这种情况的产生是因为管理层的问题,管理层试图把问题转嫁给下属。
  • 还有人指出,个人主动性和责任感是可以通过经验和训练来培养的,而不是天生的。
  • 有些人认为,公司的停滞不前是因为员工们过于注重维护现有的流程和模式,而不是创新和进步。
  • 也有人觉得,需要帮助和指导的员工并不是问题,问题在于如何有效地帮助和指导他们。

Nextcloud cries foul over Google Play Store app rejection #

https://www.theregister.com/2025/05/13/nextcloud_play_store_complaint/

Nextcloud 是一家欧洲软件供应商,最近指责 Google 故意限制其 Android Files 应用程序的功能,该应用程序拥有超过 80 万用户。问题出在"All files access"权限上,Google 要求 Nextcloud 使用更注重隐私的存储访问工具,如 Storage Access Framework(SAF)或 MediaStore API。然而,Nextcloud 声称这些替代方案无法满足其应用程序的需求,因为它们无法提供对所有文件类型的访问权限。

Nextcloud 表示,其 Android Files 应用程序自 2016 年推出以来一直具有读写所有文件类型的权限,从未收到 Google 关于安全问题的投诉。然而,在 2024 年,Google Play Store 突然撤销了该权限,有效地限制了应用程序的功能。Nextcloud 试图与 Google 沟通,但只收到复制粘贴的开发者指南段落。尽管 Nextcloud 多次提出上诉,Google 仍拒绝恢复应用程序的全部功能。

Nextcloud 认为,Google 的行为是为了限制竞争,遏制小公司的发展。Nextcloud 援引了 Microsoft 和 Apple 等大公司的类似行为,指出这些公司曾被指控采取反竞争行为。Nextcloud 还提到,自己曾在 2021 年与其他公司一起向欧盟提出投诉,指控 Microsoft 的反竞争行为,但至今尚未得到解决。

Nextcloud 表示,小公司如自己几乎没有任何办法来对抗大公司的限制,监管机构的执法速度也太慢,罚款金额太少,无法对大公司产生有效的威慑作用。Nextcloud 认为,大公司担心小公司会破坏自己的市场份额,因此试图限制小公司的发展。Nextcloud 的 Android Files 应用程序目前有 824,000 名用户,公司表示将继续努力维护应用程序的功能和用户权益。


HN 热度 244 points | 评论 153 comments | 作者:brodo | 15 hours ago #

https://news.ycombinator.com/item?id=43970959

  • 谷歌对 NextCloud 应用的拒绝是由于安全问题,NextCloud 需要访问所有文件,但谷歌的政策不允许这样做
  • NextCloud 可以使用 FDroid 版本来绕过谷歌的限制
  • 谷歌的政策是为了保护用户的安全和隐私,但也可能限制了某些应用的功能
  • NextCloud 需要访问所有文件来实现其功能,但谷歌的政策不允许这样做,导致了冲突
  • 谷歌的政策可能是为了保护自己的利益,而不是真正考虑用户的需求
  • 使用 scoped storage 可以解决部分问题,但可能会有性能限制
  • 如果谷歌禁止安装非谷歌商店应用,可能会面临欧盟的罚款和处罚
  • 谷歌的政策可能会限制开发者的自由和创造力
  • NextCloud 可以使用其他方式来实现其功能,但可能会增加复杂性和不便利
  • 谷歌的政策可能会导致开发者选择其他平台或分发渠道
  • 谷歌的政策可能会损害用户的权益和利益
  • 谷歌应该考虑用户的需求和开发者的需求,找到一个平衡点来解决问题

Why I’m resigning from the National Science Foundation #

https://time.com/7285045/resigning-national-science-foundation-library-congress/

本文的作者阿隆德拉·纳尔逊(Alondra Nelson)宣布,她将辞去在国家科学基金会(National Science Foundation)和国会图书馆(Library of Congress)的职务。纳尔逊曾担任白宫科学和技术政策主任,她表示,尽管她曾希望这些公共机构能够继续其促进和保护知识的使命,但现实情况却使她无法继续下去。

纳尔逊指出,国家科学基金会和国会图书馆等机构正面临着日益恶化的政治环境,科学家、图书管理员和政策分析师们尽管努力工作,但仍然无法抵御来自行政部门的压力。这些机构的独立性和完整性正在被侵蚀,纳尔逊表示,她无法再继续为这些机构服务。

纳尔逊特别提到了国家科学基金会的现状,她表示,该机构的独立性已经被破坏,行政部门正在干预其决策过程。她还提到了国会图书馆的 Scholars Council,该机构原本应该为图书馆的项目提供咨询,但现在已经失去了其原本的功能。

纳尔逊表示,她的辞职是因为这些机构已经无法再履行其原本的使命,行政部门的干预已经使得这些机构失去了其独立性和完整性。她还提到了雷·布拉德伯里(Ray Bradbury)的著名小说《华氏 451 度》(Fahrenheit 451),该小说描绘了一个书籍被烧毁、知识被压制的社会,纳尔逊表示,现实情况已经与小说中的情景非常相似。

纳尔逊的辞职是对当前政治环境的严厉批评,她表示,行政部门的行为已经对知识的自由和民主的原则构成了严重的威胁。她还呼吁人们关注这些问题,防止知识和民主的进一步侵蚀。


HN 热度 215 points | 评论 247 comments | 作者:jbegley | 9 hours ago #

https://news.ycombinator.com/item?id=43973210

  • 美国的科学研究领域已经受到严重损害,尤其是在特朗普政府时期,许多外国科学家正在考虑离开美国或转向工业研究。
  • 美国的科学研究资金面临不确定性,未来几年可能难以恢复,导致科学研究人才流失和创新能力下降。
  • 大学不能同时要求公共资金支持和保持意识形态纯洁,政府不应根据政治倾向进行区分。
  • 行业研究与学术研究有所不同,行业研究往往受短期利润驱动,而学术研究则注重长期的科学进步和人类利益。
  • 行业研究并非完全不能进行基础科学研究,例如贝尔实验室和微软研究院等都有进行理论计算机科学和数学研究的例子。
  • 但是,某些科学领域如天文学、物理学和地质物理学等可能难以在行业中进行研究。

PDF to Text, a challenging problem #

https://www.marginalia.nu/log/a_119_pdf/

本文讨论了从 PDF 文件中提取文本的挑战。PDF 文件格式并不是一个文本格式,而是一个图形格式,它将字形映射到“纸张”上的坐标上。这种格式使得提取文本信息变得困难,因为字形可能被旋转、重叠和乱序排列,并且缺乏语义信息。

为了解决这个问题,作者尝试使用 PDFBox 的 PDFTextStripper 类,但是发现它有一些局限性,例如不能识别标题和其他语义信息。因此,作者进行了一些修改,以便更好地提取 PDF 文件中的文本信息。

首先,作者尝试识别标题。他们发现,标题通常使用粗体或更粗的字体,并且与其他文本隔离。然而,并不是所有的标题都使用粗体字体,有些标题可能使用字体大小来区分。为了解决这个问题,作者使用了字体大小的统计方法,计算每页的字体大小分布,并使用中位数作为阈值来识别标题。

其次,作者尝试连接连续的标题。他们发现,标题可能被分成多行,并且需要连接这些行以形成一个完整的标题。然而,这个问题并不是那么简单,因为有些标题可能使用右对齐或缩进来表示段落的开始。

最后,作者讨论了识别段落的方法。他们发现,PDFTextStripper 使用了一种混合方法,结合行距和缩进来识别段落。然而,这种方法有一些局限性,例如不能处理不同行距的文档。为了解决这个问题,作者使用了行距的统计方法,计算每页的行距分布,并使用中位数作为阈值来识别段落。

总的来说,本文讨论了从 PDF 文件中提取文本的挑战和解决方法。作者使用了统计方法和机器学习模型来识别标题、连接连续的标题和识别段落。这些方法可以帮助提高 PDF 文件中文本信息的提取准确性和效率。


HN 热度 209 points | 评论 113 comments | 作者:ingve | 9 hours ago #

https://news.ycombinator.com/item?id=43973721

  • PDF 转换为文本是一个具有挑战性的问题
  • 有些人曾经花费大量时间研究过 PDF 和 OCR,但后来却完全忘记了
  • Tesseract 是过去最好的开源 OCR,但现在 docTR 可能更好
  • 有些人尝试过使用 Tesseract 来提取 PDF 中的文本
  • 有人希望能够像浏览器的开发者工具一样查看 PDF 的内容流
  • PDF.js 可以将 PDF 渲染为 DOM,从而可以更容易地解析 PDF
  • cpdf 工具可以将 PDF 转换为 JSON 格式,但不能实现实时的交互
  • 有些人使用过 cpdf 工具来解析 PDF,但仍然存在一些限制
  • 有人认为能够像查看 HTML 源代码一样查看 PDF 的内容流是非常有用的