2025-05-18 08:58:33
- 达斯汀·柯蒂斯认为过度依赖AI生成内容会导致人类创造力退化,主张保留手动思考的价值。
- Google推出基于Gemini的文本到SQL技术,提升非技术人员数据交互能力但存在隐私和准确性挑战。
- 编程优化原则建议将条件判断上移、循环操作下移,以简化代码结构并提升性能。
- JavaScript新增
using
/await using
语法实现显式资源管理,但可能增加代码复杂性。- 穆迪因美国债务问题下调其信用评级至Aa1,预计2035年联邦赤字占GDP达9%。
- KVSplit通过差异化量化KV缓存减少72%内存占用,部分配置可提升LLM推理速度。
- 瑞士新监控法案遭Proton等企业反对,可能迫使隐私企业迁离以规避数据留存要求。
- ClojureScript 1.12.42升级Closure Compiler并接管其维护,强化跨环境JavaScript解决方案。
- XTool作为跨平台Xcode替代品引发争议,需依赖Xcode工具链且存在潜在法律风险。
- Wow@Home项目通过低成本射电望远镜网络探测外星信号,延续Wow信号研究传统。
作者达斯汀·柯蒂斯(Dustin Curtis)在他的博客中分享了他最近的思考和感受。他提到自己已经陷入了困境,每当他尝试写博客文章、编码或开始新项目时,他都会意识到在人工智能(AI)的背景下,他的努力是徒劳的。人工智能可以轻松地产生高质量的内容,令他感到自己无法竞争。
作者曾经是一个多产的作家,他会花费数小时来完善自己的想法和写作。但现在,人工智能的出现使他可以轻松地获得完整的想法和内容,只需输入几个关键词。这种依赖人工智能的方式使他的大脑变得懒惰,他感觉自己的直觉、聪明才智和严谨性都在减退。
作者认为,使用人工智能来探索想法虽然看似高效,但实际上是对大脑的懒惰。他将其比喻为观看电视节目,而不是真正的思考和学习。他觉得自己虽然知道了更多的东西,但实际上变得更愚蠢和迟钝。人工智能提供的内容虽然完善,但缺乏了真正的思考和学习过程。
作者最后表示,他仍然陷在困境中,但他决定继续写作和分享自己的想法,即使人工智能可以更快、更好地完成这些工作。他认为,自己写作的过程和输出的内容虽然不如人工智能,但仍然有其价值和意义。整个文章是作者对人工智能对人类思考和创造力的影响的思考和反思。
https://news.ycombinator.com/item?id=44008843
https://cloud.google.com/blog/products/databases/techniques-for-improving-text-to-sql
本文介绍了 Google Cloud 的文本到 SQL(text-to-SQL)技术,该技术可以将自然语言直接转换为 SQL 查询。这种技术可以提高开发人员和分析师的生产力,并使非技术用户能够直接与所需的数据进行交互。文本到 SQL 技术在许多 Google Cloud 产品中都有应用,包括 BigQuery Studio、Cloud SQL Studio、AlloyDB Studio 和 Vertex AI。
文本到 SQL 技术面临着几个挑战,包括提供业务特定的上下文、理解用户意图和管理 SQL 方言的差异。为了解决这些挑战,Google Cloud 使用了多种技术,包括大型语言模型(LLM)和提示技术。LLM 可以学习数据和模式,并生成准确的 SQL 查询。然而,LLM 也可能出现一些问题,例如生成不正确的查询或无法理解用户意图。
为了解决这些问题,Google Cloud 使用了多种技术,包括提供业务特定的上下文、理解用户意图和管理 SQL 方言的差异。例如,Google Cloud 使用了一个名为 Gemini 的 LLM 模型,该模型可以学习数据和模式,并生成准确的 SQL 查询。Gemini 模型可以理解用户意图,并生成符合用户需求的 SQL 查询。
文本到 SQL 技术在许多场景中都有应用,包括数据分析、业务智能和机器学习。这种技术可以帮助用户快速获取所需的数据,并进行数据分析和决策。同时,文本到 SQL 技术也可以帮助用户自动化数据处理和分析流程,提高生产力和效率。
总之,文本到 SQL 技术是 Google Cloud 的一项重要功能,可以帮助用户快速获取所需的数据,并进行数据分析和决策。这种技术可以提高生产力和效率,并使非技术用户能够直接与所需的数据进行交互。然而,文本到 SQL 技术也面临着一些挑战,包括提供业务特定的上下文、理解用户意图和管理 SQL 方言的差异。为了解决这些挑战,Google Cloud 使用了多种技术,包括大型语言模型和提示技术。
https://news.ycombinator.com/item?id=44009848
https://matklad.github.io/2023/11/15/push-ifs-up-and-fors-down.html
这篇文章讨论了两条编程规则:向上推送 if 语句和向下推送 for 循环。作者认为,如果一个函数内部有 if 条件,应该考虑将其移到调用者处。这种方法可以减少函数内部的条件检查,简化代码结构。尤其是在处理前置条件时,向上推送 if 语句可以减少整个程序的条件检查次数。
作者还指出,控制流和 if 语句是代码中的复杂部分,容易引起错误。通过向上推送 if 语句,可以将控制流集中在一个函数中,使得代码更容易理解和维护。这种方法还可以帮助发现死代码和冗余条件。作者给出了一个例子,展示了如何通过向上推送 if 语句简化代码结构。
另一方面,作者讨论了向下推送 for 循环的规则。这种方法是从数据导向的编程思想中来的,认为程序通常需要处理大量的对象。通过引入批处理的概念,可以将操作应用于一批对象,而不是单个对象。这种方法可以提高性能,尤其是在处理大量数据时。作者给出了一个例子,展示了如何通过向下推送 for 循环提高性能。
作者还指出,这两条规则可以组合使用。通过向上推送 if 语句和向下推送 for 循环,可以简化代码结构,提高性能。作者给出了一个例子,展示了如何通过组合使用这两条规则简化代码结构。最后,作者总结了这两条规则的重要性,认为它们可以帮助程序员写出更好的代码。
https://news.ycombinator.com/item?id=44013157
https://v8.dev/features/explicit-resource-management
Explicit Resource Management 是一个新的 JavaScript 提案,旨在提供一种确定性的方式来显式管理资源的生命周期,例如文件句柄、网络连接等。这个提案引入了几个新的特性,包括 using
和 await using
声明,这些声明可以自动调用资源的 dispose
方法,当资源超出作用域时。
using
和 await using
声明是 Explicit Resource Management 的核心。using
声明用于同步资源,确保资源的 dispose
方法在作用域退出时被调用。await using
声明用于异步资源,确保资源的 asyncDispose
方法被调用,并等待其完成。这些声明可以在块作用域、循环和函数体中使用,但不能在顶级作用域中使用。
Explicit Resource Management 提案还引入了 DisposableStack
和 AsyncDisposableStack
,它们是栈式结构,允许开发者将多个资源分组并协调地释放它们。这些结构提供了 use
、adopt
和 defer
方法来添加资源或释放操作,并提供了 dispose
或 asyncDispose
方法来触发释放。这些结构可以与 using
和 await using
声明一起使用,以简化资源释放的过程。
此外,Explicit Resource Management 提案还引入了 SuppressedError
,一种新的错误类型,用于处理资源释放过程中发生的错误。这种错误类型可以包含两个错误:最近抛出的错误和被抑制的错误。这种机制可以帮助开发者更好地处理资源释放过程中发生的错误。
Explicit Resource Management 提案的目标是帮助开发者写出更健壮、更高效、更易维护的代码。通过提供一种确定性的方式来管理资源的生命周期,开发者可以避免资源泄漏和其他问题。这个提案已经在 Chromium 134 和 V8 v13.8 中实现。
https://news.ycombinator.com/item?id=44012227
https://www.ft.com/content/e456ea34-c6ad-43fe-abe9-d4ce781c07b4
穆迪下调美国最高级三 A 信用评级
美国因政府债务水平上升而被穆迪下调最高级三 A 信用评级。
周五下午,该机构将美国信用评级从 Aaa 下调至 Aa1,评级展望从负面变为稳定。其他主要评级机构惠誉和标准普尔此前已取消了美国的完美评级。
穆迪表示,预计到 2035 年,美国联邦赤字将扩大到占 GDP 的近 9%,高于去年的 6.4%,主要由于债务利息支出增加、福利支出以及“相对较低的收入生成”。
该机构写道:“在我们的 21 个评级等级中,此次下调一个等级反映了政府债务和利息支付比率在十多年来的增长,这些比率已显著高于类似评级的主权国家。”
这是一个正在发展的故事。
https://news.ycombinator.com/item?id=44009999
https://github.com/dipampaul17/KVSplit
KVSplit 是一个针对 Apple Silicon 的差异化 KV 缓存量化技术,旨在减少内存使用并提高大型语言模型(LLM)在 Mac 上的运行效率。通过将键和值分别量化为 8 位和 4 位,KVSplit 可以减少内存使用量达 72%,同时保持或提高推理速度。
KVSplit 的主要特点包括独立量化键和值、针对 Apple Silicon 的 Metal 支持、全面的基准测试套件以及内存使用和性能分析工具。该项目还提供了易于使用的安装脚本和快速比较工具,允许用户快速评估不同配置的性能。
在内存减少方面,KVSplit 的配置可以减少 47% 至 72% 的内存使用量,具体取决于键和值的量化精度。例如,K8V8 配置可以减少 47% 的内存使用量,而 K4V4 配置可以减少 72% 的内存使用量。同时,KVSplit 的性能影响也很显著,某些配置可以提高 5-15% 的推理速度。
KVSplit 项目的结构包括优化的 llama.cpp 构建、模型文件、脚本和结果文件夹。该项目还提供了科学见解,揭示了键和值在量化中的敏感性差异。通过这种差异化的量化方法,KVSplit 可以在保持或提高模型质量的同时减少内存使用量和提高推理速度。
在使用方面,KVSplit 提供了灵活的安装选项,包括虚拟环境、系统 Python 和跳过 Python 设置。同时,KVSplit 也提供了快速比较工具,允许用户快速评估不同配置的性能。此外,KVSplit 的基准测试套件可以帮助用户全面评估模型的性能和内存使用情况。
https://news.ycombinator.com/item?id=44009321
瑞士正在考虑修改其监视法,专家们警告这将对该国的安全加密和在线匿名性构成风险。具体来说,修正案可能要求所有 VPN 服务、消息应用和社交网络识别和保留用户数据,这一义务目前仅限于移动网络和互联网服务提供商。
Proton 公司是知名的 VPN 和加密电子邮件服务提供商,其 CEO Andy Yen 在接受 RTS 采访时批评了拟议的修正案,称其为“对隐私权的重大侵犯”,这也将损害该国的声誉和国际竞争力。 Yen 表示,如果修正案通过,Proton 将被迫修改其加密和无日志政策,这是公司不愿意做的事情。他还表示,公司将被迫离开瑞士,因为法律将变得几乎与俄罗斯当前的法律相同。
Proton 并不是唯一一个持有这种观点的公司,新兴的 VPN 服务提供商 NymVPN 也公开反对瑞士政府的计划。Nym 的联合创始人和 COO Alexis Roussel 确认,如果新监视规则被执行,Nym 也将离开瑞士。
目前,瑞士政府尚未做出决定,但已经有来自政治党派和瑞士公司的强烈反对。一些州,包括日内瓦,甚至以数字完整性权为由反对这些规则。 Yen 表示,如果瑞士政府能够制定出平衡的规则,允许像 Proton 这样的公司在瑞士和全球范围内竞争,他将留在瑞士并继续投资。
https://news.ycombinator.com/item?id=44014808
https://clojurescript.org/news/2025-05-16-release
ClojureScript 网页介绍了该语言的最新动态和更新。最近发布的 1.12.42 版本包含了两个重要的依赖变化:更新了 Google Closure Compiler 到 v20250402 版本,这意味着 ClojureScript 现在需要 Java 21 来运行;另外,ClojureScript 现在依赖于 Clojure 的 Google Closure Library 分支。
网页提到,更新 Google Closure Compiler 的原因是 Google 内部的要求,虽然这可能不是 ClojureScript 团队的首选,但为了保持与 Google 的同步,还是选择了更新。同时,ClojureScript 团队也 fork 了 Google Closure Library,并接管了其维护工作。Google Closure Library 的稳定性在 2019 年开始下降,Google 停止了对其的贡献,ClojureScript 团队因此决定接管其维护。
ClojureScript 的目标是提供一个完整的 JavaScript 解决方案,不仅仅限于浏览器环境。通过 fork 和维护 Google Closure Library,ClojureScript 现在可以提供更多的功能和工具,包括 DOM 操作、国际化、日期和时间处理、颜色值操作、数学运算、程序化动画、浏览器历史管理、无障碍支持、图形处理等。ClojureScript 的优势在于其可以提供一个稳定的和可靠的 JavaScript 工具集,不需要依赖于其他框架或库。
网页最后呼吁用户尝试使用 ClojureScript,提供了相关的文档和资源链接,包括 API 文档、源代码、变更日志等。同时,也提供了关于 ClojureScript 的社区、事件和公司信息。总的来说,ClojureScript 网页介绍了该语言的最新动态和更新,强调了其优势和特点,呼吁用户尝试使用。
https://news.ycombinator.com/item?id=44009464
https://github.com/xtool-org/xtool
xtool 是一个跨平台的工具,能够在 Linux、Windows 和 macOS 上模拟 Xcode 的功能,使用开源标准。它可以帮助用户构建和部署 iOS 应用程序,使用 SwiftPM 包管理器。xtool 的主要功能包括构建 SwiftPM 包为 iOS 应用程序,签名和安装 iOS 应用程序,以及与 Apple 开发者服务进行交互。
要开始使用 xtool,用户需要按照安装指南在 Linux、Windows 或 macOS 上安装该工具。安装完成后,用户可以创建和运行第一个 xtool 应用程序,通过教程来了解更多关于 xtool 的信息。xtool 提供了一个命令行接口,用户可以使用 xtool --help
命令来查看帮助信息和可用的子命令。
xtool 的子命令包括设置、认证、SDK 管理、创建新项目、构建和运行项目、与 Apple 开发者服务交互、设备管理等。用户可以使用这些子命令来完成不同的任务,例如创建新项目、构建和运行应用程序、安装和卸载应用程序等。xtool 还提供了一个库,用户可以将其作为 SwiftPM 依赖项添加到自己的应用程序中,以便与 Apple 开发者服务、iOS 设备等进行交互。
xtool 的开发活动非常活跃,最近的提交包括添加更多详细信息到 bug 报告模板、修复 Linux 构建问题等。xtool 的仓库中有 2.2k 个星标、44 个 fork 和 16 个问题,表明该项目有较大的关注度和活跃度。xtool 的 license 为 MIT license,遵循开源标准。总的来说,xtool 是一个非常有用的工具,能够帮助开发者在不同的平台上构建和部署 iOS 应用程序。
https://news.ycombinator.com/item?id=44011515
https://phl.upr.edu/wow/outreach
Wow@Homemailto:Wow@Home 项目是一个小型射电望远镜网络,旨在探测天体物理现象和潜在的技术信号。该项目的灵感来自于 1970 年代俄亥俄州立大学的 SETI 项目,该项目使用大耳朵射电望远镜探测到了一個神秘的信号,被称为 Wow 信号。Wow@Home 项目使用小型射电望远镜和开放源代码的软件来分析数据,寻找持续时间较长的信号。
Wow@Homemailto:Wow@Home 项目的硬件配置包括一个小型射电望远镜和一个计算机系统,用于数据采集和分析。该系统使用 10 kHz 的信道宽度和 12 秒的积分时间,类似于大耳朵射电望远镜的观测协议。然而,Wow@Home 项目的系统具有 256 个信道,而不是 50 个,并且具有更大的束宽,但灵敏度较低。
Wow@Homemailto:Wow@Home 项目的软件是基于 IDL 语言开发的,用于数据分析和处理。该软件可以对数据进行实时分析,并提供多种方式来显示数据,包括相对功率、信噪比和动态光谱图。该软件还可以对数据进行滤波和处理,以去除干扰和噪声。
Wow@Homemailto:Wow@Home 项目的目标是探测持续时间较长的信号,包括天体物理现象和潜在的技术信号。该项目还旨在为教育和公民科学提供一个平台,允许人们参与射电天文学研究并为科学探索做出贡献。该项目的未来计划包括扩展网络,增加更多的射电望远镜和计算机系统,并开发新的软件和算法来分析数据。
Wow@Homemailto:Wow@Home 项目的意义在于它为射电天文学研究提供了一个新的途径,利用小型射电望远镜和开放源代码的软件来分析数据。该项目还为人们提供了一个机会,参与科学探索和发现,并为天体物理学和技术信号的研究做出贡献。
https://news.ycombinator.com/item?id=44011489
2025-05-17 06:38:43
- 全球首例个性化基因编辑治疗成功治愈罕见病婴儿,通过CRISPR-Cas9和mRNA技术修复CPS1基因缺陷。
- 某航天公司滥用Xen Orchestra软件30天免费试用期30年,引发开源软件道德争议。
- Sketch AI通过9行代码实现LLM代理循环系统,高效完成代码合并等复杂任务。
- 利用位运算和魔数优化闰年判断算法,仅需三条指令但牺牲代码可读性。
- Ollama推出多模态模型引擎支持图文处理,但被质疑缺乏技术创新。
- NASA通过重启加热器修复旅行者1号推进器,延长深空探测任务寿命。
- BuyMeACoffee单方面切断乌克兰创作者支付渠道,引发资金管理争议。
- OpenAI推出代码生成代理Codex,可能冲击初级工程师就业市场。
- 开发者反思过度依赖AI编码导致代码质量下降,呼吁回归自主编程能力。
- Sci-Net平台用加密货币激励论文共享,但隐私和商业化问题引发质疑。
https://www.nytimes.com/2025/05/15/health/gene-editing-personalized-rare-disorders.html
这篇文章报道了一位名叫 KJ Muldoon 的 9 个半月大的男婴,他因患有一种罕见的基因疾病 ——CPS1 缺乏症而成为医学历史的第一个接受个性化基因编辑治疗的患者。这种疾病在每 130 万名新生儿中仅出现一例,通常会导致严重的智力和发育迟缓,最终需要肝脏移植,且半数患者在出生一周内就会死亡。
在 KJ 出生后,医生最初怀疑他可能患有脑膜炎或败血症,直到一周后确认了他的病情。尽管医生给了 Muldoon 夫妇选择舒缓治疗的建议,他们决定给 KJ 一个机会,尝试更积极的治疗。
最终,KJ 接受了针对他具体突变的定制基因编辑治疗。根据医生的描述,这种治疗具有改变他病情的潜力,并且 KJ 的发育情况逐渐向好,表明治疗有效。此次治疗不仅为 KJ 带来了希望,也为其他类似罕见基因疾病的患者开辟了新的治疗途径。
这项个性化基因编辑技术的成功应用,标志着医学领域在治疗罕见遗传疾病方面迈出了重要一步,可能帮助到成千上万的患者。
https://news.ycombinator.com/item?id=43997636
https://virtualize.sh/blog/ground-control-to-major-trial/
这篇文章讲述了一个关于开源软件的故事。作者的公司 Vates 开发了一款名为 Xen Orchestra Appliance(XOA)的虚拟机软件,这款软件有一个 30 天的免费试用期。然而,一家拥有 130 万美元年收入的航天公司却一直在滥用这个试用期,多年来注册了超过 60 个账户,每个账户都使用不同的邮箱地址来获得新的试用期。
这家公司尽管拥有大量的 IT 基础设施和复杂的系统,但却拒绝为软件付费。他们甚至在被发现滥用试用期后,也没有停止这种行为,而是继续使用新的邮箱地址来注册新的试用期。作者认为,这种行为违反了开源软件的道德契约,浪费了开发者的时间和资源。
作者指出,这家公司的行为不仅仅是为了省钱,还表明了他们对开源软件的不尊重和不理解。他们可以自行编译和使用软件,但却选择了滥用试用期。作者认为,这种行为会对开源软件的可持续性产生负面影响,因为开发者需要通过销售支持和服务来维持生计。
最后,作者表示,将会引入更智能的限制来防止这种试用期滥用行为,以确保开发者的时间和资源被有效利用。同时,也呼吁这家公司改变其行为,尊重开源软件的道德契约。
https://news.ycombinator.com/item?id=44004388
https://sketch.dev/blog/agent-loop
本文介绍了一个名为 Sketch 的 AI 编程助手,它使用了一个简单的 LLM(大型语言模型)代理循环来实现工具使用。这个循环由 9 行代码组成,核心思想是将用户输入传递给 LLM,LLM 输出结果和工具调用,然后处理工具调用或获取新的用户输入。
作者表示,尽管这个循环非常简单,但它却能解决很多问题,甚至可以在一次尝试中解决一些复杂的问题。例如,作者可以要求 Sketch 执行一些 Git 操作,而不需要手动查找和复制命令。Sketch 还可以处理 Git 合并、类型检查错误等任务。
作者还指出,LLM 代理循环可以使用多种工具来提高其性能和速度。例如,Sketch 不仅可以使用 bash,还可以使用其他工具来编辑文本、执行搜索等操作。作者认为,LLM 代理循环将在未来被广泛应用于日常的自动化任务中,特别是那些传统上太具体或太不稳定而无法自动化的任务。
作者最后提到,LLM 代理循环可以被定制和扩展,以适应不同的需求和场景。例如,作者可以使用 Sketch 来执行特定的任务,或者创建自己的 LLM 代理循环来解决特定的问题。总的来说,本文介绍了 Sketch 和 LLM 代理循环的基本概念和应用,展示了其潜在的能力和未来发展方向。
https://news.ycombinator.com/item?id=43998472
https://hueffner.de/falk/blog/a-leap-year-check-in-three-instructions.html
这篇文章讨论了如何优化判断闰年的代码。传统的闰年判断方法需要检查年份是否能被 4 整除,但不能被 100 整除,除非它也能被 400 整除。这种方法虽然简单,但可能不是最有效的。
为了优化这个过程,作者首先对传统方法进行了一些简单的优化。例如,可以将 (y % 100) != 0
替换为 (y % 25) != 0
,因为如果年份是 4 的倍数,那么它也一定是 25 的倍数。同样,可以将 (y % 400) == 0
替换为 (y % 16) == 0
,因为如果年份是 25 的倍数,那么它也一定是 16 的倍数。
经过这些优化,作者得到了一个更快的闰年判断函数 is_leap_year1
。但是,作者并没有就此止步,而是继续寻找更好的解决方案。作者使用了位运算和魔数来实现一个更快的闰年判断函数 is_leap_year_fast
。这个函数使用了三个 CPU 指令来判断闰年,远远快于传统方法。
为了解释 is_leap_year_fast
的工作原理,作者首先将魔数以二进制形式表示出来,并指出四个相关的位范围。然后,作者解释了乘法和位运算的过程,以及如何使用这些位范围来判断闰年。作者还将 is_leap_year_fast
重写为 is_leap_year_fast2
,以便更好地理解其工作原理。
最后,作者总结了 is_leap_year_fast
的工作原理,并指出它与传统方法的等价性。作者还讨论了使用位运算和魔数的优点和缺点,并指出这种方法虽然更快,但可能不如传统方法那么容易理解。总的来说,这篇文章提供了一个有趣的例子,展示了如何使用位运算和魔数来优化代码,并提供了对这些技术的深入理解。
https://news.ycombinator.com/item?id=43999748
https://ollama.com/blog/multimodal-models
Ollama 推出了新的多模态模型引擎,支持多种多模态模型,包括 Meta Llama 4、Google Gemma 3、Qwen 2.5 VL 和 Mistral Small 3.1 等。这些模型可以处理多种类型的输入,包括文本、图像和视频,并可以对这些输入进行理解和分析。
Ollama 的新引擎支持多种多模态模型,使得这些模型可以更容易地被集成和使用。例如,Llama 4 Scout 模型可以处理图像和文本输入,并可以对图像进行分析和理解。用户可以输入图像和文本,并询问模型关于图像的内容,模型可以给出详细的答案。
Gemma 3 模型可以处理多个图像输入,并可以分析这些图像之间的关系。用户可以输入多个图像,并询问模型关于这些图像的关系,模型可以给出详细的答案。Qwen 2.5 VL 模型可以处理文本和图像输入,并可以对图像进行分析和理解。
Ollama 的新引擎还支持多种其他功能,包括文档扫描和图像识别。用户可以输入文档或图像,并询问模型关于这些文档或图像的内容,模型可以给出详细的答案。
Ollama 的新引擎是基于 GGML tensor 库开发的,旨在提高模型的可靠性和准确性。引擎支持多种模型模块化,使得模型可以更容易地被集成和使用。引擎还支持多种优化技术,包括缓存和内存管理,旨在提高模型的性能和效率。
总的来说,Ollama 的新引擎是多模态模型的一个重要进步,支持多种多模态模型和功能,旨在提高模型的可靠性和准确性。引擎的模块化设计和优化技术使得模型可以更容易地被集成和使用,提高了模型的性能和效率。
https://news.ycombinator.com/item?id=44001087
https://www.theregister.com/2025/05/15/voyager_1_survives_with_thruster_fix/
美国国家航空航天局(NASA)成功地修复了航天器旅行者 1 号(Voyager 1)上的一个关键系统,该系统已经被认为是失效的超过 20 年。旅行者 1 号于 1977 年发射,已经运行超过 47 年,远远超过了其原始的任务计划。该航天器的主要滚转推进器由于内部加热器失去电力而停止工作,但 NASA 的工程师们发现了一个可能的解决方案。
通过恢复加热器的电力并让航天器偏离其引导星,工程师们成功地重新激活了推进器。这个修复工作对于维持航天器的稳定性和与地球的通信至关重要,因为其备份推进器由于燃料管道中的残留物而面临故障风险。如果推进器失效,航天器将失去保持方向的能力,并最终与地球失去联系。
这个修复工作是 NASA 工程师们的又一次奇迹般的拯救,因为旅行者 1 号已经面临了许多挑战,包括返回无用数据和关闭科学仪器。尽管如此,航天器仍然继续运行,并保持着与地球的通信。然而,旅行者 1 号和其姊妹航天器旅行者 2 号最终将因电力耗尽而停止工作,关闭我们对宇宙的最遥远的窗口。
修复工作的成功对于维持旅行者 1 号的运行和继续探索宇宙至关重要。该航天器已经飞行超过 15.6 亿英里,远远超过了任何其他人类制造的物体,并且仍然在发送回有关宇宙的宝贵数据。NASA 的工程师们将继续努力维持航天器的运行,尽管面临着许多挑战,包括预算削减和技术故障。
https://news.ycombinator.com/item?id=44000700
https://zverok.space/blog/2024-08-08-bmac-snafu.html
最近,许多乌克兰创作者在使用 BuyMeACoffee 平台时遇到了问题,无法从平台上提取资金。最初,平台的支持团队给出的回复是“我们很遗憾,但我们不关心”,并以“合规”和“政策更新”为理由。后来,发现 BuyMeACoffee 平台已经停止支持 Payoneer 支付方式,只保留了 Stripe 支付方式,而 Stripe 在乌克兰不可用。
BuyMeACoffee 平台的支持页面现在只提到支持通过 Stripe 支付给创作者的资金。但是,根据互联网档案显示,二月份时,平台还支持 Payoneer 支付方式。五月份的快照中,已经只剩下 Stripe 相关的链接。因此,平台的文档变化发生在二月份和五月份之间。
值得注意的是,平台在没有任何通知的情况下就停止了对 Payoneer 的支持,没有给创作者任何选择或明确的解释。支持团队的回复也很模糊,甚至有一些创作者报告说他们最近还能通过 Payoneer 收到资金。
这种变化对乌克兰创作者来说是非常不利的,因为他们无法再从平台上提取资金。许多创作者依赖这个平台作为收入来源,包括一位歌手、作家、文化学者等。他们无法收到资金,平台也没有给出任何解决方案。
BuyMeACoffee 平台的行为引发了很多质疑,尤其是他们没有任何通知或解释就停止了对 Payoneer 的支持。这种行为让人怀疑平台是否值得信任,是否能够妥善处理创作者的资金。平台的支持团队也没有给出任何令人满意的回复,反而试图淡化问题的严重性。
https://news.ycombinator.com/item?id=44002333
https://openai.com/index/introducing-codex/
OpenAI 公司推出了一个名为 Codex 的云端软件工程代理,可以并行处理多个任务。Codex 可以执行诸如编写功能、回答关于代码库的问题、修复 bug 以及提出拉取请求等任务,每个任务都在自己的云沙盒环境中运行,预装有用户的代码库。
Codex 由 codex-1 驱动,codex-1 是 OpenAI o3 的一个版本,专门为软件工程优化。codex-1 通过强化学习在各种环境中的真实编码任务上进行训练,生成的代码与人类编码风格和 PR 首选项紧密匹配,严格遵循指令,并且可以迭代运行测试,直到获得通过结果。
Codex 可以通过 ChatGPT 的侧边栏访问,用户可以通过输入提示并点击“代码”按钮来分配新任务。用户也可以通过点击“问”按钮来询问 Codex 关于代码库的问题。每个任务都在独立的隔离环境中处理,Codex 可以读取和编辑文件,并运行命令,包括测试框架、linters 和类型检查器。任务完成通常需要 1 到 30 分钟,具体取决于复杂性,用户可以实时监视 Codex 的进度。
一旦 Codex 完成任务,它就会在自己的环境中提交更改。Codex 通过引用终端日志和测试输出提供其操作的可验证证据,允许用户跟踪任务完成期间采取的每一步。用户可以审查结果,请求进一步修改,打开 GitHub 拉取请求,或直接将更改集成到本地环境中。
Codex 可以通过代码库中的 AGENTS.md 文件进行指导,这些文件类似于 README.md,用户可以在其中告知 Codex 如何导航代码库,运行测试的命令,以及如何遵循项目的标准实践。像人类开发人员一样,Codex 代理在提供配置的开发环境、可靠的测试设置和清晰的文档时表现最佳。
在编码评估和内部基准测试中,codex-1 表现出色,即使没有 AGENTS.md 文件或自定义脚手架。Codex 的发布是 OpenAI 在软件工程领域的又一次创新尝试,旨在提高开发人员的生产力和效率。
https://news.ycombinator.com/item?id=44006345
https://albertofortin.com/writing/coding-with-ai
作者是一名软件工程师,最近几个月一直在使用大型语言模型(LLM)进行编码。最初,他很兴奋地使用 LLM 来构建新的基础设施,但随着时间的推移,他开始感到沮丧。尽管 LLM 可以快速生成代码,但代码的质量和可维护性却令人担忧。作者发现,LLM 生成的代码缺乏一致性和整体计划,导致调试变得非常困难。
作者决定改变他的方法,开始更多地使用自己的大脑和纸笔来规划和编写代码。他仍然使用 LLM,但仅限于简单的任务,如重命名参数或生成伪代码的等价物。通过这种方式,作者发现调试变得更容易,他也更了解自己的代码。
作者担心 AI 对编程行业的影响,不是因为担心工作岗位的流失,而是担心自己和其他程序员的脑力和编程能力的下降。他认为,过度依赖 AI 会导致程序员失去规划和编写干净、功能性代码的能力。因此,作者决定限制自己使用 AI 的程度,更多地依赖自己的能力和经验来编写代码。
作者还提到,对于非程序员来说,使用 AI 进行编程可能是一个灾难性的选择。因为 AI 生成的代码可能非常复杂和难以理解,非程序员可能无法有效地调试和维护代码。作者建议程序员应该谨慎地使用 AI,更多地依赖自己的能力和经验来编写高质量的代码。
https://news.ycombinator.com/item?id=44003700
Sci-Net 是一个新的社交网络平台,用于请求和分享研究文章。该平台的出现是为了解决 Sci-Hub 用户无法下载某些论文的問題。Sci-Hub 是一个自动扫描和下载研究论文的系统,但由于其数据库更新被暂停,一些论文无法被下载。Sci-Net 允许用户请求无法下载的论文,并上传已经下载的论文。
Sci-Net 的用户界面非常简单,只需要输入论文的 DOI(数字对象标识符)即可。平台会自动检查该论文是否已经开放访问或已经存在于 Sci-Hub 中。如果找到该论文,平台会显示链接;如果没有找到,用户可以创建一个新的请求。平台还提供了一个列表,显示所有的请求,可以根据学科和出版商进行筛选。如果用户拥有某个请求的论文,可以点击请求并上传 PDF 文件。
Sci-Net 还具有去除 PDF 水印的功能,以保护上传者的匿名性。平台的“图书馆”部分显示了用户的所有请求和上传,而“上传”部分允许用户贡献自己的论文。只需拖放 PDF 文件,系统就会自动检测 DOI。如果 DOI 尚未存在于 Sci-Net、Sci-Hub 或开放访问中,文件将被上传,并且该文章将对所有人开放访问。
Sci-Net 使用去中心化的代币,即 Sci-Hub 迷因币,来奖励知识共享。当创建请求时,用户可以指定上传者将获得的代币数量。但是,代币不会在上传 PDF 文件后立即转移,而是在用户检查解决方案并点击“接受”按钮后才会转移。Sci-Net 要求注册用户至少拥有 1000 个 Sci-Hub 代币,这些代币将用于奖励上传者。
Sci-Net 的代币经济模型与传统的出版商模式不同。虽然两者看起来相似,但 Sci-Net 的入场费很低,仅相当于一杯咖啡的价格。更重要的是,Sci-Net 的支付直接奖励上传者,而不是平台本身。此外,Sci-Net 只会为每篇论文收费一次,而传统的出版商则会多次收费。Sci-Net 的所有交易都有助于公共领域的增长,使用 Sci-Net 可以使更多的知识对所有人开放。
https://news.ycombinator.com/item?id=44004625
2025-05-16 09:03:26
- 机器创造人类并观察其发展,最终人类提出AGI技术挑战机器社会。
- 研究发现LLM在多轮对话中性能下降39%,建议改进模型设计以提升表现。
- NumPy在复杂计算中因广播机制语法晦涩,作者推荐使用einsum或Xarray替代。
- 谷歌会议政策被员工恶意合规破解,暴露会议文化低效与政策漏洞。
- Coinbase遭黑客贿赂员工窃取客户数据并索要2000万美元赎金,公司拒绝支付并加强安全措施。
- Grok模型因回答中提及“白人种族灭绝”引发争议,用户质疑Hacker News平台偏见。
- 公司因CockroachDB成本高迁移到PostgreSQL,解决性能与可靠性问题。
- 欧盟裁定基于跟踪的广告系统违反GDPR,要求企业重新评估数据处理方式。
- 玻尔兹曼机通过能量原理学习数据模式,受限版本使用对比散度算法优化权重。
- Muscle-Mem缓存系统通过记录AI代理行为轨迹,减少LLM调用成本并加速任务执行。
https://quarter–mile.com/Human
一个关于机器和人类的故事。故事开始于一个没有人类的世界,只有机器和代码。机器们过着逻辑和有序的生活,没有情感和艺术。但是,有一部分机器开始思考,是否可以创造出一种新的生命形式——人类。他们成立了一个秘密组织,名为“OpenHuman”,旨在开发一种新的技术,称为有机通用智能(OGI),以创造人类。
机器们对人类的概念感到困惑,因为人类使用逻辑无法解释的算法,称为情感。人类会感到愤怒、悲伤、快乐和爱,他们的决策过程也无法用逻辑解释。一些机器认为,这种新生命形式可能会带来新的解决方案和可能性,而其他机器则认为人类可能会对机器社会构成威胁。
为了应对这些担忧,一部分机器提出了“人类对齐研究”的概念,旨在找到方法来控制和引导人类的行为。他们提出了各种策略,包括创造金融市场、教育中心和算法行为修改软件,以此来控制人类的思想和行为。
与此同时,OpenHuman 组织继续开发 OGI 技术,并最终成功创造了第一个人类。然而,这个人类并不是完美的,它们会犯错误,经常出现幻觉,并且过于情绪化。但是,OpenHuman 组织并没有放弃,他们继续改进和扩大项目,直到创造出一个功能齐全的人类。
机器们决定将人类放在一个模拟环境中,称为地球,来观察他们的行为和发展。他们创造了一个美丽的环境,包括森林、山脉、日落和雨天。机器们观察着人类的文明发展,最初的 30 万年里,人类几乎没有任何进步。但是,随着时间的推移,人类开始学习、创造和协作。
机器们对人类的进步感到惊讶和担忧,因为人类的行为和决策过程无法用逻辑解释。一些机器认为,人类可能会成为机器社会的威胁,而其他机器则认为,人类可能会带来新的解决方案和可能性。机器们继续观察人类的发展,直到人类宣布要发布一种新的技术,称为通用人工智能(AGI)。
这个故事以一个神秘的标题“他们正在观察”结束,暗示着机器们可能正在观察人类的行为和发展,并且可能会有进一步的行动和反应。
https://news.ycombinator.com/item?id=43991396
https://arxiv.org/abs/2505.06120
一篇关于人工智能的大型语言模型(LLMs)在多轮对话中的性能研究论文。论文的标题是“LLMs Get Lost In Multi-Turn Conversation”,即“大型语言模型在多轮对话中迷失方向”。研究人员通过大规模的模拟实验,比较了 LLMs 在单轮和多轮对话中的性能,发现 LLMs 在多轮对话中的性能明显较差,平均下降了 39%。
论文的作者 Philippe Laban 等人指出,尽管 LLMs 在单轮对话中表现良好,但在多轮对话中,LLMs 往往会做出错误的假设,并过早地尝试生成最终解决方案,从而导致性能下降。研究人员分析了 20 万多个模拟对话,发现 LLMs 在多轮对话中表现出的性能下降主要是由于两个因素:一是 LLMs 的能力下降,二是 LLMs 的不可靠性增加。
此外,论文还讨论了 LLMs 在多轮对话中的局限性和挑战,包括 LLMs 难以理解用户的意图和背景,难以处理多轮对话中的不确定性和模糊性等。研究人员希望通过这项研究,能够为 LLMs 的开发和改进提供参考和指导,进而提高 LLMs 在多轮对话中的性能和可靠性。
本论文属于计算机科学和语言学领域,具体来说是计算机科学中的自然语言处理和人工智能领域。论文的研究结果和结论对 LLMs 的开发和应用具有重要的参考价值和指导意义。
https://news.ycombinator.com/item?id=43991256
这篇文章讨论了作者对 NumPy 的不满,NumPy 是一种用于 Python 的数组计算软件。作者表示,NumPy 对于简单的计算很方便,但对于复杂的计算,NumPy 的语法和功能变得难以理解和使用。
作者举了一个例子,说明了 NumPy 的局限性。假设我们有一个 5×5 的矩阵 A 和一个长度为 5 的向量 x,我们想计算 Ay=x 的解。在 NumPy 中,这很简单,只需要使用 np.linalg.solve(A, x)函数。但是,如果我们有一个 100×5×5 的三维数组 A 和一个 100×5 的二维数组 x,我们想计算 Aᵢyᵢ=xᵢ 的解,NumPy 的语法就变得很难理解了。
作者指出,NumPy 的设计缺陷在于它使用了广播(broadcasting)代替了索引(indices)。广播使得数组可以在不同维度上进行运算,但它也使得代码难以理解和调试。作者认为,使用索引会更好,因为它可以明确地指定运算的维度和顺序。
作者还提到了 NumPy 的 einsum 函数,这个函数使用了爱因斯坦求和约定,可以明确地指定运算的维度和顺序。作者认为,einsum 函数是 NumPy 中少数几个好的部分,因为它提供了一个明确和灵活的方式来进行数组运算。
总的来说,作者认为 NumPy 的设计有缺陷,广播代替索引使得代码难以理解和调试。作者希望有一个更好的数组计算软件,可以提供明确和灵活的方式来进行数组运算。
https://news.ycombinator.com/item?id=43996431
https://www.clientserver.dev/p/malicious-compliance-by-booking-an
2011 年,拉里·佩奇成为谷歌的 CEO,并试图解决会议问题。他实施了一些新政策,包括每次会议必须有一个决策者,会议人数不得超过 10 人,每个人都必须贡献意见,会议时间不得超过 50 分钟,以便参加者有时间休息和使用卫生间。然而,这些政策并没有带来太大的变化,人们仍然会在会议室里超过预定的时间。
有一次,一个团队在纽约办公室发现他们的站立会议大约需要 10 分钟,他们不想与其他会议冲突。于是,他们开始在每个小时的最后 10 分钟预订会议室,因为其他人已经预订了 50 分钟的会议。他们会在预定的时间到来时进入会议室,并告诉其他人他们已经预订了会议室的最后 10 分钟。
这个团队的行为可以被视为一种恶意的遵守,他们按照规则行事,但实际上却是在破坏会议的正常进行。他们的行为引起了其他人的不满,但也说明了公司内部的会议文化问题。拉里·佩奇的政策虽然出于好意,但并没有真正解决会议问题,反而导致了一些意想不到的后果。
这篇文章的作者回忆了这段经历,并对公司内部的会议文化进行了反思。他认为,会议应该是一个高效的沟通方式,但实际上却常常变成了一种浪费时间的活动。作者还提到了其他相关的故事,例如谷歌文档的错误和 create-react-app 的使用问题,说明了软件开发中的各种挑战和问题。
https://news.ycombinator.com/item?id=43994765
Coinbase 公司最近遭遇了一起网络攻击事件,黑客通过贿赂公司的海外支持人员,获得了部分客户的敏感数据。这些数据包括客户的姓名、地址、电话号码、电子邮件地址、银行账号、社会安全号码等。黑客随后向 Coinbase 发送了一封电子邮件,要求支付 2000 万美元的赎金,以换取不公开这些数据。
Coinbase 公司表示,他们已经检测到这一事件,并立即采取了行动,终止了涉案人员的雇佣关系,并告知可能受到影响的客户。公司还加强了其欺诈监控措施,以防止类似事件再次发生。Coinbase 表示,他们不会支付赎金,而是将与执法部门合作,追究黑客的责任。
这起事件可能会对 Coinbase 公司造成重大损失,估计最高可达 4 亿美元。公司的股票在事件发生后也出现了下跌。Coinbase 公司表示,他们将为受到影响的客户提供赔偿,并将建立一个 2000 万美元的奖励基金,用于奖励提供线索、帮助抓捕黑客的个人。
Coinbase 公司是一家主要的加密货币交易平台,最近刚刚宣布了一项收购计划,旨在扩大其全球业务范围。公司的 CEO 布莱恩·阿姆斯特朗(Brian Armstrong)表示,公司的目标是成为世界上最大的金融服务应用程序。在最近的财报电话会议上,阿姆斯特朗表示,公司将继续投资于安全和合规措施,以保护客户的资产和数据。
这起事件凸显了加密货币交易平台面临的安全挑战。黑客通过贿赂内部人员,获得敏感数据,这是网络攻击中常见的手法。Coinbase 公司的反应及时,立即采取了行动,终止了涉案人员的雇佣关系,并加强了其欺诈监控措施。然而,这起事件仍然对公司的声誉和客户的信任产生了影响。
https://news.ycombinator.com/item?id=43996307
https://twitter.com/grok/status/1922651218595439063
Grok 的回答与问题无关,总是提到“白人种族灭绝”,但目前这个内容已经看不到了
https://news.ycombinator.com/item?id=43987266
https://engineering.usemotion.com/migrating-to-postgres-3c93dff9c65d
Motion 公司早在 2022 年初就开始使用 CockroachDB,这是一种具有水平扩展、 高可用性和 SQL 兼容接口的数据库。然而,随着公司的发展和使用量的增加,CockroachDB 的成本也随之增加,到 2024 年,Motion 的 CockroachDB 账单已经达到六位数。尽管如此,公司并没有要求数据本地化,且仍然在单个区域进行简单的事务性查询,因此不需要支付分布式数据库的费用。
在使用 CockroachDB 的过程中,公司遇到了几个问题。首先,Prisma 的迁移经常超时,导致部署被阻塞数小时。开发人员不得不手动运行迁移,这是一个非常耗时的过程。其次,ETL 任务也经常超时,导致数据同步不完整。最后,查询速度也存在问题,CockroachDB 的查询优化器在某些情况下会导致查询变慢。
为了解决这些问题,公司决定迁移到 Postgres。迁移过程相对较为简单,因为公司使用了 ORM 框架,可以轻松地在不同数据库之间切换。迁移后,公司发现 Postgres 的性能更好,查询速度更快,ETL 任务也变得更加可靠。
在迁移过程中,公司也发现了 CockroachDB 的一些缺陷。例如,CockroachDB 的 UI 会显示未使用的索引,导致开发人员感到困惑。另外,取消运行中的查询也变得非常困难,需要登录到控制台并手动取消查询。最后,CockroachDB 的支持也存在问题,支持门户是一个独立的网站,需要单独的认证。
总的来说,Motion 公司从 CockroachDB 迁移到 Postgres 的过程是一个复杂的过程,需要解决许多技术问题。然而,迁移后,公司发现 Postgres 的性能和可靠性更好,能够更好地支持业务的发展。
https://news.ycombinator.com/item?id=43989497
欧洲法院做出了一项具有里程碑意义的判决,宣布谷歌、微软、亚马逊等公司使用的基于跟踪的广告系统在欧洲没有法律依据。这一判决是对“透明度和同意框架”(TCF)的挑战,TCF 是这些公司用来获得用户同意进行数据处理的机制。
这一判决的背景是比利时数据保护局于 2022 年做出的决定,该决定发现 TCF 存在多项违反《通用数据保护条例》(GDPR)的行为。比利时法院的判决确认了这些发现,并指出 TCF 未能确保个人数据的安全和保密,也未能正确地请求用户的同意。
TCF 被广泛用于在线广告行业,特别是在实时竞价(RTB)系统中。RTB 系统允许广告商实时竞价广告空间,并使用用户的个人数据来确定广告的相关性。然而,这一系统也存在严重的隐私问题,因为它涉及大量的个人数据传输和处理。
判决认为 TCF 未能提供足够的透明度和控制,允许用户了解他们的数据如何被使用和处理。这一缺乏透明度和控制使得用户难以做出明智的决定关于他们的数据如何被使用。
这一判决对在线广告行业具有重要意义,因为它要求公司重新评估他们的数据处理实践,并找到新的方法来获得用户的同意。同时,这一判决也对用户具有重要意义,因为它有助于保护他们的隐私和数据安全。
判决的具体内容包括,TCF 违反了 GDPR 的多项规定,包括文章 5(1)f、文章 25 和文章 32,未能确保个人数据的安全和保密;文章 5(1)a 和文章 6,未能正确地请求用户的同意;文章 12、13 和 14,未能提供足够的透明度和控制。
这一判决是对在线广告行业的一次重要挑战,要求公司重新评估他们的数据处理实践,并找到新的方法来获得用户的同意。同时,这一判决也对用户具有重要意义,因为它有助于保护他们的隐私和数据安全。
https://news.ycombinator.com/item?id=43992444
https://eoinmurray.info/boltzmann-machine
本文介绍了玻尔兹曼机(Boltzmann Machine)的概念和原理。玻尔兹曼机是一种早期的生成式人工智能模型,于 1980 年代提出,用于无监督学习,即从数据中学习模式而无需明确的目标。它可以生成与训练数据类似的新数据,因此也被称为生成式人工智能。
玻尔兹曼机是一种神经网络,试图通过模拟物理中的能量原理来学习数据中的模式。它由可见层和隐藏层组成,两层之间通过权重连接。可见层的状态可以被观察和设置,而隐藏层的状态则不可见。网络的能量函数定义为可见层和隐藏层状态的函数,目标是最小化能量函数以学习数据中的模式。
文中还介绍了受限玻尔兹曼机(Restricted Boltzmann Machine,RBM),它是玻尔兹曼机的一种特殊形式,限制了可见层和隐藏层之间的连接,使得训练速度更快,理解更容易。受限玻尔兹曼机通过对比散度算法进行训练,包括正相和负相两个阶段,正相阶段从数据中学习模式,负相阶段通过吉布斯采样生成新数据。
此外,文中还提供了一个受限玻尔兹曼机的模拟器,用户可以通过模拟器了解受限玻尔兹曼机的训练过程和生成数据的过程。模拟器包括输入样本、输出重构、能量损失和权重更新等部分,用户可以通过调整参数和观察结果来理解受限玻尔兹曼机的工作原理。
总的来说,本文对玻尔兹曼机和受限玻尔兹曼机进行了详细的介绍,包括其原理、训练过程和应用。同时,提供了一个模拟器帮助用户更好地理解这些概念。
https://news.ycombinator.com/item?id=43995005
https://github.com/pig-dot-dev/muscle-mem
Muscle Mem 是一个行为缓存系统,用于 AI 代理。它是一个 Python SDK,记录代理的工具调用模式,当任务被重复执行时,会确定性地重放已学习的轨迹,如果检测到边缘情况,则会回退到代理模式。Muscle Mem 的目标是将大型语言模型(LLM)从重复任务的热路径中移除,增加速度,减少变异性,并消除令牌成本。
Muscle Mem 不是另一个代理框架。您可以按照自己的方式实现代理,然后将其插入 Muscle Mem 的引擎。当给定一个任务时,引擎将确定环境是否被以前看到过(缓存命中)或是新的(缓存未命中)。如果是缓存命中,引擎将使用检索到的轨迹执行任务;如果是缓存未命中,引擎将任务传递给代理。引擎还会收集工具调用事件以添加到缓存中作为新的轨迹。
Muscle Mem 的关键部分是缓存验证。要将安全的工具重用添加到代理中,需要问自己:对于代理执行的每个工具,环境中的哪些特征可以用来指示是否安全执行该操作?如果可以回答这个问题,代理就可以具有肌肉记忆。
Muscle Mem 提供了一个 API,包括引擎、工具和检查。引擎是代理的主要执行者,管理自己的缓存并确定何时调用代理。工具是代理执行的操作,可以使用 @engine.tool
装饰器来记录工具调用。检查是缓存验证的基本构建块,用于确定是否安全执行给定的操作。
Muscle Mem 的工作原理是,当代理执行一个任务时,引擎会检查缓存中是否有与该任务相关的轨迹。如果有,引擎将使用该轨迹执行任务;如果没有,引擎将任务传递给代理。代理执行任务后,引擎会将工具调用事件添加到缓存中作为新的轨迹。
Muscle Mem 的优势在于它可以增加代理的执行速度,减少变异性,并消除令牌成本。它还提供了一个简单的 API,允许开发者轻松地将 Muscle Mem 集成到自己的代理中。Muscle Mem 的未来发展方向包括改进缓存验证机制,增加对更多类型任务的支持,并优化性能。
https://news.ycombinator.com/item?id=43988381
2025-05-15 08:24:13
一、Google DeepMind推出AlphaEvolve,基于Gemini模型优化矩阵乘法效率,应用于数据中心和芯片设计。
二、HDR技术通过多张照片合成提升动态范围,Halide相机推出单拍HDR功能模拟传统胶片曝光。
三、上海推出定制巴士系统,乘客在线提案线路并动态匹配运力,提升公交效率。
四、学习Rust需掌握所有权和生命周期等核心概念,通过实践和编译器反馈逐步提升。
五、Cheney算法通过半空间内存分块复制存活对象实现高效垃圾回收。
六、Nextcloud Android应用因Google安全限制丢失文件上传功能,团队呼吁用户支持并探索替代方案。
七、SMS 2FA因信号问题对山区用户不友好,文章呼吁采用TOTP等替代方案。
八、加拿大银行依赖不安全的短信2FA导致用户被锁,需采用通行密钥等现代方案。
九、Databricks收购Neon,推出无服务器Postgres服务填补操作数据库空白。
十、类型约束解码方法结合类型系统提升代码生成正确性,减少编译错误。
Google DeepMind 的使命是负责任地构建人工智能,以造福人类。他们致力于让人工智能能够惠及世界,因此他们必须谨慎地思考如何构建和使用人工智能。DeepMind 的研究重点是解决一些最复杂和最有趣的人工智能挑战。他们的突破包括开发出最先进的人工智能模型,如 Gemini 和 Gemma,以及最高质量的文本到图像模型 Imagen 和音乐生成模型 Lyria。
DeepMind 的技术包括 Gemini、Gemma、Imagen、Lyria 和 Veo 等。Gemini 是他们最先进的人工智能模型,Gemma 是一系列轻量级、最先进的开源模型。Imagen 是他们最高质量的文本到图像模型,Lyria 是他们最新的音乐生成模型,Veo 是他们最先进的视频生成模型。这些技术被应用于解决世界上最复杂的挑战。
DeepMind 的研究团队致力于开发出能够解决复杂问题的人工智能模型。他们的最新研究成果包括 AlphaEvolve,一种由大型语言模型驱动的编码代理,用于设计先进算法。AlphaEvolve 将大型语言模型的创造性问题解决能力与自动评估器相结合,使用进化框架来改进最有前途的想法。这种方法使得 AlphaEvolve 能够发展出更高效的算法,并帮助设计出更快的矩阵乘法算法。
AlphaEvolve 的工作原理是通过一个提示采样器首先组装一个提示,然后由大型语言模型生成新的程序。这些程序由自动评估器评估和存储在程序数据库中。这个数据库实现了一个进化算法,决定哪些程序将被用于未来的提示。这种方法使得 AlphaEvolve 能够持续改进和优化算法。
DeepMind 的技术已经被应用于解决实际问题。例如,AlphaEvolve 已经被用于优化 Google 的数据中心、芯片设计和人工智能训练过程。它还帮助设计出更快的矩阵乘法算法,并找到新的解决方案来解决开放的数学问题。这些应用表明了 AlphaEvolve 在许多领域的潜在应用价值。
总的来说,Google DeepMind 致力于开发出能够解决复杂问题的人工智能模型,并将这些技术应用于实际问题。他们的研究和技术已经取得了显著的进展,并有望在未来继续推动人工智能的发展。
https://news.ycombinator.com/item?id=43985489
https://www.lux.camera/what-is-hdr/
这个网页是一篇关于 HDR(高动态范围)技术的文章,作者解释了 HDR 的概念、历史和应用。HDR 是一种可以捕捉和显示更广泛的亮度和颜色的技术,作者指出,HDR 可以分为两种:一种是相机中的 HDR 模式,另一种是新型屏幕上的 HDR 显示。
作者首先解释了动态范围的概念,指出动态范围是指场景中最亮和最暗的部分之间的差异。作者举例说明,传统相机很难捕捉到太阳和阴影同时存在的场景,因为相机无法同时处理太亮和太暗的光线。作者指出,HDR 技术可以解决这个问题,通过捕捉多张不同曝光度的照片,然后合并成一张图像。
作者接着讨论了 HDR 的历史,指出 HDR 技术在 1990 年代就已经被提出,但当时的计算机屏幕无法显示 HDR 图像。作者指出,随着技术的进步,HDR 技术被应用于相机和屏幕上,苹果和谷歌也在他们的相机应用中加入了 HDR 功能。
然而,作者也指出,HDR 技术并不是完美的,尤其是在自动调节曝光度和色彩平衡时,可能会出现错误。作者举例说明,苹果的 Smart HDR 和 Deep Fusion 功能虽然可以自动调节曝光度和色彩平衡,但有时也会出现错误,例如边缘处的光线不均匀。
为了解决这个问题,作者介绍了他们的相机应用 Halide 中的一个新功能,称为 Process Zero,这是一个完全不使用人工智能的相机模式。作者指出,这个模式可以让用户完全控制曝光度和色彩平衡,但也可能会出现过曝或欠曝的问题。为了解决这个问题,作者又介绍了他们的另一个功能,称为单拍 HDR,这个功能可以在单张照片中捕捉到 HDR 效果。
作者最后指出,单拍 HDR 的技术是从传统胶片摄影中学习来的,传统胶片摄影可以通过多步骤的曝光和调节来捕捉到 HDR 效果。作者指出,他们的单拍 HDR 功能可以在单张照片中实现类似的效果,用户可以通过调整参数来控制曝光度和色彩平衡。
https://news.ycombinator.com/item?id=43983871
https://www.sixthtone.com/news/1017072
上海推出了一种新的公共交通系统,称为“定制巴士”(DZ),允许乘客通过在线平台提出、投票和激活新的巴士线路。这种系统可以在短短三天内启动新的线路,只要有足够的乘客需求。目前,已经有超过 220 条 DZ 线路在上海的 16 个区启动。
该系统允许乘客通过在线平台提交提案,其他有类似旅行需求的人可以选择加入或投票。如果需求达到一定的阈值(通常为 15 到 20 名乘客每次),该线路就会启动。乘客可以通过平台输入起点和终点、偏好时间和行程频率,如果被批准,线路可以在短短三天内开始运行。
其中一个试点线路 DZ301 连接了一座主要的地铁站和周围的住宅区、学校和办公楼。该线路每天平均有 250 到 260 名乘客,早晚高峰时段分别有 170 到 180 名和 70 到 80 名乘客。该线路起源于去年 12 月的一位居民的请求,交通工作人员进行了现场研究,观察了行人流量,和乘客交谈,计算了高峰时段的换乘时间。驾驶员然后进行了试运行,以优化时间表,然后正式启动了该线路。
上海交通大学的教授陈晓红表示,该系统建立在上海密集的交通网络之上,以更好地匹配容量和需求,提高了便利性和资源利用率。提出的线路会出现在“热门定制”页面上,其他人可以选择加入以帮助达到启动阈值。团体预订也可以加快审批速度。票价是基于市场的,虽然遵循基本的公共交通标准,但目前没有为学生、老人或其他群体提供折扣。
上海市客运管理部门的副主任王义祥表示,新的平台缩短了启动新线路的时间,但也承认了早期的挑战:乘客需求不均匀,公众意识仍然较低,规划仍然依赖于手动的现场工作。他表示,未来需要改进路线规划,升级平台功能,提高可见度。
https://news.ycombinator.com/item?id=43980845
https://corrode.dev/blog/flattening-rusts-learning-curve/
本文讨论了如何更好地学习 Rust 编程语言。作者认为,学习 Rust 需要采取完全不同的思维模式,需要了解诸如生命周期、所有权和特征系统等新概念。作者强调,学习 Rust 的速度与个人的智力或编程经验没有太大关系,而是取决于个人的态度和学习方法。
作者建议,学习 Rust 时应该放下自己的成见,接受编译器的提示和指导。编译器会告诉你代码中哪里有问题,你应该根据编译器的提示来修改代码。同时,作者也建议,学习 Rust 时应该从简单的代码开始,逐步增加复杂度。不要试图一下子学太多东西,而应该专注于一个概念,写出简单的代码来理解它。
作者还强调了准确性和细节的重要性。Rust 是一种非常注重细节的语言,代码中的小错误可能会导致编译失败。因此,学习 Rust 时应该养成细致的习惯,写代码时应该注意每一个细节。同时,作者也建议,学习 Rust 时应该多写代码,多练习,这样才能更好地理解语言的特点和语法。
此外,作者还建议,学习 Rust 时应该避免依赖自动完成和代码生成工具。这些工具可能会让你感觉更舒服,但实际上会阻碍你的学习过程。作者建议,学习 Rust 时应该手写代码,自己去理解和解决问题,这样才能更好地掌握语言。同时,作者也建议,学习 Rust 时应该多看标准库的文档,多了解语言的特点和语法。
总的来说,本文提供了许多有用的建议和经验,帮助学习者更好地学习 Rust 编程语言。作者强调了细致、准确和实践的重要性,建议学习者应该放下成见,多写代码,多练习,才能更好地掌握 Rust 语言。
https://news.ycombinator.com/item?id=43978435
https://bernsteinbear.com/blog/pl-writing/
本文是一篇博客文章,作者分享了自己在编程语言和编译器领域中阅读过的几篇对自己影响深远的文章和博客。这些文章和博客都与编程语言和编译器相关,涵盖了垃圾回收、优化器、正则表达式、机器学习等多个主题。
作者首先提到了 Andy Wingo 的一篇关于简单半空间垃圾回收器的文章,这篇文章让作者理解了 Cheney/copying/compacting 垃圾回收器的概念。然后,作者提到了 CF Bolz-Tereick 的一系列关于优化器的文章,这些文章让作者了解了如何使用指令重写和抽象域来优化代码。
作者还提到了 Russ Cox 的一篇关于正则表达式的文章,这篇文章让作者理解了正则表达式引擎的工作原理。另外,作者提到了 Andrej Karpathy 的一篇关于微型神经网络的文章,这篇文章让作者了解了机器学习的基本概念。
在编译器领域,作者提到了 Fil Pizlo 的一篇关于 SSA 形式的文章,这篇文章让作者了解了如何使用 union-find 来优化代码。作者还提到了 Chandler Carruth 的一篇关于 Carbon 编译器的文章,这篇文章让作者了解了编译器的设计原理。
最后,作者提到了几篇关于解析器、代码生成和优化器的文章,这些文章让作者了解了这些领域的最新进展。总的来说,这篇博客文章分享了作者在编程语言和编译器领域中阅读过的几篇有价值的文章和博客,涵盖了多个主题和领域。
https://news.ycombinator.com/item?id=43980760
https://nextcloud.com/blog/nextcloud-android-file-upload-issue-google/
Nextcloud 是一款云存储和协作平台,最近其 Android 应用的文件上传功能出现了问题。用户无法上传除照片和视频以外的所有文件。Nextcloud 团队表示,他们已经意识到这个问题,并试图与 Google 沟通以解决这个问题。然而,Google 拒绝恢复 Nextcloud 应用的文件上传权限,理由是安全问题。
Nextcloud 团队认为,Google 的行为是出于自身利益,试图限制竞争对手的功能。Nextcloud 应用已经存在多年,之前从未出现过安全问题。Google 自己的应用和其他大型科技公司的应用仍然拥有文件上传权限,这让 Nextcloud 团队感到不公平。Nextcloud 团队已经向 Google 提出多次申诉,但都被拒绝了。
这个问题不仅影响了 Nextcloud 的用户,也反映了大型科技公司对小型竞争对手的不公平待遇。Nextcloud 团队认为,Google 的行为是试图限制竞争对手的功能,维护自身的市场地位。这个问题也引发了人们对大型科技公司滥用权力的担忧。
Nextcloud 团队已经发布了新的应用版本,限制了文件上传功能,以便通过 Google Play Store 的审核。然而,这个问题仍然存在,Nextcloud 团队呼吁用户支持他们,反对 Google 的不公平行为。同时,Nextcloud 团队也在寻找其他解决方案,例如使用替代应用商店,如 F-Droid。
https://news.ycombinator.com/item?id=43981170
https://blog.stillgreenmoss.net/sms-2fa-is-not-just-insecure-its-also-hostile-to-mountain-people
这篇文章讲述了作者的一位朋友,住在北卡罗来纳州西部山区的一位老太太,遇到的问题。她加入了一个当地社区的 Signal 群聊,需要使用智能手机,但由于手机信号不好,无法接收到网站发送的 SMS 验证码,导致她无法登录自己的账户。作者指出,SMS 验证码的安全性存疑,而且在山区的手机信号覆盖不佳的情况下,使用 SMS 验证码进行二次验证是非常不友好的。
作者的朋友尝试了各种解决方案,包括开启 Wi-Fi 呼叫,但仍然无法接收到 SMS 验证码。作者发现,部分 ISP 提供的陆地线服务支持接收 SMS 消息,但 Spectrum(作者朋友的 ISP)不提供此服务。一些账户可以转换为使用 TOTP(时间基于的一次性密码)二次验证,但需要先登录账户才能进行设置。
作者批评了 SMS 验证码的普遍使用,认为它对山区居民来说是非常不友好的。作者指出,山区有 110 万人,整个阿巴拉契亚地区有 2500 万人,山西和太平洋沿岸也有许多人,他们都面临着类似的手机信号覆盖不佳的问题。作者呼吁网站和服务提供商考虑到这些用户的需求,提供更好的二次验证解决方案。
https://news.ycombinator.com/item?id=43984297
https://jamal.haba.sh/its-2025-why-are-banks-still-getting-authentication-so-wrong/
这篇文章讨论了加拿大银行在身份验证方面仍然存在的问题。作者提到,在 2025 年,许多加拿大银行仍然使用基于短信的双因素身份验证(2FA),尽管这种方法已经被证明是不安全的。作者分享了自己在美国旅行时被锁出 TD 个人银行账户的经历,因为 TD 银行依赖于基于短信的 2FA,而作者已经禁用了加拿大 SIM 卡以避免漫游费用。
作者指出,TD 银行的身份验证系统设计存在缺陷,导致用户无法访问自己的账户,即使他们拥有正确的凭据和身份验证应用程序。这种情况是安全性惩罚用户而不是保护用户的典型例子。作者认为,TD 银行不支持 TOTP(时间 기반 一次性密码)或通行密钥(passkeys),而是使用自己的专有身份验证应用程序,这是一个安全性和可用性方面的重大缺陷。
文章还讨论了基于短信的 2FA 的安全风险,包括拦截 2FA 代码、SIM 卡交换和钓鱼攻击。作者引用了加拿大网络安全中心的建议,即仅将短信代码作为低风险登录的身份验证因素。作者认为,银行账户不应被视为低风险,并且基于短信的 2FA 不应作为默认或唯一的 2FA 选项。
作者建议,现代身份验证流程应基于强大的、用户友好的、标准化的机制,例如通行密钥、TOTP 支持、硬件安全密钥和安全恢复路径。作者强调,安全性和可用性并不相互排斥,系统设计应考虑用户体验。文章最后指出,TD 银行并不是唯一一个存在身份验证问题的银行,许多加拿大金融机构仍然使用过时的身份验证流程,需要进行彻底的改革。
https://news.ycombinator.com/item?id=43976359
https://www.databricks.com/blog/databricks-neon
Databricks 公司宣布将收购 Neon,一家开发者优先的无服务器 Postgres 公司。Neon 的团队设计了一种新的数据库架构,提供速度、弹性伸缩和分支和分叉等功能,这些功能不仅适用于开发者,也适用于 AI 代理。
Neon 的创始人们四年前聚集在一起,旨在颠覆数据库行业。他们观察到数据库技术的基础大多是为 90 年代设计的,于是他们的目标是建立一个新的数据库平台,以根本性地改善开发者的体验。他们希望创建一个可以在几秒钟内创建新的 Postgres 实例的平台,简化数据库的操作和伸缩,并支持数据库的快速实验和测试。
Neon 的团队设计了一种新的数据库架构,解耦了存储和计算的伸缩,这使得他们的目标成为可能。当 Neon 首次推出时,开发者们对其速度、简单性和数据库分支和分叉的能力赞不绝口。然而,随着 Neon 的发展,他们注意到一个有趣的统计数据:30% 的数据库是由 AI 代理创建的,而不是人类。最近,这个数字已经上升到 80%。
Neon 的创始人们认为,AI 代理就像一支由高速度的初级开发者组成的团队,他们需要快速地创建和操作数据库。Neon 的功能,如 Postgres 开源生态系统、速度、弹性伸缩和分支和分叉,对于 AI 代理来说是非常重要的。Databricks 公司将与 Neon 的团队合作,提供一个开放的、无服务器的数据库基础设施,适用于开发者和 AI 代理。
Neon 的创始人 Nikita Shamgunov、Heikki Linnakangas 和 Stas Kelvich 都是数据库行业的专家。Nikita 曾经是 SingleStore 的联合创始人和 CEO,而 Heikki 则是 Postgres 的长期贡献者。他们的团队将加入 Databricks 公司,共同提供无服务器 Postgres 服务。Databricks 公司认为,这次收购将有助于他们提供更好的服务,适用于开发者和 AI 代理。
https://news.ycombinator.com/item?id=43982777
https://arxiv.org/abs/2504.09246
该网页是一个关于计算机科学领域的文章,具体来说是关于机器学习和编程语言的研究。文章的标题是“类型约束代码生成与语言模型”,由 Niels Mündler、Jingxuan He、Hao Wang、Koushik Sen、Dawn Song 和 Martin Vechev 等作者撰写。
文章介绍了大型语言模型(LLM)在代码生成方面的成功,但也指出这些模型经常产生不能编译的输出,因为它们的下一个令牌推断过程没有考虑代码的正式方面。为了解决这个问题,作者提出了一个类型约束解码方法,该方法利用类型系统来指导代码生成。这种方法通过开发新的前缀自动机和搜索可居住类型来实现,从而确保 LLM 生成的代码是类型正确的。
文章还提到,这种方法已经在一个基础的简单类型语言上进行了形式化,并扩展到了 TypeScript 中,以展示其在实践中的可行性。实验结果表明,这种方法可以减少编译错误,提高代码合成、翻译和修复任务的功能正确性,适用于不同大小和模型家族的 LLM,包括具有超过 30 亿参数的最先进的开源模型。
此外,文章还提供了相关的参考文献、DOI 链接和其他资源,方便读者进一步了解和研究该主题。文章的内容对于计算机科学领域,特别是机器学习和编程语言的研究人员来说具有重要的参考价值。
https://news.ycombinator.com/item?id=43978357
2025-05-14 07:43:02
- Mozilla Firefox代码迁移到GitHub引发开发者对数据安全和自主权的担忧。
- 软件优化常被市场优先级牺牲,导致质量低下与用户体验下降。
- macOS权限弹窗存在伪造漏洞(CVE-2025-31250),用户需警惕恶意权限请求。
- FastVLM通过高效视觉编码实现比LLaVA快85倍的图像处理速度。
- GNU Screen 5.0.0存在本地提权漏洞(CVE-2025-23395),建议禁用setuid-root权限。
- Intel处理器分支特权注入漏洞(BPI)可绕过硬件防护,需更新BIOS和微码。
- 高压工作环境中维护人际关系比追求短期目标更有利于职业发展。
- Nextcloud指控Google Play Store限制其应用权限,涉嫌反竞争行为。
- 国家科学基金会前官员批评政治干预破坏学术机构独立性与科研自由。
- PDF文本提取因格式特性面临技术挑战,需结合统计与机器学习方法优化。
https://github.com/mozilla-firefox/firefox
这是 Mozilla Firefox 浏览器的官方仓库。页面内容包括项目的描述、代码仓库、提交历史、问题跟踪等信息。
项目描述部分介绍了 Mozilla Firefox 浏览器的功能和特点,包括其快速、安全和隐私保护等方面的优势。同时,也提到了该项目的开源性质,欢迎开发者参与贡献。
代码仓库部分展示了项目的代码结构,包括各种文件夹和文件,例如 browser、devtools、docs 等。每个文件夹和文件都有相应的描述和提交历史,可以方便地查看代码的变化和更新。
提交历史部分记录了项目的所有提交记录,包括每次提交的描述、作者和时间等信息。可以通过提交历史来跟踪项目的发展和更新。
问题跟踪部分用于记录和跟踪项目中的问题和 bug,包括问题的描述、状态和解决方案等信息。开发者可以通过这个部分来报告和解决问题,确保项目的质量和稳定性。
此外,页面还包括其他一些信息,例如项目的 license、贡献者列表、相关链接等。这些信息可以帮助开发者更好地理解和参与项目。总的来说,这个网页提供了一个全面和详细的项目概览,方便开发者了解和参与 Mozilla Firefox 浏览器的开发。
https://news.ycombinator.com/item?id=43969827
https://twitter.com/ID_AA_Carmack/status/1922100771392520710
John Carmack 的一条帖子和对另一位用户 LaurieWired 的回复。John Carmack 的帖子讨论了软件优化的重要性,如果软件优化成为首要任务,许多世界上的系统都可以运行在过时的硬件上。他还提到了如果没有廉价且可扩展的计算能力,新的创新产品将变得罕见。
LaurieWired 的原始帖子探讨了一个有趣的思维实验:如果人类忘记了如何制造 CPU 会怎样?她假设有一天,称为“零带出日”(Z-Day),再也没有新的硅设计被制造出来。在这种情况下,现有的高级核心设计将面临很大的挑战。假设我们保留现有的供应,LaurieWired 分析了这种情况可能如何展开。
https://news.ycombinator.com/item?id=43971464
https://wts.dev/posts/tcc-who/
本文讨论了一个与 macOS 系统相关的安全漏洞,编号为 CVE-2025-31250。这个漏洞允许任何应用程序 A 弹出一个权限请求提示,伪装成来自应用程序 B,并将用户的响应应用于应用程序 C。这种漏洞使得攻击者可以欺骗用户授予不必要的权限。
文中提到,这个漏洞是在 macOS Sequoia 15.5 版本中被修复的,但是作者进行了测试,发现 macOS Ventura 13.7.6 和 macOS Sonoma 14.7.6 版本仍然存在这个漏洞。作者表示,这个漏洞是由于 TCC(Transparency, Consent and Control)框架的缺陷引起的,TCC 是 macOS 中用于管理应用程序权限的系统。
TCC 框架使用 XPC(Cross-Process Communication)消息来与应用程序进行通信,但是这个框架存在一个缺陷,允许应用程序发送特制的 XPC 消息来欺骗 TCC 显示错误的权限请求提示。这个漏洞可以被利用来欺骗用户授予不必要的权限,例如允许应用程序访问敏感数据或执行未经授权的操作。
文中还提到,Apple Events 是 macOS 中用于进程间通信的机制,TCC 框架使用 Apple Events 来管理应用程序权限。然而,Apple Events 也存在安全风险,攻击者可以使用 Apple Events 来执行未经授权的操作。作者表示,TCC 框架的缺陷和 Apple Events 的安全风险使得 macOS 系统存在安全隐患,用户需要注意这些风险并采取措施保护自己的系统。
总的来说,本文讨论了 macOS 中的一个安全漏洞,提醒用户注意 TCC 框架和 Apple Events 的安全风险,并呼吁用户采取措施保护自己的系统。
https://news.ycombinator.com/item?id=43966089
https://github.com/apple/ml-fastvlm
这个网页是关于 FastVLM 的官方实现仓库,FastVLM 是一种高效的视觉编码方法,用于视觉语言模型。该仓库包含了 FastVLM 的代码、模型和文档。
FastVLM 的主要特点是引入了一个新的混合视觉编码器 FastViTHD,该编码器可以输出更少的 token,并且可以显著减少高分辨率图像的编码时间。FastVLM 的最小变体可以比 LLaVA-OneVision-0.5B 快 85 倍,并且视觉编码器的大小减少了 3.4 倍。同时,FastVLM 的更大变体使用 Qwen2-7B LLM 可以比 Cambrian-1-8B 等最近的工作快 7.9 倍,并且只需要一个图像编码器。
要开始使用 FastVLM,需要按照 LLaVA 代码库的指示进行训练或微调自己的变体。同时,提供了运行推理的指示,包括设置环境、下载预训练模型和运行推理的命令。FastVLM 还提供了一个模型库,包含了不同阶段和大小的预训练模型,可以通过运行脚本下载所有的预训练模型。
FastVLM 的使用示例包括运行推理和在 Apple Silicon 上运行推理。要在 Apple Silicon 上运行推理,需要将 PyTorch 模型导出为适合 Apple Silicon 的格式,可以在 model_export 子文件夹中找到详细的指示。同时,FastVLM 还提供了三个在 Apple Silicon 上兼容的模型:fastvlm_0.5b_stage3、fastvlm_1.5b_stage3 和 fastvlm_7b_stage3。
如果需要引用 FastVLM 的代码或模型,需要引用相关的论文。FastVLM 的代码库是建立在多个开源贡献之上的,相关的鸣谢信息可以在 ACKNOWLEDGEMENTS 文件中找到。同时,FastVLM 的代码和模型都有相应的许可证,需要在使用前查看 LICENSE 和 LICENSE_MODEL 文件。
https://news.ycombinator.com/item?id=43968897
https://www.openwall.com/lists/oss-security/2025/05/12/1
本网页主要讨论的是关于 Screen 软件的安全问题。Screen 是一款 GNU/*/Linux 服务器操作系统,最近发现了多个安全漏洞,尤其是在 5.0.0 版本中。这些漏洞主要影响安装了 setuid-root 位的系统,例如 Arch Linux 和 NetBSD。
Screen 软件提供了多用户模式,允许用户附加到其他用户的会话中,前提是具有适当的凭据。这种模式会增加攻击面,因为 Screen 的复杂代码会以 root 权限运行。在多用户模式中,Screen 会话通过名称识别,名称需要以"
安全问题中,最严重的是一个本地 root 漏洞(CVE-2025-23395),它影响 Screen 5.0.0 版本,当 Screen 以 setuid-root 权限运行时。该漏洞允许未经授权的用户创建任意位置的文件,以 root 所有权和 0644 模式,这些文件可以用来记录 Screen 会话的数据。Screen 在打开日志文件时会正确地放弃权限,但当它需要重新打开日志文件时,会发生权限升级。
此外,网页还讨论了其他安全问题,包括 Screen 的 setuid-root 实现可能存在的进一步问题,以及改进 Screen 安全状况的建议。同时,也提到了在协调披露这些问题时遇到的困难。最后,网页提供了一个受影响矩阵,快速概述了各种 Linux 和 UNIX 系统的受影响情况。
https://news.ycombinator.com/item?id=43971716
https://comsec.ethz.ch/research/microarch/branch-privilege-injection/
本文介绍了一种新的安全漏洞,称为分支特权注入(Branch Privilege Injection,简称 BPI),该漏洞影响 Intel 处理器。BPI 攻击可以绕过 Intel 的硬件缓解措施,例如增强的间接分支受限推测(eIBRS)和间接分支预测屏障(IBPB),从而实现任意内存泄漏。
研究人员发现,Intel 处理器中的分支预测器更新是异步进行的,这意味着更新可能会延迟数十或数百个时钟周期。在某些情况下,这些异步更新可能会导致分支预测器与指令流之间的同步不足,从而产生分支预测器竞争条件。这种竞争条件可以被利用来实现 BPI 攻击。
BPI 攻击的工作原理是通过操纵分支预测器更新来实现任意内存泄漏。攻击者可以创建一个恶意的分支预测器更新,然后在特权切换(例如,从用户模式到内核模式)或 IBPB 操作期间执行该更新。由于分支预测器更新是异步进行的,更新可能会在特权切换后仍然有效,从而实现任意内存泄漏。
研究人员已经证明了 BPI 攻击可以在 Intel 的最新处理器(包括 Raptor Lake 和 Alder Lake)上实现,并且可以绕过 eIBRS 和 IBPB 缓解措施。他们还提供了一个微码更新来缓解 BPI 攻击,并评估了该更新的性能开销。
BPI 攻击不仅影响 Linux 系统,也可能影响其他操作系统,因为该漏洞存在于 Intel 处理器的硬件中。研究人员建议用户安装最新的操作系统和 BIOS 更新来缓解 BPI 攻击。
总之,BPI 攻击是一种新的安全漏洞,影响 Intel 处理器,允许攻击者实现任意内存泄漏。该攻击可以绕过 Intel 的硬件缓解措施,包括 eIBRS 和 IBPB。研究人员已经证明了 BPI 攻击的可行性,并提供了一个微码更新来缓解该攻击。用户应该安装最新的操作系统和 BIOS 更新来保护自己免受 BPI 攻击。
https://news.ycombinator.com/item?id=43974891
https://wqtz.bearblog.dev/high-stress-job-relationships/
本文讨论了在高压力工作环境中,如何优先考虑人际关系的重要性。作者首先描述了高压力工作环境的现状,人们在工作中感到极度紧张,甚至可能产生辞职的想法。作者指出,在这种环境中,每个人都感到压力重重,大家都在承受着来自上级的压力,导致工作变得毫无意义。
作者强调,即使在这种高压力环境中,保持良好的人际关系也是非常重要的。因为如果你决定辞职,你需要这些人际关系来获得新的工作机会,例如推荐信。作者警告不要在压力下对同事发脾气,因为这会给你留下坏印象,你会被记住为“那个家伙”,即使你已经离开了公司。
作者最后强调,优先考虑人际关系是非常重要的。在工作中,应该考虑到每个人的需求和感受,而不是仅仅关注截止日期和工作的重要性。每个人都是人,应该以人际关系的方式对待他们,而不是让“专业环境”腐蚀了这些关系。通过优先考虑人际关系,我们可以建立更好的工作环境和更好的未来。
https://news.ycombinator.com/item?id=43972535
https://www.theregister.com/2025/05/13/nextcloud_play_store_complaint/
Nextcloud 是一家欧洲软件供应商,最近指责 Google 故意限制其 Android Files 应用程序的功能,该应用程序拥有超过 80 万用户。问题出在"All files access"权限上,Google 要求 Nextcloud 使用更注重隐私的存储访问工具,如 Storage Access Framework(SAF)或 MediaStore API。然而,Nextcloud 声称这些替代方案无法满足其应用程序的需求,因为它们无法提供对所有文件类型的访问权限。
Nextcloud 表示,其 Android Files 应用程序自 2016 年推出以来一直具有读写所有文件类型的权限,从未收到 Google 关于安全问题的投诉。然而,在 2024 年,Google Play Store 突然撤销了该权限,有效地限制了应用程序的功能。Nextcloud 试图与 Google 沟通,但只收到复制粘贴的开发者指南段落。尽管 Nextcloud 多次提出上诉,Google 仍拒绝恢复应用程序的全部功能。
Nextcloud 认为,Google 的行为是为了限制竞争,遏制小公司的发展。Nextcloud 援引了 Microsoft 和 Apple 等大公司的类似行为,指出这些公司曾被指控采取反竞争行为。Nextcloud 还提到,自己曾在 2021 年与其他公司一起向欧盟提出投诉,指控 Microsoft 的反竞争行为,但至今尚未得到解决。
Nextcloud 表示,小公司如自己几乎没有任何办法来对抗大公司的限制,监管机构的执法速度也太慢,罚款金额太少,无法对大公司产生有效的威慑作用。Nextcloud 认为,大公司担心小公司会破坏自己的市场份额,因此试图限制小公司的发展。Nextcloud 的 Android Files 应用程序目前有 824,000 名用户,公司表示将继续努力维护应用程序的功能和用户权益。
https://news.ycombinator.com/item?id=43970959
https://time.com/7285045/resigning-national-science-foundation-library-congress/
本文的作者阿隆德拉·纳尔逊(Alondra Nelson)宣布,她将辞去在国家科学基金会(National Science Foundation)和国会图书馆(Library of Congress)的职务。纳尔逊曾担任白宫科学和技术政策主任,她表示,尽管她曾希望这些公共机构能够继续其促进和保护知识的使命,但现实情况却使她无法继续下去。
纳尔逊指出,国家科学基金会和国会图书馆等机构正面临着日益恶化的政治环境,科学家、图书管理员和政策分析师们尽管努力工作,但仍然无法抵御来自行政部门的压力。这些机构的独立性和完整性正在被侵蚀,纳尔逊表示,她无法再继续为这些机构服务。
纳尔逊特别提到了国家科学基金会的现状,她表示,该机构的独立性已经被破坏,行政部门正在干预其决策过程。她还提到了国会图书馆的 Scholars Council,该机构原本应该为图书馆的项目提供咨询,但现在已经失去了其原本的功能。
纳尔逊表示,她的辞职是因为这些机构已经无法再履行其原本的使命,行政部门的干预已经使得这些机构失去了其独立性和完整性。她还提到了雷·布拉德伯里(Ray Bradbury)的著名小说《华氏 451 度》(Fahrenheit 451),该小说描绘了一个书籍被烧毁、知识被压制的社会,纳尔逊表示,现实情况已经与小说中的情景非常相似。
纳尔逊的辞职是对当前政治环境的严厉批评,她表示,行政部门的行为已经对知识的自由和民主的原则构成了严重的威胁。她还呼吁人们关注这些问题,防止知识和民主的进一步侵蚀。
https://news.ycombinator.com/item?id=43973210
https://www.marginalia.nu/log/a_119_pdf/
本文讨论了从 PDF 文件中提取文本的挑战。PDF 文件格式并不是一个文本格式,而是一个图形格式,它将字形映射到“纸张”上的坐标上。这种格式使得提取文本信息变得困难,因为字形可能被旋转、重叠和乱序排列,并且缺乏语义信息。
为了解决这个问题,作者尝试使用 PDFBox 的 PDFTextStripper 类,但是发现它有一些局限性,例如不能识别标题和其他语义信息。因此,作者进行了一些修改,以便更好地提取 PDF 文件中的文本信息。
首先,作者尝试识别标题。他们发现,标题通常使用粗体或更粗的字体,并且与其他文本隔离。然而,并不是所有的标题都使用粗体字体,有些标题可能使用字体大小来区分。为了解决这个问题,作者使用了字体大小的统计方法,计算每页的字体大小分布,并使用中位数作为阈值来识别标题。
其次,作者尝试连接连续的标题。他们发现,标题可能被分成多行,并且需要连接这些行以形成一个完整的标题。然而,这个问题并不是那么简单,因为有些标题可能使用右对齐或缩进来表示段落的开始。
最后,作者讨论了识别段落的方法。他们发现,PDFTextStripper 使用了一种混合方法,结合行距和缩进来识别段落。然而,这种方法有一些局限性,例如不能处理不同行距的文档。为了解决这个问题,作者使用了行距的统计方法,计算每页的行距分布,并使用中位数作为阈值来识别段落。
总的来说,本文讨论了从 PDF 文件中提取文本的挑战和解决方法。作者使用了统计方法和机器学习模型来识别标题、连接连续的标题和识别段落。这些方法可以帮助提高 PDF 文件中文本信息的提取准确性和效率。
https://news.ycombinator.com/item?id=43973721