MoreRSS

site iconHackerNews AI 摘要

使用 RPA 方案,每天自动获取 Top Stories ,使用 GPT 方式自动摘要,同时会一并摘要 HackerNews 网友的评论。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

HackerNews AI 摘要的 RSS 预览

2024 11 23 HackerNews

2024-11-23 08:49:41

2024-11-23 Hacker News Top Stories #

  1. 一个项目使用稀疏自编码器(SAE)来解释大型语言模型(LLM)的行为,特别是 Llama 3.2 模型,旨在提取 LLM 中的可解释特征。
  2. 处理 Cookie 是一个复杂的问题,Cookie 设置时容易出现隐蔽问题,如 cookie shadowing,导致多个几乎相同的 cookie 同时存在。
  3. 亚马逊将再投资 40 亿美元于人工智能初创公司 Anthropic,这是继今年 3 月宣布投资 27.5 亿美元后,又一笔重大投资。
  4. 大型语言模型(LLM)在国际象棋方面的表现,特别是针对 gpt-3.5-turbo-instruct 这一模型表现出的异常强大棋力的原因。
  5. Netlify庆祝其开发者用户数量达到五百万,推出了一款互动游戏,让用户可以通过这个旅程了解Netlify的成长历程,以及每位开发者在其中所扮演的角色。
  6. 美国俄勒冈州的克拉玛斯河在拆除四座水坝后,成千上万的鲑鱼回归了它们的故乡。
  7. ChipWits 游戏的 40 周年纪念:原始 FORTH 代码开源!游戏的开发团队还分享了游戏开发过程中的故事,包括如何使用 FORTH 编程语言开发游戏。
  8. Autoflow 是一个基于 TiDB Serverless Vector Storage 的图形 RAG(知识图谱)工具,旨在提供一个开源的知识图谱平台。
  9. 普林斯顿大学和华盛顿大学的研究团队开发出了一种名为 “超光学” 的新型相机,这种相机的体积只有一颗盐粒大小。
  10. WebGPU 规范一直在不断发展,Google、Mozilla、Apple、Intel 和 Microsoft 等大公司每周都会开会讨论其开发进度。

Show HN: Llama 3.2 Interpretability with Sparse Autoencoders #

https://github.com/PaulPauls/llama3_interpretability_sae

这个网页是一个 GitHub 仓库的页面,介绍了一个名为“Llama 3 Interpretability with Sparse Autoencoders”的项目。该项目旨在使用稀疏自编码器(SAE)来解释大型语言模型(LLM)的行为,特别是 Llama 3.2 模型。

项目概述 该项目的目标是使用 SAE 来提取 LLM 中的可解释特征,这些特征可以帮助理解模型的行为、检测错误信息、分析信息流等。项目的灵感来自于最近的研究,包括 Anthropic、OpenAI 和 Google DeepMind 的工作。

项目的主要特点包括:

  • 一个完整的端到端管道,从激活捕获到 SAE 训练、特征解释和验证,使用 PyTorch 编写,依赖性最小。
  • 使用自定义的句子分割 OpenWebText 数据集变体捕获大型语言模型的残差激活作为 SAE 训练数据集。
  • 对训练数据进行预处理(预批处理、统计计算)以实现高效训练。
  • 支持分布式训练和批量处理。
  • 提供了一个用于解释和可视化 SAE 学习特征的工具集。

项目的当前状态是版本 0.2,虽然它已经是一个高效且可扩展的状态,但它仍然是一个非最终版本,未来可能会有更新和改进。项目的作者鼓励贡献代码或反馈,并感谢任何发现的错误报告。


HN 热度 527 points | 评论 77 comments | 作者:PaulPauls | 1 day ago #

https://news.ycombinator.com/item?id=42208383

  • 机械解释性解决了大型语言模型在自我解释时的不真实性问题
  • 人类也会对自己无法解释的想法或行为编造看似合理的解释
  • 数学中的非正式想法可以在后续通过形式化来验证
  • 一些系统旨在听起来合理,而另一些系统旨在说出真相
  • 人类和 LLM 在解释行为时都存在编造合理理由的现象,这并不罕见
  • 人类在进行解释时,有时会无意识地将假设提升为信念
  • 对 LLM 的可解释性要求可能比对人类更高,因为 LLM 被视为工具,需要更可靠
  • LLM 的解释能力如果不可靠,会影响其在某些领域的实用性,如创意写作之外的应用

Handling cookies is a minefield #

https://grayduck.mn/2024/11/21/handling-cookies-is-a-minefield/

这篇文章由 April King 撰写,主要讨论了 HTTP Cookie 在不同浏览器和编程库中的处理差异,以及这些差异可能引发的问题。

** 文章概述 **

HTTP Cookie 是由 JavaScript 或 HTTP 服务器设置的小数据块,主要用于在原本无状态的万维网中维护状态。尽管 Cookie 的工作原理似乎简单,但实际操作中却充满了复杂性和潜在的问题。文章通过一个简单的 JavaScript 示例来引入问题,该示例将一个 JSON 对象序列化后存储为 Cookie,但在使用 Go 标准库时却引发了解析错误。

**Cookie 的规范 **

文章回顾了 Cookie 的定义及其演变,提到 RFC 2109、RFC 2965 和 RFC 6265 等规范。其中涉及两个关键部分:

  1. ** 服务器发送 Cookie 的方式 **(RFC 6265,第 4.1.1 节):规定了 Cookie 的格式和可接受的字符。
  2. ** 浏览器接受 Cookie 的方式 **(RFC 6265,第 5.6 节):定义了浏览器解析 Cookie 的算法,指出如果包含控制字符,则应忽略整个 Cookie。

作者指出,规范之间的矛盾使得服务器和浏览器在处理 Cookie 时出现了不一致,特别是在允许的字符范围上。

** 浏览器的处理差异 **

  • Firefox: 接受了一些 RFC 中不推荐的字符(如空格、双引号、逗号等),同时也存在配置选项可以阻止 Unicode 字符的使用。
  • Chromium: 相较于 Firefox,略微严格,拒绝接受水平制表符,但允许空格、双引号、逗号、反斜杠和 Unicode 字符。
  • Safari (WebKit): 处理方式不同,遇到不允许的字符时不会忽略整个 Cookie,而是接受直到那个字符为止。Safari 还存在一个奇怪的 bug,即在处理包含逗号的 Cookie 时会删除逗号周围的空格。

** 编程库的处理差异 **

文章以 Go 语言的 Cookie 处理为例,展示了编程库在处理 Cookie 时的挑战。Go 的标准库在发送 Cookie 时相对严格,只允许一些常见字符,但在解析浏览器发送的 Cookie 时则较为宽松。这样一来,就可能导致兼容性问题,尤其是在涉及到不同浏览器和不同标准库时。

** 结论 **

整篇文章强调了 Cookie 处理的复杂性,指出了浏览器和服务器之间在 Cookie 处理上的不一致性,以及在不同的编程环境中所遇到的挑战。这种不一致性可能导致开发者在处理状态保持时面临各种问题,因此需要特别关注和测试 Cookie 的设置和解析过程,以避免潜在的错误。作者呼吁在 Cookie 处理的标准和实现之间进行更好的协调,以减少这些问题的发生。


HN 热度 514 points | 评论 234 comments | 作者:todsacerdoti | 1 day ago #

https://news.ycombinator.com/item?id=42206556

  • Cookie 设置时容易出现隐蔽问题,如 cookie shadowing,导致多个几乎相同的 cookie 同时存在
  • 在同一域名下设置不同环境(如 staging 和 dev)是一个巨大的错误,容易导致配置错误
  • 使用不同的顶级域名来隔离开发、测试和生产环境,可以避免 cookie 干扰
  • 通过 CNAME 设置子域名,可以有效隔离环境同时保持一致性
  • 使用子域名如*.dev.example.com、*.test.example.com、*.prod.example.com 可以避免 cookie 冲突
  • 企业客户和邮件发送时,使用相同的顶级域名会更有帮助
  • 规范中关于 cookie 域名前缀的点号(.)是无效的,但浏览器会忽略它以保持向后兼容
  • jshttp/cookie 库的 serialize()方法应严格遵循规范,避免设置无效的 cookie 头
  • 严格验证 cookie 值可以避免潜在的安全问题,如代码注入

Amazon to invest another $4B in Anthropic #

https://www.cnbc.com/2024/11/22/amazon-to-invest-another-4-billion-in-anthropic-openais-biggest-rival.html

亚马逊宣布将再投资 40 亿美元于人工智能初创公司 Anthropic,这是继今年 3 月宣布投资 27.5 亿美元后,又一笔重大投资。Anthropic 是由前 OpenAI 研究高管创立的公司,开发了 Claude 聊天机器人和 AI 模型。

亚马逊的投资将使其成为 Anthropic 的主要云计算和培训合作伙伴,Anthropic 将使用亚马逊的 AWS Trainium 和 Inferentia 芯片来训练和部署其最大的 AI 模型。Anthropic 的 Claude 聊天机器人是近期人工智能领域的热门产品之一,其他公司如 OpenAI 的 ChatGPT 和谷歌的 Gemini 也在此领域展开竞争。亚马逊和微软等科技巨头也在积极投资和开发人工智能技术。


HN 热度 446 points | 评论 242 comments | 作者:swyx | 8 hours ago #

https://news.ycombinator.com/item?id=42215126

  • Claude Sonnet 3.5 的表现令人惊讶,能够生成详细的答案和图表,甚至编写和运行 Python 代码。
  • Claude 在理解用户意图方面优于 ChatGPT,能够提供完整文件而无需重复指令。
  • Claude 会提出澄清问题以更好地理解用户目标,而 ChatGPT 从未这样做。
  • Claude 在编程语言如 Swift 上的表现不如 GPT,GPT 在数学和语法方面也更好。
  • GPT 和 Claude 的优劣取决于特定领域和子领域,GPT 在不常见语言如 Applescript 上表现更好。
  • Claude 在对话中更具有同理心和个性,而 ChatGPT 则较为机械。
  • Claude 的 API 使用没有速率限制问题,可以通过自定义前端轻松切换模型。
  • 用户建议在长时间对话中导出聊天记录和总结,以避免上下文窗口过载。
  • Claude 在高负载下存在请求响应延迟问题,需要改进服务质量。

OK, I can partly explain the LLM chess weirdness now #

https://dynomight.net/more-chess/

这篇文章探讨了大型语言模型(LLM)在国际象棋方面的表现,特别是针对 gpt-3.5-turbo-instruct 这一模型表现出的异常强大棋力的原因。作者首先提出了几个可能的理论来解释这种现象:

  1. 基础模型的能力在通过指令微调后未能保持。
  2. gpt-3.5-turbo-instruct 可能接受了更多的国际象棋数据训练。
  3. 某些 LLM 架构可能具有独特的优势。
  4. LLM 的训练数据中需要包含大量棋局数据。

作者还提到了一些网络上流传的其他理论,比如 OpenAI 作弊,LLM 根本无法真正下棋等,这些理论并不成立。

经过实验,作者证明了其实最近的聊天模型也可以很好地下棋,只要使用合适的提示语。接下来,作者详细描述了不同模型在国际象棋对弈中的表现,包括 gpt-3.5-turbo-instruct 和 gpt-4o-mini、gpt-4o 等模型。在与国际象棋引擎 Stockfish 对战的实验中,gpt-3.5-turbo-instruct 表现优异,而 gpt-4o 系列模型则表现较差。

为了改进这些模型的表现,作者尝试了不同的提示方法,包括重复系统提示、提供例子和微调等。结果显示,仅仅提供三条小示例就显著提高了模型的表现。微调也同样有效,但将例子和微调结合使用时,结果显示例子反而使微调变得冗余。

此外,作者尝试通过列出合法走法来帮助模型,但结果却是让模型的表现变差。因此,作者最终提出,LLM 的基础模型本身在下棋方面具有一定的能力,但如何引导模型理解棋局和做出决策是关键。

总结而言,文章揭示了如何通过适当的提示和微调,提升 LLM 在国际象棋方面的表现,并探讨了影响其能力的多个因素。作者强调,gpt-3.5-turbo-instruct 模型的成功并不是由于任何作弊行为,而是源于其内在的训练和架构优势。


HN 热度 439 points | 评论 405 comments | 作者:dmazin | 1 day ago #

https://news.ycombinator.com/item?id=42206817

  • 文章没有提供非法移动的频率数据,因此无法得出有意义的结论
  • 检测非法移动在计算上是简单的,与过滤错误的医疗建议不同
  • 国际象棋规则虽然不简单,但已经是一个解决的问题,检测合法移动已被多次实现
  • LLM 在国际象棋中表现优于随机选择合法移动,即使有时尝试非法移动
  • 检测有效的医疗建议比检测国际象棋的合法移动复杂得多,两者不可比较
  • 国际象棋规则的实现难度被高估了,实际上比其他算法简单
  • LLM 可能通过模仿和讨论展示出与数学教授相当的能力,特别是在提供上下文的情况下
  • 通过脚本纠正错误数学,不能证明 LLM 对数学有良好理解
  • 对于“理解”的定义尚不明确,LLM 可能通过图灵测试的对话方式展示理解
  • 数学和自然语言是不同的领域,擅长自然语言并不意味着擅长数学
  • 数学问题通常只有一个正确答案,而自然语言问题则更难区分模仿和理解

Show HN: A Marble Madness-inspired WebGL game we built for Netlify #

https://5-million-devs.netlify.com/

Netlify 最近庆祝其开发者用户数量达到五百万。这个里程碑标志着 Netlify 在支持开发者和推动网站构建方面的重要成就。在这个庆祝活动中,Netlify 提供了一次互动体验,用户可以通过这个旅程了解 Netlify 的成长历程,以及每位开发者在其中所扮演的角色。

该活动不仅回顾了 Netlify 的发展历程,还展现了许多有趣的瞬间,体现了开发者与平台之间的紧密联系。Netlify 邀请大家一同参与,感受这一路走来的乐趣。

整体来看,Netlify 的五百万开发者庆祝活动不仅是对过去成就的回顾,也是在激励更多开发者加入这个不断发展的社区。


HN 热度 423 points | 评论 178 comments | 作者:franck | 14 hours ago #

https://news.ycombinator.com/item?id=42212644

  • 游戏中的白色发光点应作为动力或奖励,而不是惩罚。
  • 游戏的控制非常流畅,物理效果也很出色。
  • 游戏比预期的广告宣传要好得多,设计精良,控制完美,有多个路线可选。
  • 物理碰撞在帧率下降时容易出问题,导致球卡在物体中。
  • 游戏开发用了大约 8 周时间,团队有两人。
  • 选择 Three.js 和 Rapier 而不是 Unity WebGL 的原因是支持移动设备。
  • 游戏中存在一些 bug,例如在特定情况下球会掉入平台下方并无法重生。
  • Unity WebGL 在移动设备上的支持已经存在多年,但 Unity 6 的 Web 导出功能将进一步改善这一点。

Salmon return to lay eggs in historic habitat after dam removal project #

https://www.opb.org/article/2024/11/17/salmon-return-to-lay-eggs-in-historic-habitat-after-largest-dam-removal-project-in-us-history/

美国俄勒冈州的克拉玛斯河(Klamath River)在拆除四座水坝后,成千上万的鲑鱼回归了它们的故乡。这些鲑鱼在过去几十年里由于水坝的阻塞而无法返回。水坝的拆除是美国历史上最大的水坝拆除项目,旨在恢复河流的自然流动和改善鲑鱼的栖息环境。

拆除水坝后,鲑鱼迅速回归了它们的故乡。据报道,仅在斯宾塞溪(Spencer Creek)就发现了 42 个鲑鱼卵巢,共有 115 条鲑鱼。这些鲑鱼的回归标志着河流生态系统的恢复和鲑鱼种群的复苏。

克拉玛斯河是美国西海岸第三大鲑鱼产卵地,但由于水坝的阻塞,鲑鱼数量大幅减少。水坝的拆除是当地土著部落多年斗争的结果,他们希望恢复河流的自然流动和保护鲑鱼的栖息环境。

水坝的拆除不仅恢复了河流的自然流动,也改善了水质。据报道,拆除水坝后,河水温度下降了 8 摄氏度,水质也得到了改善。这些变化有利于鲑鱼的生长和繁殖。

鲑鱼的回归是河流生态系统恢复的重要标志,也是当地土著部落多年斗争的成果。随着鲑鱼种群的复苏,河流生态系统也将得到进一步的恢复和保护。


HN 热度 295 points | 评论 205 comments | 作者:gmays | 11 hours ago #

https://news.ycombinator.com/item?id=42213663

  • 鲑鱼返回出生地的行为主要依赖于化学感应,如特定的气味记忆
  • 鲑鱼可能具备类似信鸽的地球磁场导航能力
  • 鲑鱼的迁徙行为可能是为了寻找适合繁殖的环境,而不是特定的记忆
  • 鲑鱼在寻找繁殖地时,可能会受到环境特征(如较低的有害藻类浓度和较凉的水温)的吸引
  • 鲑鱼返回出生地的行为并非 100% 准确,部分鲑鱼会随机游向其他区域
  • 鲑鱼的这种行为可能是为了在特定溪流消失时,仍有机会在其他地方繁殖
  • 鲑鱼返回出生地的行为可能受到遗传适应特定溪流特征的选择优势驱动
  • 人工孵化的鲑鱼在返回时,现在可以游向支流自然繁殖,而不是被收集回孵化场
  • 鲑鱼梯的设计中加入人工瀑布声可以提高效果,因为鲑鱼在静水中会寻找水流声

The FORTH code for Chipwits is released in the game’s 40th anniversary #

https://chipwits.com/2024/11/16/chipwits-40th-birthday-original-forth-code-open-sourced/

ChipWits 游戏的 40 周年纪念:原始 FORTH 代码开源!

ChipWits 是一款编程逻辑/益智游戏,于 1984 年首次发布。游戏的创作者 Doug Sharp 和 Mike Johnston 在 1984 年开始开发这款游戏,当时他们还在为其他公司开发游戏。他们选择使用 FORTH 编程语言,因为它在当时的 8 位微型计算机上非常流行。

游戏的开发过程非常艰难,Doug 和 Mike 需要在短时间内完成游戏的开发。他们使用 MacForth Plus 编程语言开发游戏,并在 7 个月内完成了游戏的开发。游戏于 1984 年圣诞节期间发布。

游戏在发布后获得了广泛的好评,包括 MacUser 编辑选择奖和 MacWorld 杂志的好评。游戏还被列入 2008 年 MacLife 杂志的“十大 Apple II/Mac 游戏”榜单。

在游戏发布 40 周年之际,Doug Sharp 找到了原始的游戏代码,并将其开源。游戏的原始代码使用 FORTH 编程语言编写,共有 3000 行代码。游戏的开发团队还提供了一个在线模拟器,允许玩家在浏览器中玩到原始的 ChipWits 游戏。

游戏的开发团队还分享了游戏开发过程中的故事,包括如何使用 FORTH 编程语言开发游戏,以及如何将游戏移植到其他平台。他们还分享了游戏的设计理念,包括如何使用图标式语言来教玩家编程概念。

总之,ChipWits 游戏的 40 周年纪念是一个值得纪念的事件,游戏的开发团队通过开源原始代码和分享开发过程中的故事,向玩家展示了游戏开发的历史和文化。


HN 热度 229 points | 评论 67 comments | 作者:JoeDaDude | 1 day ago #

https://news.ycombinator.com/item?id=42207304

  • Forth 语言在硬件开发和驱动程序中长期被使用,是一种基于栈的语言
  • 选择 Forth 编写 ChipWits 是因为可以在 128k Mac 上原生开发,且 Forth 通常是新计算机上最先实现的语言之一
  • Forth 语言比裸机编程容易得多,尽管它可能看起来有些奇怪,但比从头开始要好得多
  • 基本的 Lisp 方言需要至少 4 个通用寄存器,而 65C02 微处理器只有 1 个或 3 个寄存器,这使得 Lisp 在该环境下难以实现
  • Forth 在寄存器资源有限的环境中表现良好,只需要栈指针和几个寄存器即可实现基本操作
  • 《Lisp in Small Pieces》是一本非常好的书,展示了如何构建多个不同的 Lisp 解释器和编译器
  • 编写 Lisp 的高级特性如逃逸闭包、延续和条件处理需要更多的努力和谨慎
  • Forth 代码实际上是一系列子例程调用,没有语法树,没有指针算术,没有基本类型检查,甚至没有数组类型
  • 使用 Forth 编写代码需要策略和自律,否则调试可能会很棘手,但一旦掌握,可以比汇编语言更高效
  • 垃圾回收不是实现 Lisp 引导所必需的,但手动内存管理的 Lisp 使用起来会显得很奇怪
  • 从 Rust 的内存模型中借鉴可以有助于实现手动内存管理的 Lisp,RAII 也很容易实现

Autoflow, a Graph RAG based and conversational knowledge base tool #

https://github.com/pingcap/autoflow

pingcap/autoflow 是一个基于 TiDB Serverless Vector Storage 的图形 RAG(知识图谱)工具,旨在提供一个开源的知识图谱平台。该项目的主要特点包括:

  • Perplexity 风格的对话搜索页面:该平台具备一个内置的网站爬虫,可以爬取官方网站和文档网站,提供全面的搜索结果。
  • 可编辑的知识图谱:用户可以编辑知识图谱,以添加更多信息或纠正不准确的信息。
  • 可嵌入的 JavaScript 代码段:用户可以将对话搜索窗口嵌入到自己的网站中,提供即时的产品相关查询响应。

部署:

  • 该项目可以使用 Docker Compose 部署,需要 4 个 CPU 核心和 8GB RAM。

技术栈:

  • TiDB:用于存储聊天记录、向量、JSON 和分析数据的数据库。
  • LlamaIndex:RAG 框架。
  • DSPy:用于编程基础模型的框架。
  • Next.js:前端框架。
  • shadcn/ui:设计框架。

联系我们:

  • 用户可以通过 Twitter 联系开发团队。

贡献:

  • 该项目欢迎社区贡献者参与开发。感兴趣的开发者可以阅读贡献指南。

许可:

  • 该项目遵循 Apache License 2.0 许可协议。

HN 热度 218 points | 评论 31 comments | 作者:jinqueeny | 22 hours ago #

https://news.ycombinator.com/item?id=42210689

  • 该工具在回答具体问题时速度更快,但回答“什么是 TiDB”这样的基础问题时显得过于复杂和缓慢
  • 界面美观对于演示产品来说很重要,不应被简单地否定
  • 自托管版本的需求强烈,用户希望能在家庭服务器上运行类似工具
  • 个人浏览历史的自动收集和搜索功能具有很高的实用价值
  • 本地 LLM 的应用可以更好地保护个人隐私
  • 希望 Mozilla 能够开发类似功能的个人助手
  • 个人知识管理工具应提供更多定制化选项,以满足不同用户的需求
  • 自动归档和管理书签的内容可以提高信息检索的效率
  • 本地归档工具的测试反馈良好,但需注意与商业利益的冲突
  • 用户对隐私和选择权的关注很高,反对默认开启上传至云端的功能
  • 自托管的开源项目更受用户欢迎,商业公司开发的闭源组件则面临更多质疑

A “meta-optics” camera that is the size of a grain of salt #

https://cacm.acm.org/news/a-camera-the-size-of-a-grain-of-salt-could-change-imaging-as-we-know-it/

一项来自普林斯顿大学和华盛顿大学的研究团队开发出了一种名为 “超光学” 的新型相机,这种相机的体积只有一颗盐粒大小。研究人员利用一种称为 “超表面” 的技术,该技术由 160 万个微型圆柱形柱体构成,类似于计算机芯片的生产方式。这种超光学相机能够以与传统相机相同的质量捕捉全彩图像,而其体积比传统相机小 500,000 倍。

** 研究的创新点 **

  1. ** 超表面的应用 **:超表面是一种人造材料,能够以独特的方式操控光线。研究团队通过调节每个纳米天线的性质,实现了在仅 0.5 毫米厚的超表面上聚集更多的光学性能,从而使相机体积显著缩小。
  2. **AI 技术的整合 **:研究团队还利用人工智能优化了纳米天线的设计和图像处理。这种 AI 驱动的方法使得超光学相机能够捕捉清晰的全彩图像,并去除了图像中的畸变。

** 潜在应用 **

超光学相机的潜在应用非常广泛,尤其是在以下几个领域:

  • ** 医疗成像 **:由于其微小的尺寸,超光学相机可以被应用于内窥镜,使得非侵入性诊断和手术成为可能。
  • ** 消费电子 **:这种相机可以被集成到智能手机、可穿戴设备、增强现实(AR)和虚拟现实(VR)头显中,允许更轻便、更高质量的摄像功能。
  • ** 无人机 **:更小的相机将使无人机更轻、更省电,从而提高它们的效率和性能。
  • ** 天文观测 **:更大尺寸的超表面可以取代传统望远镜的镜头,简化设计并提高发射到太空中的光学设备的能力。

** 技术生产 **

由于超表面可以用类似于计算机芯片的成熟技术生产,这为其大规模应用提供了可能,预计生产成本会显著降低。

总体而言,这项研究为相机技术的未来发展开辟了新的思路,可能会在多个行业中产生深远的影响。


HN 热度 203 points | 评论 125 comments | 作者:rbanffy | 13 hours ago #

https://news.ycombinator.com/item?id=42212992

  • 评论者对纳米相机能否产生与传统相机质量相等的全彩图像表示怀疑,但原论文中的示例令人印象深刻
  • 图像质量明显不如传统相机,缺乏锐度和色彩
  • 传统超薄镜头相机主要用于内窥镜,纳米相机与之相比有一定优势
  • 评论者不确定所展示的图像是否真实,比如一张被误认为是腹部脂肪的图像
  • 由于相机尺寸极小,光圈受限,低光和景深将是挑战
  • 评论者推测图像可能是通过将纳米相机粘贴在另一相机镜头中心拍摄的
  • 评论者建议使用多个纳米相机组成类似昆虫复眼的结构,以实现 3D 成像
  • 纳米相机的工作原理是利用基于物理的神经网络处理图像,去除相机产生的像差
  • 评论者认为应该对任何声称绕过衍射极限的技术持怀疑态度
  • 评论者提到这种技术在 1972 年的科幻小说《Other Days, Other Eyes》中已有设想,书中描述了这种微型相机可能带来的监控社会
  • 评论者希望看到纳米相机拍摄完全随机的分形噪声图像,以验证其是否只是重建已知图像模式

What’s Next for WebGPU #

https://developer.chrome.com/blog/next-for-webgpu

WebGPU 规范一直在不断发展,Google、Mozilla、Apple、Intel 和 Microsoft 等大公司每周都会开会讨论其开发进度。在最近一次 Web 工作组会议上,我们简要介绍了 WebGPU 的下一迭代计划实现的主要目标和功能。

会议的重点是讨论里程碑 0 的进展,并确定在该规范达到 W3C 候选推荐状态之前需要解决的问题。这是标准化流程的下一步,可更好地保证稳定性和知识产权保护。会议参与者普遍认为这些问题不构成障碍,并且可以及时解决,为 W3C 推荐 WebGPU 候选标准铺平了道路。

会议参与者也优先考虑了新功能。他们首先从开发者、实现者和利益相关方的反馈中汇总了功能请求列表。经过讨论,我们确定了以下适用于 AI 的 WebGPU 关键功能:子群组和子群组矩阵、纹理缓冲区、UMA 缓冲区映射。我们还在考虑和优先考虑以下 WebGPU 功能,以解锁新类型的渲染算法:无绑定、多绘制间接、64 位原子操作。

为了增强 WebGPU 的功能并与更广泛的 Web 平台集成,我们讨论了以下 WebGPU 功能:兼容模式、WebXR、Canvas2D。会议还就改进 WGSL 工具和库的努力进行了演讲和讨论。一个值得注意的计划是开发 WESL(WGSL 扩展着色语言),旨在为 WGSL 提供一组由社区驱动的扩展。

会议强调了 WebGPU 工作组、开发者和更广泛的图形社区之间通力协作对于塑造 WebGPU 未来的重要性。该工作组正在积极征求有关提议功能的反馈,并致力于与开发者合作,确保 WebGPU 能够满足他们的需求。WebGPU 的后续演变有望取得重大进展,为 Web 图形开拓新的可能性,并让开发者能够为 AI 打造更加沉浸且富有吸引力的 Web 体验。


HN 热度 192 points | 评论 176 comments | 作者:mariuz | 1 day ago #

https://news.ycombinator.com/item?id=42209272

  • Bindless 是 WebGPU 中最重要的特性,缺乏该特性导致状态变化频繁,严重影响性能
  • Bindless 的缺失对 Rust 3D 图形渲染造成了毁灭性影响,限制了高性能游戏的开发
  • WGPU 性能下降是因为 Mozilla 的开发者目前更关注兼容性和安全性,而非性能优化
  • WGPU 是一个开源项目,除了 Mozilla 的贡献者外,还有其他贡献者根据自己的需求添加特性
  • WGPU 的性能和功能主要取决于资源投入,需要更多贡献者参与
  • WGPU 在浏览器外应作为中间件存在,要么保持与 WebGPU 兼容,要么转向原生代码开发
  • WebGPU 的设计层级导致即使只扩展其 API,也会产生多种不同的使用方式,增加开发复杂性

2024 11 22 HackerNews

2024-11-22 07:19:15

2024-11-22 Hacker News Top Stories #

  1. 国际刑事法院对以色列领导人发出逮捕令。
  2. 数学思维并非你所想的那样。
  3. 学术贫困的学生通过 Z-Library 获得帮助。
  4. 减肥药物可能导致心脏肌肉缩小。
  5. 荷兰的城市交叉路口设计。
  6. PHP 8.4 新特性。
  7. 跨平台桌面应用框架 Electrobun。
  8. 谷歌停止允许像福布斯这样的网站在搜索结果中占据“最佳 CBD 果冻”的位置。
  9. Hyrum’s Law 在 Golang 中的应用。
  10. “恶魔核心”的迷因化。

ICC issues warrants for Netanyahu, Gallant, and Hamas officials #

https://www.icc-cpi.int/news/situation-state-palestine-icc-pre-trial-chamber-i-rejects-state-israels-challenges

国际刑事法院(ICC)对巴勒斯坦国的调查取得进展。2024 年 11 月 21 日,ICC 第一预审庭驳回了以色列对法院管辖权的挑战,并对本雅明·内塔尼亚胡和约阿夫·加兰特发出逮捕令。

以色列对法院管辖权的挑战 以色列于 2024 年 9 月 26 日提交了两项请求。第一项请求挑战了法院对巴勒斯坦国的管辖权,第二项请求要求检察官重新通知以色列当局关于调查的启动。以色列还要求法院停止对相关案件的审理,包括对内塔尼亚胡和加兰特的逮捕令申请。

预审庭驳回了以色列的挑战,认为以色列的挑战为时过早。预审庭还驳回了以色列关于重新通知的请求,认为检察官已经在 2021 年通知了以色列关于调查的启动。

逮捕令 预审庭对内塔尼亚胡和加兰特发出逮捕令,指控他们犯有反人类罪和战争罪。逮捕令指控他们在 2023 年 10 月 8 日至 2024 年 5 月 20 日期间犯有这些罪行。

预审庭认为,内塔尼亚胡和加兰特的行为属于法院的管辖权。预审庭还发现,内塔尼亚胡和加兰特对以下罪行负有刑事责任:战争罪中的饥饿作为战争手段;反人类罪中的谋杀、迫害和其他不人道行为。

预审庭还发现,内塔尼亚胡和加兰特作为平民监督者,对故意攻击平民人口的战争罪行负有责任。

预审庭认为,以色列和巴勒斯坦之间的国际人道主义法适用于国际武装冲突。预审庭还发现,非国际武装冲突的法律适用于以色列和哈马斯之间的战斗。预审庭认为,内塔尼亚胡和加兰特的行为涉及以色列政府和军队对巴勒斯坦平民人口的行动,特别是对加沙平民的行动。因此,预审庭认为,发出逮捕令是适当的。


HN 热度 628 points | 评论 658 comments | 作者:runarberg | 11 hours ago #

https://news.ycombinator.com/item?id=42203543

  • 国际刑事法院和检察官在此案中立场坚定,基于专家意见和证据。
  • 卡里姆·汗(Khan)曾是以色列支持的国际刑事法院首席检察官候选人。
  • 以色列不是国际刑事法院成员,因此对检察官的选择没有直接影响。
  • 内塔尼亚胡和加兰特提供的证据表明他们有犯罪意图。
  • 国际刑事法院的定罪率较低,此案的最终结果难以预测。
  • 美国和摩萨德的反应是此案的主要担忧。
  • 战争罪和危害人类罪的意图证明相对容易,而种族灭绝罪的证明则非常困难。
  • 视频证据和以色列政客的言论并不能直接证明内塔尼亚胡和加兰特的个人犯罪意图。
  • 国际刑事法院的逮捕令限制了内塔尼亚胡和加兰特的国际旅行。
  • 逮捕令可能对以色列与欧洲的商业关系产生负面影响。
  • 未来可能有更多以色列军事人员面临逮捕令,这将对以色列产生重大负面影响。
  • 内塔尼亚胡的政治地位不稳定,未来可能失去权力。

Everyone is capable of, and can benefit from, mathematical thinking #

https://www.quantamagazine.org/mathematical-thinking-isnt-what-you-think-it-is-20241118/

数学家大卫·贝西斯(David Bessis)认为,每个人都有能力进行数学思考,并且可以从中受益。他在其新书《数学:直觉和好奇心的秘密世界》(Mathematica: A Secret World of Intuition and Curiosity)中阐述了这一观点。贝西斯认为,数学思考是一种对话,是直觉和逻辑、语言和抽象之间的对话。他还指出,数学思考是一种身体练习,需要训练和锻炼。

贝西斯认为,数学教育应该注重培养学生的直觉和想象力,而不是仅仅关注逻辑和公式。他还指出,数学家们在工作时经常使用直觉和想象力,而不是仅仅依靠逻辑和公式。贝西斯的观点挑战了传统的数学教育方法,强调了数学思考的创造性和艺术性。

贝西斯还指出,数学思考可以应用于日常生活中的各种问题和挑战。他认为,数学思考可以帮助人们更好地理解世界,解决问题和做出决策。贝西斯的观点为数学教育和数学应用提供了新的视角和思考方向。

贝西斯的书《数学:直觉和好奇心的秘密世界》是一本关于数学思考和数学教育的书。书中,贝西斯分享了他对数学思考的理解和见解,阐述了数学思考的重要性和应用性。书中还包括了许多例子和案例,展示了数学思考在日常生活中的应用。


HN 热度 513 points | 评论 298 comments | 作者:sonabinu | 21 hours ago #

https://news.ycombinator.com/item?id=42200209

  • 作者的书《Mathematica》很棒,展示了数学技能更像体育才能,需要在脑海中操纵不同的数学对象,如同想象力运动。
  • MathAcademy.com 是一个很好的学习数学的网站,可以重新学习基础数学,但学习过程可能有些紧张。
  • 书中的观点激发了对编程中反模式的精确描述,有助于理解编程中的数学。
  • 评论者希望书中能提供更多实用和应用性的内容,而不仅仅是动机性的陈词滥调。
  • 有人推荐了几本扩展数学直觉的书籍,如《非物理学家的场论》、《非物理学家的拉格朗日力学》、《数学的引力:几何如何统治宇宙》、《向量:空间、时间和数学变换的惊人故事》。
  • MathAcademy.com 通过生成问题和间隔重复来强化学习,但对于解释数学的实用性和应用场景略显不足。
  • 有人分享了从基础数学到高级数学的学习经验,认为每天投入 30 分钟到 1 小时的时间,可以在 32 天内从 30% 的水平提升到 76%。
  • 有人建议将数学学习融入到实际的开发项目中,以避免遗忘。

Z-Library Helps Students to Overcome Academic Poverty, Study Finds #

https://torrentfreak.com/z-library-helps-students-to-overcome-academic-poverty-study-finds-241120/

最近一项研究发现,Z-Library 用户的动机并非只是为了获得免费的书籍,而是出于对知识的渴望和对学术资源的需求。研究发现,许多用户来自发展中国家,无法负担昂贵的学术书籍和期刊费用。他们将 Z-Library 视为一种必要的资源,以便进一步自己的学术生涯。

研究还发现,用户们普遍认为,知识应该是免费的,尤其是在学术领域。他们认为,出版商的利润过高,而作者和审稿人却得不到相应的报酬。因此,他们认为,使用 Z-Library 下载书籍和期刊是一种合理的行为。

研究还调查了中国的研究生,他们普遍认为,Z-Library 是他们获取学术资源的重要渠道。他们认为,学术书籍和期刊的价格太高,无法负担。他们还认为,Z-Library 提供的资源对于他们的学术研究是非常重要的。

研究的作者认为,大学和出版商应该重新考虑他们的做法,提供更多的免费学术资源。他们认为,这样可以减少学术不公平现象,促进学术研究的发展。

总的来说,这项研究为我们了解 Z-Library 用户的动机和需求提供了新的见解。它也提醒我们,学术资源的获取应该是公平和合理的。


HN 热度 384 points | 评论 125 comments | 作者:hn_acker | 24 hours ago #

https://news.ycombinator.com/item?id=42199301

  • 阴影图书馆帮助学生发现真正有用的书籍,减少不必要的购买
  • 使用 Z-Library 和 Libgen 等资源可以有效管理学术资料,提高学习效率
  • 有些用户在阅读或试听后,会购买他们喜欢的书籍或音乐的实体版本
  • 行业普遍认为盗版代表“失去的销售”是不切实际的,许多盗版用户要么负担不起,要么不愿意在未试用前付费
  • 盗版有时能帮助内容保持相关性,避免被遗忘
  • 专业音频软件公司因盗版导致销售大幅下降,说明盗版确实影响了销售
  • 欧盟资助的研究表明盗版并不有害,但试图掩盖这一发现
  • 反盗版斗争使得作者电影难以获取,反而促进了好莱坞大片的流行

Weight-loss drug found to shrink muscle in mice, human cells #

https://www.ualberta.ca/en/folio/2024/11/weight-loss-drug-found-to-shrink-heart-muscle.html

阿尔伯塔大学的研究人员发现,用于减肥的药物可能会导致心脏肌肉缩小。研究人员对这种现象表示担忧,认为这可能会导致长期的负面健康后果。

研究人员使用小鼠进行研究,发现心脏肌肉在肥胖和非肥胖小鼠中都减少了。这种系统性影响也在人类心脏细胞中得到证实。

研究人员表示,虽然他们没有观察到心脏功能受损,但长期使用这种药物可能会导致心脏问题。他们建议在未来的临床研究中仔细评估心脏结构和功能。

研究人员还指出,使用减肥药物的人可能会失去过多的肌肉,这可能会导致长期的健康问题,包括免疫力下降、感染风险增加和伤口愈合不良。

研究人员建议,在减肥过程中,应注重营养和锻炼,以保持肌肉强壮。他们还建议使用减肥药物的人应遵循平衡的计划,包括足够的蛋白质和阻力训练,以最大限度地减少肌肉损失。


HN 热度 338 points | 评论 391 comments | 作者:Eumenes | 23 hours ago #

https://news.ycombinator.com/item?id=42199447

  • 体重减轻时肌肉减少是自然现象,身体会根据日常活动调整肌肉量
  • 该药物导致的肌肉减少比例远高于传统减肥方法,可能带来长期健康问题
  • 快速减肥比缓慢减肥更容易导致肌肉量减少,即使总体减重量相同
  • 肌肉减少可能降低生存率和生活质量,但减肥带来的脂肪减少可以提高生活质量
  • 传统减肥方法在预防心血管疾病、关节疼痛和糖尿病并发症方面未显示出与 GLP1 药物相同的生存益处
  • 30 岁后,如果不进行积极锻炼,肌肉量会自然减少,肥胖者通过药物或饥饿减肥可能无法恢复肌肉量
  • 肥胖会导致心脏增大、肌肉增大和器官受压,而非器官缩小

A common urban intersection in the Netherlands (2018) #

https://bicycledutch.wordpress.com/2018/02/20/a-common-urban-intersection-in-the-netherlands/

荷兰的城市交叉路口设计

荷兰的城市交叉路口设计注重安全和效率。文章以一个典型的交叉路口为例,展示了荷兰如何设计交叉路口以确保不同类型的交通流畅和安全。

交叉路口设计

该交叉路口位于荷兰城市’s-Hertogenbosch,连接一条主要道路和一条小街。主要道路有一个 50km/h 的速度限制,配有专用自行车道和人行横道。小街有一个 30km/h 的速度限制,主要用于居民出行。

交叉路口的设计注重安全和效率。主要道路的自行车道和人行横道是分离的,确保自行车和行人安全通过。小街的入口处有一个减速带,提醒驾驶员减速。交叉路口中心有一个岛屿,提供了一个安全的空间供驾驶员等待。

驾驶员的视角

从驾驶员的角度来看,交叉路口的设计是清晰的。驾驶员可以轻松看到交叉路口的布局,包括自行车道和人行横道。驾驶员需要注意的是,自行车道和人行横道优先于机动车辆。

自行车道的设计

自行车道的设计也是交叉路口的一个重要部分。自行车道是连续的,确保自行车可以安全通过交叉路口。自行车道的宽度足够,允许自行车安全通过。自行车道的表面也是专门设计的,提供了良好的抓地性。

行人的视角

从行人的角度来看,交叉路口的设计也是安全的。行人可以轻松看到交叉路口的布局,包括自行车道和机动车辆的通行方向。行人需要注意的是,机动车辆优先于行人。

总体来说,荷兰的城市交叉路口设计注重安全和效率。通过设计分离的自行车道和人行横道,减速带和岛屿,交叉路口可以确保不同类型的交通流畅和安全。


HN 热度 333 points | 评论 287 comments | 作者:itronitron | 14 hours ago #

https://news.ycombinator.com/item?id=42202397

  • 英国的自行车道设计存在重大缺陷,如共享人行道在每个侧路都需让行,导致骑行体验不佳
  • 意大利的自行车道也存在类似问题,如路面质量差、与行人共享且布满障碍物
  • 爱尔兰的自行车道设计在不同地区差异较大,如都柏林市议会与南都柏林郡议会采取不同方式
  • 英国未能借鉴其他国家的成功设计,并确保各地政府遵循统一标准
  • 荷兰式的交通设计使安全行为变得自然和直观,能有效改变用户习惯
  • 伦敦的自行车道设计导致只有最激进的骑行者留在路上,超过一半的骑行者闯红灯
  • 汽车驾驶员和骑行者在闯红灯时面临不同的后果,汽车驾驶员闯红灯更危险
  • 交通信号灯主要为汽车驾驶员设计,骑行者在某些情况下可以安全地通过红灯
  • 荷兰的行人与骑行者共享空间设计减少了事故,通过减少速度和增加眼神交流实现安全
  • 人们对于自行车与行人共享空间的危险性有直观反应,但对自行车与汽车混行的危险性却习以为常

PHP 8.4 #

https://www.php.net/releases/8.4/en.php

PHP 8.4 是一个功能丰富的版本,包含许多新特性和改进。以下是其中一些主要的特性和变化:

属性钩子(Property Hooks) 属性钩子提供了对计算属性的支持,使 IDE 和静态分析工具可以更好地理解代码。它还允许在设置属性值时进行预处理或后处理,而无需检查是否存在相应的 getter 或 setter 方法。

不对称可见性(Asymmetric Visibility) 在 PHP 8.4 中,可以独立控制属性的读写权限,这减少了需要编写 getter 方法来暴露属性值而不允许外部修改的需求。

弃用属性(#[\Deprecated] Attribute) 新的 #[\Deprecated] 属性使得 PHP 的弃用机制可以应用于用户定义的函数、方法和类常量。

新 DOM API 和 HTML5 支持 PHP 8.4 引入了一个新的 DOM API,提供了对 HTML5 文档的标准兼容支持,修复了几个长期存在的兼容性问题,并添加了几个函数使得使用文档更加方便。

BCMath 对象 API 新的 BcMath\Number 对象使得可以使用面向对象的方式和标准数学运算符来处理任意精度的数字。

新数组函数 PHP 8.4 引入了一些新的数组函数,例如 array_is_list() 和 array_key_last(),使得数组操作更加方便。


HN 热度 324 points | 评论 214 comments | 作者:theThree | 13 hours ago #

https://news.ycombinator.com/item?id=42202670

  • 设置属性时不会导致无限递归,因为钩子内部的属性访问不会触发其他钩子
  • 这种特性在 C#中已经存在很长时间,总体上是积极的,减少了样板代码和不一致性
  • 属性钩子可能会增加语言的复杂性,对于 PHP 这种成熟的语言来说,引入这种特性可能不会带来同样的好处
  • 使用 IDE 可以减轻这种特性的“魔法”感,但对于不使用 IDE 的开发者来说,这可能是一个问题
  • 属性的 getter 和 setter 应该尽量简单,不涉及太多逻辑,否则对调用者来说是隐藏的控制流
  • 99% 的 getter 和 setter 相关工作通常由 IDE 处理,这种封装风格是 OOP 的标准,语言应该支持而不是依赖额外的设计模式或 IDE 工具
  • 引入新特性可能会增加语言的臃肿,但在多种语言的实验室中,语言的增长提供了更多选择,好的特性会被其他语言借鉴,不好的特性则保持小众和独特
  • 属性钩子解决了 PHP 中手动编写 getter 和 setter 的痛点,使代码更简洁,更容易扩展

Electrobun: Cross-platform desktop applications written in TypeScript #

https://electrobun.dev/

Electrobun 是一个用于构建、更新和发布超快、超小、跨平台桌面应用程序的解决方案。它使用 Bun 作为主进程和 Webview 的执行环境,并使用 Zig 编写了本地绑定。Electrobun 的目标是提供一个一站式的解决方案,让开发者可以使用 Typescript 编写主进程和 Webview 的代码,而不需要考虑底层细节。

Electrobun 的特点包括:

  • 快速:Electrobun 使用 Bun 和 Webview 的组合来实现快速的应用程序执行。
  • 安全:Electrobun 使用主进程和 Webview 之间的隔离来确保应用程序的安全性。
  • 小巧:Electrobun 的应用程序包非常小,仅为 12MB 左右,更新包也非常小,只有 4KB 左右。
  • 全面:Electrobun 提供了一套完整的工作流程,让开发者可以快速开始编写代码和发布应用程序。

Electrobun 的文档包括:

  • 入门指南:介绍 Electrobun 的基本概念和使用方法。
  • Hello World:一个简单的示例应用程序,展示了如何使用 Electrobun 构建一个桌面应用程序。
  • 社区:Electrobun 的社区资源,包括 GitHub、Discord 和 Twitter 等。

Electrobun 的赞助商包括 Blackboard Technologies Inc.。


HN 热度 267 points | 评论 109 comments | 作者:CharlesW | 23 hours ago #

https://news.ycombinator.com/item?id=42199486

  • 该项目类似于 Tauri,但使用 Zig 进行快速/原生部分,并对前端/UI 部分更加有主见
  • 项目初期专注于 Mac 平台,以获得良好的开发者体验并吸引贡献者
  • Windows 的向后兼容性和 UI 风格的多样性使得 Mac 应用需要保持较高的设计一致性
  • 项目使用 Bun 代替 Node.js,运行 TypeScript,支持主进程和浏览器上下文
  • 项目将支持跨平台,但目前优先解决稳定性问题
  • 项目提供自定义优化的 bsdiff 实现和自解压机制,以减少初始下载和更新的大小
  • 项目提供自定义加密的 RPC 机制,便于 Bun 和浏览器进程之间的通信
  • 项目提供自定义 OOPIF 实现,允许嵌入隔离的浏览器上下文
  • 项目使用系统 Webview,不捆绑 Chromium
  • 项目当前的 Playground 应用大小为 50.4MB,主要由 Bun 运行时占用
  • 项目可能提供捆绑第三方 Webview 的选项,但不推荐
  • 项目类似于 Electron,但用 Bun 替换了 Node.js,用系统 Webview 替换了 Chromium
  • 项目是众多基于 Webview 的框架之一,优势在于使用 Bun 而非 Node.js
  • 对于真正轻量级的跨平台桌面应用,建议使用非 Webview 的原生框架如 Qt、GTK、wxWidgets 或 FLTK
  • 项目作为 Electron 的替代品,虽然门槛较低,但仍需解决性能和兼容性问题

Google stops letting sites like Forbes rule search for “Best CBD Gummies” #

https://arstechnica.com/gadgets/2024/11/google-cracks-down-on-parasite-seo-punishing-established-publishers/

谷歌停止允许像福布斯这样的网站在搜索结果中占据“最佳 CBD 果冻”的位置

谷歌昨天宣布,正在更新其网站声誉滥用政策,这意味着一些大型网站,特别是那些依靠其域名权威来推广第三方产品推荐的网站,将面临重大变化。

如果您曾经搜索过产品评论,并且看到一些不太相关的网站出现在搜索结果中,那么谷歌就是在针对这种情况。这种情况下,第三方内容被发布在主机网站上,目的是利用主机网站已经建立的排名信号。

谷歌表示,这种策略的目标是让内容在搜索结果中排名更高,而不是在其他网站上排名更高,这会导致用户体验不佳。

根据 Search Engine Land 的报道,福布斯、华尔街日报、CNN、财富和时代等网站的流量已经受到影响。福布斯的流量下降了 43%,时代的流量下降了 97%。

谷歌表示,这种网站声誉滥用策略有很多形式,但都有一个共同点:利用已建立的网站域名来销售产品。福布斯等网站通过其域名权威来推广第三方产品推荐,赚取佣金。

谷歌表示,已经审查了可能涉及不同程度的第一方参与的情况,但无论如何,第三方内容的本质和试图利用主机网站排名信号的不公平性不会改变。因此,使用第三方内容来利用高搜索质量排名,超出网站的主要焦点,被视为垃圾邮件。

谷歌的更新政策不会影响传统的第三方内容,如新闻稿、联合报道或明显的赞助内容。谷歌已经给予了一些网站“手动操作”,而不是仅仅依靠算法来捕捉这种不透明的安排。


HN 热度 249 points | 评论 180 comments | 作者:pseudolus | 1 day ago #

https://news.ycombinator.com/item?id=42198115

  • Google 的新政策可能是因为面临 ChatGPT 的竞争
  • 手动审查并禁止垃圾网站可能比自动化更有效
  • Google 早期就意识到广告和 SEO 垃圾网站之间的共生关系,并尝试制定政策限制
  • Google 可能通过操纵搜索质量来提高广告收入
  • ChatGPT 在某些情况下提供了更好的搜索体验,尤其是在长尾查询上
  • Google 的搜索结果质量下降,用户难以找到所需信息
  • 人工审查可以用于处理复杂且难以自动化的请求
  • 财务激励是导致 SEO 垃圾网站泛滥的根本原因
  • Google 曾经通过 Panda 更新打击 SEO 垃圾网站,但之后似乎停止了努力
  • Google 拥有庞大的员工基数,可以承担更多的人工审查成本
  • 人工审查可以扩展到每年的前一百万搜索查询
  • Google 和 SEO 垃圾网站之间存在互利关系,损害了用户体验
  • 人工审查需要考虑多语言问题,可能需要更多人力
  • Google 可能因 DOJ 的反垄断调查而调整搜索质量政策

Hyrum’s Law in Golang #

https://abenezer.org/blog/hyrum-law-in-golang

最近,我在探索 Go 代码库时,发现了一条有趣的注释。注释中提到“Hyrum’s Law”,这是一个由 Hyrum Wright,Google 的一名软件工程师命名的原则。这个原则的内容是:“当有足够多的用户使用一个 API 时,不管你在契约中承诺什么,系统的所有可观察行为都会被某些人依赖。”换句话说,代码中任何可观察的行为,无论是故意还是偶然的,最终都会被某些人依赖。

在这篇文章中,作者提到了 Go 代码库中的一些例子,说明了 Hyrum’s Law 的应用。例如,在 Go 的 crypto/rsa 包中,有一个函数 EncryptOAEP,它使用了 Hyrum’s Law 来解释为什么不能改变某些行为。同样,在 internal/weak 包中,也有一个注释提到了 Hyrum’s Law,解释了为什么不能改变某些行为。

作者还提到了 JavaScript 的发展历史,如何因为广泛依赖于各种奇怪的、非预期的行为而被迫保留这些行为。现在,作者终于知道了这个现象的名字——Hyrum’s Law。

最后,作者总结了 Hyrum’s Law 的教训:在改变可能被他人依赖的代码时要小心,并尝试设计系统以避免意外行为被依赖。同时,也要设计系统以最小化意外行为被依赖的可能性。


HN 热度 244 points | 评论 160 comments | 作者:thunderbong | 16 hours ago #

https://news.ycombinator.com/item?id=42201892

  • Hyrum’s Law 是一个有用的观察,但不能过度关注,优化代码可能会无意中破坏某些用户的系统
  • Hyrum’s Law 是系统在足够使用后出现的技术特性,如何应对这种特性取决于项目的社会背景
  • 在大型软件公司中,优化代码时必须确保不破坏任何内部服务,即使用户误用了 API
  • 对于开源项目,优化代码可能会破坏未正式支持的行为,但通常 99.99% 的用户会受益
  • 优化代码可能会导致依赖特定运行时间的系统出现问题,例如数据库查找循环
  • 一些旧系统曾依赖于函数的运行时间,但现在大多数系统运行在多核 CPU 上,不再依赖单个函数的执行时间
  • 性能影响严重时,即使没有正式的 API 合同,也可能被视为破坏性更改
  • 在加密领域,函数的运行时间非常重要,例如密码验证时间不应依赖于密码的具体值
  • 优化代码时,选择新算法可能会改善最佳和平均情况的运行时间,但会恶化最坏情况的运行时间,影响不同用户
  • Go 语言对向后兼容性的承诺非常坚定,这导致了对 Hyrum’s Law 的广泛讨论

The meme-ification of the “Demon Core” #

https://doomsdaymachines.net/p/the-meme-ification-of-the-demon-core

“末日机器”博客的文章《“恶魔核心”的迷因化》讨论了 1946 年 5 月 21 日,加拿大物理学家路易斯·斯洛廷在洛斯阿拉莫斯实验室进行的一次核临界实验事故。斯洛廷在演示如何进行临界实验时,不小心让钚核心接触到反射体,导致了一次核反应,释放出大量辐射,斯洛廷和其他在场人员受到辐射,斯洛廷九天后死亡。

文章讨论了这次事故的历史背景和技术细节,并指出这次事故被称为“恶魔核心”事故。文章还讨论了这次事故在互联网上被迷因化的现象,指出这次事故被用来制作各种搞笑图片和视频,例如将斯洛廷的实验设置与卡通角色或其他搞笑元素结合起来。

文章认为,这种迷因化现象反映了互联网上对核能和核事故的态度和认知,人们通过这种方式来表达对核能的恐惧和不安。文章还指出,这种迷因化现象也反映了互联网上对历史事件和技术细节的兴趣和热情。

总的来说,这篇文章讨论了“恶魔核心”事故的历史背景和技术细节,并分析了这次事故在互联网上被迷因化的现象,反映了互联网上对核能和核事故的态度和认知。


HN 热度 240 points | 评论 175 comments | 作者:SaberTail | 20 hours ago #

https://news.ycombinator.com/item?id=42200699

  • Demon Core 膜因起源于 2013 年的 KanColle 社区,主要在图像和视频中传播
  • 该膜因最早在 Pixiv 上的记录可追溯到 2016 年 1 月 17 日,比其他日本 Demon Core 膜因早几年
  • Futaba Channel 是日本的一个图像板网站,4chan 基于此网站并借鉴了其文化
  • 大多数喜剧都是悲剧加上时间,笑是一种自私的行为
  • Demon Core 膜因的幽默在于将极其危险和紧张的事情与轻松的行为对比,这种对比让人觉得不可思议
  • 与加油站点燃香烟的情况类似,但 Demon Core 膜因更具有魔幻色彩,激发了人们对奇幻故事和神秘力量的想象
  • 虽然 Louis Slotin 的死亡过程并非瞬间,但他的命运在瞬间被决定,这与大多数其他死亡形式不同

2024 11 21 HackerNews

2024-11-21 07:49:50

2024-11-21 Hacker News Top Stories #

  1. Let’s Encrypt 是一个免费证书颁发机构,旨在让每个人都可以轻松获得基本的服务器证书。
  2. Epic 公司允许 Internet Archive 免费分发《Unreal》和《Unreal Tournament》两款经典游戏。
  3. 蒙提·派森的电影《蒙提·派森和圣杯》无意中为观众普及了亚瑟王传说等历史知识。
  4. 海底电缆被破坏,疑似与中国籍货船 Yi Peng 3 有关。
  5. 分析性抗锯齿(Analytical Anti-Aliasing)是一种图形处理技术,用于消除图像中的锯齿边缘。
  6. Tiny Glade 的实时全局光照引擎非常先进,且完全自定义,开发者之一 Tomasz Stachowiak 在实时渲染领域很有名气。
  7. 黑洞视觉是一个 iOS 应用程序,允许用户通过 iPhone 的摄像头观察黑洞的视觉效果。
  8. 软件开发中的估算问题是指估算不应被视为截止日期,但管理层往往忽视这一点,频繁更改规格导致问题。
  9. BM25 算法是目前最常用的全文搜索算法之一,它是 Lucene/Elasticsearch 和 SQLite 等搜索引擎的默认算法。
  10. SpaceX 的超级重型火箭在墨西哥湾进行了溅落测试,取消了原计划的着陆。

Let’s Encrypt is 10 years old now #

https://letsencrypt.org/2014/11/18/announcing-lets-encrypt/

Let’s Encrypt 是一个新的免费证书颁发机构,旨在让每个人都可以轻松获得基本的服务器证书。该项目由 Mozilla Corporation、Cisco Systems、Inc.、Akamai Technologies、Electronic Frontier Foundation、IdenTrust、Inc. 和密歇根大学的研究人员共同开发。Let’s Encrypt 的目标是让每个人都可以免费获得服务器证书,并且整个过程都是自动化的。

Let’s Encrypt 的关键原则包括:

  • 免费:任何拥有域名的人都可以免费获得证书。
  • 自动化:整个证书颁发过程都是自动化的,用户不需要进行任何手动操作。
  • 安全:Let’s Encrypt 将成为现代安全技术和最佳实践的平台。
  • 透明:所有证书颁发和吊销记录都将公开。
  • 开放:自动化颁发和更新协议将是开放标准,软件也将是开源的。
  • 合作:Let’s Encrypt 是一个共同的努力,旨在让整个互联网社区受益,而不仅仅是某一个组织。

该项目计划于 2015 年第二季度推出。任何人都可以通过赞助 ISRG、帮助构建 Let’s Encrypt 或者捐款来支持该项目。Let’s Encrypt 的目标是让 HTTPS 成为互联网的标准,保护用户的隐私和安全。


HN 热度 472 points | 评论 172 comments | 作者:gslin | 17 hours ago #

https://news.ycombinator.com/item?id=42191228

  • Let’s Encrypt 是一项伟大的服务,它使互联网变得更加安全,降低了 HTTPS 证书的成本
  • 仍有人像 2013 年一样,每年手动或自动续订证书
  • 银行环境有时要求 SSL 证书至少有一年的有效期,这排除了 Let’s Encrypt
  • 银行采用“打勾式安全”,即遵循一系列安全规范,尽管有些规范已经过时或不合理
  • 银行的安全措施可能受到监管要求的影响,而非技术知识的缺乏
  • 提供更长有效期证书的付费服务可能是 Let’s Encrypt 的一个商业机会
  • 保持 Let’s Encrypt 完全非营利性更好,以避免将安全功能与付费绑定
  • 通过提供长有效期证书的付费服务,可以减少留在非 ACME 生态系统中的激励
  • 全球签和 DigiCert 已经支持 ACME 协议

Epic Allows Internet Archive to Distribute Unreal and Unreal Tournament Forever #

https://www.techdirt.com/2024/11/18/epic-allows-internet-archive-to-distribute-for-free-unreal-unreal-tournament-forever/

Epic 允许 Internet Archive 免费分发《Unreal》和《Unreal Tournament》

Epic 公司最近宣布允许 Internet Archive 免费分发《Unreal》和《Unreal Tournament》两款经典游戏。这两款游戏都是 20 世纪 90 年代末和 21 世纪初期非常流行的第一人称射击游戏。

根据 Internet Archive 的说法,Epic 公司已经同意允许他们免费分发这两款游戏,并且还提供了游戏的源代码。Internet Archive 是一个非营利组织,致力于保存和提供数字内容,包括游戏、电影、音乐和书籍等。

《Unreal》和《Unreal Tournament》都是由 Epic 公司开发的,分别于 1998 年和 1999 年发布。两款游戏都获得了广泛的好评,并且在当时的游戏市场上取得了很大的成功。

Epic 公司的这一决定受到游戏玩家和开发者的欢迎。许多人认为,这一决定是对游戏文化和历史的保护和尊重。同时,也有许多人认为,这一决定将有助于促进游戏开发和创新的发展。

Internet Archive 的创始人 Brewster Kahle 表示:“我们很高兴能够与 Epic 公司合作,提供这些经典游戏。我们相信,这些游戏不仅仅是娱乐产品,还代表着游戏开发和创新的历史和文化。”

Epic 公司的这一决定也引发了人们对游戏开发和分发模式的讨论。许多人认为,游戏开发商应该更加开放和合作,允许玩家和开发者自由地使用和修改游戏内容。同时,也有许多人认为,游戏开发商应该保护自己的知识产权和商业利益。

总的来说,Epic 公司允许 Internet Archive 免费分发《Unreal》和《Unreal Tournament》是游戏行业的一件大事,标志着游戏开发商开始更加开放和合作。同时,也引发了人们对游戏开发和分发模式的讨论和思考。


HN 热度 459 points | 评论 105 comments | 作者:chocmake | 20 hours ago #

https://news.ycombinator.com/item?id=42190541

  • 希望 Epic 能像 Quake 一样将 Unreal Tournament 开源,即使缺少一些专有依赖,社区也能替代它们
  • Unreal Engine 1 可能有一天会开源,但需要先清理代码
  • 清理代码可能是开发者对代码感到羞愧,但并非必要
  • 开源旧代码需要大量努力,包括找到所有涉及的人或了解版权的法律状态,检查代码中的专有内容
  • WebRTC 可以实现浏览器中的 UDP 连接,但只能与合作的 WebRTC 对等体通信
  • Unreal Tournament 的多人游戏和变种器(mutator)概念非常有趣,可惜后来的游戏没有继续这一概念
  • 游戏引擎可以同时发布在多个不同的许可证下
  • 早期的 Unreal Tournament 游戏如“Game of the Year Edition”给许多人留下了美好的回忆,包括地图、游戏模式和音效
  • Infiltration 等全面转换模组为 Unreal Tournament 增添了更多乐趣,花费了大量时间和精力
  • Unreal Tournament 的音乐,特别是 Facing Worlds 的地图音乐,激发了对音乐的兴趣
  • 25 年前的游戏引擎今天已经没有太多可以作为商业秘密的内容
  • Unreal Engine 的源代码大部分已经公开在 GitHub 上,除了受 NDA 保护的特定平台部分

What is the origin of the lake tank image that has become a meme? (2021) #

https://history.stackexchange.com/questions/57033/what-is-the-origin-of-the-lake-tank-image-that-has-become-a-meme

这个网页是一个关于历史事件的讨论页面,讨论的是一张照片的来源和背景。照片中有一辆德国坦克陷入河中,旁边站着一名德国士兵。讨论者们试图找出照片的拍摄时间、地点和背景。

照片中坦克的型号被确认为 Panzer IV,士兵的制服被认为是苏联军队的制服,但并不是专家。有人提到照片可能是在 2017 年首次出现在俄罗斯网站上,但没有明确的来源。

经过进一步讨论和研究,人们发现了照片的真实背景。照片拍摄于 1940 年 5 月 13 日,地点在比利时的默兹河畔。坦克属于德国第 5 装甲师的第 31 装甲团,坦克的指挥官是海因茨·佐贝尔中尉。坦克是在渡河过程中掉入河中的。

照片中站在坦克旁边的士兵被认为是一名德国工兵,他可能是在坦克被打捞出来时拍摄的照片。士兵的制服被确认为德国工兵的制服,持有的枪支是 Kar98k 步枪。

总之,这个网页的讨论揭示了照片的真实背景,包括拍摄时间、地点、坦克的型号和士兵的身份。


HN 热度 441 points | 评论 97 comments | 作者:napolux | 10 hours ago #

https://news.ycombinator.com/item?id=42193771

  • 蒙提·派森的电影《蒙提·派森和圣杯》无意中为观众普及了亚瑟王传说等历史知识
  • 喜剧往往不以事实准确性著称,例如关于罗马帝国的贡献和西班牙宗教裁判所的描述存在历史错误
  • 罗马帝国在水系统建设方面取得了显著成就,包括建造了世界上最大的输水道网络,以及至今仍在使用的下水道系统
  • 罗马帝国的统治带来了和平与繁荣,尽管这种和平是通过武力维持的
  • 罗马法是罗马帝国的重要贡献之一
  • 奴隶制在前工业社会中普遍存在,因为人力和畜力是唯一的可靠能源
  • 奴隶制在经济上是低效的,因为它不创造需求,也不促进经济增长
  • 蒙提·派森的喜剧虽然不准确,但激发了观众对历史的兴趣和独立调查
  • 每个人的文化遗产中都可能包含奴隶制、暴行等负面历史,重要的是个人的选择和行为
  • 《辛普森一家》等流行文化作品虽然不准确,但也帮助更多人了解了经典文学作品

Yi Peng 3 crossed both cables C-Lion 1 and BSC at times matching when they broke #

https://bsky.app/profile/auonsson.bsky.social/post/3lbc5va7f722p

本文讨论了最近发生的事件,涉及一艘名为"Yi Peng 3"的中国籍货船。该船在波罗的海地区活动时,疑似与两条海底电缆(C-Lion 1 和 BSC)的损坏有关。事件发生在 2024 年 11 月 19 日。

货船 Yi Peng 3 被丹麦海军跟踪了一段时间,期间该船穿过了两条海底电缆。然而,目前尚无证据表明该船曾被登船检查。该船目前已离开波罗的海地区,进入丹麦海峡。

事件的具体细节尚不清楚,但该船的行为引发了人们对其活动的关注。事件发生后,相关部门可能会进行进一步调查,以确定货船的动机和行为。


HN 热度 432 points | 评论 538 comments | 作者:perihelions | 16 hours ago #

https://news.ycombinator.com/item?id=42191394

  • 北溪管道爆炸后,海底电缆和卫星的使用寿命可能会缩短。
  • 北溪管道爆炸是美国、俄罗斯和乌克兰的联合行动。
  • 北溪管道爆炸是俄罗斯内部人士出于醉酒冒险行为导致。
  • 北溪管道爆炸是波兰为了最大化与挪威的天然气连接而采取的行动。
  • 北溪管道爆炸是挪威为了向波兰出售更多天然气而策划的。
  • 北溪管道爆炸可能是美国在 BALTOPS 22 演习期间秘密行动的结果。
  • 欧洲需要具备快速发射卫星的能力,以应对海底电缆被破坏的情况。
  • 海底电缆比卫星更可靠,但需要修改国际海洋法,禁止敌对国家船只在重要电缆附近自由航行。
  • 欧洲实际上已经处于非正式战争状态,需要对海底电缆进行非正式监控和反破坏措施。
  • 欧洲并未进入战争状态,目前只是在帮助乌克兰,这并不是欧盟的战争。

AAA – Analytical Anti-Aliasing #

https://blog.frost.kiwi/analytical-anti-aliasing/

本文探讨了抗锯齿(Anti-Aliasing)技术,特别是分析性抗锯齿(Analytical Anti-Aliasing)。抗锯齿是一种图形处理技术,用于消除图像中的锯齿边缘。文章首先介绍了抗锯齿的基本概念和几种常见的抗锯齿算法,包括 SSAA(Super Sampling Anti-Aliasing)、MSAA(Multisample Anti-Aliasing)和 FXAA(Fast Approximate Anti-Aliasing)。

文章接着深入讨论了分析性抗锯齿的原理和实现。分析性抗锯齿是一种基于数学分析的抗锯齿方法,它通过计算图像的梯度和曲率来确定边缘的位置和方向,从而实现更准确的抗锯齿效果。文章还介绍了分析性抗锯齿的优点,包括更好的图像质量和更低的计算复杂度。

文章还讨论了分析性抗锯齿在实际应用中的挑战和解决方案,包括如何处理复杂的图形场景和如何优化算法的性能。最后,文章总结了分析性抗锯齿的优势和未来发展方向,认为分析性抗锯齿将成为图形处理领域的重要技术。

总的来说,本文提供了一个全面和深入的介绍分析性抗锯齿的原理、实现和应用,适合图形处理领域的专业人员和研究人员阅读。


HN 热度 420 points | 评论 58 comments | 作者:todsacerdoti | 15 hours ago #

https://news.ycombinator.com/item?id=42191709

  • Google Maps 使用 AAA 技术对所有道路段进行处理,每个道路段都是一个实例化的矩形,通过 AAA 技术使其看起来像抗锯齿的宽线,具有圆形端帽和接头
  • 抗锯齿应该在线性 RGB 空间而不是 sRGB 空间中进行,但多年来字体已经调整以适应 sRGB 空间,有时 sRGB 更好
  • WebGL1 支持 MSAA,但无法控制样本数量,WebGL2 仍然缺少 MSAA 纹理对象,这在 WebGPU 中是可能的
  • 文章的介绍部分可能会让人失望,因为它主要讨论的是 SDF 的抗锯齿,而不是 3D 场景的抗锯齿
  • 文章中的链接默认应该在新标签页中打开,以避免在移动浏览器中重新加载页面的问题
  • 作者的技术栈未在源代码中明确提及,但可以通过 GitHub 评论链接找到源代码
  • 文章内容非常出色,使用了 WebGL 示例,深入浅出地解释了图形编程
  • TAA 在低帧率下容易产生鬼影效果,许多人因此选择更慢但更稳定的算法
  • 一些移动设备在 2x MSAA 时会出现类似伪影的问题,这可能与 GPU 和 API 有关
  • 使用分析抗锯齿方法可以提高 UI 元素的渲染质量,对于非 3D 场景非常有用

Tiny Glade ‘built’ its way to >600k sold in a month #

https://newsletter.gamediscover.co/p/how-tiny-glade-built-its-way-to-600k

这篇文章来自《GameDiscoverCo》新闻通讯,作者是 Simon Carless,主要讨论了小型独立游戏《Tiny Glade》在上市一个月内销售超过 60 万份的成功案例,以及与游戏发现和平台相关的最新动态。

首先,作者提到《Tiny Glade》是一款休闲建设类游戏,具有开放式沙盒的特点,玩家可以在游戏中自由地创造和设计,游戏没有严格的目标或失败条件。开发团队在游戏的开发过程中花费了两年的时间,并在 2023 年 9 月 23 日正式上线,发布前曾在 Steam Next Fest 获得了良好的关注。

销售数据与市场表现 #

  • 游戏在发售后短时间内销售了 616,000 份,预计将长期保持良好的销售势头。
  • 该游戏的日活跃用户(DAU)数量与同时在线用户(CCU)比例高达 30 倍,显示出其吸引力。
  • 玩家平均游戏时长约为 1 小时 4 分钟,虽然相对较短,但并未影响用户对游戏的积极评价,用户评分高达 97% 正面评价。

用户群体和市场反应 #

根据开发团队提供的数据,游戏的主要购买国家包括美国(32%)、德国(9%)、法国(7%)等,显示出游戏的市场分布。作者分析了游戏的目标用户群体,认为他们主要偏好自由度高的城镇建设类游戏和休闲游戏。

营销策略 #

游戏之所以取得如此成功,得益于开发团队在社交媒体上的积极推广,以及在各大平台上发布的预告片和试玩版本,吸引了大量玩家和流媒体主播的关注。在 Steam 上,该游戏在推出时已经积累了超过 137 万的愿望单,显示出强大的市场需求。

开发理念与设计哲学 #

在与开发者 Ana Opara 和 Tomasz Stachowiak 的访谈中,强调了他们追求的设计理念:

  • ** 逃离压力 **:游戏旨在为玩家提供一个安静的空间,让他们在没有压力的情况下自由发挥创造力。
  • ** 迭代开发 **:开发过程中进行了多次外部测试和迭代,确保用户体验的平滑和满意度。
  • ** 游戏体验 **:游戏设计的核心在于 “无错误答案” 和 “生动的世界反应”,让玩家感受到游戏环境的活力。

结论 #

《Tiny Glade》的成功证明了高质量的游戏设计和有效的市场推广相结合的重要性,同时展示了自由创作和休闲体验在现代游戏市场中的吸引力。作者还提到,尽管在游戏行业中存在平台垄断和收入分配不公的问题,但小型开发团队通过创新和独特的游戏理念仍能获得成功。整体来看,这篇文章深刻探讨了现代游戏开发的多个方面,包括市场策略、用户体验、设计理念等,提供了丰富的行业见解。


HN 热度 393 points | 评论 97 comments | 作者:TaurenHunter | 21 hours ago #

https://news.ycombinator.com/item?id=42190065

  • Tiny Glade 的实时全局光照引擎非常先进,且完全自定义,开发者之一 Tomasz Stachowiak 在实时渲染领域很有名气
  • 另一位开发者 Anastasia Opara 在程序化图形领域很有名,曾做过精彩的演讲
  • 游戏的成功在于两位开发者的技术和艺术才能
  • 游戏的创造模式非常出色,但生存模式仍在开发中
  • 游戏的探索和建造元素吸引了许多玩家,尤其是喜欢 Valheim 的玩家
  • 游戏的创造模式更像是一个技术演示,缺乏深度和目标
  • 游戏的深度来自于玩家的创造力,不一定需要明确的目标和游戏循环
  • Tiny Glade 是首个在 Steam 上取得显著财务成功的完全用 Rust 和 Vulkan 编写的游戏项目
  • Rust 编写的其他游戏如 Gnorp Apologue 也值得购买和尝试
  • 游戏的成功可能会促使开发者将其移植到游戏主机平台,尽管存在一些障碍

Show HN: Physically accurate black hole simulation using your iPhone camera #

https://apps.apple.com/us/app/black-hole-vision/id6737292448

黑洞视觉

这是一个 iOS 应用程序,允许用户通过 iPhone 的摄像头观察黑洞的视觉效果。该应用程序使用真实的物理引擎模拟黑洞的引力透镜效应,将周围的光线弯曲成环形。用户可以看到黑洞周围的光环(photon ring),这是黑洞透镜效应的一个特征。

应用程序功能

  • 将黑洞放置在 iPhone 摄像头的视野中
  • 模拟黑洞的引力透镜效应
  • 显示黑洞周围的光环(photon ring)
  • 支持旋转黑洞(Kerr 黑洞)
  • 用户可以调整黑洞的旋转速度

开发背景

该应用程序由 Alexandru Lupsasca 开发,得到了美国国家科学基金会的支持。应用程序的代码开源,托管在 GitHub 上。开发团队包括 Trevor Gravely、Roman Berens 和 Alex Lupsasca。

应用程序信息

  • 应用程序名称:Black Hole Vision
  • 类别:教育
  • 语言:英语
  • 适用平台:iPhone、iPad、Mac
  • 操作系统要求:iOS 17.5 或以上、macOS 14.5 或以上
  • 大小:67.1 MB
  • 价格:免费

HN 热度 311 points | 评论 114 comments | 作者:yunyu | 1 day ago #

https://news.ycombinator.com/item?id=42185668

  • 该应用通过 iPhone 摄像头模拟黑洞的引力透镜效应,提供物理上准确的视觉体验
  • 应用包括静态和旋转(Kerr)黑洞模式,用户可以调整黑洞的旋转速度
  • 应用的源代码可在 GitHub 上找到,包括 Mathematica 笔记本
  • 项目得到了美国国家科学基金会的支持
  • 该应用展示了光线如何被黑洞弯曲,使用户能够“看到”黑洞背后的景象
  • 黑洞会吸收部分光线,但同时也会因时空弯曲而使原本看不到的光线到达观察者
  • 从外部观察者角度看,物体接近事件视界时会“冻结”
  • 预览中生成的黑洞图像可能不完全正确,取决于定义的视场和黑洞是否旋转

When did estimates turn into deadlines? #

https://domainanalysis.io/p/architecture-modernization-execution

本文的作者 Indu Alagarsamy 分享了自己最近的经历,包括车祸和公司的劳资纠纷,之后开始讨论软件开发中的估算问题。作者认为,估算是一种艺术,而不是科学,尤其是在复杂的软件现代化项目中。

作者使用汽车维修的例子来说明估算的复杂性,指出即使是经验丰富的技工也可能无法预测到所有的潜在问题。作者还引用了 David J Snowden 和 Mary E Boone 的文章《领导者的决策框架》,讨论了复杂性和复杂性的区别,认为软件现代化项目通常属于复杂性范畴。

作者建议,应对复杂性项目的估算应采取灵活的态度,而不是固定的日期和预算。


HN 热度 291 points | 评论 213 comments | 作者:alexzeitler | 1 day ago #

https://news.ycombinator.com/item?id=42187506

  • 估算不应被视为截止日期,但管理层往往忽视这一点,频繁更改规格导致问题
  • 为避免责备,团队成员会大幅垫高估算时间,最终导致项目成本过高
  • 无责备文化有助于团队更诚实,提高生产力,但可能保护低绩效者,过度建立保障措施
  • 将焦点从责备转向改进对创新至关重要
  • 医疗行业中的成本垫高现象与软件开发行业类似,都是为了应对系统中的不合理要求
  • 紧急护理的费用垫高是为了补贴无力支付的患者,但这也导致了系统性成本问题
  • 无责备文化可以减少隐藏错误,提高问题解决效率,但需要配套的激励机制来避免负面影响

Understanding the BM25 full text search algorithm #

https://emschwartz.me/understanding-the-bm25-full-text-search-algorithm/

BM25 算法是目前最常用的全文搜索算法之一,它是 Lucene/Elasticsearch 和 SQLite 等搜索引擎的默认算法。近年来,全文搜索和向量相似度搜索的结合,即“混合搜索”,变得越来越流行。作者想要了解全文搜索的工作原理,特别是 BM25 算法,因此写下了这篇文章。

BM25 算法的目标是根据查询词的重要性和文档的相关性来计算文档的得分。算法的主要组成部分包括:

  1. 查询词的重要性:BM25 算法使用逆文档频率(IDF)来计算查询词的重要性。IDF 是指查询词在整个文档集合中出现的频率。出现频率越低的词,重要性越高。
  2. 文档的相关性:BM25 算法使用词频(TF)来计算文档的相关性。词频是指查询词在文档中出现的次数。词频越高,相关性越高。
  3. 文档长度的归一化:BM25 算法使用文档长度的归一化来避免长文档的词频过高。文档长度的归一化是指文档的长度与平均文档长度的比值。

BM25 算法的计算公式如下:

score(D,Q)=∑i=1nln(N−n(qi)+0.5n(qi)+0.5+1)·f(qi,D)·(k1+1)f(qi,D)+k1·(1−b+b·|D|avgdl)

其中,D 是文档,Q 是查询词,n 是查询词的数量,qi 是每个查询词,N 是文档集合的大小,n(qi)是包含查询词 qi 的文档数量,f(qi,D)是查询词 qi 在文档 D 中的词频,k1 是调节词频的参数,b 是调节文档长度的参数,|D| 是文档 D 的长度,avgdl 是平均文档长度。

BM25 算法的优点包括:

  • BM25 算法可以有效地计算文档的相关性和重要性。
  • BM25 算法可以避免长文档的词频过高。
  • BM25 算法可以根据查询词的重要性和文档的相关性来计算文档的得分。

BM25 算法的缺点包括:

  • BM25 算法需要大量的计算资源。
  • BM25 算法需要调整参数来获得最佳的结果。

总的来说,BM25 算法是目前最常用的全文搜索算法之一,它可以有效地计算文档的相关性和重要性。但是,BM25 算法需要大量的计算资源和参数调整,因此需要仔细考虑使用的场景和优化的方法。


HN 热度 271 points | 评论 51 comments | 作者:rrampage | 19 hours ago #

https://news.ycombinator.com/item?id=42190650

  • Typesense 是一个适合中小型项目的高效搜索解决方案,支持混合搜索,易于部署和使用。
  • 针对特定任务,使用不同的小型分类器模型和手动调整关键词权重,可以实现非常精准的搜索结果。
  • RRF(Reciprocal Rank Fusion)虽然简单,但可能不是所有场景的最佳选择,有时会拖累搜索效果。
  • 搜索栈的选择应根据具体需求灵活使用,结合多种工具和方法,如 Elasticsearch、Turbopuffer、Redis 等,以应对不同类型的查询。
  • BM25 结合语义本体增强查询和基于向量的重排序,可以有效提升搜索质量,尤其是在前几名结果中。
  • txtai 库实现了高效的 BM25 索引和混合搜索方法,支持 BM25 分数的归一化和 RRF。
  • 使用 text-embedding-3-large、SPLADE 和 RRF 进行混合搜索,效果良好。
  • BM25 是“Best Matching 25”的缩写,属于概率模型,由 Stephen Robertson 和 Karen Spärck Jones 提出,经过 TREC 会议测试,证明其有效性。
  • 除了“词袋”模型和概率模型,还有多种理论框架用于文档排名,如“偏离随机性”、“统计语言建模”、“学习排序”、“量子信息检索”、“神经排序”等。

SpaceX Super Heavy splashes down in the gulf, canceling chopsticks landing #

https://twitter.com/spacex/status/1858995009384837380

在 X(前身为 Twitter)上,SpaceX 发布了关于 “超级重型火箭正在进行降落燃烧并将在墨西哥湾进行溅落” 的消息。网友们对此进行了热烈讨论,主要包括以下几点内容:

  1. ** 降落与溅落 **:许多用户对火箭的降落过程表达了关注,有人希望能够成功捕捉到火箭,尽管他们也理解进行海上溅落测试的重要性。
  2. ** 特朗普的影响 **:部分网友讨论了特朗普的到场是否对捕捉决策产生了影响,有人对特朗普表示不满,认为他没有帮助。
  3. ** 捕捉标准 **:有人提出了关于火箭捕捉标准的问题,猜测可能与火箭的计划速度有关,并表示希望能够了解未来捕捉标准的变化。
  4. ** 测试飞行的价值 **:不少网友提醒大家,这些都是测试飞行,即使火箭最终在海中溅落,SpaceX 依然可以获得有价值的信息。
  5. ** 降落过程的表现 **:有用户对超级重型火箭的降落过程表示赞赏,称其为 “在重力面前再次挑战” 的壮举,并形容降落燃烧过程为 “艺术品”。
  6. ** 未来计划的影响 **:有人提到,降落过程的顺利与否可能会影响未来的决策标准,尤其是与快速发射许可相关的计划。

总的来说,虽然火箭没有成功捕捉,但这次测试仍被视为获取重要数据的机会,对 SpaceX 的后续发展和发射计划具有重要意义。


HN 热度 262 points | 评论 407 comments | 作者:alach11 | 1 day ago #

https://news.ycombinator.com/item?id=42188687

  • SpaceX 成功展示了发动机在太空中的重新点火,这是一个重要的里程碑。
  • 目前将星舰送入低地球轨道存在风险,因为如果发动机无法重新点火,它可能会在随机位置坠落,造成大型碎片。
  • 飞行终止系统(FTS)可以减少燃料爆炸的风险,但无法完全避免碎片产生。
  • 在轨道上激活 FTS 可能会导致 100 吨的危险碎片留在轨道中,因此不建议这样做。
  • 测试飞行的主要目的是收集数据,而不是运送有效载荷,例如今天的测试有意削弱了星舰的热屏蔽以验证之前的估计。
  • SpaceX 在测试飞行中不携带有效载荷是因为他们需要确保能够安全地进行再入大气层测试,而轨道飞行可能因发动机故障而无法实现这一目标。
  • 即使星舰在低地球轨道上,如果无法确保受控再入,仍然存在安全风险。
  • SpaceX 已经成功在太空中点燃了猛禽发动机,未来的飞行可能会尝试进入轨道。
  • 测试飞行的授权范围不包括将有效载荷送入轨道,因此目前星舰的测试飞行不携带有效载荷。

2024 11 20 HackerNews

2024-11-20 07:24:10

2024-11-20 Hacker News Top Stories #

  1. 美国司法部要求谷歌出售 Chrome 浏览器,以打破其在搜索市场的垄断地位。
  2. FastGraphRAG 是一个流线型的、可提示的图形 RAG 框架,旨在为可解释性、 高精度、代理驱动的检索工作流程提供支持。
  3. Cerebras 推出 Llama 3.1 405B 模型,实现了前所未有的速度和性能。
  4. 《科学美国人》杂志的主编劳拉·赫尔穆特最近辞职,这可能是由于她在社交媒体上发表了一系列激进的言论。
  5. 谷歌学术是一个帮助研究人员查找和阅读研究论文的工具,诞生于 20 年前,至今仍在不断发展。
  6. OpenStreetMap(OSM)推出了新矢量瓦片,提供更高的灵活性和更好的视觉效果。
  7. 该研究收集了 350,757 次硬币抛掷数据,结果支持了 D-H-M 模型的预测:硬币落在同一侧的概率约为 51%。
  8. 作者试图更新自己四年前创建的个人网站的经历,使用的框架是 Gatsby,然而由于项目已经四年没有更新,导致了许多问题的出现。
  9. Maslow CNC 是一个大型 CNC 路由器,旨在使大型 CNC 路由成为每个人的可能。
  10. Hyperfine 是一个命令行基准测试工具,支持统计分析、任意 shell 命令、实时反馈、预热运行、缓存清除命令、统计异常检测、结果导出等功能。

DOJ will push Google to sell off Chrome #

https://www.bloomberg.com/news/articles/2024-11-18/doj-will-push-google-to-sell-off-chrome-to-break-search-monopoly

美国司法部的反垄断官员决定请求法官强制谷歌公司出售其 Chrome 浏览器,这将标志着对这家全球最大科技公司的历史性打击。司法部将向法官提出建议,要求与人工智能和 Android 手机操作系统相关的措施。反垄断官员与加入案件的各州也计划推荐法官对谷歌实施数据许可要求。

如果法官采纳这些提议,可能会重新塑造在线搜索市场和快速发展的人工智能产业。这起案件最早是在特朗普政府时期提起的,后在拜登总统任内持续推进,是华盛顿自两十年前未能拆分微软以来,对科技公司最为激进的监管措施。

谷歌的监管事务副总裁 Lee-Anne Mulholland 表示,司法部的做法超出了案件的法律问题,政府干预将对消费者、开发者以及美国的技术领导力造成伤害。随后,谷歌股价在交易中下跌了 1.8%。

反垄断执法者希望法官下令谷歌出售 Chrome 浏览器,因为该浏览器是用户访问谷歌搜索引擎的重要途径,目前在美国市场的占有率约为 61%。在准备建议时,政府律师与数十家公司进行了会面,并考虑到可能添加一些提案。

反垄断官员放弃了强迫谷歌出售 Android 系统的更严厉选项。谷歌计划对法官在 8 月作出的裁决提出上诉,该裁决认定谷歌在在线搜索和搜索文本广告市场上违反了反垄断法。

法官已设定在明年 4 月进行为期两周的听证会,讨论谷歌需采取哪些措施来纠正其非法行为,并计划在 2025 年 8 月之前发布最终裁决。司法部和各州同意要求谷歌必须许可其流行搜索引擎的结果和数据,并为网站提供更多选项,以防止其内容被谷歌的人工智能产品使用。

此外,反垄断执法者还准备建议谷歌将 Android 手机操作系统与其其他产品(如搜索和 Google Play 移动应用商店)分开销售。他们还准备要求谷歌与广告商共享更多信息,并给予广告商更多控制广告展示位置的权利。

谷歌现在在搜索页面顶部展示人工智能驱动的答案,称为 “AI 概述”。尽管网站可以选择不让其信息被谷歌用于创建 AI 模型,但如果选择退出,将可能导致其在搜索结果中的排名下降,从而更难吸引客户。

关于数据许可,反垄断执法者计划提出两个选项:要求谷歌出售基础的 “点击和查询” 数据,并单独提供其搜索结果的授权。谷歌目前销售的联合搜索结果存在限制,强迫谷歌出售搜索结果将使竞争对手的搜索引擎和 AI 初创公司能够快速提升其质量。


HN 热度 1084 points | 评论 1242 comments | 作者:redm | 1 day ago #

https://news.ycombinator.com/item?id=42177767

  • 谷歌通过 Chrome 浏览器获取大量用户浏览数据,有利于广告业务
  • 谷歌拥有特殊 API 和功能,其他浏览器无法使用
  • 谷歌推动如 Manifest v3、FLoC 等新功能,可能增加广告
  • 谷歌在移动版 Firefox 上提供较差的搜索体验
  • AOSP 缺少关键应用,第三方平台难以与谷歌竞争
  • 第三方启动器和应用商店难以实现谷歌特有的功能
  • 谷歌的完整性检查影响第三方应用的使用
  • 浏览器不是自给自足的产品,需要资金支持
  • 如果谷歌被迫剥离 Chrome,市场可能会更加开放和竞争
  • 微软和 Opera 已经放弃自研浏览器引擎,转而使用 Chromium
  • 竞争可能使 Chrome 变得更好或更糟
  • 可以考虑通过制造商支付浏览器开发费来资助浏览器开发
  • 用户可以选择免费的 Chromium,不必购买 Chrome
  • Oracle 可能收购 Chrome 后,将其变为商业产品
  • 如果没有合适的浏览器,用户宁愿选择没有互联网的生活
  • 希望有人能建立非营利组织接管 Chromium 开发

Show HN: FastGraphRAG – Better RAG using good old PageRank #

https://github.com/circlemind-ai/fast-graphrag

Fast GraphRAG 是一个流线型的、可提示的图形 RAG 框架,旨在为可解释性、 高精度、代理驱动的检索工作流程提供支持。它具有以下特点:

  • 可解释性和调试知识:图形提供了一个人类可导航的知识视图,可以查询、可视化和更新。
  • 快速、低成本、高效:旨在在不需要大量资源或成本的情况下运行。
  • 动态数据:自动生成和细化图形以适应您的域和本体需求。
  • 增量更新:支持实时更新以适应您的数据演变。
  • 智能探索:利用基于 PageRank 的图形探索以增强准确性和可靠性。
  • 异步和类型化:完全异步,具有完整的类型支持以实现强大和可预测的工作流程。

Fast GraphRAG 旨在无缝地集成到您的检索管道中,为您提供高级 RAG 的功能,而无需构建和设计代理工作流程。

Fast GraphRAG 的安装和使用非常简单。您可以通过 PyPi 安装它,或者从源代码安装。它需要 OpenAI API 密钥来运行。

Fast GraphRAG 提供了一个快速入门的示例,展示了如何使用它来分析一篇文章并回答问题。它还提供了一个自定义语言模型的示例,展示了如何配置 Fast GraphRAG 以使用不同的语言模型和嵌入器。

Fast GraphRAG 的社区非常活跃,欢迎任何形式的贡献。您可以加入 Discord 频道与开发者交流,或者查看文档了解如何开始贡献。

Fast GraphRAG 的哲学是增加世界上成功的 GenAI 应用程序的数量。为此,它构建了内存和数据工具,使 LLM 应用程序能够利用高度专业化的检索管道,而无需设置和维护代理工作流程。

Fast GraphRAG 是开源的,遵循 MIT 许可证。您可以免费使用它,也可以选择使用托管服务。托管服务提供了更快、更可靠的体验,您的前 100 个请求每月免费,之后您可以根据使用情况付费。


HN 热度 419 points | 评论 111 comments | 作者:liukidar | 1 day ago #

https://news.ycombinator.com/item?id=42174829

  • 通过在数据摄取时使用大型语言模型进行处理,BM25 的词汇搜索可以提供非常相关的结果
  • 当查询的大小与嵌入存储中的内容大小相近时,嵌入向量的效果最好
  • 使用大型语言模型生成假设答案,然后用这个假设答案查询嵌入向量,这种方法非常有效
  • 结合以上三种方法,可以实现类似的知识分解和提取步骤,但使用元提示器自动生成领域/实体类型
  • 大型语言模型在识别知识分解的正确粒度方面表现不佳,可以通过让模型输出 mermaid.js 思维导图来解决
  • 通过思维导图的层次结构,可以生成可以从该节点回答的问题,并对这些问题进行索引和嵌入
  • 用户查询可以直接从这些问题中匹配,使用 BM25 获得良好的输出,混合方法效果更好,但提升不大
  • 不在查询时使用大型语言模型,可以逐层深入节点,使用嵌入相似性作为遍历的成本函数

Llama 3.1 405B now runs at 969 tokens/s on Cerebras Inference #

https://cerebras.ai/blog/llama-405b-inference

Cerebras 推出 Llama 3.1 405B 模型,实现了前所未有的速度和性能。该模型在 Cerebras Inference 平台上运行,能够达到 969 个输出标记每秒的速度,远超其他平台。同时,Cerebras Inference 平台还实现了最短的时间到第一个标记(Time-to-first-token),仅为 240 毫秒。

  1. 速度表现 :

    • 在给定 1000 个标记的提示时,Llama 3.1 405B 能够达到 969 个输出标记每秒的速度。
    • 在 100,000 个标记的提示下,Cerebras 仍然能以 539 个标记每秒的速度完成,表现优于大多数竞争对手。
  2. 延迟表现:

    • 首个标记的响应时间仅为 240 毫秒,远低于基于 GPU 的解决方案,后者的初始响应时间可能需要几秒钟。客户在使用 Cerebras 推理平台后,报告总延迟降低了 75%,极大改善了实时交互的用户体验,尤其在语音和视频 AI 应用中。
  3. 定价与可用性:

    • Cerebras 推理平台的 Llama 3.1 405B 模型现已开始客户试用,预计在 2025 年第一季度正式发布。定价为每百万个输入标记 6 美元和每百万个输出标记 12 美元,输出价格比 AWS、Azure 和 GCP 低 20%。
  4. 开放模型的优势:

    • Cerebras 表示,Llama 3.1 405B 模型的成功得益于 Meta 的开放政策与 Cerebras 的突破性推理技术,使其在速度上超过了许多封闭的前沿模型。这使得 Llama 3.1 405B 成为语音、视频和推理应用的理想基础,尤其是在对低延迟和高推理步数要求高的场景中。

总的来说,Cerebras 的技术使得 Llama 3.1 405B 模型在处理速度、延迟和长上下文支持方面实现了显著的突破,推动了瞬时 AI 的前沿进展。


HN 热度 416 points | 评论 134 comments | 作者:benchmarkist | 23 hours ago #

https://news.ycombinator.com/item?id=42178761

  • Cerebras 的 CPU 拥有约 1 百万个核心,能够在没有网络延迟的情况下进行推理,可能主要依赖 CPU 缓存而非 HBM
  • Cerebras 系统的平均成本约为 136 万美元,零售价约为 250 万美元,需要 20 个系统来支持 405B 参数模型的推理,总成本超过 3000 万美元
  • GPU 进行推理的限制因素是内存带宽,对于 405B 参数模型,969 tok/s 的速度需要 392 TB/s 的内存带宽,相当于 200 个 H100 GPU
  • AMD 的 MI325x 加速器拥有 256GB HBM3e 内存,6TB/s 的内存带宽,显示了 AMD 在这一方向上的进展
  • 大批量处理时,GPU 可以通过重用加载的模型张量元素来提高计算吞吐量,减少内存带宽瓶颈
  • 当前 AI 推理设备的功耗和冷却要求非常高,即使硬件价格大幅下降,功耗可能仍接近当前水平
  • 摩尔定律在消费级产品中似乎已经趋于平稳,但在数据中心计算领域,由于需求的特殊性,情况更为复杂
  • Cerebras 的芯片是晶圆级芯片,这种技术在半导体行业中是创新的,但成本降低的驱动力已经减弱
  • 目前可以以 500 美元的价格在桌面 PC 上进行 AI 推理,但模型较小且速度较慢
  • 未来几年内,随着技术进步,高端 AI 推理设备可能会变得更加亲民,类似于过去几十年计算机的发展历程

Scientific American’s departing editor and the politicization of science #

https://reason.com/2024/11/18/how-scientific-americans-departing-editor-helped-degrade-science/

《科学美国人》杂志的主编劳拉·赫尔穆特(Laura Helmuth)最近辞职,这可能是由于她在社交媒体上发表了一系列激进的言论。虽然这些言论本身并不足以成为她离职的理由,但它们却反映了她在任期间推行的意识形态倾向,这种倾向使得《科学美国人》杂志逐渐失去了其科学权威性。

赫尔穆特

在任期间,《科学美国人》杂志发表了一系列有争议的文章,例如“进化论否定是白人至上主义”的说法,以及对统计学基本概念“正态分布”的误解。这些文章不仅表明了杂志的意识形态偏见,也暴露了其编辑们对科学知识的缺乏。

更令人担忧的是,《科学美国人》杂志在报道青年性别医学问题时采取了有偏见的立场。尽管相关研究证据尚不充分,杂志却一再宣称青年性别医学的有效性,并将批评者妖魔化。这种做法不仅误导了公众,也可能对青少年的健康造成危害。

赫尔穆特的离职可能是对《科学美国人》杂志失去科学权威性的一个警告。杂志需要重新审视其编辑政策,确保其报道的客观性和科学性,以恢复其在公众心目中的信誉。


HN 热度 413 points | 评论 769 comments | 作者:Bostonian | 1 day ago #

https://news.ycombinator.com/item?id=42177619

  • 科学可以被企业利用来保护自身利益,例如可口可乐公司通过倡导运动而非饮食控制来应对肥胖危机。
  • 事实本身是客观的,但事实的解释和呈现方式会受到个人情感和偏见的影响。
  • 人们对事实的解读可能因个人立场不同而产生差异,例如对运动和饮食控制在解决肥胖问题上的重要性看法不一。
  • 关键在于识别信息传播者的动机和利益关系,而不仅仅是相信科学。
  • 批判性思维是一种将个人世界观与现实对齐的过程,类似于科学方法的应用。
  • 宣传通过改变信息的传播强度而非传播虚假信息来影响公众认知。
  • 即使在存在多个相互矛盾的虚假信息源时,宣传仍能有效运作。
  • “信任科学”这一口号可能将科学结果与信仰混淆,科学本质上是怀疑而非信任。
  • 阴谋论的问题在于,即使假设阴谋论中的所有内容都是真实的,也无法解释为何如此多的人会保持沉默。
  • 情感偏见和权力差异可以影响人们的认知,现代媒体的传播效应可能导致真相被掩盖。

20 years of Google Scholar #

https://blog.google/outreach-initiatives/education/google-scholar-20-years/

谷歌学术(Google Scholar)是一个帮助研究人员查找和阅读研究论文的工具。它诞生于 20 年前,至今仍在不断发展。谷歌学术就像一个巨大的研究图书馆,拥有众多酷炫的功能。用户可以使用它来查找法律案例、保存文章、关注自己喜欢的作者等。

谷歌学术的创始人是两位研究人员,他们在 2004 年开始开发这个工具。当时,获取学术信息非常困难,往往被付费墙阻挡。他们希望能够让研究人员能够轻松找到和阅读同行的作品。经过 9 个月的开发,谷歌学术终于诞生了。

谷歌学术的早期发展非常艰难。由于当时的互联网速度非常慢,团队不得不采用一种称为“Sneakernet”的低科技解决方案。他们从出版商那里获取文章,然后将这些文章加载到物理硬盘上,最后将这些硬盘送到办公室。

谷歌学术的产品座右铭是“站在巨人的肩膀上”。这句话体现了研究社区的协作精神,谷歌学术的目标是帮助研究人员能够轻松访问和构建于前人知识的基础之上。

谷歌学术的目标是成为一个全面的图书馆,涵盖来自世界各地的众多语言、书籍、文章和研究论文。用户可以在谷歌学术上找到同行评审的在线学术期刊和书籍、会议论文、硕士论文和博士论文、预印本、摘要、技术报告和其他学术文献。

谷歌学术最近添加了一些新功能,包括使用人工智能生成论文摘要、提供论文的快速预览、链接引用的文章、相关文章等。用户可以使用这些功能来快速了解论文的主要内容,或者深入研究论文的具体细节。

除了这些功能之外,谷歌学术还提供了一些其他的工具和技巧,例如查找法律案例、保存文章、关注作者等。用户可以使用这些功能来提高自己的研究效率,找到更多的相关信息。

谷歌学术已经被广泛应用于各个领域,包括学术研究、法律、医学等。它已经成为研究人员的必备工具,帮助他们找到和阅读相关的研究论文。


HN 热度 391 points | 评论 171 comments | 作者:thepuppet33r | 1 day ago #

https://news.ycombinator.com/item?id=42175023

  • Google Scholar 最大的成就是打破了 Elsevier 等公司在学术搜索上的垄断。
  • Google Scholar 仍然参与并鼓励了有利于大型出版商的文献计量学。
  • 文献计量学有其价值,不应简单地视为游戏,它有助于识别高质量的研究内容。
  • 按引用次数排序是默认设置,因为大多数用户寻找的是高引用率的论文,但也有用户更关心最近的研究或被忽视的优秀研究。
  • 对于没有大学订阅权限的用户,Sci-Hub 是获取研究论文的重要途径。
  • Sci-Hub 已经暂停更新,替代资源的质量因领域而异,但开放获取资源在 COVID-19 后得到了显著发展。
  • NIH 要求所有内部和外部研究必须开放获取,这推动了开放获取资源的发展。
  • 有些学科领域,如管理学特别是会计学,大学的期刊订阅存在盲点,Sci-Hub 和 Annas-Archive 也无法完全覆盖。
  • 对于某些学科,如计算机科学和数学,Sci-Hub 的替代资源可能更丰富,但在医学和生命科学领域则较差。
  • Sci-Hub 暂停更新的原因可能是印度法院的禁令,但该禁令在俄罗斯及其镜像站点的效力存疑。

OpenStreetMap’s New Vector Tiles #

https://tech.marksblogg.com/osm-mvt-vector-tiles.html

OpenStreetMap(OSM)在其 20 年的历史中,一直以来提供的是栅格瓦片(raster tiles),这些地图的样式和规则在渲染之前就已经定义好,最终用户只能看到静态的 PNG 图像。近期,OSM 开始提供以 Mapbox Vector Tiles(MVT)格式的矢量瓦片(vector tiles),这使得最终用户可以调整样式和渲染规则,并提取每个瓦片中的底层信息。与栅格瓦片相比,矢量瓦片的图像更加清晰,用户还可以更改标签的语言。

在这篇文章中,作者使用了其高性能工作站来可视化和分析 OSM 的矢量瓦片。工作站配备了 6 GHz 的 Intel Core i9-14900K CPU、96 GB 的 DDR5 RAM 以及 4 TB 的 NVMe SSD。作者在 Windows 11 Pro 上运行 Ubuntu 22 LTS,并使用 Python 等工具来处理 OSM 数据。

安装前提条件 #

作者首先更新了系统,并安装了一些必要的工具和 Python 库,包括 jq、python3-pip、python3-virtualenv 等。然后设置了 Python 虚拟环境并安装了用于可视化的 leafmap、mapbox_vector_tile、morecantile 和 notebook 等依赖。此外,作者还使用了 DuckDB 和其多个扩展来分析数据。

在 QGIS 中使用 OSM 的矢量瓦片 #

作者演示了如何在 QGIS 中查看 OSM 的矢量瓦片,步骤包括创建新的连接,设置样式 URL 和源 URL。尽管 QGIS 可以渲染矢量数据,但有时图标的渲染效果可能不尽如人意。

在 Leafmap 中使用 M 矢量瓦片 #

作者在 Jupyter 中创建了一个配置文件夹,并设置了密码。随后通过 map 库加载矢量瓦片并渲染出布哈利法大厦周围的区域,POI 兴趣点)图标渲染良好。

分析好的 #

作者下载了布尔哈利法附近的一个放级别为 14 的瓦片,并提取其 x 和 y 值来构下载链接。下载后,作者将 114 KB 的 MVT 文件转换 14 MB 的 JSON 文件,利用 Pythonmapbox_vector_tile 库进行解码。

接着,作者展示了该瓦片的顶级键,并通过提取了兴趣点(POI)数据到单独的 JSON 文件中,随后在 DuckDB 中加载这些数据进行分析。通过查询,作者提取了餐厅和咖啡店的相关信息,并展示了一些具有特定菜系的记录。

总结而言,OSM 的新矢量瓦片为用户提供了更高的灵活性和更好的视觉效果,而作者通过使用多种工具与库,展示了如何可视化和分析这些数据,展示了现代地理信息系统(GIS)技术在数据处理与可视化中的应用潜力。


HN 热度 336 points | 评论 127 comments | 作者:marklit | 11 hours ago #

https://news.ycombinator.com/item?id=42182519

  • 矢量瓦片在细节和可读性上不如原始的栅格瓦片
  • 矢量瓦片的生成软件更注重持续更新,而不是样式细节
  • 使用 Maputnik 编辑器可以启用矢量地图中的更多图层和功能
  • OSM 地图因为显示的 POI 多而更具实用性,但与 Google Maps 相比,某些地方的目录不全
  • 矢量瓦片技术在开源社区中发展迅速,现在可以免费使用
  • OSM 采用的新技术栈允许矢量瓦片每分钟从 OSM 映射更改中直接更新
  • 矢量瓦片在阿拉伯语字体渲染上存在问题,字符断裂且方向错误
  • 客户端矢量渲染器可以实现与服务器端相同的渲染效果,但技术栈不同导致实现难度
  • 矢量瓦片格式为 Mapbox MVT,基于 protobuf,包含 OSM 数据但有特定格式

Fair coins tend to land on the side they started: Evidence from 350,757 flips #

https://www.researchgate.net/publication/374700857_Fair_coins_tend_to_land_on_the_same_side_they_started_Evidence_from_350757_flips

该网页是一篇研究文章,讨论了一个关于硬币抛掷的物理模型。该模型由 Diaconis、Holmes 和 Montgomery(D-H-M)在 2007 年提出,预测当人们抛掷一枚普通硬币时,它倾向于落在同一侧。研究人员收集了 350,757 次硬币抛掷数据,结果支持了 D-H-M 模型的预测:硬币落在同一侧的概率约为 51%。研究还发现,人们抛掷硬币时存在相当大的个体差异,但硬币落在头或尾的概率基本相等。研究结果为 D-H-M 物理模型提供了强有力的统计支持。

该研究的背景是,硬币抛掷通常被认为是随机事件,但实际上它遵循牛顿物理学的规律。研究人员指出,硬币抛掷的随机性来自于初始条件的微小波动,包括起始位置、配置、向上力和角动量等。研究结果表明,人们抛掷硬币时存在一定的偏差,但这种偏差并不是由于硬币本身的原因,而是由于抛掷动作的个体差异。

研究结果对我们理解硬币抛掷的物理规律有重要意义,也对我们如何看待随机事件有重要启示。同时,研究结果也表明,人们在抛掷硬币时存在一定的主观偏差,这种偏差可能会影响我们对随机事件的判断。


HN 热度 296 points | 评论 153 comments | 作者:seanhunter | 14 hours ago #

https://news.ycombinator.com/item?id=42181345

  • 作者解释了实验的背景、目的和数据收集方法,强调实验是业余时间完成的,没有浪费公共资金
  • 评论者指出实验中志愿者的翻转方式存在差异,约三分之一的人几乎没有偏差,而另一部分人则偏差较大
  • 作者承认志愿者之间存在偏差异质性,但更倾向于认为这是一个连续的偏差范围,而非两个独立的群体
  • 评论者提到 NFL 的专业翻转可能有更高质量的视频记录,这可能对研究结果有帮助
  • 评论者认为让硬币落地而不是接住可以减少或消除偏差
  • 评论者推测体育博彩公司可能已经内部研究过类似问题,因为这可能带来经济利益
  • 评论者质疑实验的样本量实际上很小,只有 48 个测试者,且部分测试者的翻转方式不标准
  • 评论者认为实验者作为测试对象可能会引入偏差,特别是在低转速、低高度的翻转中
  • 评论者以幽默方式提出需要成立专门的机构来评估和维护硬币翻转的公正性

The tragedy of running an old Node project #

https://abdisalan.com/posts/tragedy-running-old-node-project/

这篇文章讲述了作者试图更新自己四年前创建的个人网站的经历。作者使用的框架是 Gatsby,然而由于项目已经四年没有更新,导致了许多问题的出现。

作者首先尝试运行项目,但是遇到了许多依赖问题,包括找不到 python2 等错误。作者不得不安装 python2,并花费了 30 分钟的时间来配置环境。然而,问题并没有解决,作者又遇到了 C++ 编译错误。

经过一番搜索和尝试,作者意识到可能是 node 版本的问题。由于项目没有指定 node 版本,作者不得不通过试错来找到正确的版本。最终,作者发现使用 node v12 可以解决问题。

整个过程耗时两个小时,作者感到疲惫不堪。文章结尾处,作者感叹自己花费了大量时间来解决这些问题,仅仅是为了更新自己的博客网站。


HN 热度 221 points | 评论 316 comments | 作者:abdisalan | 1 day ago #

https://news.ycombinator.com/item?id=42175316

  • 两年未使用 npm 就浪费了两个小时,这在 Node 项目中很常见。
  • 四年后重启项目只花了两个小时,这在可接受范围内,且指定了 Node 版本可以避免问题。
  • 代码腐烂是普遍现象,依赖项越多问题越严重,Node 项目尤其糟糕。
  • Go 语言因为标准库大、向后兼容性好,所以项目更稳定,相比之下 Java 和 Python 也有类似问题。
  • Java 项目依赖于特定版本的工具(如 Gradle),如果版本不匹配也会遇到类似问题。
  • 使用 Gradle Wrapper 可以解决版本不匹配的问题,推荐这种方法。
  • Maven 通过使用精确版本号来确保依赖项的稳定性,这降低了旧项目无法运行的风险。
  • 与 Node/NPM 生态系统相比,Java/Maven 项目遇到兼容性问题的概率较低。
  • 旧的 Java 项目(如 JavaFX)可能需要额外的步骤才能运行,但仍然可以运行。
  • Go 项目即使依赖很多第三方库,也几乎可以保持工作状态,这得益于最小版本选择和 Go 模块镜像。

Maslow 4: Large format CNC routing made accessible #

https://www.maslowcnc.com

Maslow CNC 是一个大型 CNC 路由器,旨在使大型 CNC 路由成为每个人的可能。该项目的目标是让每个人都能将自己的想法变成现实。

Maslow CNC 的社区已经创作了许多令人惊叹的作品,包括家具、标志、艺术品等。这些作品展示了 Maslow CNC 的强大功能和社区的创造力。

社区成员 Brr 创建了一个 P9L 椅子和一个 P9S 凳子,使用来自 Instructables 的计划。Bryan_Pollock 创建了一个立式办公桌,使用 Moment of Inspiration CAD 程序。Madgrizzle 创作了一幅令人惊叹的千年隼雕刻,引发了社区对如何绘制雕刻的讨论。

Maslow CNC 的社区还包括许多其他创作者,他们创作了各种作品,包括船舶、家具、艺术品等。这些作品展示了 Maslow CNC 的多样性和社区的创造力。

Maslow CNC 的目标是让每个人都能将自己的想法变成现实。通过提供一个强大的 CNC 路由器和一个活跃的社区,Maslow CNC 使得每个人都能创作出令人惊叹的作品。


HN 热度 221 points | 评论 77 comments | 作者:mdaniel | 21 hours ago #

https://news.ycombinator.com/item?id=42179467

  • 该项目是开源的,但因名称所有权问题引发了争议
  • Maslow 4.1 Kickstarter 活动已成功筹集了超过目标的资金
  • 相比昂贵的 CNC 设备,Maslow 4 提供了惊人的功能和较低的价格
  • 价格差异可能因地区和关税而异,美国用户购买成本较低
  • 早期版本的 Maslow 设置和调试非常耗时,新版本改进了自动校准功能
  • 对于木工切割,Maslow 4 表现良好,适合需要一些 DIY 精神的用户
  • 激光切割机在制作模型时比 CNC 更简单,但成本更高
  • Shaper Origin 通过机器视觉提供更高的精度,但价格昂贵且操作复杂
  • 对于高端定制橱柜和木工,Shaper Origin 可能具有良好的投资回报率
  • Maslow 4 在中心切割、重复切割和夜间无人操作方面表现出色
  • 有人使用 CNC 模板制作业务,如定制混凝土浇筑模具和石膏铸造支架
  • 对于非专业用户,手锯可能已经足够使用

Hyperfine: A command-line benchmarking tool #

https://github.com/sharkdp/hyperfine

hyperfine 是一个命令行 benchmarking 工具。它支持统计分析、任意 shell 命令、实时反馈、预热运行、缓存清除命令、统计异常检测、结果导出等功能。hyperfine 可以用于比较不同程序的运行时间,支持多种输出格式,包括 CSV、JSON、Markdown 等。

hyperfine 的使用方法包括基本 benchmarking、预热运行、准备命令、参数化 benchmarking 等。基本 benchmarking 可以通过命令 hyperfine 来执行,预热运行可以通过-w/–warmup 选项来指定,准备命令可以通过-p/–prepare 选项来指定。参数化 benchmarking 可以通过-P/–parameter-scan 选项来指定参数范围和步长。

hyperfine 还支持中间 shell 的使用,可以通过-S/–shell 选项来指定 shell 类型。默认情况下,hyperfine 使用/bin/sh 作为 shell。hyperfine 也支持直接执行命令,而不使用中间 shell,可以通过-N 或–shell=none 选项来指定。

hyperfine 还支持 shell 函数和别名的使用,可以通过 export-f 选项来导出 shell 函数,或者通过 inline 或 source 的方式来定义 shell 函数和别名。

hyperfine 的结果可以通过多种方式导出,包括 CSV、JSON、Markdown 等格式。Markdown 格式的输出可以通过–export-markdown 选项来指定,JSON 格式的输出可以通过–export-json 选项来指定。


HN 热度 221 points | 评论 51 comments | 作者:hundredwatt | 1 day ago #

https://news.ycombinator.com/item?id=42177462

  • hyperfine 是一个很好的命令行基准测试工具,作者还开发了其他一些高质量的命令行工具如 fd、bat 和 hexyl
  • fd 是 find 的优秀替代品,使用更方便,速度更快,且尊重 .gitignore
  • perf stat 是一个已经广泛安装的工具,适用于不需要安装 hyperfine 的情况
  • poop 是 hyperfine 和 perf 之间的一个不错的选择,但仅限于 Linux 系统
  • 在 macOS 上使用 hyperfine 进行启动时间基准测试时,可能会遇到操作系统缓存 inodes 的问题
  • xcode instruments 的 System Trace 模板可以用于网页性能测试,但有时会出现内存损坏问题
  • hyperfine 的统计功能较为基础,缺乏高级统计分析和自动隔离功能,但提供了脚本和导出功能以供进一步分析
  • hyperfine 适合快速基准测试,但对于单毫秒级别的优化,可能不是最佳选择

2024 11 19 HackerNews

2024-11-19 07:10:53

2024-11-19 Hacker News Top Stories #

  1. iOS 18 引入了一个新的安全功能:在设备长时间未使用后自动重启。
  2. 人类活动已经导致全球气温升高 1.5 摄氏度。
  3. 作者被 hCaptcha 辅助功能账户封禁,因为认为他不是盲人。
  4. Ondsel 公司宣布关闭,尽管它为 FreeCAD 做出了巨大贡献。
  5. Windows 95 的安装程序使用了三个操作系统:MS-DOS、Windows 3.1 和 Windows 95。
  6. 科学出版的新方式:使用 HTML 进行数据探索和分析。
  7. Regatta Storage 是一个云文件系统,可以连接到现有的数据集,并直接使用最近写入的文件数据。
  8. 生成 QR 码的逐步过程拆解。
  9. AlphaProof 在 IMO 2024 解决方案中展示了一些最酷的想法。
  10. 不丹,一个曾经以幸福指数闻名的国家,如今却面临着年轻人大量流出的问题。

Reverse Engineering iOS 18 Inactivity Reboot #

https://naehrdine.blogspot.com/2024/11/reverse-engineering-ios-18-inactivity.html

iOS 18 引入了一项新的安全功能:在设备长时间未使用后自动重启。该功能旨在保护设备免受攻击,特别是在设备被盗或遗失后。

在 iOS 18 中,当设备长时间未使用时,Secure Enclave Processor (SEP) 会跟踪设备最后一次解锁的时间。如果最后一次解锁时间超过 3 天,SEP 会通知 AppleSEPKeyStore 内核模块,后者会通知用户空间启动重启过程。SpringBoard 会终止所有用户空间进程,以防止数据丢失。

如果 AppleSEPKeyStore 内核模块发现设备在应该重启后仍然处于开机状态,内核会发生宕机。这应该不会发生,除非有人试图篡改不活动重启功能。

在重启后,keybagd 会读取 NVRAM 变量 aks-inactivity,并发送包含设备未解锁时间的分析事件到 Apple。

该功能旨在防止攻击者利用设备长时间未使用的状态来获取敏感信息。攻击者可能会利用设备长时间未使用的状态来获取设备上的敏感信息,例如银行账户信息或其他重要数据。

总之,iOS 18 的不活动重启功能是一项安全功能,旨在保护设备免受攻击,特别是在设备被盗或遗失后。该功能会在设备长时间未使用后自动重启设备,以防止攻击者获取敏感信息。


HN 热度 481 points | 评论 152 comments | 作者:moonsword | 1 day ago #

https://news.ycombinator.com/item?id=42167633

  • 在设备首次解锁后,用户数据会被解密,但开发者可以选择让应用数据在设备锁定时不可用的密钥
  • 苹果提供了系统通知,允许开发者在内容即将不可用时将数据写入磁盘
  • 苹果的安全研究设备(SRD)是一种特殊融合的 iPhone,允许在不绕过安全功能的情况下进行 iOS 安全研究
  • 在边境等情况下,如果担心手机安全,建议完全关机以防止数据被访问
  • 如果在边境被要求提供设备和密码,使用 GrapheneOS 的紧急密码功能可以安全地擦除设备,但可能面临被逮捕的风险
  • 在大多数民主国家的边境,销毁个人财产和销毁证据之间有明确的界限,后者通常需要法院文件
  • 在实际操作中,边境人员的态度和行为可能不受法律约束,合作比坚持法律立场更安全
  • 对于特殊人群(如记者、活动家等),擦除设备可能是最好的选择
  • 避免离开美国可以完全避免边境检查带来的问题
  • 美国海关和边境保护局在某些情况下可以在没有搜查令的情况下进行搜查,且最高法院裁定受害者无权获得赔偿

Humans have caused 1.5 °C of long-term global warming according to new estimates #

https://www.lancaster.ac.uk/news/humans-have-already-caused-15-c-of-long-term-global-warming-according-to-new-estimates

兰卡斯特大学的研究人员发现,人类活动已经导致全球气温升高 1.5 摄氏度。该研究使用了一个新的方法来估计人类活动对全球气温的影响,通过分析冰芯中二氧化碳的含量来确定一个更准确的“前工业化”基准线。研究结果表明,人类活动已经导致全球气温升高 1.49 摄氏度,超过了 1.5 摄氏度的警戒线。

研究人员使用了一个新的方法来估计人类活动对全球气温的影响。他们分析了冰芯中二氧化碳的含量,来确定一个更准确的“前工业化”基准线。这个基准线比以前使用的 1850-1900 年的基准线更早,可以更准确地反映人类活动对全球气温的影响。

研究结果表明,人类活动已经导致全球气温升高 1.49 摄氏度,超过了 1.5 摄氏度的警戒线。研究人员警告说,如果当前的温室气体排放量不减少,全球气温将继续升高,导致更加严重的气候变化后果。

该研究的结果对了解人类活动对全球气温的影响具有重要意义。研究人员希望该研究的结果可以为政策制定者和公众提供参考,帮助他们了解气候变化的严重性和必要性。


HN 热度 389 points | 评论 528 comments | 作者:gmays | 1 day ago #

https://news.ycombinator.com/item?id=42166030

  • 人类剩余的碳排放预算约为 140 吨二氧化碳/人,到 2050 年平均每人每年只能排放 5.4 吨二氧化碳。
  • 用世界平均水平来对比排放量较高的国家是误导性的,这种做法被气候怀疑论者用来否定气候问题的严重性。
  • 悲观主义是由于我们未能采取有效行动应对气候变化,而不是导致失败的原因。
  • 美国通过《通胀削减法案》投入大量资金支持清洁能源技术制造,这是美国政府迄今最大的气候行动。
  • 《通胀削减法案》的资金规模相对较小,不足以实现美国向近零排放能源生产的转变。
  • 美国的税收负担主要落在工人身上,而大公司和富人承担的税负相对较少。
  • 美国的高收入者支付了大部分所得税,但他们的平均收入远高于其他人群。
  • 支持政府在气候问题上采取更多资源投入,但目前的投入水平远低于大多数人认为可接受的水平。

I was banned from the hCaptcha accessibility account for not being blind (2023) #

https://michaels.world/2023/11/i-was-banned-from-the-hcaptcha-accessibility-account-for-not-being-blind/

本文的作者是一位盲人,曾经使用 hCaptcha 的辅助功能账户来绕过验证码。然而,在与 hCaptcha 的支持团队沟通时,他被告知由于他不是盲人,因此不能使用辅助功能账户。作者感到困惑和愤怒,因为他确实是盲人,并且已经验证了自己的账户。

作者认为,hCaptcha 的做法是错误的,因为他们故意使自己的产品不易于盲人使用,却又提供了一个辅助功能账户来绕过验证码。作者担心,如果他依赖于这种辅助功能账户来使用 hCaptcha,那么他就可能会遇到问题。

作者还提到,他曾经尝试在 Brave 浏览器中使用 hCaptcha 的辅助功能账户,但由于技术问题,无法成功设置 cookie。作者认为,hCaptcha 的支持团队不应该怀疑他的身份,并且应该提供更好的支持。

总的来说,作者认为 hCaptcha 的做法是错误的,并且可能会对盲人用户造成伤害。作者呼吁读者分享这篇文章,并警告其他人不要使用 hCaptcha。


HN 热度 318 points | 评论 222 comments | 作者:blindgeek | 13 hours ago #

https://news.ycombinator.com/item?id=42171164

  • hCaptcha 的用户体验非常糟糕,尤其是对于使用不同设备和浏览器的用户
  • hCaptcha 的图片难以辨认,对于视力有障碍的用户来说尤其困难
  • hCaptcha 在某些情况下比 reCaptcha 更糟糕
  • 使用 Tor、VPN 和非监控浏览器的用户在使用 hCaptcha 时体验较好,而 Google reCaptcha 则经常陷入无法解决的循环
  • 没有最好的验证码,reCaptcha V2 和 hCaptcha 在可访问性方面可能是最不差的选择
  • Brave 的 PoW 验证码可能更好,因为它不需要用户输入或交互
  • 验证码的设计有时过于模糊,不清楚应该选择物体的哪一部分
  • 验证码中的图片和问题可能具有文化偏见,不是所有人都能识别
  • Google reCaptcha 有时会故意多次失败,以收集更多用户数据
  • 验证码的缓慢加载可能只是为了增加机器人的成本,而不是真正提高安全性
  • 验证码可能被用来鼓励用户保持登录状态,而不是真正防止机器人
  • 有些验证码问题设计不合理,导致用户即使正确回答也会被拒绝通过

We are shutting down Ondsel #

https://ondsel.com/blog/goodbye/

Ondsel 公司宣布关闭

Ondsel 公司经过近两年的运营后,决定关闭。公司表示感谢来自 FreeCAD 社区和更广泛的工程 CAD 社区的支持。

关闭原因

Ondsel 公司从一开始就知道与商业 CAD 软件竞争会很困难。闭源 CAD 软件在学校和行业中已经深入人心,Ondsel 公司需要找到一种方式来提供真正的价值并与其他工具共存。然而,经过多次调查和与近百名机械工程师、服务工程师、发明家、车间所有者和其他用户的访谈后,公司未能找到商业模式来证明其可行性。

成就

尽管 Ondsel 公司未能建立一个可持续的商业模式,但公司仍然取得了一些成就:

  • 改进了 FreeCAD 应用程序,包括集成的装配工作台和 3D 约束求解器。
  • 为 Sketcher 和 TechDraw 工作台做出了重大贡献。
  • 引入了 VarSets,一个全新的自定义属性系统。
  • 为 TechDraw 和 CAM 工作台引入了新功能。
  • 为第三方插件 SheetMetal 做出了贡献。

Lens 服务

Ondsel 公司还开发了 Lens 服务,一个连接 CAD 体验的服务。该服务使团队能够组织硬件产品的迭代开发,并使用户能够共享和发布模型。

未来计划

Ondsel 公司的开发人员将继续为 FreeCAD 做出贡献。公司将通知客户和用户关闭的消息,并将继续运行服务器一段时间,以便用户下载数据。付费客户将获得剩余订阅时间的退款。


HN 热度 297 points | 评论 158 comments | 作者:pabs3 | 17 hours ago #

https://news.ycombinator.com/item?id=42169998

  • Ondsel 为 FreeCAD 做出了巨大贡献,尽管它即将关闭,但不能算作失败
  • 在线 CAD 选项价格昂贵,免费开源软件功能不足或易用性差
  • GatorCAM for CNC 价格低廉,适合制作者使用
  • OnShape 虽不是开源软件,但免费供个人使用,性能出色
  • 一些用户更喜欢本地软件而非基于网页的平台
  • 电气图绘制方面,免费选项不够好,draw.io 可以通过自定义符号满足需求
  • Fritzing 不适合绘制实际电子原理图,建议使用 KiCad
  • Alibre 是制作者中受欢迎的 CAD 软件,一次性购买,支持 CNC
  • Fusion 360 适合个人项目,但文件所有权问题令人担忧
  • SolidWorks 适合偶尔使用,价格合理
  • 本地矢量绘图软件如 Inkscape 也是不错的选择
  • 一些用户对基于网页的 CAD 软件感到迟钝和笨拙
  • 软件的永久许可在操作系统支持范围内才有意义

Why did Windows 95 setup use three operating systems? #

https://devblogs.microsoft.com/oldnewthing/20241112-00/?p=110507

Windows 95 安装程序为什么使用三个操作系统?

Windows 95 安装程序可以从三个起点升级:MS-DOS、Windows 3.1 和 Windows 95。安装程序可以写成三个版本:一个用于从 MS-DOS 安装,一个用于从 Windows 3.1 安装,另一个用于从 Windows 95 安装。但是,这样做会导致代码重复和维护困难。

为了解决这个问题,开发者决定写一个通用的安装程序,能够在所有三个起点上运行。这个安装程序分为三个阶段:第一个阶段是 MS-DOS 程序,用于安装一个微型版本的 Windows 3.1;第二个阶段是 16 位 Windows 程序,用于在微型 Windows 3.1 或真实的 Windows 3.1 或 Windows 95 上运行,进行硬件检测和文件复制;第三个阶段是 32 位 Windows 程序,用于在真实的 Windows 95 上运行,进行最终的设置和配置。

这种设计使得安装程序能够在所有三个起点上运行,同时避免了代码重复和维护困难。每个阶段都有其特定的任务,共同完成了 Windows 95 的安装过程。

微型 Windows 3.1 是一个非常小的 Windows 版本,只包含了运行安装程序所需的最基本功能。它可以从几个软盘上安装,之后会启动微型 Windows 3.1 并运行安装程序的第二个阶段。

安装程序的第二个阶段会进行硬件检测,确定需要安装哪些驱动程序。它还会复制 Windows 95 文件和驱动程序,并将旧的设置迁移到新的操作系统中。

安装程序的第三个阶段会在真实的 Windows 95 上运行,进行最终的设置和配置,包括安装打印机等设备。

总之,Windows 95 安装程序使用三个操作系统是为了实现一个通用的安装程序,能够在所有三个起点上运行,同时避免代码重复和维护困难。每个阶段都有其特定的任务,共同完成了 Windows 95 的安装过程。


HN 热度 293 points | 评论 170 comments | 作者:mooreds | 1 day ago #

https://news.ycombinator.com/item?id=42166606

  • Windows 95 的 GUI 非常直观,微软当时在很多方面都非常务实和合理
  • 现代 Windows 的 UI/UX 体验不如以前,很多功能被审美选择所隐藏
  • Windows 11 经过大量调整后对普通用户还可以,但对高级用户来说右键菜单等设置被破坏
  • NTFS 比 FAT32 更可靠,功能更多,文件大小限制更少
  • 在处理大量小文件时,Windows 的元数据操作非常昂贵,影响性能
  • Linux 的文件系统在处理大量小文件时比 Windows 更高效
  • Windows 95 到 Windows 2000 的可用性有了巨大提升,但 Windows 8 及以后的版本放弃了这些成果
  • 连续交付模式导致无法从整体上关注用户体验,只能解决最突出的问题
  • 微软和 IBM 曾投入大量资源研究用户体验,但现在这种研究似乎减少了
  • Windows 的文件系统虽然功能强大,但在某些场景下性能不如 Linux
  • 小文件处理问题不仅限于 Windows,其他文件系统也有类似问题,如 Lustre
  • SQLite 等工具在处理大量小文件时表现更好,可以减少文件系统开销
  • Windows 10 启动资源管理器时的延迟比 Windows XP 大得多,用户体验下降
  • 微软为了吸引开发者,尝试了多种方法来加速文件 I/O,但效果有限
  • Windows 11 的 UI/UX 体验下降是一个行业现象,不仅限于微软,从桌面 PC 到汽车的界面都趋向于手机风格
  • 开发者工具如 Open Shell 可以改善 Windows 的用户体验,特别是对于高级用户
  • Windows 的权限系统比 Linux 更复杂,导致处理大量小文件时性能更差
  • 微软在开发过程中确实考虑了开发者的需求,但某些决策仍影响了整体性能和用户体验

Reactive HTML Notebooks #

https://maxbo.me/a-html-file-is-all-you-need.html

本文探讨了使用 HTML 作为科学出版平台的可能性,旨在将数据探索、分析和可视化与出版过程整合在一起。作者认为,HTML 可以作为一种平台,用于所有三个阶段,避免了手动过程、CLI 工具、CI 步骤和第三方平台的烦恼。

文中首先介绍了“细胞”(Cells)的概念,展示了如何使用 CSS 和 JavaScript 创建一个基本的代码编辑器。然后,作者引入了 Observable 标准库和 Observable 运行时,并绑定它们到窗口对象。通过创建一个名为“counter”的细胞,作者演示了如何使用 Observable Plot 创建一个图表。

接下来,文中讨论了 TeX、Markdown 和 Graphviz 的使用,展示了如何使用这些工具创建不同类型的输出。作者还介绍了如何使用 Observable Inspector 来监控细胞的状态,包括运行中的细胞和错误细胞。

文中还展示了如何使用 SQLite 和 Python 来查询数据库,并使用 Matplotlib 和 Python 的 sqlite3 模块来创建图表。另外,作者还演示了如何使用 R 语言和 WebR 来创建图表。

最后,文中讨论了输入和可变性,展示了如何使用 Observable Inputs 创建交互式输入控件,并使用 mutable 函数来注册可变对象。文中还提到了下一步的计划,包括将所有这些功能整合到一个库中,并提供适当的文档。


HN 热度 269 points | 评论 43 comments | 作者:california-og | 14 hours ago #

https://news.ycombinator.com/item?id=42170740

  • HTML 可以成为计算笔记本的优秀基础,但实现方式可以更声明式和基于标准。
  • 通过使用纯文本文件存储和分发内容,可以避免在浏览器中重新实现程序员编辑器的问题。
  • 当前的实现对于探索性数据分析来说用户体验较差,但发布体验良好,因为只需一个文件即可完成。
  • 这种方法重新带回了 HTML/JS 的趣味可能性,但在数据分析方面可能不是最佳选择。
  • 统一平台进行探索性数据分析并轻松发布,尽管当前用户体验不佳,但有改进空间,可能优于 Jupyter 笔记本的 JSON 格式。
  • 将尝试在 Raku 中支持这种 HTML 笔记本格式,目前 Raku 的笔记本解决方案基于 Jupyter 或 Mathematica。
  • 帖子格式从基础开始逐步构建到有趣的内容,没有过多的依赖和框架,易于跟随和理解。
  • 反应式 HTML 主要依赖 JavaScript 实现交互和反应性功能。

Launch HN: Regatta Storage (YC F24) – Turn S3 into a local-like, POSIX cloud FS #

https://news.ycombinator.com/item?id=42174204

Regatta Storage 的创始人 Hunter 在 Amazon 的 Elastic File System (EFS) 和 Netflix 等公司积累了近十年的大规模云存储建设和运营经验。他发现,尽管 EFS 在 Netflix 看起来是一个自然的选择,但实际使用并不广泛,因为从本地磁盘迁移到 NFS 时常常会遇到性能问题,而且应用程序将本地磁盘视为临时存储时需要手动清理遗留数据。

因此,Hunter 决定构建 Regatta,这是一个按需付费的云文件系统,能够随着应用程序的扩展而自动扩展。Regatta 通过与 S3 的本机文件格式同步,可以连接到现有的数据集,并直接使用最近写入的文件数据。当数据不被积极使用时,它将从 Regatta 缓存中移除,因此您只需为后端的 S3 存储付费。

Regatta Storage 的底层实现是通过 NFSv3(很快将使用自定义协议)连接到缓存实例的文件系统,然后将这些实例连接到客户的 S3 桶,提供亚毫秒级的缓存读写性能。这种持久的缓存允许我们为所有连接的文件客户端提供一致且高效的文件系统视图。

Regatta Storage 已经吸引了用户,他们使用它来构建完全无服务器的 Jupyter 笔记本服务器,为 AI 研究人员提供服务,他们更喜欢使用 S3 网络界面上传和共享数据。还有团队将其用作 S3 上的分布式缓存层,以实现对常见文件的低延迟访问。还有团队用它来替换他们的薄配置 Ceph 启动卷,以实现显著的成本节约。

Regatta Storage 的团队期待看到用户如何使用他们的服务,并希望社区提供早期反馈、未来方向的想法或在这一领域的经验。Hunter 将在接下来的几个小时内回复评论。


HN 热度 261 points | 评论 182 comments | 作者:huntaub | 6 hours ago #

https://news.ycombinator.com/item?id=42174204

  • Regatta Storage 提供了比 Rclone 更强的数据一致性保证,特别是在多客户端并行操作时。
  • Regatta Storage 与 Rclone 和 s3fs 的区别应该以表格形式展示,以便更直观地理解。
  • Regatta Storage 是 YC 近年来最酷的项目之一,用户对其工作原理充满好奇。
  • Regatta Storage 的缓存机制不在本地磁盘上,而是利用 Linux 页面缓存和内存,自动扩展以适应应用程序的工作集大小。
  • Regatta Storage 支持在多个服务器上挂载,但对 Lambda 函数的适用性有限制。
  • 用户可以在 Regatta Storage 上运行 Clickhouse 或 Postgres 等数据库,但对开源的态度持保留意见。
  • Regatta Storage 在不同云环境中的性能可能会有所不同,但在 AWS 内部运行可以获得更快的速度。
  • Regatta Storage 在 Docker 环境中使用 FUSE 和 NFS 挂载时,解决了以往遇到的问题。

Creating a QR Code step by step #

https://www.nayuki.io/page/creating-a-qr-code-step-by-step

该网页展示了一个使用 JavaScript 编写的 QR 码生成器的逐步过程,详细解释了如何将一个文本字符串编码成 QR 码。以下是其主要步骤的详细总结:

1. 用户输入 #

用户输入一个文本字符串,该字符串包含 17 个 Unicode 字符。

2. Unicode 字符分析 #

对输入的每个字符进行分析,确定其 Unicode 代码点以及是否可以使用不同的编码模式(数字、字母数字、字节、汉字)进行编码。最终确定选择 “字节” 模式来编码所有字符,因为该模式能够容纳所有输入的字符。

3. 创建数据段 #

将每个字符转换为二进制位。在字节模式下,每个字符生成 8 位数据。最终生成一个包含 136 位的单一数据段。

4. 适配版本号 #

根据需要的比特长度,选择合适的 QR 码版本号。根据不同版本的容量,确认所需比特长度是否适合选择的版本号,最终选择版本 1。

5. 连接段,添加填充,生成码字 #

将多个比特串连接在一起,包括段模式、字符计数、数据段、终止符、比特填充和字节填充,形成完整的数据比特序列。

6. 拆分块,添加 ECC,交织 #

对生成的码字序列进行块拆分,计算错误校正码(ECC),并将其附加到每个块的末尾。

7. 绘制固定模式 #

绘制 QR 码的基本结构,包括定时模式、查找器模式和格式位。这些模式用于帮助扫码器识别和解码 QR 码。

8. 尝试应用每种掩码 #

为非功能模块应用掩码,并计算不同掩码的惩罚分数。这些惩罚分数通过计算同色模块的连续性、相同颜色的 2x2 块、类似查找器的模式和暗 / 亮模块的比例来评估。

9. 计算惩罚点,选择最佳掩码 #

根据计算的惩罚分数选择最佳的掩码模式,以确保 QR 码的可读性和稳定性。

10. 生成最终的 QR 码 #

根据上述步骤生成最终的 QR 码,并显示在用户界面中。

该网页还提供了相关的 QR 码设计信息、教程和其他工具的链接,以帮助用户更深入地理解 QR 码的构造和工作原理。


HN 热度 242 points | 评论 43 comments | 作者:D4Ha | 1 day ago #

https://news.ycombinator.com/item?id=42165862

  • QR 码的 Reed-Solomon 纠错码计算部分在线上资料中经常被忽略,尽管它非常有趣
  • 有教程详细解释了 QR 码的纠错码计算,提供了额外的资源链接
  • 从头开始生成 QR 码的过程,包括纠错码计算,可以使用长除法实现
  • Reed-Solomon 纠错码计算虽然复杂,但却是整个 QR 码生成过程中最吸引人的部分
  • 维基百科上有 Reed-Solomon 纠错码的详细文章
  • Veritasium 最近发布了一段关于 QR 码的视频,解释了 QR 码的天才之处
  • 博主收到了一些读者的反馈,其中包含对印度人的负面评论
  • 博主在评论中表现出精英主义倾向,对印度人的英语水平和文化背景进行了贬低
  • 互联网名人经常收到一些明显的请求或要求,这些请求往往来自学生,试图寻找捷径或认为博主有义务提供个人支持
  • 语言随时间而变化,这是正常的,应该努力理解不同文化背景下的英语使用者
  • 对印度人的英语进行嘲笑是一种种族主义行为,应该避免
  • 印度人对国内的诈骗行为同样感到愤怒,因为这些诈骗者也会针对印度人
  • 印度政府正在逐步采取措施打击金融犯罪,回应民众的需求

AlphaProof’s Greatest Hits #

https://rishimehta.xyz/2024/11/17/alphaproofs-greatest-hits.html

本文总结了 AlphaProof 在 IMO 2024 解决方案中的一些最酷的想法。AlphaProof 使用 Lean 语言编写证明,因此本文将从每个问题的证明中选取一些关键的策略来解释这些想法。

问题 1 要求找出所有实数 α,使得对于每个正整数 n,表达式⌊α⌋+⌊2α⌋+⋯+⌊nα⌋都是 n 的倍数。AlphaProof 的解决方案表明,满足该性质的 α 只有偶数。证明的关键步骤是设置一个整数 ℓ,使得 2ℓ=⌊α⌋+⌊2α⌋,然后证明对于所有自然数 n,⌊(n+1)α⌋=⌊α⌋+2n(ℓ−⌊α⌋)。从而得出 α=2(ℓ−⌊α⌋),即 α 是偶数。

问题 2 要求找出所有正整数对(a,b),使得存在正整数 g 和 N,对于所有 n≥N,gcd(a^n+b^n,g)=1。AlphaProof 的解决方案表明,只有(1,1)满足该性质。证明的关键步骤是考虑 ab+1,并证明它必须能整除 g。然后,通过选择 n=Nφ(ab+1),可以得到(ab+1)|(a^Nφ(ab+1)+b)和(ab+1)|(b^Nφ(ab+1)+a),从而推导出 a=b=1。

问题 6 要求证明,对于任何 aquaesulian 函数 f,存在一个整数 c,使得对于任何有理数 r,f(r)+f(-r)的值最多只有 c 个。AlphaProof 的解决方案表明,c=2。证明的关键步骤是首先证明 c≤2,然后通过构造一个特殊的 aquaesulian 函数 f 来证明 c=2。该函数定义为 f(x)=-x+2⌈x⌉,并且可以证明 f(-1)+f(1)=0 和 f(1/2)+f(-1/2)=2,得出两个不同的值。


HN 热度 241 points | 评论 126 comments | 作者:rishicomplex | 1 day ago #

https://news.ycombinator.com/item?id=42165397

  • 重大数学突破仍由人类完成,但可能被标榜为 AI 成果,因为大公司有更多资金激励
  • AI 解决数学问题更多是为了展示其 AI 能力,而非真正关心数学本身
  • 解决数学问题对 AI 公司来说是很好的公关机会,即使夸大了 AI 的实际作用
  • LLM 与形式化语言的结合是未来趋势,可以正式验证每个陈述并处理幻觉问题
  • Cyc 项目已经尝试解决类似问题 40 年,但其核心在于处理大量常识和日常事实的推理
  • Cyc 的知识库主要通过手工编写公理构建,推理引擎执行逻辑演绎、归纳推理、统计机器学习等
  • Cyc 通过类型来指导选择,但类型系统并非解决所有问题的万能药
  • 编码现实陈述为形式化语言是巨大挑战,目前难以实现
  • 在数学以外的领域,如生物学、语言学和历史,可以使用概率模型和形式逻辑工具结合处理
  • 在社会学、心理学和哲学等更宽松的领域,LLM 可以直接应用,但需要更广泛的知识背景
  • 理论物理等领域与数学证明相距甚远,难以直接应用形式逻辑工具

Bhutan, after prioritizing happiness, now faces an existential crisis #

https://www.cbsnews.com/news/bhutan-emigration-crisis-60-minutes/

不丹,一个曾经以幸福指数闻名的国家,如今却面临着年轻人大量流出的问题。这个只有马里兰州大小的国家,曾经是世界上最孤立的国家之一,直到 1970 年代才开始允许外国游客访问。佛教是国家宗教,人们穿着传统服装,建筑也遵循传统风格。政府致力于保护环境,规定至少 60% 的土地必须保持森林覆盖,且大部分能源来自水力发电,不丹是世界上唯一一个碳负排放的国家。

不丹的第四任国王在 1970 年代提出“国民幸福指数”(GNH)的概念,强调经济增长与文化保护的平衡。每五年,政府都会对国民进行幸福指数调查,以此作为政策决策的依据。然而,尽管不丹拥有免费的医疗和教育,生活水平不断提高,年轻人却仍然纷纷离开。政府统计显示,9% 的国民已经离开,主要是年轻人,他们在澳大利亚等国找到更高薪的工作。

政府正在努力吸引年轻人回国,包括开发旅游业和创造就业机会。国王还提出建设一个“心灵之城”,旨在吸引年轻人回国。然而,政府也意识到,这是一个长期的过程,需要时间和努力来解决这个问题。


HN 热度 220 points | 评论 294 comments | 作者:nradov | 9 hours ago #

https://news.ycombinator.com/item?id=42172281

  • 幸福感与物质主义的吸引力之间的冲突导致了年轻一代的出走
  • 教育投资可能导致人才流失,但限制教育或强制人才留下并非长久之计
  • 发展中国家的脑力流失是因为高技能人才在发达国家能获得更高收入
  • 文化环境对个人发展和创新的支持程度影响人才的去留
  • 美国等发达国家的文化更欢迎不同背景的人才,促进经济发展
  • 旅行对教育和视野拓展有重要作用,但廉价旅行可能带来负面影响
  • 发展中国家与发达国家的生活质量差异,如饮用水安全,也是人才流失的原因
  • 美国自 70 年代以来的实质性进步有限,经济增长主要得益于世界储备货币地位
  • 食物质量、住房条件、医疗保健和汽车安全等方面的显著改善是现代生活的进步体现