MoreRSS

site iconHackerNews AI 摘要修改

使用 RPA 方案,每天自动获取 Top Stories ,使用 GPT 方式自动摘要,同时会一并摘要 HackerNews 网友的评论。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

HackerNews AI 摘要的 RSS 预览

2024 12 27 HackerNews

2024-12-27 08:58:33

2024-12-27 Hacker News Top Stories #

  1. Blackcandy 是一个自托管的音乐流媒体服务器,旨在成为个人音乐中心。
  2. Portspoof 是一款旨在增强操作系统安全性的程序,它通过模拟所有 TCP 端口上的有效服务来迷惑扫描工具。
  3. Server-Sent Events(SSE)是一种从服务器向客户端发送事件的技术,允许服务器向客户端推送更新,而无需客户端请求。
  4. Egui 是一个易于使用的即时模式 GUI 库,使用 Rust 编程语言编写,支持 Web 和本地应用程序。
  5. CobolCraft 是一个用 COBOL 编写的 Minecraft 服务器,支持 Minecraft 1.21.4(当前最新版本)。
  6. 秒数与时区:POSIX 时间不是从 1970 年 1 月 1 日 00:00:00 开始算起的秒数,而是从协调世界时(UTC)开始算起的秒数。
  7. Sherlock 项目是一款用于搜索和识别社交媒体账户的工具,支持超过 400 个社交网络平台。
  8. Siyuan 是一个以隐私为首要考虑的个人知识管理系统,支持细粒度的块级引用和 Markdown WYSIWYG 编辑。
  9. Differential Growth Addon for Blender 是一个开源、免费的 Blender 插件,用于生成有机形状和模式。
  10. 阿塞拜疆航空公司的一架 Embraer 190 型飞机坠毁事件可能是由于一枚空中防御导弹意外击中飞机。

Blackcandy: Self hosted music streaming server #

https://github.com/blackcandy-org/blackcandy

Black Candy 是一个自托管的音乐流媒体服务器,旨在成为个人音乐中心。用户可以通过访问 https://demo.blackcandy.org 来尝试演示版,使用 demo 用户(邮箱:[email protected],密码:foobar)登录。不过,演示用户没有管理员权限,因此无法体验所有功能,演示中使用的音乐均来自自由音乐档案(Free Music Archive),用户需注意相关许可。

** 安装 **

Black Candy 使用 Docker 镜像进行安装,用户可以通过以下命令快速运行 Black Candy:


docker run -p 3000:3000 ghcr.io/blackcandy-org/blackcandy:latest

或从 Docker Hub 拉取:


docker run -p 3000:3000 blackcandy/blackcandy:latest

安装完成后,用户可以通过浏览器访问 http://localhost:3000http://host-ip:3000,并使用初始管理员账户登录(邮箱:[email protected],密码:foobar)。

** 升级 **

在进行重大版本升级时,用户需仔细阅读升级指南,因为可能会有一些破坏性更改。具体的升级步骤包括拉取新镜像、停止并删除旧容器,然后创建新容器。命令如下:


docker pull ghcr.io/blackcandy-org/blackcandy:latest

docker stop <your_blackcandy_container>

docker rm <your_blackcandy_container>

docker run <OPTIONS> ghcr.io/blackcandy-org/blackcandy:latest

如果使用 Docker Compose,升级命令如下:


docker pull ghcr.io/blackcandy-org/blackcandy:latest

docker-compose down

docker-compose up

** 移动应用 **

Black Candy 的移动应用可在各大应用商店下载,Android 用户也可以从 GitHub Release 下载 APK 文件。

** 配置 **

  • ** 端口映射 **:Black Candy 默认使用 3000 端口,用户可以通过 -p 选项进行端口映射。
  • ** 媒体文件挂载 **:用户可以将主机上的媒体文件挂载到容器中,并使用 MEDIA_PATH 环境变量设置媒体路径。
  • ** 使用 PostgreSQL 作为数据库 **:默认情况下,Black Candy 使用 SQLite 数据库。对于需要更高性能或在云服务(如 Heroku)上托管的用户,可以使用 PostgreSQL。
  • ** 数据持久化 **:所有需要持久化的数据都存储在 /app/storage 目录中,用户可以将此目录挂载到主机上以保持数据持久性。
  • ** 使用 Nginx 传输文件 **:Black Candy 支持使用 Nginx 传递音频文件,这种方式比通过 Black Candy 后端处理更高效。用户可以使用 Docker Compose 设置 Nginx 和 Black Candy 的服务。

** 日志管理 **

Black Candy 默认将日志输出到标准输出,用户可以利用 Docker 提供的多种日志管理选项进行控制。

** 环境变量 **

Black Candy 支持多种环境变量配置,包括数据库 URL、媒体路径、数据库适配器、Nginx sendfile 设置等。关键环境变量包括:

  • DB_URL:PostgreSQL 数据库的 URL。
  • MEDIA_PATH:设置 Black Candy 的媒体路径。
  • DB_ADAPTER:支持 SQLite 和 PostgreSQL。
  • NGINX_SENDFILE:控制 Nginx sendfile 的启用。
  • SECRET_KEY_BASE:设置应用的密钥,以避免旧会话失效。
  • FORCE_SSL:强制应用通过 SSL 访问。

** 开发 **

Black Candy 的开发环境要求安装 Ruby、Node.js、libvips 和 FFmpeg。安装依赖后,用户需要配置数据库,并可以通过运行 ./bin/dev 启动开发服务,随后访问 http://localhost:3000 进行登录。

** 集成 **

Black Candy 支持通过 Discogs API 获取艺术家和专辑的图像,用户需在设置页面中配置 API 令牌以启用此功能。

** 赞助 **

该项目得到了赞助支持。


HN 热度 590 points | 评论 252 comments | 作者:nateb2022 | 21 hours ago #

https://news.ycombinator.com/item?id=42512896

  • 自建主机音乐流媒体服务器 Blackcandy
  • Jellyfin 服务器和家庭助手很棒
  • Jellyfin 适合备份物理媒体
  • 可以使用 selfh.st 找到更多自建应用
  • nginx-proxy 可以帮助记住域名而不是端口号
  • Traefik 和 nginx-proxy 都可以用来反向代理和自动化证书
  • Tailscale 和 Cloudflare Tunnels 可以用来保护访问
  • 自建服务可以使用域名和 TLS 证书
  • 有些服务不支持路径访问,只支持子域名
  • 自建服务需要保护主页不被他人访问
  • Home Assistant 可以用来构建家庭安全系统
  • Frigate 适合用于 RTSP 相机的安全解决方案
  • Konnected 可以用来复用已有的家庭安全系统
  • 创建播放列表并将其拖放到手机上仍然是最佳体验
  • Syncthing 可以用来自动同步音乐文件
  • 手机存储成本降低,直接存储音乐文件成为可能

Portspoof: Emulate a valid service on all 65535 TCP ports #

https://github.com/drk1wi/portspoof

**Portspoof 概述 **

Portspoof 是一款旨在增强操作系统安全性的程序,它通过以下几种技术实现其目标:

  1. ** 所有 TCP 端口始终处于开放状态 **:无论攻击者尝试连接哪个端口,Portspoof 都会返回 SYN+ACK 信号,而不是告诉攻击者某个端口处于关闭或过滤状态。这样,攻击者无法通过常规的端口扫描(如 SYN 扫描)来确定系统上真实开放的端口,因为所有端口看起来都是开放的。
  2. ** 每个开放的 TCP 端口模拟服务 **:Portspoof 拥有一个庞大的动态服务签名数据库,用于生成虚假的服务横幅,从而迷惑扫描工具。扫描软件通常试图确定某个开放端口上运行的服务版本,而 Portspoof 会根据服务签名正则表达式数据库,动态生成有效的服务签名响应。
  3. ** 降低攻击者的侦察效率 **:结合以上两种技术,攻击者很难识别出系统的真实服务,唯一能够判断服务是否被模拟的方法是通过协议探测(想象一下要对 65,000 个开放端口进行协议探测的困难)。进行这一阶段的侦察需要耗费超过 8 小时的时间和 200MB 的数据流量。

** 主动防御的艺术 **

Portspoof 可以用作 “利用框架前端”,使您的系统变成一个响应迅速且具有攻击性的机器。实际上,这意味着利用攻击者的工具和漏洞来反击他们。目前在配置文件(portspoof.conf)中有一些示例利用。

Portspoof 的主要特点包括:

  • ** 增加攻击者的侦察难度 **:大大延长攻击者侦察阶段的时间。
  • ** 用户空间软件 **:不需要 root 权限。
  • ** 每个运行实例仅绑定一个 TCP 端口 **:简化了管理和配置。
  • ** 易于通过 iptables 规则进行自定义 **:提供灵活性。
  • ** 低 CPU 和内存占用 **:采用多线程设计,资源占用极少。
  • ** 拥有超过 9000 种动态服务签名 **:使攻击者扫描软件获取虚假信息。

** 作者与商业用途 **

Portspoof 的作者是 Piotr Duszyński(@drk1wi)。该软件遵循 GPL-2.0 许可协议。对于商业和合法应用,用户需要联系作者以获得适当的许可安排。

总之,Portspoof 作为一款轻量级、快速、便携且安全的程序,是任何防火墙或安全系统的重要补充,旨在让攻击者的侦察过程变得繁琐和耗时。


HN 热度 363 points | 评论 135 comments | 作者:nateb2022 | 1 day ago #

https://news.ycombinator.com/item?id=42509953

  • 计算机安全将继续朝着"主动防御"的方向发展,类似于 Portspoof 这样的方法。
  • MariaDB 默认设置使数据库监听端口 0 以禁用 Internet 访问,但这并不总是有效。
  • 可以使用防火墙规则将端口 0 的流量重定向到其他端口。
  • 端口 0 可以在某些 Linux 版本上绑定。
  • Portspoof 可以用作"利用框架前端",使系统成为响应迅速且具攻击性的机器。
  • 主动防御可能包括返回 zip 炸弹或使用诱饵来迷惑攻击者。
  • 免疫系统是一个复杂而精妙的系统,但它并不完美,时常会出现错误。
  • 人们对免疫系统的描述可能会暗示有一种"指导手",但这实际上是演化的结果。
  • AI 可以用于创建高质量的诱饵来迷惑攻击者。
  • 自然界中存在一些模仿的例子,例如蝴蝶翅膀模仿捕食者的眼睛。

Server-Sent Events (SSE) Are Underrated #

https://igorstechnoclub.com/server-sent-events-sse-are-underrated/

Server-Sent Events(SSE)是一种从服务器向客户端发送事件的技术,允许服务器向客户端推送更新,而无需客户端请求。SSE 是一种简单、轻量级的技术,适用于实时更新的应用场景。

SSE 的工作原理是,客户端向服务器发送一个 HTTP 请求,服务器保持连接打开,并向客户端发送事件。客户端可以使用 EventSource API 来接收和处理这些事件。

SSE 的优势包括:

  • 简单易用:SSE 使用标准的 HTTP 协议,易于实现和集成。
  • 低延迟:SSE 允许服务器实时向客户端推送更新,减少延迟。
  • 低资源消耗:SSE 只需要保持一个 HTTP 连接,资源消耗较低。

SSE 的应用场景包括:

  • 实时更新:SSE 适用于实时更新的应用场景,例如实时新闻、股票价格、聊天室等。
  • 游戏:SSE 可以用于游戏中的实时更新,例如游戏状态、玩家位置等。
  • IoT:SSE 可以用于物联网设备的实时更新,例如传感器数据、设备状态等。

SSE 的实现包括:

  • 服务器端:服务器需要保持连接打开,并向客户端发送事件。
  • 客户端:客户端需要使用 EventSource API 来接收和处理事件。

SSE 的注意事项包括:

  • 浏览器支持:SSE 需要浏览器支持,目前大多数现代浏览器都支持 SSE。
  • 事件格式:SSE 事件需要遵循特定的格式,包括事件类型、数据等。
  • 错误处理:SSE 需要处理错误和异常,例如连接断开、事件格式错误等。

总之,SSE 是一种简单、轻量级的技术,适用于实时更新的应用场景。它的优势包括简单易用、低延迟、低资源消耗等。然而,SSE 也需要注意浏览器支持、事件格式、错误处理等问题。


HN 热度 302 points | 评论 134 comments | 作者:Igor_Wiwi | 1 day ago #

https://news.ycombinator.com/item?id=42511318

  • SSE(Server-Sent Events)是一种被低估的技术,具有许多优点,包括实时更新、低延迟和高效率。
  • SSE 可以用于替代 WebSocket,尤其是在需要实时更新和低延迟的场景中。
  • SSE 有一些缺点,例如浏览器连接数限制和缺乏授权头支持。
  • 可以使用 Broadcast Channel API 来检测浏览器标签页打开和关闭,以解决 SSE 连接数限制的问题。
  • 服务工作线程(Service Worker)也可以用来解决 SSE 连接数限制的问题。
  • SSE 和 WebSocket 都有自己的优缺点,选择哪种技术取决于具体的应用场景和需求。
  • SSE 在实时更新和低延迟方面有优势,但在连接数限制和授权头支持方面有一些缺点。
  • WebSocket 在连接数限制和授权头支持方面有优势,但在实时更新和低延迟方面有一些缺点。

Egui – An immediate mode GUI written in Rust #

https://www.egui.rs/

egui 是一个易于使用的即时模式 GUI 库,使用 Rust 编程语言编写,支持 Web 和本地应用程序。它的目标是成为最简单、最快速且高度可移植的 Rust GUI 库,适合任何可以绘制纹理三角形的环境,如游戏引擎。egui 的官方框架是 eframe,支持在 Web、Linux、Mac、Windows 和 Android 上编写应用程序。

主要特点 #

  • ** 易用性 **:egui 旨在成为最容易使用的 GUI 库,用户无需担心复杂的状态管理和回调。
  • ** 即时模式 **:egui 采用即时模式,意味着用户每帧都需重绘界面,简化了应用程序代码结构。
  • ** 跨平台 **:同一代码可以在 Web 和本地应用中运行。
  • ** 简单的 2D 图形 API**:支持自定义绘制(epaint)。
  • ** 无回调机制 **:在 egui 中,组件的状态和行为在每一帧中直接更新,而不需要保留状态。

使用场景 #

egui 适合需要简单 GUI 的 Rust 项目,尤其是游戏引擎中的 GUI。它不适用于希望创建本地外观界面的应用或对稳定性有高要求的项目。

集成 #

egui 可以轻松集成到现有的游戏引擎或平台。集成主要包括:

  1. ** 输入处理 **:收集鼠标、键盘等输入信息。
  2. ** 调用 GUI 代码 **:执行用户定义的 GUI 逻辑。
  3. ** 输出处理 **:处理 egui 的输出,如光标变化和纹理分配。
  4. ** 渲染 **:绘制 egui 生成的三角形网格。

目标与非目标 #

  • ** 目标 **:

    • 提供最易用的 GUI 库。
    • 60Hz 的响应速度。
    • 友好,容易上手。
    • 纯粹的即时模式,避免复杂性。
    • 可扩展性强,允许用户编写自定义控件。
  • ** 非目标 **:

    • 追求成为最强大的 GUI 库。
    • 提供原生界面的外观。

状态与功能 #

egui 仍在积极开发中,功能不断更新。当前提供的功能包括:

  • 各种控件:标签、按钮、复选框、滑块等。
  • 图像支持。
  • 布局管理:支持水平、垂直和列布局。
  • 文本编辑功能。
  • 窗口管理:可以移动、调整大小和关闭窗口。
  • 渲染功能:抗锯齿的线条、圆形和文本渲染。
  • 访问性支持。

FAQ #

  • ** 非拉丁字符支持 **:可以通过加载自定义字体实现。
  • ** 外观定制 **:支持通过 Context::set_style 自定义颜色、间距和字体。
  • ** 异步支持 **:需保持 GUI 线程非阻塞,使用消息通道或共享内存来进行线程间通信。
  • ** 文件对话框 **:支持原生和 Web 的异步文件对话框。
  • ** 无障碍支持 **:通过 AccessKit 支持屏幕阅读器功能,当前在 Windows 和 macOS 上可用。

开始使用 #

用户可以从 egui 的示例文件夹获取简单示例,并通过相关文档和社区讨论获取更多信息。对于想要集成 egui 的开发者,提供了详细的集成指南和第三方集成的资源。

总的来说,egui 是一个轻量级且易于使用的 Rust GUI 库,适合希望快速开发简单交互界面的开发者。


HN 热度 273 points | 评论 134 comments | 作者:josephcsible | 23 hours ago #

https://news.ycombinator.com/item?id=42512636

  • Rust 编译时间较长,可能需要使用 lld 或 mold 链接器来加速编译。
  • Modules 不会解决编译时间问题,热重载可能是更好的解决方案。
  • 低像素密度设备上,基于 canvas 的 UI 渲染库可能会有字体渲染问题。
  • 即使在高像素密度设备上,子像素渲染仍然是必要的。
  • egui 不适合用于普通的桌面应用程序,仅适合用于 2D 游戏或图形程序的叠加层。
  • egui 需要一个对话框生成工具来减少重复代码。
  • egui 仅在必要时重绘 UI,例如当有动画或输入事件时。
  • egui 不适合用于大型文本框或滚动文本。
  • Bevy 引擎支持 egui,用于游戏 UI 的开发。

A Minecraft server written in COBOL #

https://github.com/meyfa/CobolCraft

CobolCraft 是一个用 COBOL 编写的 Minecraft 服务器。它支持 Minecraft 1.21.4(当前最新版本)。该项目的特点包括:

  • 无限地形生成和动态区块加载
  • 持久化世界和玩家数据到磁盘
  • 支持 Minecraft 的文件格式(导入现有世界)
  • 多人游戏(最多 10 名玩家)
  • 服务器状态(显示在线状态)
  • 破坏和放置方块
  • 方块交互(右键点击,例如打开门)
  • 玩家物品栏(仅限创造模式)
  • 聊天
  • 命令(游戏内和交互式控制台)
  • 通过 server.properties 配置
  • 白名单(持久化,存储在 whitelist.json 中)

注意:具有多种状态、方向或交互式方块的方块需要大量专门的代码才能正常工作,这超出了本项目的范围。然而,一些方块是支持的,例如:

  • 火把(所有变种)
  • 石板(所有变种)
  • 楼梯(非连接)
  • 旋转柱,如原木或玄武岩
  • 按钮(非交互式)
  • 门(包括交互)
  • 陷阱门(包括交互)

使用方法:

CobolCraft 使用 GnuCOBOL 开发,适用于 Linux。其他操作系统(如 Windows)的支持尚未测试。但是,可以使用 Docker 进行平台无关的部署。

要在 Linux 上部署,需要安装以下软件包:

  • cobc(例如,来自 Debian 的 gnucobol APT 包)
  • make
  • g++
  • zlib(例如,zlib1g-dev 在 Debian 上)
  • curl(需要下载官方服务器 .jar 文件)
  • 最新版本的 Java(需要从服务器 .jar 文件中提取数据)

然后执行 make 命令编译,接着执行 make run 命令启动服务器,监听端口 25565。

或者,使用 Docker:

  • 拉取 Docker 镜像:docker pull meyfa/cobolcraft:latest
  • 或者自己构建:git clone https://github.com/meyfa/CobolCraft.git cobolcraft && cd cobolcraft
  • 构建 Docker 镜像:docker build –tag meyfa/cobolcraft .
  • 运行 Docker 容器:docker run –rm –interactive –tty –publish 25565:25565 –volume “$(pwd)/server.properties:/app/server.properties” –volume “$(pwd)/whitelist.json:/app/whitelist.json” –volume “$(pwd)/save:/app/save” meyfa/cobolcraft

配置服务器:

编辑 server.properties 文件,该文件在第一次运行时自动生成,包含所有支持选项的默认值:

  • 服务器端口(默认:25565)
  • 白名单(默认:false)
  • 服务器状态(默认:“CobolCraft”)

注意:默认情况下,服务器仅可通过 localhost 访问(即仅在本地系统上通过 localhost:25565 访问)。要使其可从外部访问(本地网络、VPN、端口转发、租赁服务器等),可以使用以下命令启动 Docker 容器:

docker run –rm -it -p 0.0.0.0:25565:25565 meyfa/cobolcraft

为什么:

COBOL 有很多谣言和耻辱。作者想了解更多关于这个语言的信息,最好的方法是通过一个项目。作者没有任何 COBOL 经验,但决定写一个 Minecraft 服务器。虽然 COBOL 不适合低级数据操作,但作者仍然实现了一个功能齐全的服务器。


HN 热度 258 points | 评论 81 comments | 作者:notamy | 21 hours ago #

https://news.ycombinator.com/item?id=42513022

  • COBOL 语言虽然有很多负面传闻,但实际上它仍然可以用来做一些有趣的事情。
  • COBOL 语言的面向对象编程风格很别扭。
  • 用 FORTRAN 语言写程序可能会因为忽略空格而导致一些意想不到的错误。
  • 现代语言可能会因为强调代码的可维护性和可读性而导致项目进展缓慢。
  • 简单的语言可能更适合快速实现一个项目的原型。
  • Rust 语言可能不太适合写游戏,因为它不擅长处理复杂的对象图。
  • 代码的质量和语言的选择没有直接关系,取决于程序员的经验和态度。
  • Bevy 引擎可能过度注重市场营销而忽略了实际功能的开发。
  • Fyrox 引擎可能是 Rust 中一个更好的选择,尽管它不如 Bevy 引擎那么有名。
  • 代码的质量和语言的选择没有直接关系,取决于程序员的经验和态度。

Seconds Since the Epoch #

https://aphyr.com/posts/378-seconds-since-the-epoch

这个网页是一篇博客文章,讨论了 POSIX 时间(也称为 Unix 时间)的概念。文章指出,POSIX 时间不是从 1970 年 1 月 1 日 00:00:00 开始算起的秒数,而是从协调世界时(UTC)开始算起的秒数。由于 UTC 时间会有闰秒的调整,POSIX 时间会随之变化。

文章解释了 IEEE 1003.1 标准中关于 POSIX 时间的定义,指出标准假设每天都是 86,400 秒长,但实际上 UTC 时间会有闰秒的调整。文章还提到,POSIX 时间的计算公式忽略了闰秒的影响,这导致了 POSIX 时间和实际时间之间的差异。

文章讨论了闰秒对 POSIX 时间的影响,指出闰秒会导致 POSIX 时间跳跃式变化,可能会导致软件 bug。文章还提到,有一些替代方法可以避免闰秒问题,例如使用 CLOCK_MONOTONIC 或 TAI 时间。

最后,文章提到,目前有一个努力正在进行中,旨在 2035 年之前取消闰秒,这将使得时间计算更加简单。文章还呼吁读者在 2035 年之前积累更多的闰秒,以便于将来进行时间转换。


HN 热度 246 points | 评论 172 comments | 作者:zdw | 24 hours ago #

https://news.ycombinator.com/item?id=42512371

-Leap 秒的存在使得时间戳的计算变得复杂,尤其是在跨越时区和日光节约时。 -有些人认为,Leap 秒的存在是必要的,因为它可以确保时间戳的准确性,但也有人认为它是不必要的,甚至是有害的。 -Unix 时间戳不考虑 Leap 秒,这意味着在 1970 年和 1971 年,Unix 时间戳与 UTC 时间戳不一致。 -有些人认为,UTC 时间戳应该与 TAI 时间戳保持一致,而不是考虑 Leap 秒。 -Leap 秒的累积可能导致时间戳的偏差,尤其是在长时间的计算中。 -有些人认为,应该使用 TAI 时间戳作为标准,而不是 UTC 时间戳。 -日光节约时的变化可能导致时间戳的计算变得复杂。 -有些人认为,时间戳的计算应该考虑到时区和日光节约时的变化。 -Leap 秒的存在使得时间戳的比较变得复杂,尤其是在不同系统之间。 -有些人认为,应该使用一个统一的时间戳标准,以避免时间戳的计算和比较中的复杂性。


Sherlock: Hunt down social media accounts by username across 400 social networks #

https://sherlockproject.xyz/

Sherlock 项目是用于搜索和识别社交媒体账户的工具。它支持超过 400 个社交网络平台,包括 Facebook、Twitter、Instagram 等。用户可以通过输入用户名来搜索相关的社交媒体账户。Sherlock 项目提供了详细的使用指南和支持文档,方便用户快速上手。同时,项目也开放了贡献渠道,鼓励开发者参与添加新的社交媒体平台支持。


HN 热度 245 points | 评论 147 comments | 作者:leonry | 1 day ago #

https://news.ycombinator.com/item?id=42509809

  • 使用唯一的用户名可以防止被跟踪
  • 使用相同的用户名可以避免被冒充
  • 不要重复使用电子邮件账号
  • 使用电子邮件子地址可以区分不同的账号
  • 部分邮箱服务商支持使用"+“号作为标签来区分邮箱
  • 部分邮箱服务商支持使用”.“号作为标签来区分邮箱
  • 使用 OAuth/OIDC 协议的身份提供者可以使用”+“号作为标签来区分账号
  • 部分邮箱服务商不允许创建多个账号绑定同一个手机号码
  • 有些邮箱服务商提供了廉价的邮箱服务,允许创建唯一的邮箱地址用于注册网站
  • 苹果的 iCloud 订阅服务提供了抛弃式的苹果邮箱地址功能
  • 使用手机号码进行验证可能需要维护手机号码的独占访问权
  • 市场上存在提供手机号码验证服务的需求,但成本相对较高

Siyuan: Privacy-first, self-hosted personal knowledge management software #

https://github.com/siyuan-note/siyuan

SiYuan 是一个以隐私为首要考虑的个人知识管理系统,支持细粒度的块级引用和 Markdown WYSIWYG 编辑。SiYuan 的主要特点包括:

  • 内容块:支持块级引用和双向链接,自定义属性,SQL 查询嵌入,协议 siyuan:// 等。
  • 编辑器:支持块级编辑,Markdown WYSIWYG,列表大纲,块级缩放,大型文档编辑,数学公式,图表,流程图,甘特图,时间轴,员工等。
  • 数据库:支持表格视图,闪存卡,AI 写作和 Q/A 聊天等。
  • Android/iOS/HarmonyOS App:支持移动端应用。
  • Docker 部署:支持 Docker 部署。
  • API:支持 API 接口。
  • 社区市场:支持社区市场。

SiYuan 的架构和生态包括:

  • 项目:SiYuan 的开发计划和进展。
  • star 历史:SiYuan 的 star 历史。
  • 路线图:SiYuan 的开发路线图。

SiYuan 的下载和安装包括:

  • 应用市场:支持应用市场安装。
  • 安装包:支持安装包安装。
  • Docker 部署:支持 Docker 部署。
  • Unraid 主机:支持 Unraid 主机安装。

SiYuan 的社区和开发指南包括:

  • 社区:SiYuan 的社区论坛。
  • 开发指南:SiYuan 的开发指南。

SiYuan 的常见问题包括:

  • SiYuan 如何存储数据?
  • 是否支持数据同步?
  • SiYuan 是否开源?
  • 如何升级到新版本?
  • 如果某些块(如列表项中的段落块)找不到块图标怎么办?
  • 如果数据存储库密钥丢失怎么办?
  • 是否需要付费?

HN 热度 243 points | 评论 115 comments | 作者:thunderbong | 22 hours ago #

https://news.ycombinator.com/item?id=42512713

  • 知识管理应该遵循"文件优先于应用程序"的 Unix 方式,使用目录结构、文件名、纯文本、列表和 Markdown 等工具进行管理。
  • 使用通用概念对内容进行分类,如位置、事物、人物、事件、度量、方法等。
  • 不要试图通过 Web 来解决问题,因为这会导致你花更多的时间解决 Web 本身的问题,而不是知识管理和生产力问题。
  • 智能手机/触摸屏是一个主要问题,但也不要试图通过 Web 来解决它,应该使用文件管理器或 fzf 等工具来适应触摸屏。
  • 标签功能是非常有用的,可以链接不同笔记之间的关系。
  • 标签系统比层次结构更强大,因为一个项目可以有多个标签,但只能属于一个目录。
  • 层次结构可以帮助创建一个更有条理的系统,促进思考和创造力。
  • 标签系统容易变成一个"黑洞”,让内容难以被检索和利用。
  • 使用纯文本文件和 fzf 等工具可以实现高效的任务管理和笔记系统。
  • 同步和移动设备的支持是当前系统的痛点,需要找到合适的解决方案。
  • Flutter Flow 等工具可以用来构建移动应用程序,但可能不适合所有人的需求。

Differential Growth Addon for Blender #

https://boris.okunskiy.name/posts/blender-differential-growth

本文介绍了 Differential Growth Addon for Blender,这是一款开源、免费的 Blender 插件,用于生成有机形状和模式。插件的作者认为,自然界的形状和模式一直以来都对人类产生着深远的影响和吸引力,人们总是试图模仿和反映自然界的过程。

插件的作者分享了一些使用 Differential Growth Addon for Blender 生成的有机形状和模式的例子,包括类似莴苣的形状、类似地衣的形状和类似藻类的形状。这些形状都是通过调整插件的参数和设置来生成的。

插件的作者还邀请读者下载最新版本的插件,并加入讨论社区,分享自己的作品和经验。同时,作者也希望读者能够享受使用插件的过程,并创造出更多的美丽的有机形状和模式。


HN 热度 240 points | 评论 27 comments | 作者:kelseyfrog | 20 hours ago #

https://news.ycombinator.com/item?id=42513157

  • Blender 是一个令人难以置信的软件,几年前我问自己为什么要花数百个小时玩游戏,而不花同样的时间学习 Blender。
  • 我最近才有了这样的顿悟,我是一个全职软件开发人员,多年来一直在研究游戏开发,但我一直放弃了我的想法,因为我无法制作“好的”艺术/资产。
  • 我同意,一些软件你无法相信是免费的,我也做了一些非常糟糕的建模,甚至我的甜甜圈也不好看。
  • 令人难以置信的是,一种细胞可以不断分裂,甚至血管在每个人身上都差不多。
  • Houdini 是一个快速发展的目标,但看起来像 Blender 和 Unreal Engine 这样的软件——甚至在核心功能上,而不仅仅是插件——正在赶上它。
  • 我很好奇,你的用例是什么,Blender 不是最合适的选择?
  • 如果你足够聪明,你甚至可以使用所有这些来驱动你的几何图形、音频和着色器,在没有(文本)代码的情况下同时进行。
  • 但是,对于真正的深度过程和模拟,任何涉及体积的东西,以及适应复杂的管道,我们谈论的是 etch-a-sketch 和油画之间的区别。
  • 我想,如果 Blender 从一开始就是一个纯粹的程序化工具,并且只专注于该用例,那么差异将远远超出功能列表所示的内容。
  • 我认为与其他建模专注的 DCC(如 Maya、Max 和 C4D)之间的差异要小得多。
  • 但这个插件是基于 L 系统还是其他系统?为什么既网页也没有 GitHub 上的数学解释?

Air missile accident emerges as probable cause of Azerbaijan E190tragedy #

https://www.euronews.com/2024/12/25/azerbaijani-passenger-plane-crashes-near-kazakh-city-of-aktau

阿塞拜疆航空的一架 Embraer 190 型飞机于周三早晨在哈萨克斯坦的阿克套市坠毁,机上 67 人中有 38 人遇难。根据阿塞拜疆航空公司提供的信息遇难者中包括 37 名阿塞拜疆公民、名俄罗斯公民、6 名哈萨克斯坦公民和 3 名吉尔吉斯斯坦公民。

在飞往俄罗斯格罗兹尼的过程中,幸存乘客听到了一声巨响,随之感觉到飞机受到碎片的撞击,机身受损。相关调查的消息来源表示,这一事件可能与一枚空中防御导弹意外击中飞机有关。格罗兹尼因受到保护,成为乌克兰无人机的潜在目标,因此该地区的防空系统十分严密。

哈萨克斯坦的紧急事务部最初报告称,坠毁事件中有 25 人幸存,但随着搜救工作的进行,幸存者人数不断修正,最终确认有 29 人幸存。所有幸存者,包括两名儿童,已被送往医院接受治疗。

根据航班追踪数据,飞机在接近阿克套机场时出现了不寻常的飞行轨迹,似乎做出了一个数字八字形的飞行,并在最后几分钟内高度波动。此外,FlightRadar24 表示,该飞机在飞行过程中遭遇了强烈的 GPS 干扰,导致其传输错误的数据。

阿塞拜疆总统伊尔哈姆・阿利耶夫在新闻发布会上表示,目前尚不宜对坠毁原因进行推测,但确认由于天气恶劣,飞机改变了原定航线,前往阿克套机场,并最终在降落时坠毁。阿塞拜疆航空公司表示,将持续更新公众信息,并已在社交媒体上将其横幅更改为黑色,以表达哀悼。


HN 热度 213 points | 评论 145 comments | 作者:bratao | 1 day ago #

https://news.ycombinator.com/item?id=42511267

  • 对于飞机尾部的损伤,许多人认为这可能是由于弹片造成的,生还者也证实了飞机内的爆炸声。
  • 有人推测,可能是俄罗斯的防空系统误击了这架民航飞机,因为该地区正在进行无人机攻击,俄罗斯防空部队的反应非常敏感。
  • 讨论中提到,民航飞机通常会使用应答器,能够识别为民用航空器,而无人机可能无法被正确识别,尤其在防空系统的操作中。
  • 质疑为什么在活跃的战争区域仍然允许民航飞机飞行,认为应该停止这种做法。
  • 有观点认为,飞行员在被击中后选择了远离战争区域的航线,尽管这样可能会增加飞行的复杂性和风险。
  • 讨论了飞机失事后为何选择飞往哈萨克斯坦而不是靠近的机场,认为可能是由于对战区的避让。
  • 有评论指出,当前的空域控制和通讯系统可能无法有效区分敌我目标,增加了误击的风险。
  • 一些评论者提到,当前地区的多条机场关闭,导致飞行选择有限。
  • 有人关注到,网络上对相关讨论的干扰,怀疑是否受到外部影响,试图引发争议。
  • 对于此事件的外交解决方案持怀疑态度,认为过去的谈判未能成功,未来的前景并不乐观。
  • 评论中提到,美国在欧洲安全上的战略失误,使得局势变得更加复杂,可能会引发更大的冲突。
  • 许多人认为,民航和军用飞机的应答器系统存在本质区别,导致了民航飞机在战争中被误识别的风险。
  • 一些人对飞机的结构表示惊讶,认为这次事故中幸存者的生存能力体现了飞机设计的坚固性。

2024 12 26 HackerNews

2024-12-26 09:10:43

2024-12-26 Hacker News Top Stories #

macOS menu bar app that shows how full the ISS urine tank is in real time #

  1. 国际空间站尿液箱满溢程度实时监测应用是一款 macOS 菜单栏应用程序,实时显示国际空间站尿液箱的满溢程度。
  2. Ornamented Christmas Tree (2013) 是一篇关于 Wolfram 语言编写圣诞树动画的文章,展示了一个生成圣诞树动画的代码示例。
  3. 这个开放问题教会我什么是拓扑学是一篇关于数学教育的视频博客,视频标题是《这个开放问题教会我什么是拓扑学》。
  4. Ruby 3.4.0 是 Ruby 语言的最新版本,带来了许多新特性和改进,包括引入 it 块参数引用、默认解析器从 parse.y 切换到 Prism 等。
  5. 试用 QvQ - Qwen 新的视觉推理模型是一篇关于 QvQ-72B-Preview 模型的文章,介绍了该模型的特点和应用。
  6. 埃及航空 804 号班机失踪事件真相是一篇关于埃及航空 804 号班机失踪事件的文章,讨论了事故的原因和调查进展。
  7. FixBrowser 是一个轻量级网页浏览器,从头开始创建,故意不支持 JavaScript,以使其更快、更少占用资源。
  8. 学术论文语义搜索网站是一篇关于 PaperMatch 网站的文章,介绍了该网站的功能和特点。
  9. CRT 模拟在 GPU 着色器中实现,效果比黑帧插入更好是一篇关于 CRT 模拟算法的文章,介绍了该算法的原理和应用。
  10. F* 是一种通用的、面向证明的编程语言,支持纯函数式和命令式编程,结合了依赖类型的表达力和基于 SMT 求解和策略式交互式定理证明的证明自动化。

https://github.com/Jaennaet/pISSStream

pISSStream 是一个 macOS 菜单栏应用程序,它实时显示国际空间站尿液箱的满溢程度。该应用程序使用 NASA 官方的公共 ISS 遥测流,提供由 Lightstreamer 提供的数据。

当 pISSStream 可以连接到 Lightstreamer 并且 ISS 遥测信号被地面站接收时,菜单栏项显示一个带有填充百分比的图标,菜单项显示为“已连接”。如果连接到 Lightstreamer 或 ISS 遥测信号本身丢失,菜单栏项显示一个带有最后接收值的图标,菜单项显示为“连接丢失”或“信号丢失(LOS)”。

开发者 Jaennaet 表示,他开发这个应用程序的动机是因为他认为这是一种“令人难以置信的愚蠢的使用空间站遥测流的方式”,但同时也是一种“令人惊讶的方式”。他还表示,这是一个很好的学习 Swift 和 macOS 开发的机会。

该应用程序的代码可能不完美,可能会出现一些错误,但开发者表示他不太担心这些问题。同时,他还提到了一个名为 ISS-Mimic 的项目,该项目提供了更多的 ISS 遥测数据,但他不会将这些数据添加到 pISSStream 中。

总的来说,pISSStream 是一个有趣的应用程序,它实时显示国际空间站尿液箱的满溢程度,虽然它可能有一些错误,但它仍然是一个值得注意的项目。


HN 热度 984 points | 评论 219 comments | 作者:ajdude | 1 day ago #

https://news.ycombinator.com/item?id=42505454

  • 项目作者的表达方式很幽默,直接说明了项目的非目标。
  • 如果通信设备都坏了,只有一个测量国际空间站尿液箱的传感器还在工作,宇航员就可以通过控制尿液箱的液面来发送信息。
  • 如果有人将这个想法拍成电影,应该支付版权费给原作者,但实际上,原作者在社交媒体平台上发布的内容可能已经被平台获取了版权。
  • 有人提到了一个关于航母穿越时空到古罗马的故事,可能与这个想法有关。
  • 社交媒体平台可能会获取用户发布内容的版权,但这并不意味着用户不能保留自己的权利。
  • 《火星救援》这部电影中,宇航员使用 ASCII 码表来与地球通信的场景不太可信。
  • 在《火星救援》中,宇航员使用 ASCII 码表来与地球通信的场景不太可信,因为他们可以使用更简单的方法来通信。
  • 《火星救援》这部电影中,宇航员使用 ASCII 码表来与地球通信的场景不太可信,因为他们可以使用摩尔斯密码来通信。

T * sin (t)' ≈ Ornamented Christmas Tree (2013) #

https://community.wolfram.com/c/portal/getImageAttachment?filename=tree.gif&userId=93201

这篇文章探讨了一个与 “t * sin (t)” 公式有关的著名 Reddit 讨论,具体是如何用 Wolfram 语言编写一个带灯光的圣诞树。文章的作者 Vitaliy Kaurov 在讨论中展示了一个生成圣诞树动画的代码示例,并分享了相应的 GIF 文件。

文章首先提到,Reddit 上关于如何通过简单的数学方程编程制作一个灯光圣诞树的讨论引起了广泛关注。作者表示,他使用 Wolfram 语言快速实现了这一想法,并提供了具有轻微闪烁效果的动画。

在技术细节方面,作者解释了代码中的几个关键参数:

  • PD 代表点与点之间的平均距离。
  • 函数 s [t, f] 用于重新缩放驱动参数 t,以确保参数曲线的点均匀分布。
  • 函数 dt [cl, ps, sg, hf, dp, f] 用于生成 3D 图形中的点,涉及到颜色、大小和位置的计算。

作者生成了 100 帧的 GIF 动画,并强调了在较远距离下灯光的调暗和阴影处理的重要性。


HN 热度 366 points | 评论 39 comments | 作者:ryeguy_24 | 24 hours ago #

https://news.ycombinator.com/item?id=42506145

  • 这个动画很美丽,并且数学知识也很有用。
  • 有人每年都会发帖子关于 T * sin(t)的圣诞树,这次是 Silvia Hao 的版本。
  • 有人在 Desmos 上制作了一个圣诞树的动画。
  • 有人使用 Chaos Game 方法制作了一个圣诞树的动画。
  • 有人使用 140 个字符的 Javascript 代码制作了一个圣诞树的动画。
  • 有人制作了一个 GIF 格式的圣诞树动画。
  • 有人在 SAS 社区分享了一个使用 Damped Oscillation 制作的圣诞树动画。
  • 有人希望在 openprocessing.org 上实现这个动画。
  • 有人建议让 30% 的灯泡随机熄灭。
  • 有人指出,如果一串灯泡中有一颗烧坏了,整个串都会熄灭。
  • 有人认为这个函数不仅仅是一个圣诞树,也可以看作是一个钻头。
  • 有人认为这个函数也可以看作是一个管道。
  • 有人认为这个函数不仅仅是一个圣诞树,也可以看作是一个其他东西。

This open problem taught me what topology is [video] #

https://www.youtube.com/watch?v=IQqtsm-bBRU

这个网页是关于数学教育的视频博客,视频标题是《这个开放问题教会我什么是拓扑学》。视频内容介绍了拓扑学的基本概念和应用,通过一个具体的问题来说明拓扑学的思想和方法。

视频中提到了一个开放问题,即如何在一个矩形中嵌入一个正方形,使得正方形的四个顶点都在矩形的边上。视频作者通过一步步的推导和证明,展示了如何使用拓扑学的方法来解决这个问题。

视频中还提到了拓扑学的基本概念,如连续性、紧密性、同伦等,并通过具体的例子来说明这些概念的应用。视频作者还提到了拓扑学在其他领域的应用,如音乐理论和对称性。

视频评论中,有很多观众对视频内容的赞赏和感谢,认为视频作者的解释清晰易懂,帮助他们理解了拓扑学的基本概念。一些观众还分享了他们自己的学习经历和体会,感谢视频作者的努力和贡献。


HN 热度 353 points | 评论 54 comments | 作者:surprisetalk | 19 hours ago #

https://news.ycombinator.com/item?id=42507185

  • 3b1b 视频展示了数学教育的可能性,但采用这种方法来教授数学可能需要很长时间。
  • Möbius 带在数学证明中的作用非常重要,之前低估了它的价值。
  • 即使对数学一无所知,也可以通过图像和视频来理解和欣赏数学的美妙之处。
  • 成为数学专家非常困难,需要付出大量的努力和承受失败的打击。
  • 可以通过规则、后果和能力来思考四维空间,而不是试图可视化它。
  • 可以使用 VR 技术来创建四维空间并帮助可视化。
  • 时间可以被认为是自然界中的第四维,但它与空间维度有所不同。

Ruby 3.4.0 #

https://www.ruby-lang.org/en/news/2024/12/25/ruby-3-4-0-released/ Ruby 3.4.0 已发布,带来了许多新特性和改进。其中包括:

  • 引入了 it 块参数引用,用于引用没有变量名的块参数。
  • 默认解析器从 parse.y 切换到 Prism
  • socket 库现在支持 Happy Eyeballs Version 2(RFC 8305),用于改善网络连接的性能和可靠性。
  • YJIT(Just-In-Time 编译器)得到了改进,包括性能提升、内存使用减少和 bug 修复。
  • 引入了模块化垃圾回收(Modular GC),允许动态加载不同的垃圾回收实现。
  • 语言变化包括字符串文字在没有 frozen_string_literal 注释的文件中会发出弃用警告,关键字散列 nil 现在支持,块传递不再允许在索引中,关键字参数不再允许在索引中,顶级名称 ::Ruby 现在是保留的。
  • 核心类更新包括异常、垃圾回收、Ractor 和范围。
  • 标准库更新包括 RubyGems、Bundler、JSON 和 Tempfile。
  • 兼容性问题包括错误消息和回溯显示的变化。

这些变化和改进将为 Ruby 开发者带来更好的性能、更好的开发体验和更强大的功能。


HN 热度 302 points | 评论 174 comments | 作者:aaronbrethorst | 18 hours ago #

https://news.ycombinator.com/item?id=42507312

  • 手写解析器比使用解析器生成器更好,因为后者难以调试和维护。
  • 解析器生成器虽然可以处理边缘情况,但手写解析器更容易维护和理解。
  • 解析器生成器可以报告语法冲突,但手写解析器可以更好地处理歧义。
  • 手写解析器需要了解解析理论和实现语言,但解析器生成器需要了解解析理论、实现语言和生成器本身。
  • 解析器生成器可以处理复杂的语法,但手写解析器更适合简单的语法。
  • 解析器生成器可以节省时间,但手写解析器可以更好地控制解析过程。
  • 手写解析器可以更好地优化性能,但解析器生成器可以更快地开发。
  • 解析器生成器可以处理二进制格式,但手写解析器更适合文本格式。
  • 解析器生成器可以更好地处理语法冲突,但手写解析器可以更好地处理语义分析。
  • 解析器生成器可以更快地开发,但手写解析器可以更好地维护和扩展。

Trying out QvQ – Qwen’s new visual reasoning model #

https://simonwillison.net/2024/Dec/24/qvq/

本文介绍了 Alibaba 的 Qwen 团队最近发布的新模型 QvQ-72B-Preview,该模型专注于增强视觉推理能力。作者尝试使用该模型进行了几个实验,包括计数、估计物体高度等任务。实验结果显示,模型在某些任务上表现良好,但也存在一些错误。

作者还提到了模型的特点,包括其可以接受图像和文本输入,并输出长篇的思考过程。模型的语气也被描述为友好和幽默。作者还比较了 QvQ 与其他模型,如 OpenAI 的 o1 和 o3 模型。

文中还提到了如何在本地运行 QvQ 模型,包括使用 Hugging Face Transformers 和 qwen-vl-utils Python 包。作者还分享了自己在 MacBook Pro 上运行 QvQ 模型的经验,包括使用 mlx-vlm 包和 uv run 命令。

最后,作者总结了 QvQ 模型的潜力和局限性,认为其在视觉推理方面具有很大的潜力,但也需要进一步改进。


HN 热度 233 points | 评论 78 comments | 作者:simonw | 1 day ago #

https://news.ycombinator.com/item?id=42505038

  • QvQ 模型在描述图片时,可能会受到审查的影响,例如在描述“坦克人”照片时会返回空白响应。
  • 使用 QvQ 模型描述图片时,可能需要使用特定的提示或策略来获得更好的结果。
  • QvQ 模型在解决特定问题时,可能需要通过编写程序来获得更好的结果,而不是直接尝试解决问题。
  • QvQ 模型可能不具备自我意识,无法自动意识到需要编写程序来解决问题。
  • QvQ 模型在处理某些问题时,可能会受到训练数据的限制,例如在处理单词搜索问题时可能会失败。
  • QvQ 模型在描述图片时,可能会受到图片内容的影响,例如在描述北京街景时会返回完整的响应,而在描述天安门广场时会返回不完整的响应。

Masks, Smoke, and Mirrors: The story of EgyptAir flight 804 #

https://admiralcloudberg.medium.com/masks-smoke-and-mirrors-the-untold-story-of-egyptair-flight-804-42c788fcac2d

埃及航空 804 号班机失踪事件发生在 2016 年 5 月 19 日,飞机在从巴黎飞往开罗的途中突然消失。事故发生后,埃及航空事故调查局(EAAID)开始调查。然而,调查进展缓慢,法国和埃及的调查人员之间出现了分歧。法国方面认为飞机可能是由于火灾而坠毁,而埃及方面则认为飞机可能是被炸弹炸毁的。

2016 年 10 月,埃及方面发布了一份最终报告,报告中包含了大量的证据,包括飞机残骸的照片和视频,飞行记录仪的数据,以及目击者的证言。报告指出,飞机在坠毁前曾经出现过火灾的迹象,但最终原因仍然不明。

2024 年 10 月,埃及方面再次发布了一份报告,报告中指出,飞机坠毁的原因是由于飞行员错误操作导致的。报告还指出,飞行员在坠毁前曾经试图重启飞机的引擎,但未成功。

事故发生后,国际民航组织(ICAO)对埃及航空业进行了审查,发现埃及航空业存在多个安全隐患。埃及方面随后采取了一系列措施来改善航空安全,包括加强飞行员培训和改进飞机维护。

事故的调查和处理过程中,埃及和法国方面存在着分歧和争议。埃及方面认为法国方面的调查方法存在问题,而法国方面则认为埃及方面的调查结果不够透明。事故的最终原因仍然存在争议,两国方面的调查结果也存在差异。

事故发生后,埃及航空业遭受了重大的打击,多个国家对埃及航空业实施了禁飞令。事故也引发了人们对航空安全的关注,国际民航组织对航空安全进行了审查和改进。


HN 热度 232 points | 评论 122 comments | 作者:gdmt | 1 day ago #

https://news.ycombinator.com/item?id=42504343

  • 有人认为 EAAID 的报告存在自相矛盾的地方,可能是被迫支持某种假设,但仍然试图以某种方式抵抗。
  • 认为埃及政府可能因为飞机维护不善而试图掩盖事故的真实原因。
  • 讨论了氧气泄漏导致火灾的可能性,认为这是由于飞机的氧气面罩系统存在问题。
  • 否定吸烟在飞机上没有危险,认为在封闭空间内吸烟是危险的。
  • 强调氧气浓度高会导致钢铁燃烧的现象,说明了火灾的危险性。
  • 指出飞机设计中的多重故障可能导致悲剧的发生,提到 “瑞士奶酪” 式的故障。
  • 认为虽然发生这类事件的概率极低,但不能忽视其可能性。
  • 对当前飞机灭火系统使用卤烷的做法表示担忧,认为有必要逐步寻找替代品。
  • 有人提到灭火器在特定情况下可能无法有效灭火,并且对卤烷的使用产生负面影响。
  • 有观点认为现有的飞机安全标准仍有改进空间,需持续优化以降低风险。

Show HN: FixBrowser – a lightweight web browser created from scratch #

https://www.fixbrowser.org/

FixBrowser 是一个真正的轻量级网页浏览器,从头开始创建。它故意不支持 JavaScript,以使其更快、更少占用资源。相反,它包含一组更新的脚本,可以修复和改进各种网站。

FixBrowser 的主要目标是隐私,使用白名单方法加载资源,以避免任何不必要的跟踪。浏览器目前处于 Alpha 阶段,所有基础模块都已就绪,但需要更多工作。

除了 FixBrowser 之外,还有 FixProxy,它使用浏览器的后端部分(除渲染外的所有内容),可与常规网页浏览器一起使用。它提供了一种安全的浏览方式,已经比较成熟,开发者已经使用它多年作为主要的浏览方式,效果良好。

下载地址:

  • Windows:fixbrowser-windows-0.1.zip(支持 Windows 2000/XP/Vista/7/8/8.1/10/11)
  • Linux:fixbrowser-linux-0.1.zip(支持 glibc 2.3.4 或更新版本,GTK2)
  • 源代码:fixbrowser-0.1.zip

计划在不久的将来支持以下系统:Linux GTK3/4、Haiku、MacOS 10.6+。还计划为 Windows 95/98/Me 提供支持,以及为移动设备(iOS/Android)提供支持。

捐赠:

该项目需要您的帮助。为了完成这个项目,需要筹集 5000 欧元。这将使开发者能够在 FixBrowser 上工作,使其可用于实际浏览,并实现一些额外的功能。工作将持续大约一年,预计在大约 6 个月内会有重大改进。

您可以选择以下额外的功能来实现:

  • 集成 CEF:允许为选定的网站或标签使用完整的浏览器体验
  • 视频播放支持:支持使用
  • 扩展支持:良好的扩展支持,包括使用本地代码的能力
  • 支持验证码和其他门户:将通过创建一个由捐赠资助的服务来解决
  • FixProxy 改进:如果您喜欢使用 FixProxy,并希望看到它改进并具有更多功能

额外的建议(例如支持哪些网站或功能等):

电子邮件(可选,仅用于与捐赠相关的联系):

捐赠金额:

您可以使用 PayPal 帐户或借记卡/信用卡(无需 PayPal 帐户)进行捐赠。


HN 热度 216 points | 评论 104 comments | 作者:jezek2 | 22 hours ago #

https://news.ycombinator.com/item?id=42506569

  • FixBrowser 是一个非常令人印象深刻的项目,尤其是在 Opera 和 Microsoft 放弃了自己的引擎并采用 Blink,Mozilla 放弃了 Servo 的时候,人们开始担心开源网络的未来。
  • ETag 可以用于客户端缓存资源,减少数据使用、服务器资源和客户端处理,因此建议为可信网站提供可选的 ETag 支持。
  • 即使 FixBrowser/FixProxy 成为流行的浏览器,个别用户也可能会因为 IP 范围和客户端行为的差异而被轻易识别。
  • Servo 项目从未被 Mozilla 放弃,它始终是一个测试 Firefox 引擎技术的试验田,后来社区将浏览器部分分叉并继续开发。
  • 即使没有 JavaScript,HTTP 协议和浏览器也可能包含用于追踪的功能,例如加载图像/跟踪像素以跟踪鼠标移动。
  • 仅允许纯 HTML 和极少量的 CSS 样式可能是防止追踪的唯一方法,但这可能会导致大多数网站不兼容。
  • FixBrowser 使用 FixScript 语言编写,FixScript 是一种内存安全、线程安全和整数溢出安全的语言,具有最小的原生表面,极大地降低了安全问题。
  • 支持多种脚本引擎可能是一个不错的功能,例如可插入的 V8、SpiderMonkey 或 Python 引擎,这可能会开启一个新的 Web 开发前景,不再受限于 JavaScript 的缺陷。
  • Python 不太适合浏览器脚本,因为它有一个庞大的标准库,且大部分与浏览器环境的沙盒和异步执行模型不兼容。
  • 多语言支持曾经是早期 Web 浏览器的设计目标,但由于互操作性问题和 JavaScript 的流行,这一功能被放弃了。

Show HN: I made a website to semantically search ArXiv papers #

https://papermatch.mitanshu.tech/

PaperMatch 是一个旨在快速发现相关研究的在线平台。用户可以通过输入关键词、论文编号(如 2401.07215)或者主题(如 “智能电视与隐私”)来寻找相关的学术研究。该平台的设计旨在为研究人员和学生提供便利,使他们能够快速获取所需的文献资料。

PaperMatch 的界面简洁明了,用户体验良好,能够高效地连接研究者与相关研究成果。平台由 Mitanshu Sukhwani 开发,充分利用了 Gradio 工具进行构建。用户可以在网站上尝试不同的输入,以探索与其研究主题相关的更多信息。

总之,PaperMatch 是一个有助于学术研究的工具,能够快速提供相关的研究资料和信息,节省研究人员的时间和精力。


HN 热度 213 points | 评论 55 comments | 作者:Quizzical4230 | 19 hours ago #

https://news.ycombinator.com/item?id=42507116

  • 语义搜索可以应用于多个领域,如在线广告搜索、跨多个电商平台的商品搜索等。
  • 语义搜索可以帮助用户更好地发现相关论文和作者,特别是在准备论文时。
  • 语义搜索可以理解语义细微差别,匹配概念相似的论文,即使没有完全匹配的关键词。
  • 语义搜索在某些领域可能更有用,但这取决于嵌入模型的能力。
  • 语义搜索可以帮助用户以自然语言查询找到相关的内容,而不仅仅是依靠关键词搜索。
  • 语义搜索可以应用于内部文档和代码库的搜索,帮助用户快速找到相关的内容。
  • 语义搜索可以结合 LLM 模型来提取代码的意义,并进行语义搜索。
  • 语义搜索可以帮助用户发现新颖的内容和观点,而不仅仅是依靠传统的关键词搜索。

CRT Simulation in a GPU Shader, Looks Better Than Black Frame Insertion #

https://blurbusters.com/crt-simulation-in-a-gpu-shader-looks-better-than-bfi/

本文介绍了一种新的算法,用于模拟 CRT(阴极射线管)显示器的扫描效果,旨在减少显示器的运动模糊。该算法由 Mark Rejhon 和 Timothy Lottes 共同开发,现已开源发布在 Shadertoy 和 Github 上。

该算法的特点包括:

  • 对 240Hz 以上显示器进行主要的运动模糊减少
  • 软化的磷光衰减和滚动扫描,减少眼部疲劳
  • 可变的每像素 MPRT(亮度重新分配算法)
  • 适用于减少 60 年来 60fps 60Hz 内容的显示运动模糊
  • 适用于 LCD 和 OLED 显示器
  • 实时和慢动作模式
  • 亮度调整(通过牺牲亮度来减少运动模糊)

该算法可以在各种软件和硬件中实现,例如:

  • 模拟器软件(如 Retroarch)
  • 视频处理设备(如 Retrotink 4K)
  • 游戏引擎(如添加低运动模糊设置的游戏)
  • 显示器固件(如添加 CRT 模拟模式的显示器)

该算法的实现需要重新处理所有刷新周期,才能实现真正的 CRT 扫描效果。同时,该算法也可以与空间模拟(CRT 掩膜滤波器)相结合,实现更真实的 CRT 模拟效果。


HN 热度 183 points | 评论 58 comments | 作者:bangonkeyboard | 24 hours ago #

https://news.ycombinator.com/item?id=42506211

  • 该 CRT 模拟效果在 240Hz 的显示屏上效果非常好,远远超过 BFI(黑帧插入)技术。
  • 该效果可能会导致某些显示屏产生闪烁或色带问题。
  • 该效果可以在 RetroArch 中使用 Slang shader 实现。
  • 该效果可能需要更高的刷新率(如 480Hz 或 1000Hz)才能达到最佳效果。
  • 该效果可以减少运动模糊,但可能无法完全模拟老式 CRT 显示器的效果。
  • 该效果可能会对某些人造成伤害,特别是对于光敏性人群。
  • 该效果可以在标准 60Hz 显示屏上运行,但可能需要调整参数来获得最佳效果。
  • 该效果可以在某些显示屏上产生很好的效果,但也可能会产生色带或闪烁问题。

F*: A proof oriented general purpose programming language #

https://fstar-lang.org/

F* 是一种通用的、面向证明的编程语言,支持纯函数式和命令式编程。它结合了依赖类型的表达力和基于 SMT 求解和策略式交互式定理证明的证明自动化。F* 程序默认编译为 OCaml,各种 F* 片段也可以提取到 F#、C 或 Wasm。F* 是用 F* 实现的,并使用 OCaml 引导。

F* 是开源的,托管在 GitHub 上,由微软研究、Inria 和社区共同开发。F* 的设计和实现基于 2016 年的 POPL 论文《Dependent Types and Multi-monadic Effects in F*》。F* 有一个低级别的子集 Low*,可以编译为 C。F* 还有一个元编程系统 Meta-F*,用于实现 F* 的各种方面,包括策略引擎和类型类支持。

F* 被广泛应用于安全和密码学领域,例如 Project Everest、HACL*、ValeCrypt 和 EverCrypt。F* 也被用于其他领域,如编译器和解析器生成。F* 有一个活跃的社区,包括 GitHub 讨论、邮件列表和在线研讨会。F* 的文档包括在线书籍、教程和课程材料。


HN 热度 151 points | 评论 38 comments | 作者:akkad33 | 12 hours ago #

https://news.ycombinator.com/item?id=42508642

  • F*语言的目标是让形式化验证变得更加容易和实用,特别是在实际软件开发中。
  • F 语言与 Lean 语言的主要区别在于 F 更注重于实际软件开发中的形式化验证,而 Lean 更侧重于交互式定理证明和形式化数学理论。
  • F*语言使用 SMT 自动化技术,而 Lean 则更注重手动证明。
  • F*语言的名称可能不太好,因为它难以在搜索引擎中找到。
  • F*语言的文档可能不够完善,需要更多的学习资源。
  • F*语言的子语言和变体可能会让初学者感到困惑。

2024 12 25 HackerNews

2024-12-25 07:05:20

2024-12-25 Hacker News Top Stories #

  1. 视频分享了世界上最大的CRT电视机的故事,讲述了作者如何找到并修复这台电视机的过程,以及他与日本游戏开发者Abebe的合作。
  2. 数学概念:π的邪恶孪生兄弟 ϖ,与圆形 ∞ 相关,与圆形 π 类似。
  3. 使用ESP32模块、MPU6050 IMU、核心无刷电机和塑料螺旋桨等组件,构建一款可以通过手机控制的小型无人机。
  4. 第38届混沌通信大会将于2024年12月27日至30日在汉堡举行,讨论技术、社会和乌托邦。
  5. 使用机器学习编译(MLC)技术,可以将LLM模型编译为适用于AMD显卡的代码,从而实现与NVIDIA显卡相似的性能。
  6. 文章探讨了癌症指南的格式问题,尤其是它们被限制在PDF文档中的现状,以及如何通过机器可读的格式来改善癌症护理的标准化。
  7. 乐高岛反编译项目是一项功能性完整的乐高岛(1997年版)反编译工作,目标是提供一个可修改、改进和移植到其他平台的可工作代码库。
  8. 东京市政府发布了整个城市的点云数据,并且这些数据是免费的,任何人都可以下载使用。
  9. 英特尔公司的股东们正在要求公司的前CEO Pat Gelsinger和CFO David Zinsner归还他们所获得的所有利润、利益和其他报酬。
  10. 研究文章介绍了人工智能模型Llama 3.3 70B的研究成果,包括训练了一个稀疏自编码器(SAE)来解释模型的潜在空间,并发布了一个可供公众使用的API。

What happened to the world’s largest tube TV? [video] #

https://www.youtube.com/watch?v=JfZxOuc9Qwk

视频标题为"What Happened to the World’s Largest Tube TV?"。视频内容讲述了一个关于世界上最大的 CRT 电视机的故事。视频作者 Shank Mods 分享了他如何找到并修复这台电视机的过程,以及他与日本游戏开发者 Abebe 的合作。

视频中提到了这台电视机的历史,称其为"PVM-4300",并展示了其巨大的尺寸和重量。视频作者还分享了他如何找到这台电视机的原主人,并与他们取得联系的过程。

视频中还包括了一些有趣的细节,例如电视机的重量超过 1000 磅,需要特殊的设备来搬运。视频作者还展示了电视机的内部结构,并解释了其工作原理。

视频的评论区中,有许多观众对视频内容进行了讨论和分享。一些评论者分享了他们自己的 CRT 电视机的经历,而其他人则对视频作者的工作表示赞赏。


HN 热度 597 points | 评论 267 comments | 作者:ecliptik | 1 day ago #

https://news.ycombinator.com/item?id=42497093

  • 保存电视机的做法是正确的,电视机的原主人也希望它能被妥善保管和使用。
  • 如果电视机被送到博物馆,它可能会被束之高阁,无法发挥其应有的价值。
  • 保存历史文物的空间和资金是有限的,不能保留所有的历史文物。
  • 有些公司或组织可能不重视保存历史文物,甚至会将其出售或丢弃。
  • 保存历史文物需要独立的资金和组织来维持其运营。
  • 将历史文物卖给私人收藏家可能是保留其价值的最佳方式。
  • 保存历史文物的责任和自主权是一个复杂的问题,涉及文化遗产和保护的伦理困境。
  • 将历史文物留在原产国可能更好,也可能更糟糕,取决于当地的保护和维护情况。

The number pi has an evil twin #

https://mathstodon.xyz/@johncarlosbaez/113703444230936435

约翰·卡洛斯·贝兹(John Carlos Baez)在推特上分享了一个有趣的数学概念:π 的邪恶孪生兄弟 ϖ。 ϖ 是一个与圆形 ∞ 相关的数字,与圆形 π 类似。贝兹分享了一个公式:r² = cos2θ,它定义了一个称为 lemniscate 的曲线。该曲线的周长是 2 ϖ,约为 2.62205755。贝兹还提到了与 ϖ 相关的变异三角函数 sl 和 cl,它们与圆形三角函数 sin 和 cos 类似。

贝兹还分享了一个有趣的观察:如果我们取两个点,并绘制所有曲线,使得这两个点之间的距离的乘积为一个常数,则会得到一系列称为 Cassini 的椭圆曲线。其中一个特殊的曲线是 lemniscate。贝兹还提到了一个与 ϖ 相关的公式:π 和 ϖ 之间的比率是高斯常数。

最后,贝兹分享了一个有趣的观察:蜜蜂在飞行时经常遵循一个类似 ∞ 的模式,这可能与数学中的 lemniscate 曲线有关。


HN 热度 410 points | 评论 172 comments | 作者:pkaeding | 19 hours ago #

https://news.ycombinator.com/item?id=42499567

  • π 是从圆形中推导出来的,而圆形是由一个点的距离定义的。ϖ 是从伯努利的双曲线中推导出来的,而双曲线是由两个点的距离定义的。是否有一个类似的常数是从由三个点的距离定义的形状中推导出来的?
  • 人类实际上是直观的对数尺度思想者。也就是说,没有接受过西方人早期算术训练的人类会更多地思考比率而不是差异。
  • 人类有很多对数响应:亮度、声音的响亮度、音乐的八度和相对音高。
  • 如果我们假设我们是线性存在,擅长直观加法但对直观乘法不太擅长,那么可能存在生活在对数空间的存在,他们的思想基于乘法。他们的圆圈就是双曲线。
  • 有一个通用的双曲线:当你有 N 个点时,你可以找到一个由这些点的距离的常数乘积产生的有趣曲线。也许在更高维度中,对于 1 个点,你有一个球体。对于 2 个点,形状是两个滴状的双曲线。
  • 有一个关于对数尺度的理论认为它在进化上更适应。

Build a Low-Cost Drone Using ESP32 #

https://www.digikey.com/en/maker/projects/a-step-by-step-guide-to-build-a-low-cost-drone-using-esp32/8afccd0690574bcebfa0d2ad6fd0a391

使用 ESP32 构建低成本无人机的详细指南 #

项目概述 #

随着无人机技术的发展,它们从小众爱好转变为多功能工具,广泛应用于摄影、农业、国防等领域。本项目旨在使用 ESP32 模块、MPU6050 IMU、核心无刷电机和塑料螺旋桨等易于获得的组件,构建一款可以通过手机控制的小型无人机。

无人机的主要特点 #

  • **WiFi 控制 **:通过智能手机控制无人机。
  • ** 稳定性控制 **:采用 MPU6050 IMU 传感器进行飞行稳定性控制。
  • ** 一体化 PCB 设计 **:无需 3D 打印部件,组装简单。
  • ** 易于升级 **:可通过外部模块增加如位置保持或高度保持等额外功能。
  • ** 小巧轻便 **:便于携带和操作。
  • ** 内置电池充电器 **:便于无人机充电。
  • **USB 接口 **:用于编程和调试。
  • ** 支持 Android 和 iOS 应用 **:用户可以方便地通过手机应用控制无人机。
  • ** 开源项目 **:用户可以修改和扩展功能。

完整电路图 #

无人机的电路图包括:

  • USB Type C 端口,负责充电和编程。
  • 电源管理电路,确保 USB 和电池电源之间的无缝切换。
  • 使用 MIC5219 3.3V LDO 进行电压调节。
  • MPU6050 传感器用于飞行稳定性控制。
  • 使用 SI2302 N 沟道 MOSFET 控制电机,并配有保护二极管和电阻。

自定义 PCB 设计 #

为了确保最终产品尽可能紧凑且易于组装,本项目设计了自定义 PCB。PCB 的设计考虑了无人机的脚架,使其可以方便地与主 PCB 断开。

固件编写 #

无人机的固件基于 Espressif 的 ESP-drone 固件,使用 ESP-IDF 4.4.5 版本编写。用户可以选择从 GitHub 上克隆源代码并自行编译,或使用提供的二进制文件进行闪存。

固件闪存方法 #

用户可以通过三种方法将固件闪存到 ESP32 无人机上:

  1. ** 使用 ESPIDF 从源代码构建 **:安装 ESP-IDF,克隆固件库,并使用命令行工具进行构建和闪存。
  2. ** 使用 ESPTOOL**:在终端中使用 esptool.py 命令将固件写入 ESP32。
  3. ** 使用 ESP32 闪存下载工具 **:通过图形界面选择芯片类型、固件文件和串口进行闪存。

操作无人机 #

  1. 将无人机放在平坦的表面上并开机。
  2. 无人机启动后会创建 WiFi 热点,用户连接后可使用密码 “12345678”。
  3. 下载并打开相应的手机应用程序(可在 App Store 或第三方链接中找到)。
  4. 连接成功后,无人机指示灯会闪烁绿色,用户可通过应用控制无人机的起飞、降落和方向。

起飞前检查 #

  • 确保无人机正确放置,并在水平面上启动。
  • 检查 LED 指示灯状态,绿色闪烁表示连接正常,红色闪烁表示电池电量低。
  • 使用控制器进行基本的响应测试,确保无人机能够接收到指令。

通过上述步骤,用户可以顺利构建并操作自己的低成本 ESP32 无人机,享受 DIY 乐趣与无人机飞行的体验。


HN 热度 333 points | 评论 112 comments | 作者:m3at | 23 hours ago #

https://news.ycombinator.com/item?id=42498648

  • 开源无人机社区发展迅速,硬件成本降低,软件开源,降低了进入门槛
  • 开源无人机的硬件和软件生态系统正在快速发展,包括飞控、电调、摄像头和无线通信等
  • 开源无人机的软件框架,如 Betaflight、ArduPilot 和 iNav,提供了强大的飞行控制和导航功能
  • 开源无人机的开发者社区活跃,提供了大量的文档、教程和支持
  • 开源无人机的成本相对较低,尤其是对于初学者和爱好者来说
  • 开源无人机的性能和功能已经接近商业级别,尤其是在飞行控制和导航方面
  • 开源无人机的开发者社区正在努力改进飞行控制和导航算法,提高飞行性能和安全性
  • 开源无人机的硬件和软件兼容性良好,易于集成和扩展
  • 开源无人机的开发者社区正在探索新的应用领域,如农业、林业和搜索救援等
  • 开源无人机的安全性和可靠性已经得到改善,尤其是在飞行控制和导航方面
  • 开源无人机的开发者社区正在努力提高飞行性能和安全性,减少事故和故障的发生

38th Chaos Communication Congress #

https://events.ccc.de/congress/2024/infos/index.html

第 38 届混沌通信大会

第 38 届混沌通信大会(38C3)将于 2024 年 12 月 27 日至 30 日在汉堡举行,是混沌计算机俱乐部(CCC)和志愿者组织的年度四天会议,讨论技术、社会和乌托邦。

大会内容

大会提供讲座、工作坊和各种活动,涵盖信息技术、社会影响等多个主题。自 1984 年起,大会由社区组织,鼓励所有形式的参与。您可以通过志愿者、举办和主持活动、展示自己的项目等方式参与大会。

信息渠道

  • 官网:本网站是大会的主要信息渠道,我们会在这里发布所有相关信息。
  • 大会博客:大会博客和官网是大会的主要信息渠道,我们会在这里发布更新信息,并在博客上发布详细内容。如果您不想错过任何更新,请订阅博客的 RSS feed。
  • 联系方式:您可以在我们的联系页面找到如何与其他参与者和组织团队联系的信息。

大会准备

  • 门票:您可以在官网上购买门票。
  • Bildungsurlaub:我们提供 Bildungsurlaub 服务,请在官网上查看详细信息。
  • 到达大会地点:您可以在官网上找到如何到达大会地点的信息。

大会体验

  • 场地:大会将在汉堡举行,我们会在官网上发布场地地图和导航信息。
  • 酒吧:大会提供酒吧服务,您可以在官网上查看详细信息。
  • 黑客之旅:我们提供黑客之旅活动,请在官网上查看详细信息。

支持和安全

  • 获取帮助:如果您需要帮助,请在官网上查看我们的支持页面。
  • 大会原则:我们致力于创建一个安全和尊重的环境,请在官网上查看我们的大会原则。
  • 可访问性:我们致力于使大会对所有人都可访问,请在官网上查看我们的可访问性信息。
  • 照相机和隐私:我们尊重您的隐私,请在官网上查看我们的照相机和隐私政策。
  • COVID-19 和感染保护:我们致力于保护您的健康,请在官网上查看我们的 COVID-19 和感染保护措施。

HN 热度 312 points | 评论 171 comments | 作者:joeig | 15 hours ago #

https://news.ycombinator.com/item?id=42500475

  • 今年的票务系统真的很糟糕,不公平。
  • 大多数人对嵌入式和密码学方面的演讲很感兴趣。
  • 有些人对生物学相关的演讲很感兴趣,但不确定是否值得一看。
  • 有人认为今年的票务系统很糟糕,很难买到票。
  • 有人建议通过黑客空间获取票务。
  • 有人认为黑客空间获取票务需要帮助设置他们的空间。
  • 有人认为黑客空间获取票务没有这样的要求。
  • 有人认为今年的票务系统很公平,支持核心观众。
  • 有人认为住宿费用很高,很难负担。
  • 有人建议选择经济的住宿方式,比如附近的体育馆。
  • 有人认为体育馆的住宿方式不适合所有人。
  • 有人认为提前预订酒店可以节省费用。

Making AMD GPUs competitive for LLM inference (2023) #

https://blog.mlc.ai/2023/08/09/Making-AMD-GPUs-competitive-for-LLM-inference

本文讨论了使用 AMD 显卡进行大型语言模型(LLM)推理的性能。通过使用机器学习编译(MLC)技术,可以将 LLM 模型编译为适用于 AMD 显卡的代码,从而实现与 NVIDIA 显卡相似的性能。文章指出,AMD Radeon RX 7900 XTX 显卡的性能可以达到 NVIDIA GeForce RTX 4090 的 80%,而 AMD Radeon RX 7900 XTX 显卡的价格比 NVIDIA GeForce RTX 4090 显卡便宜 40%。

文章还讨论了 MLC 技术的优势,包括可以自动优化代码、支持多种后端(如 CUDA、Metal、ROCm、Vulkan 和 OpenCL)等。并且,MLC 技术可以让开发者使用 Python 语言开发和部署 LLM 模型,提高开发效率。

文章还提供了使用 MLC 技术在 AMD 显卡上运行 LLM 模型的 benchmark 结果,结果显示 MLC 技术可以实现与 NVIDIA 显卡相似的性能。并且,文章还讨论了使用 Vulkan 后端在 SteamDeck 设备上运行 LLM 模型的结果,结果显示 MLC 技术可以在 SteamDeck 设备上实现良好的性能。

总的来说,本文讨论了使用 MLC 技术将 LLM 模型部署到 AMD 显卡上的性能和优势,证明了 MLC 技术可以实现与 NVIDIA 显卡相似的性能,具有广阔的应用前景。


HN 热度 256 points | 评论 158 comments | 作者:plasticchris | 23 hours ago #

https://news.ycombinator.com/item?id=42498634

  • AMD 的消费级 GPU 性能并不代表数据中心级 GPU 的性能
  • AMD 的 CDNA 架构和 RDNA 架构有很大不同
  • AMD 的 UDNA 架构预计在 2026 年发布
  • AMD 的 CDNA GPU 支持 Mesa,理论上可以支持 Vulkan Compute 和 SYCL
  • AMD 的 GPU 正成为大语言模型推理的严重竞争者
  • AMD 决定不发布高端 GPU,因此投资于 7x00 或 6x00GPU 将会浪费
  • Nvidia H200 的价格是 H100 的一半,因为人们无法在 H200 上运行 vLLM
  • vLLM 不能在 Nvidia H200 上运行可能是由于 AMD64 依赖
  • AMD 应该自己做 GPU 驱动程序,而不是依赖第三方
  • Intel 的 oneAPI 和 IPEX-LLM 支持还不成熟

Why are cancer guidelines stuck in PDFs? #

https://seangeiger.substack.com/p/why-are-cancer-guidelines-stuck-in

这篇文章探讨了癌症指南的格式问题,尤其是它们被限制在 PDF 文档中的现状,以及如何通过机器可读的格式来改善癌症护理的标准化。

作者首先描述了两个患有相同癌症的患者在不同医院就诊的情景。尽管医学研究提供了丰富的证据,但由于医生的时间压力、不同的培训背景和对最新研究的即时访问能力有限,患者的治疗可能会有所不同。因此,临床指南的出现变得至关重要,它们将大量医学证据提炼成结构化的建议,帮助标准化不同医院和临床医生的护理。

每年,美国国家综合癌症网络(NCCN)的顶尖肿瘤专家会根据最新研究制定针对不同癌症类型的指南。尽管这些指南经过严格的审查和更新,但由于它们通常以 PDF 格式发布,医生在查阅时面临许多挑战:需要找到正确的文档、识别相关部分、跟踪多个超链接,同时还要管理繁重的患者负担。此外,指南的更新频繁,医生很容易参考到过时的版本。

作者指出,临床指南本质上是决策树,但目前的格式难以跟踪和应用。他提出,如果将指南以结构化的数据格式发布,机器就能够解读这些指南,从而使得医疗信息系统能够自动建议诊断测试并警告医生当治疗方案偏离指南时。

作者分享了自己作为软件工程师的经历,他构建了一个小型的概念工具,旨在将 NCCN 的乳腺癌指南提取为机器可理解的结构化格式。通过定义一个能够表示大部分指南信息的模式,他创建了一个图形化界面,能够更方便地从患者案例中找到相应的指南建议。他的工具目前虽然还有一定的误差(约 70-80% 准确率),但显示了通过机器学习和结构化数据改善指南可用性的潜力。

作者最后表示,自己对这一问题的探索仍在进行中,并希望能与在这一领域工作的其他人进行合作,共同推动指南的改进。他提到,未来的工作可以定义更结构化的模式,以便更好地评估和理解指南内容。


HN 热度 248 points | 评论 119 comments | 作者:huerne | 23 hours ago #

https://news.ycombinator.com/item?id=42498462

  • PDF 格式虽然不理想,但具有可移植性和持久性,且无需额外的维护成本。
  • 医疗信息系统供应商对确保患者死亡负有责任,主要是出于追求利润的动机。
  • 医疗信息系统供应商不愿意正确实施现有的标准和协议,导致患者照护不佳。
  • 开放标准和协议可以让更多人参与改进,减少错误和不一致。
  • 医疗领域的标准和协议实现起来非常困难,需要大量投资和协调。
  • 即使在社会化医疗体系中,没有利润动机的情况下,解决这些问题也非常复杂。
  • 医疗信息系统供应商不实施开放标准和协议可能是出于对潜在责任和法律风险的担忧。
  • 医疗信息系统供应商不实施开放标准和协议可能是出于对潜在责任和法律风险的担忧。
  • 即使标准和协议开放,医疗信息系统供应商可能仍然不愿意实施,以避免潜在的法律责任和风险。
  • 将医疗信息系统标准和协议开放给公众可能会带来更好的解决方案和改进。
  • 医疗信息系统标准和协议的开放可以让更多人参与改进,减少错误和不一致。

Show HN: Complete decompilation of Lego Island #

https://github.com/isledecomp/isle

LEGO Island Decompilation 项目是一项功能性完整的 LEGO Island(1997 年版)反编译工作。该项目旨在尽可能准确地匹配原始机器码,目标是提供一个可修改、改进和移植到其他平台的可工作代码库。

项目状态:

  • ISLE.EXE 和 LEGO1.DLL 已完全反编译,并且在功能上与原始版本相同。但是,仍在努力改进源代码的准确性、命名、文档和结构。虽然可能仍存在一些未解决的 bug,但从源代码派生的二进制文件应该是可玩的。
  • 由于编译器的复杂性,这些二进制文件与原始可执行文件不完全匹配。希望有一天可以解决这个问题。

编译:

  • 项目使用 CMake 构建系统,可以使用各种编译器和开发环境。为了获得最准确的结果,建议使用 Microsoft Visual C++ 4.20(与原始游戏相同的编译器)。
  • 编译步骤:
    1. 安装 Microsoft Visual C++ 4.2 和 CMake。
    2. 运行 Visual C++ 4.2 的 BIN/VCVARS32.BAT x86 来设置环境变量。
    3. 创建一个用于编译对象的文件夹(例如源代码存储库中的 build 文件夹)。
    4. 使用 CMake 配置项目:cmake <path-to-source> -G “NMake Makefiles” -DCMAKE_BUILD_TYPE=RelWithDebInfo
    5. 构建项目:nmake 或 cmake –build <build-folder>

注意:

  • Visual C++ 4.2 有路径中包含空格的问题。如果出现配置或构建错误,请确保 CMake、存储库和 Visual C++ 4.2 不在包含空格的路径中。
  • RelWithDebInfo 是推荐的构建类型,因为它会生成调试符号,有助于进一步的反编译工作。也可以使用 Release 构建类型,但调试构建不推荐,因为它们可能与原始 LEGO1.DLL 不兼容。

HN 热度 224 points | 评论 30 comments | 作者:foxtacles | 1 day ago #

https://news.ycombinator.com/item?id=42497173

  • 该项目的工具和基础设施很有趣,注重 1:1 的准确性,并侧重于兼容性和跨平台的重新实现。
  • 该项目的作者 MattKC 在 YouTube 上有一个很好的频道,分享了他对一些游戏的逆向工程和分析。
  • 该游戏的开发者 Mindscape 创造了一个奇怪的 RIFF 格式的资源流。
  • 有人正在用 Unreal Engine 重制《乐高小小机器人》。
  • 有人希望有人能重制《乐高阿尔法小队》。
  • 该项目的作者使用了 D3D 保留模式,这是一种奇怪的渲染历史。
  • 有人感谢该项目的贡献者,因为该游戏是他们童年时的最爱。
  • 有人想学习逆向工程,但不知道从哪里开始。
  • 有人在 Twitch 上直播逆向工程《卡斯尔瓦尼亚:夜之交响曲》。
  • 有人认为该游戏的内容很少,但重玩性很高。
  • 有人认为 Roblox 很奇怪。

Tokyo released point cloud data of the entire city for free #

https://twitter.com/spatiallyjess/status/1871342549958537326

东京市政府近日发布了整个城市的点云数据,并且这些数据是免费的,任何人都可以下载使用。点云数据是通过激光扫描等技术获取的三维空间信息,广泛应用于城市规划、建筑设计和地理信息系统等领域。

该消息引发了广泛的关注和讨论,表明数据开放和共享的重要性,同时也鼓励更多的人利用这些资源进行研究和开发。对于开发者、研究人员以及对城市规划感兴趣的个人来说,这无疑是一个宝贵的机会,可以深入了解东京的城市结构和空间布局。


HN 热度 210 points | 评论 28 comments | 作者:taubek | 12 hours ago #

https://news.ycombinator.com/item?id=42501102

  • 瑞士是第一个拥有详细 3D 建筑模型的国家,覆盖了整个国家,包括每一栋建筑、桥梁、缆车、森林、树木和地理名称。
  • 瑞士的防御不仅仅依靠隐秘的堡垒和防御位置,还依靠山脉、爆炸装置和大量武装训练有素的民众。
  • 瑞士的防御堡垒和防御位置并不是秘密,很多信息可以通过卫星图片和维基百科获取。
  • Surface-level 对象可以通过卫星成像来获取。
  • 瑞士的防御堡垒和防御位置很多都是公开的,例如托布勒龙防线。
  • 加拿大温哥华市也有类似的 3D 点云数据。
  • 瑞士的 3D 建筑模型数据可以用于各种应用,包括视频游戏和建筑设计。
  • 收集点云数据的方法包括飞机和无人机等。
  • 点云数据可以用于创建 3D 模型,用于视频游戏和建筑设计等领域。
  • 点云数据可以通过各种算法转换成 3D 模型,例如 Cesium tiles 和 OSM 数据。

Intel shareholders file case asking ex CEO, CFO to return 3 years of salary #

https://www.cfodive.com/news/intel-shareholders-yank-exceo-cfo-compensation-foundry/736193/

英特尔公司的股东们正在要求公司的前 CEO Pat Gelsinger 和 CFO David Zinsner 归还他们所获得的所有利润、利益和其他报酬。股东们指控这两位高管违反了他们的受托责任和合同义务,向股东们提供了误导性的财务信息和报告。

根据在美国北加州地区法院提交的股东派生诉讼,Gelsinger 和 Zinsner 被指控违反了他们的受托责任和合同义务,向股东们提供了误导性的财务信息和报告。诉讼还指控其他公司高管和董事会成员也参与了此次违规行为。

诉讼称,Gelsinger 和 Zinsner 向股东们提供了误导性的财务信息和报告,包括关于公司的晶圆代工业务的财务表现。根据诉讼,Gelsinger 和 Zinsner 在公司的财务报告和公开声明中表示,晶圆代工业务是公司业务的“重要增长点”,但事实上,这个业务在 2023 年亏损了 7 亿美元。

英特尔公司的股东们要求公司的董事会采取行动,追究 Gelsinger 和 Zinsner 的责任,并要求他们归还所获得的利润、利益和其他报酬。诉讼还要求公司采取措施,防止类似事件再次发生。

此次诉讼是英特尔公司近期面临的又一挑战。公司在今年早些时候宣布了一项重组计划,目标是通过削减成本和优化业务来恢复公司的盈利能力。然而,公司的财务表现仍然不佳,今年第三季度的亏损达到 16.6 亿美元。


HN 热度 202 points | 评论 106 comments | 作者:YetAnotherNick | 15 hours ago #

https://news.ycombinator.com/item?id=42500482

  • 这起诉讼看起来像是 ambulance chaser(讹诈)诉讼,没有任何严肃的对 Intel 公司的指控
  • 投资者做了错误的赌注,试图在客户面前挽回面子
  • 律师们想要大笔的钱,找到了一个客户,利用他们来赚钱
  • CEO 离开不是因为他做错了什么,而是因为他的计划没有成功,这是正常的
  • Intel 公司没有足够的耐心来实施长期战略,导致 CEO 离开
  • CEO 离开是 Intel 公司继续走下坡路的又一个迹象
  • Intel 公司应该给 CEO 更多的时间来实施他的计划
  • CEO 的计划可能是好的,但没有足够的时间来实施
  • Intel 公司的董事会和投资者们只关心短期利益,不关心公司的长期发展

Show HN: Llama 3.3 70B Sparse Autoencoders with API access #

https://www.goodfire.ai/papers/mapping-latent-spaces-llama/

该网页是一篇关于人工智能模型 Llama 3.3 70B 的研究文章。文章首先介绍了研究人员训练了一个稀疏自编码器(SAE)来解释 Llama 3.3 70B 模型的潜在空间,并发布了一个可供公众使用的 API。研究人员发现,SAE 模型可以学习到广泛的概念,包括生物医学知识、物理学知识和编程概念等。文章还展示了如何使用 SAE 模型来控制语言模型的输出,例如让模型输出像海盗一样说话的文本。

文章还讨论了研究人员遇到的挑战,包括如何评估模型的性能以及如何避免模型输出有害内容。研究人员表示,他们已经采取了措施来移除有害的特征,并且正在开发一个负责的扩展计划来确保模型的安全性。

总的来说,该网页是一篇关于人工智能模型解释和控制的研究文章,展示了研究人员在这个领域的最新进展和成果。


HN 热度 184 points | 评论 47 comments | 作者:trq_ | 1 day ago #

https://news.ycombinator.com/item?id=42495936

  • 人工智能研究人员总是以“安全”为借口限制他们的研究成果,这是没有必要的。
  • 即使是数学和数据,也不能保证安全。
  • 人工智能模型可能会产生有害的结果,需要进行适当的测试和审查。
  • 限制人工智能模型的输出可能会导致模型无法产生有用的结果。
  • 人工智能模型的安全性取决于其训练数据和算法,而不是其输出内容。
  • 即使是基本的 ReLU 自编码器,也可能会产生高频特征和特征吸收的问题。
  • 需要对自编码器的变体进行更详细的评估和测试。
  • 自编码器的安全性取决于其训练数据和算法,而不是其输出内容。
  • 使用 PaCMAP 和其他大规模变体可能会产生更好的结果。

2024 12 24 HackerNews

2024-12-24 09:22:31

2024-12-24 Hacker News Top Stories #

  1. 美国医疗保险公司 United Healthcare 涉嫌滥用 DMCA 删除互联网上与其 CEO 遇刺案有关的内容。
  2. 研究表明,商业茶袋在泡茶时会释放出数百万个微塑料和纳米塑料,这些塑料颗粒可以被人体吸收,进入血液循环系统。
  3. 德国的“Stammtisch”传统可以帮助人们打击孤独感,因为现代生活中,人们越来越少参加社交活动,导致孤独感的增加。
  4. Twtxt 是一个去中心化的、极简主义的微博客服务,适合黑客使用,支持多种客户端。
  5. 长期软件开发需要考虑未来,特别是当软件需要运行数十年时,开发人员需要仔细选择依赖项,确保它们不会过时或被弃用。
  6. 最近发布的 FrontierMath 数据集和语言模型 o3 在该数据集上的表现令人惊讶,可能标志着人工智能在数学领域的重大突破。
  7. SemiAnalysis 最近进行了一项为期五个月的研究,比较 AMD 的 MI300X 和 Nvidia 的 H100/H200 的性能,结果显示 AMD 的软件栈存在许多问题,导致 MI300X 无法实现其潜在的性能。
  8. 经典游戏 ELITE 的开发过程和历史,作为一个曾经的 Commodore 64 玩家,作者对这个游戏有着深厚的感情。
  9. Xerox 将以 15 亿美元的价格收购 Lexmark,这将使两家公司联合起来,共享价值观,相互补充的优势和对打印行业的承诺。
  10. War Thunder 是一款免费在线战斗游戏,由 Gaijin Entertainment 开发和运营,最近,游戏论坛再次出现了机密文件泄露事件。

‘United Healthcare’ using DMCA against Luigi Mangione images #

https://abovethelaw.com/2024/12/united-healthcare-using-dmca-against-luigi-mangione-images-which-is-bizarre-wildly-inappropriate/

美国医疗保险公司 United Healthcare 涉嫌滥用 DMCA(数字千年版权法)来删除互联网上与其 CEO 遇刺案有关的内容。该公司被指控发送虚假的 DMCA 请求,要求删除艺术家创作的 Luigi Mangione 的肖像画、印有“Deny, Defend, Depose”的商品等内容。 Luigi Mangione 是涉嫌刺杀 United Healthcare CEO 的嫌疑人。

DMCA 是一项美国法律,旨在保护版权所有者的权利,但滥用 DMCA 请求来删除非侵权内容是违法的。United Healthcare 的行为被视为一种“版权欺诈”,即滥用版权法来压制他人的言论自由。

该公司的行为引起了人们的强烈批评,认为这是对言论自由和艺术创作自由的攻击。同时,也有人质疑 United Healthcare 是否真正拥有 Luigi Mangione 肖像的版权,认为该公司的行为是毫无根据的。

此外,独立记者也收到了 DMCA 请求,要求删除其发布的 Luigi Mangione 及其家人的照片。该照片最初发布在马里兰州议员 Nino Mangione 的竞选网站上,但后来被删除。该网站现在威胁任何使用该照片的人,这被认为是对公平使用原则的误解。

总之,United Healthcare 的行为被视为滥用 DMCA 来压制他人的言论自由和艺术创作自由,引起了人们的强烈批评。


HN 热度 363 points | 评论 225 comments | 作者:haunter | 1 day ago #

https://news.ycombinator.com/item?id=42490453

  • DMCA 的漏洞太大,任何人都可以假冒公司提交删除请求
  • 如果有人虚假地声称自己是公司的授权代理人,那就是伪证
  • 收到删除请求的人没有办法核实请求的真实性,只能假设是合法的
  • 如果忽略删除请求,可能会失去安全港保护,承担侵权责任
  • 提交反通知需要提供个人信息,承担法律责任
  • 服务提供商不必恢复删除的内容,但如果不恢复,可能会失去免责保护
  • DMCA 法律保护了公司的利益,但没有保护个人用户的权益
  • 政府和立法机构没有有效地保护公民的权益,反而受到了大公司的影响

Commercial tea bags release microplastics, entering human cells #

https://medicalxpress.com/news/2024-12-commercial-tea-bags-millions-microplastics.html

最近一项研究表明,商业茶袋在泡茶时会释放出数百万个微塑料和纳米塑料,这些塑料颗粒可以被人体吸收,进入血液循环系统。研究人员使用了多种高级分析技术来研究这些塑料颗粒的性质和行为,并发现它们可以进入人体的肠细胞,甚至进入细胞核。

研究人员使用了扫描电子显微镜、透射电子显微镜、红外光谱、动态光散射和激光多普勒测速等技术来研究茶袋释放的塑料颗粒。他们发现,茶袋在泡茶时会释放出大量的纳米塑料和微塑料,包括聚丙烯、聚酯和纤维素等材料。

研究人员还研究了这些塑料颗粒与人体肠细胞的相互作用,发现这些颗粒可以被肠细胞吸收,甚至进入细胞核。研究人员指出,这些塑料颗粒可能对人体健康造成影响,特别是长期暴露于这些塑料颗粒中的人群。

研究人员呼吁制定标准化的测试方法来评估塑料食品包装材料释放的微塑料和纳米塑料,并制定相关的法规来减少这些塑料颗粒的污染。随着塑料食品包装的使用量不断增加,研究人员强调了减少微塑料和纳米塑料污染的必要性,以确保食品安全和保护公众健康。


HN 热度 341 points | 评论 271 comments | 作者:wglb | 10 hours ago #

https://news.ycombinator.com/item?id=42494746

  • 纸茶包实际上是涂有塑料的
  • 纸茶包可能使用的是纤维素生物塑料
  • 纸茶包可能是由 PLA 制成的,PLA 是一种可生物降解的植物基塑料
  • 纸茶包在高温下会释放微塑料
  • 微塑料研究中,自然存在的聚合物和合成塑料没有区分
  • 该研究可能是为了开发一种方法来检测微塑料,而不是研究纸茶包本身
  • 该研究可能存在问题,研究结果可能不可靠

One way to fight loneliness: Germans call it a Stammtisch #

https://www.npr.org/2024/12/22/nx-s1-5233033/holidays-loneliness-cure-stammtisch

这个网页是一篇关于如何打击孤独感的文章,作者 Laurel Wamsley 描述了她在德国发现的一个传统叫做“Stammtisch”,即“常客桌”。这是一个由一群志同道合的人组成的团体,他们每月在当地酒吧或餐厅聚会,喝酒、聊天,深化友谊。

作者描述了她在柏林参加的一个 Stammtisch 活动,看到了一群人在酒吧里聚集,聊天、喝酒,享受彼此的公司。作者认为,这种传统可以帮助人们打击孤独感,因为现代生活中,人们越来越少参加社交活动,导致孤独感的增加。

文章还提到了 Stammtisch 的历史和文化背景,原来在德国的每个村庄都有一个角落酒吧,里面有一个专门为常客保留的桌子, Stammtisch 就是指这个桌子和聚集在这里的人们。现在, Stammtisch 已经演变成一种现代的社交活动,不仅仅是喝酒,还包括聊天、分享生活经验等。

作者还采访了一些 Stammtisch 的参与者,他们分享了自己的经验和感受。其中一位参与者说, Stammtisch 帮助他打开了心扉,能够与别人分享自己的感受和想法。另一位参与者说, Stammtisch 是一种很好的方式,可以帮助人们建立深厚的友谊和社交网络。

最后,作者总结了 Stammtisch 的意义,认为它是一种可以帮助人们打击孤独感、建立深厚友谊的社交活动。作者还鼓励读者们尝试参加 Stammtisch 或者建立自己的 Stammtisch 团体。


HN 热度 326 points | 评论 254 comments | 作者:geox | 1 day ago #

https://news.ycombinator.com/item?id=42488263

  • 在美国,人们的生活方式与欧洲不同,人们更注重工作和个人时间,社交活动相对较少。
  • 美国的文化强调个人主义和独立性,导致人们更倾向于独处和缺乏社交联系。
  • 在欧洲,特别是在南欧国家,人们更注重社交和家庭联系,经常聚会和共度时光。
  • 美国的城市规划和建筑设计也可能导致人们更倾向于独处,例如大型购物中心和住宅区的设计。
  • 缺乏社交联系可能导致人们感到孤独和寂寞。
  • 在美国,人们可能需要更主动地寻求社交机会和建立人际关系。
  • 社交媒体可能无法替代面对面的社交联系,人们需要找到平衡社交媒体使用和现实社交的方式。
  • 美国的教育系统和工作文化可能也对人们的社交生活产生影响,例如长时间的工作和学习时间可能导致人们缺乏社交时间。
  • 了解和接受不同的文化和生活方式可以帮助人们更好地适应和应对社交挑战。

Twtxt is a decentralised, minimalist microblogging service for hackers #

https://twtxt.readthedocs.io/en/latest/index.html

twtxt 是一个去中心化的、极简主义的微博客服务,适合黑客使用。它的文档分为多个部分,包括用户指南、API 参考和社区等。

用户指南部分包括介绍、安装、快速入门、使用、配置等内容。介绍部分解释了 twtxt 的概念和特点,安装部分提供了在不同环境下安装 twtxt 的方法,快速入门部分教用户如何快速上手使用 twtxt,使用部分详细介绍了 twtxt 的命令行接口,配置部分解释了 twtxt 的配置文件和 registry 的格式。

API 参考部分详细介绍了 twtxt 的 API 接口,包括添加新用户、获取最新推文、搜索推文、查询提及、查询标签、查询用户等。

社区部分提供了 twtxt 的 IRC 频道和 issue 跟踪器的链接。

twtxt 的特点包括去中心化、极简主义、支持多种客户端等。它的目标是提供一个简单、易用的微博客服务,适合黑客和开发者使用。


HN 热度 297 points | 评论 109 comments | 作者:Gedxx | 1 day ago #

https://news.ycombinator.com/item?id=42488983

  • twtxt 社区不活跃,很难找到活跃的站点
  • twtxt 的 feed 格式很好,但是似乎没有足够的需求
  • twtxt 的社区名是 YARN,twtxt 是协议名
  • twtxt 社区比想象中大,约有 70 人
  • twtxt 很难管理关注列表和内容,移动端应用也不好用
  • twtxt 的应用程序名称可以叫“ontheloo”
  • twtxt 的社区很小,不足以支撑一个大型的社交网络
  • twtxt 有一些 bug,配置目录和 txt 文件目录的改变会导致程序崩溃
  • twtxt 的使用者需要有很强的自律性和自我约束力
  • twtxt 的纯文本格式限制了人类表达的多样性和丰富性

Long Term Software Development #

https://berthub.eu/articles/posts/on-long-term-software-development/

最近,荷兰选举委员会(我也是该委员会的非常时期顾问)邀请我做了一次关于他们开源的 Abacus 投票统计软件的演讲。

在软件开发中,有两种不同的世界。一种是软件作为服务提供,通常采用持续部署(CD)和自动化测试(CI),以确保新版本至少能正常工作。另一种是软件用于控制核电站、选举、心脏起搏器、飞机、桥梁和重型机械等领域,这些领域需要软件长期稳定运行,不能频繁更新。

长期软件开发需要考虑未来,特别是当软件需要运行数十年时。开发人员需要仔细选择依赖项,确保它们不会过时或被弃用。依赖项的选择需要考虑其技术、社区、资金和安全性等因素。

测试是长期软件开发的关键。测试可以确保软件在不同环境下正常运行,并且可以在更新依赖项或修复 bug 时提供支持。测试还可以帮助开发人员在长期不维护软件后重新建立功能。

复杂性是软件开发的最大敌人。随着代码量的增加,复杂性也会增加,unless 开发人员采取措施控制它。开发人员需要尽量减少复杂性,确保代码简单易懂。

在长期软件开发中,需要考虑依赖项、测试和复杂性等因素,以确保软件长期稳定运行。


HN 热度 282 points | 评论 133 comments | 作者:todsacerdoti | 1 day ago #

https://news.ycombinator.com/item?id=42487670

  • 不要轻易使用第三方依赖,自己实现更好
  • 有些第三方依赖是值得信赖的,比如那些被广泛使用和支持的库
  • 使用第三方依赖需要谨慎,考虑到未来可能的维护和安全问题
  • 自己实现 auth 代码可能不如使用成熟的第三方库安全
  • 有些问题,像 auth,已经有成熟的解决方案,不需要自己实现
  • 使用第三方库可以避免自己重复发明轮子
  • 自己实现 auth 代码可能会导致安全问题和维护困难
  • 有些第三方库虽然成熟,但可能存在安全漏洞和兼容问题
  • 使用第三方库需要权衡利弊,考虑到自己的项目需求和安全要求

Can AI do maths yet? Thoughts from a mathematician #

https://xenaproject.wordpress.com/2024/12/22/can-ai-do-maths-yet-thoughts-from-a-mathematician/

本文讨论了最近发布的 FrontierMath 数据集和语言模型 o3 在该数据集上的表现。FrontierMath 数据集包含数百个困难的数学问题,旨在测试语言模型在数学领域的能力。数据集的创建者希望通过该数据集来评估语言模型是否能够真正理解数学概念,而不仅仅是记忆和回忆。

文章作者是一位数学家,他对 FrontierMath 数据集和 o3 模型的表现感到惊讶。作者认为,o3 模型在数据集上的表现远超其预期,尤其是考虑到数据集的问题难度。作者还指出,o3 模型的成功可能标志着人工智能在数学领域的重大突破。

然而,作者也指出,FrontierMath 数据集的秘密性使得人们难以了解数据集的具体内容和 o3 模型的表现。作者希望数据集的创建者能够公开更多关于数据集的信息,以便更好地理解 o3 模型的能力。

总的来说,本文讨论了 FrontierMath 数据集和 o3 模型在数学领域的表现,探讨了人工智能在数学领域的潜力和挑战。


HN 热度 260 points | 评论 222 comments | 作者:mathgenius | 14 hours ago #

https://news.ycombinator.com/item?id=42493464

  • ChatGPT 在数学问题上已经做得很好,甚至超出了作者的预期。
  • 作者认为 LLM 在数学问题上还存在很大的局限性,特别是在解决复杂问题时。
  • 有些网友认为 Wolfram Alpha 是更好的数学工具,特别是在解释数学概念和提供详细推导方面。
  • 但其他网友认为 Wolfram Alpha 的理解能力有限,难以准确理解用户的需求。
  • 有人希望 ChatGPT 能够提供更详细的数学推导和解释。
  • 也有人认为 ChatGPT 在数学问题上犯的错误往往是逻辑和概念性的,而不是简单的 tokenization 错误。
  • 有网友建议 OpenAI 应该提供一个反馈机制,让用户能够轻松指出 ChatGPT 的错误。

CUDA Moat Still Alive #

https://semianalysis.com/2024/12/22/mi300x-vs-h100-vs-h200-benchmark-part-1-training/

SemiAnalysis 最近进行了一项为期五个月的研究,旨在比较 AMD 的 MI300X 和 Nvidia 的 H100/H200 的性能。虽然 MI300X 在纸面上拥有更强大的规格和更低的总拥有成本(TCO),但实际测试结果却令人失望。AMD 的软件栈存在许多问题,导致 MI300X 无法实现其潜在的性能。

研究人员发现,MI300X 在训练工作负载方面的性能不如 H100 和 H200。他们测试了多种 benchmark,包括 GEMM、单节点训练和多节点训练,结果显示 MI300X 的性能不佳。研究人员还发现,AMD 的软件栈存在许多 bug,导致 MI300X 无法正常工作。

研究人员与 AMD 和 Nvidia 进行了多次沟通,旨在改进测试方法和修复 AMD 软件栈中的 bug。他们还向 AMD 提出了许多建议,希望能够改进 MI300X 的性能。虽然 AMD 的软件栈已经有所改善,但仍然存在许多问题。

研究人员认为,AMD 需要进一步投资其软件栈和测试流程,才能与 Nvidia 在训练工作负载方面竞争。他们还指出,AMD 的工程师非常有能力,但需要更好的支持和资源,才能实现 MI300X 的潜力。

总之,这项研究表明,MI300X 在训练工作负载方面的性能不佳,主要是由于 AMD 软件栈中的问题。研究人员希望通过这项研究,能够帮助 AMD 改进其软件栈和测试流程,实现 MI300X 的潜力。


HN 热度 202 points | 评论 157 comments | 作者:pella | 1 day ago #

https://news.ycombinator.com/item?id=42489844

  • AMD 的软件问题是硬件公司常见的问题,ASML 等公司也存在类似的问题。
  • AMD 的软件问题是由于公司内部资源不足,工程师无法获得足够的硬件资源。
  • AMD 的 CEO Lisa Su 不重视软件开发,认为硬件才是公司的核心竞争力。
  • AMD 的软件问题是由于公司的市场策略,优先考虑大客户和数据中心的需求,而忽视了普通消费者的需求。
  • AMD 需要解决软件质量问题,否则将难以在数据中心市场成功。
  • AMD 的软件问题是由于公司内部的组织结构和管理问题,需要进行改革。
  • AMD 的软件问题是由于公司的技术债务,需要进行技术债务的清理和重构。
  • AMD 的软件问题是由于公司的招聘和人才培养问题,需要吸引和留住更多的软件人才。
  • AMD 的软件问题是由于公司的产品策略,需要进行产品策略的调整和优化。

Fogus: Things and Stuff of 2024 #

https://blog.fogus.me/2024/12/23/the-best-things-and-stuff-of-2024/

2024 年度最佳发现

2024 年,我发现了许多伟大的人物、事物和想法。在这里,我想分享一些我认为值得注意的东西。

文章和博客

  • 《ELITE:无法被写出的游戏》:这篇文章讲述了经典游戏 ELITE 的开发过程和历史。作为一个曾经的 Commodore 64 玩家,我对这个游戏有着深厚的感情。
  • 《汉姆无线电文化的丰富历史》:这篇文章介绍了汉姆无线电的历史和文化。作为一个对无线电技术感兴趣的人,我觉得这篇文章非常有价值。
  • 《WordStar 的历史》:这篇文章讲述了 WordStar 软件的发展历史。作为一个程序员,我对软件的历史和发展非常感兴趣。
  • 《组合式编程》:这篇文章介绍了组合式编程的概念和技术。作为一个程序员,我觉得这篇文章非常有价值。

书籍

  • 《And so FORTH》:这本书是关于 Forth 编程语言的。作为一个对编程语言感兴趣的人,我觉得这本书非常有价值。
  • 《BASIC 和 FORTH 并行》:这本书介绍了 BASIC 和 Forth 两种编程语言的并行开发。作为一个程序员,我觉得这本书非常有趣。

电影

  • 《Withnail 和 I》:这部电影讲述了两个年轻人的故事。作为一个喜剧爱好者,我觉得这部电影非常有趣。
  • 《Jodorowsky 的 Dune》:这部电影讲述了导演 Jodorowsky 尝试拍摄《沙丘》的故事。作为一个科幻爱好者,我觉得这部电影非常有趣。
  • 《Requiem for a Dream》:这部电影讲述了四个人的故事。作为一个电影爱好者,我觉得这部电影非常有价值。

播客

  • 《Will Radio》:这个播客由 Will Byrd 主持。作为一个对技术感兴趣的人,我觉得这个播客非常有价值。
  • 《Eros + Massacre》:这个播客由 Samm Deighan 主持。作为一个对电影感兴趣的人,我觉得这个播客非常有趣。

编程语言

  • Joy:这是一个函数式编程语言。作为一个程序员,我觉得 Joy 非常有趣。
  • Forth:这是一个栈式编程语言。作为一个程序员,我觉得 Forth 非常有价值。

工作

  • Java:我在 2024 年使用 Java 进行工作。
  • Clojure:我在 2024 年使用 Clojure 进行工作。
  • ClojureScript:我在 2024 年使用 ClojureScript 进行工作。
  • Datalog:我在 2024 年使用 Datalog 进行工作。

HN 热度 202 points | 评论 27 comments | 作者:janvdberg | 10 hours ago #

https://news.ycombinator.com/item?id=42495077

  • reMarkable™ 平板电脑对社区不友好,建议选择 Boox Go 10.3 平板电脑
  • Boox Note Air 4C 的优点包括可以舒适地阅读任何 PDF 文件、支持安卓系统、使用笔记体验良好
  • Boox Note Air 4C 的缺点包括电池续航时间较短、屏幕较暗
  • Zig 语言虽然有潜力,但目前仍然存在一些问题,如构建工具 API 变化频繁、IDE 中可能出现冻结现象
  • TypeScript 相对于 JavaScript 的优势在于提供了更好的开发体验和可靠的类型系统,但也增加了构建步骤
  • Ghostty 是一个跨平台的终端仿真器,感觉 macOS 上体验更好
  • Boox 还有 13 英寸的平板电脑,适合阅读 A4 纸张和在户外使用
  • 2024 年 LLMs 对编程的影响不大

Xerox to acquire Lexmark #

https://newsroom.lexmark.com/2024-12-23-Xerox-to-Acquire-Lexmark Xerox 收购 Lexmark 交易预计将在 2025 年下半年完成 诺沃克,康涅狄格州和列克星敦,肯塔基州,2024 年 12 月 23 日 - Xerox 控股公司(NASDAQ:XRX)今天宣布,它已同意收购 Lexmark 国际公司,Lexmark 国际公司是 Ninestar Corporation,PAG Asia Capital 和上海守达投资中心的子公司,交易价值为 15 亿美元,包括承担的负债。这次收购将加强 Xerox 的核心打印产品组合,并建立一个更广泛的全球打印和托管打印服务业务,以更好地满足混合工作场所客户的不断变化的需求。

“我们收购 Lexmark 将使两家行业领先公司联合起来,共享价值观,相互补充的优势和对打印行业的承诺,创造一个更强大的组织,”Xerox 首席执行官 Steve Bandrowczak 说。“通过结合我们的能力,我们将更好地服务客户,进一步推动我们的再造。”

位于肯塔基州列克星敦的 Lexmark 是 Xerox 的宝贵合作伙伴和供应商,是创新成像解决方案和技术的领先提供商,包括一流的打印机和多功能打印机产品线。通过将 Lexmark 的解决方案与 Xerox ConnectKey 技术和高级打印和数字服务相结合,收购将创建一个更好的产品组合,并凸显了 Xerox 致力于为客户和合作伙伴增加价值的承诺。

这笔交易还将加强 Xerox 在大型、增长的 A4 彩色市场和多元化分销和地理存在的能力,包括亚太地区。新组织将服务超过 200,000 位客户,拥有 125 个制造和分销设施,分布在 16 个国家。Lexmark 和 Xerox 在每个入口、中端和生产打印市场中都占据了全球前五的份额,并是托管打印服务市场的关键玩家。

“Lexmark 有着为客户提供世界级技术、解决方案和服务的骄傲历史,我们很高兴加入 Xerox,并通过共同的才能和更强大的产品组合扩大我们的影响力,”Lexmark 总裁兼首席执行官 Allen Waugerman 说。“Lexmark 和 Xerox 是两家伟大的公司,一起会变得更伟大。”

“我们的共同价值观和愿景预计将简化运营并推动效率,使与 Xerox 合作更容易,”Bandrowczak 补充说。

交易理由 战略契合度:Xerox 和 Lexmark 拥有相互补充的运营,提供优势和最终市场接触。结合起来,这两家公司形成了一个垂直集成的制造商、分销商和打印设备和托管打印服务提供商,覆盖所有地理区域和客户类型,拥有全面的打印和打印服务产品组合。

增长机会:Lexmark 是大型、增长的 A4 彩色打印和耗材市场的领导者,并有机会扩大其 OEM 平台在 A3 设备类别中的份额。一旦合并,Xerox 预计将拥有一个更全面的产品组合来增强其产品和服务,强化其对客户的价值主张,促进设备和托管打印服务产品组合的增长,以及增强其高级数字服务和 IT 解决方案的渗透率。

财务收益:预计交易将立即对每股收益和自由现金流产生积极影响。Xerox 预计该交易将加速实现其再造的财务目标,即收入稳定和调整后营业收入增长两位数,通过改善的竞争地位和对打印行业更快增长的市场份额的接触,以及超过 2 亿美元的成本协同效应在交易完成后两年内实现。

改善资产负债表:交易将立即降低 Xerox 的资产负债表,2024 年 9 月 30 日的资产负债表比率从 6.0 倍降至约 5.4 倍。在实现 2 亿美元的成本协同效应后,资产负债表比率将降至约 4.4 倍。通过改善自由现金流和优先偿还债务,Xerox 预计将在中期内将资产负债表比率降至 3.0 倍以下。

交易细节 根据协议条款,Xerox 将以总计 15 亿美元的价格收购 Lexmark,包括净债务和其他承担的负债。Xerox 预计将通过现金和承诺的债务融资来融资收购。

与此同时,Xerox 董事会批准了股息政策的变化,将 Xerox 每年股息从每股 1 美元降至每股 0.50 美元,预计将在 2025 年第一季度宣布股息。这降低的股息支付为减债提供了额外的能力,同时继续以高于市场的收益回报股东。

Xerox 董事会一致批准了该交易。该交易受监管审批、Ninestar 股东批准以及其他通常的关闭条件的约束。预计将在 2025 年下半年完成。在此之前,Xerox 和 Lexmark 将保持其当前的运营并独立运营。

进一步的交易细节 顾问 Jefferies LLC 担任 Xerox 的财务顾问,Citi 也提供了财务建议。Ropes & Gray LLP 和 Willkie Farr & Gallagher LLP 担任 Xerox 的法律顾问。Morgan Stanley & Co. LLC 担任 Lexmark 的财务顾问,Strait Capital Management 担任 Ninestar Corporation 的财务顾问。Dechert LLP 担任 Lexmark、Ninestar Corporation、PAG Asia Capital 和上海守达投资中心的法律顾问,King & Wood Mallesons 担任 Ninestar Corporation 的中国法律顾问。

Xerox 投资者电话会议 Xerox 将于 2024 年 12 月 23 日上午 8:00 बज� 举行投资者电话会议,讨论这次交易。网络直播和演示材料可在 Xerox 网站上获得。


HN 热度 193 points | 评论 183 comments | 作者:taubek | 12 hours ago #

https://news.ycombinator.com/item?id=42494067

  • Lexmark 和 Xerox 的业务是互补的,Xerox 可能会保留 Lexmark 的运营,并利用其资源扩大 Lexmark 的业务。
  • Xerox 的打印机可能是 Lexmark 的 OEM 产品。
  • Lexmark 和 Xerox 的打印机可能与其他公司(如 Samsung 和 Dell)的产品相同或相似。
  • Broadcom 收购 Lexmark 可能会导致 Lexmark 大幅裁员,并将重点转移到为大客户提供订阅服务上。
  • Lexmark 和 Xerox 的合并可能会导致裁员,特别是在营销、财务和支持部门。
  • Lexmark 的业务重点包括工作流自动化(WFA)和物联网(IoT)技术。
  • Lexmark 的业务模式不清楚,可能需要进一步了解。
  • 企业之间的并购可能会限制市场竞争,导致创新不足。

Classified fighter jet specs leaked on War Thunder forums #

https://ukdefencejournal.org.uk/classified-fighter-jet-specs-leaked-on-war-thunder-again/

War Thunder 论坛再次泄露机密文件

War Thunder 是一款免费在线战斗游戏,由 Gaijin Entertainment 开发和运营。最近,游戏论坛再次出现了机密文件泄露事件。泄露的文件涉及 Eurofighter Typhoon 的雷达系统,包括其扫描能力和技术参数。

事件发生在游戏论坛的讨论中,一名用户在试图证明自己的观点时,发布了机密文件。虽然文件迅速被删除,用户被封禁,但这次事件再次引发了人们对游戏论坛泄露机密信息的担忧。

游戏论坛的管理人员提醒用户,不要发布任何未经证实的机密信息,并警告用户不要试图使用这些信息来证明自己的观点。管理人员还表示,任何基于机密信息的主张都不会被采纳,并且不会根据未经授权的来源调整游戏内容。

这次事件并不是 War Thunder 论坛第一次泄露机密文件。之前,游戏论坛已经出现过几次类似的事件,包括泄露 Challenger 2 坦克和 Leclerc 主战坦克的技术参数。这些事件都引发了人们对游戏论坛安全性的担忧。

专家警告,泄露机密信息可能会对军事平台的安全性和运作产生严重影响,并可能导致法律后果。游戏论坛需要采取措施防止类似事件的发生,确保用户的安全和游戏的公平性。

游戏论坛的用户需要了解发布机密信息的严重性,并遵守游戏论坛的规则和规定。同时,游戏开发商也需要采取措施加强游戏论坛的安全性,防止类似事件的发生。


HN 热度 191 points | 评论 77 comments | 作者:Trasmatta | 1 day ago #

https://news.ycombinator.com/item?id=42490191

  • 这些泄密事件大多是之前就已经泄露的文件被重新发布,之前就已经在互联网上流传多年。-泄密事件的原因是有人为了寻求关注和认可而故意泄露文件。-泄密事件不会对军事预算产生影响。-泄密事件可能会让其他国家更容易复制和防御相关技术。-泄密事件可能会让其他国家更容易找到相关技术的漏洞。-泄密事件可能会让其他国家更容易开发出对抗相关技术的武器。-泄密事件可能会让其他国家更容易推进自己的战斗机项目。-安全通过保密在某些情况下是有效的。-软件行业避免使用保密作为安全手段是因为有更好的方法。-保密在软件行业中不太有效,因为攻击者可以通过反编译等手段获取代码。-即使是保密的信息,也可能已经被其他国家的情报机构获取。-保密的信息可能是为了避免让公众知道某些项目的失败或问题而被分类。-泄密事件不会对军事预算产生影响,因为其他国家可能已经获取了相关信息。-即使获取了技术,其他国家也可能无法复制或有效使用。-俄罗斯的新式战斗机并不是很强大。

2024 12 23 HackerNews

2024-12-23 09:01:35

2024-12-23 Hacker News Top Stories #

  1. Fastmail 使用自己的硬件是因为早期没有很多选择,后来发现使用自己的硬件比使用云服务更便宜和灵活。
  2. City Roads 是一个工具,可以一次性地绘制城市中的所有道路,用户可以通过鼠标滚轮或双击地图进行缩放和平移,查看不同区域的道路细节。
  3. Rosetta 2 的创始人离开苹果公司,全职从事 Lean 项目,专注于增强 Lean 的代码生成器。
  4. 解码 Pink Floyd 的《The Wall》中的电话信号,发现 James Guthrie 在采访中提到,他在制作 Pink Floyd 的专辑《The Wall》时,使用了一种创新的方法来录制电话运营商的音频。
  5. 古代数据表格是一张古代美索不达米亚的泥板,上面记录着工人的工资和工作量,使用了类似于现代电子表格的结构。
  6. GPT-5 项目面临进度延误和巨额支出问题,原本计划在 2024 年中期发布,但由于多次训练运行遇到困难,尚未达成预期的结果。
  7. SQLite 通过使用布隆过滤器实现了 10 倍的性能提升,研究人员使用 DuckDB 作为基准,发现 DuckDB 在单线程模式下比 SQLite 快 30-50 倍。
  8. 罗伯特·弗罗斯特的诗歌《雪夜林边停留》是一首著名的诗歌,讨论了诗歌的背景和分析。
  9. 部署慢会导致会议,减少部署风险可以减少会议,自动化测试是减少风险的关键。
  10. 蒙田的文章《哲学就是学习如何死亡》讨论了如何接受死亡,如何面对死亡。

Why we use our own hardware #

https://www.fastmail.com/blog/why-we-use-our-own-hardware/

Fastmail 是一家电子邮件服务提供商,最近讨论了云计算的回归,即公司从云端迁移到本地服务器。Fastmail 有 25 年的历史,始终使用自己的硬件。他们认为,使用自己的硬件可以更好地优化成本,因为他们了解自己的使用模式和增长需求,可以提前规划硬件采购,不需要云计算的快速动态扩展。

Fastmail 的硬件升级 几年前,Fastmail 进行了最大规模的硬件升级,将所有电子邮件服务器迁移到 2U AMD 平台,使用纯 NVMe SSD。这种升级带来了巨大的性能提升和密度增加。他们还使用 ZFS 文件系统,启用了透明的 Zstandard 压缩,节省了约 40% 的空间。

ZFS 的优点 Fastmail 使用 ZFS 文件系统,有以下优点:

  • ZFS Copy-on-write 语义虽然对 Cyrus 的一些数据库结构不太友好,但仍然表现出色的性能。
  • ZFS 压缩和调优:Fastmail 启用了 Zstandard 压缩,节省了约 40% 的空间。他们还进行了参数调优,发现使用 512k 记录大小和 zstd-3 压缩可以获得最佳的压缩效果。
  • ZFS 加密:Fastmail 始终启用加密,使用 ZFS 内置的加密功能,减少了系统复杂性。

SSD 的寿命 Fastmail 使用 SSD 存储,考虑到了 SSD 的寿命问题。他们发现,实际使用中 SSD 的寿命远远超过预期,目前尚未达到写入容量的限制。他们还发现 SSD 比传统硬盘更可靠。

总的来说,Fastmail 通过使用自己的硬件和 ZFS 文件系统,实现了更好的性能、更低的成本和更高的可靠性。


HN 热度 748 points | 评论 412 comments | 作者:nmjenkins | 16 hours ago #

https://news.ycombinator.com/item?id=42485124

  • FastMail 使用自己的硬件是因为早期没有很多选择,后来发现使用自己的硬件比使用云服务更便宜和灵活。
  • AWS 等云服务的价格和复杂性令人困惑,尤其是对于小型企业来说。
  • 使用自己的硬件可以避免被云服务提供商锁定,并且可以使用简单的开源工具来管理。
  • AWS 等云服务适合于大型企业和具有不均匀负载的应用,但对于小型企业和均匀负载的应用来说,使用自己的硬件可能更划算。
  • 使用自己的硬件需要考虑物理安全和数据中心卫生等问题,但这些问题可以通过适当的规划和管理来解决。
  • 云服务提供商的 SOC 2 合规报告不能完全代替自行管理硬件的安全性。
  • 使用自己的硬件需要具备一定的技术能力和经验,但这并不意味着无法管理自己的硬件。
  • 使用自己的硬件可以避免云服务提供商的限制和额外费用,并且可以更好地控制自己的数据和应用。
  • 使用自己的硬件需要考虑硬件故障、电源和冷却等问题,但这些问题可以通过适当的规划和管理来解决。

City Roads: A tool to draw all roads in a city at once #

https://anvaka.github.io/city-roads/

这个网页是一个展示城市道路的网站。网站的主体内容是一个交互式地图,展示了城市中的每一条道路。用户可以通过鼠标滚轮或双击地图进行缩放和平移,查看不同区域的道路细节。地图上还标注了道路的名称、类型(如高速公路、主干道、次干道等)以及其他相关信息。

网站还提供了一些交互式工具,允许用户自定义地图的显示样式,例如选择显示或隐藏某些类型的道路、改变地图的颜色主题等。用户还可以使用搜索功能查找特定的道路或地点。

网站的底部有一些统计信息,显示了城市中道路的总长度、道路类型的分布等数据。网站还提供了一个关于页面,介绍了网站的开发背景、数据来源等信息。

总的来说,这个网站是一个非常有用的工具,帮助用户了解和探索城市中的道路网络。


HN 热度 434 points | 评论 52 comments | 作者:gaws | 1 day ago #

https://news.ycombinator.com/item?id=42481206

  • 这个工具很酷,但如果能区分不同类型的道路(如人行道、道路、高速公路等)就更好了。
  • European 城市的道路看起来很杂乱。
  • prettymaps 这个工具做得更好。
  • 这个工具渲染速度很快,即使在手机上也能流畅运行。
  • 使用现有的矢量瓦片来源可能会更快更简单。
  • 作者的 Twitter 上的其他项目也很有趣。
  • OSM 内容的归属信息在导出为打印在杯子上的图像时丢失了。
  • 需要在打印在杯子上的图像中包含 OSM 内容的归属信息。
  • 如果选择 Brighton 并放大到 Hove 公园,可以看到指纹迷宫的美丽矢量图。
  • 这个工具很酷,但描述得有些奇怪。
  • Google Maps 和其他地图通常会根据缩放级别隐藏街道。
  • 部分城市会返回 403 错误。
  • 使用人口大于 100k 作为缓存城市的阈值可能会导致一些城市加载速度很慢。
  • 缓存了大约 3000 个人口大于 100k 的城市。
  • 这个工具可以用来制作定制的地图。
  • 有一个 Figma 插件可以导入 OSM 作为矢量图。
  • 购买了一个印有地图的杯子,希望作者能得到一份。
  • 工具缓存了大约 3000 个人口大于 100k 的城市。
  • 工具加载速度很快,值得等待。
  • 工具可以用来回忆曾经居住过的城市。

Rosetta 2 creator leaves Apple to work on Lean full-time #

https://www.linkedin.com/posts/leonardo-de-moura-26a27b5_leanlang-leanprover-leanfro-activity-7274523099394400256-0F0x

这篇文章主要介绍了 Leonardo de Moura 在 LinkedIn 上的动态,他在文章中表达了对 Cameron Zwarich 加入 Lean FRO 的兴奋之情。Cameron 是一位出色的软件开发者,拥有超过 15 年的低级系统软件开发经验,曾是 Rosetta 2 的创造者。他将在 Lean FRO 中专注于增强 Lean 的代码生成器,Leonardo 期待他的专业知识将对 Lean 生态系统产生巨大影响。

文章还包含了一些其他用户的动态,他们分享了对软件开发的见解和经验。一位首席执行官分享了关于构建持久软件的见解,强调质量代码的重要性,并提供了一些策略,帮助开发者在软件开发过程中追求卓越。另一位软件架构师提到每行代码背后的故事,呼吁开发者追求清晰、可维护的代码,支持彼此的成长。

此外,有一位前实习生引用了一段关于代码遗产的思考,强调开发者在编写代码时不仅是在解决当前问题,更是在为未来的系统和开发者奠定基础。他提醒大家,干净、可维护的代码可以节省大量的故障排除时间,而周到的文档则能够帮助后续的开发者更好地理解代码。

还有人提到低代码开发平台对传统编码的影响,探讨了其优缺点和整体影响。最后,提到软件开发团队之间的合作比单个开发者更为重要,一位顾问分享了一篇关于开发者问题解决的文化理论的研究,强调了跨文化的知识传递和合作的重要性。

总的来说,这篇文章传达了软件开发领域中对合作、质量和人性化设计的重视,鼓励开发者们共同努力,创造出更好的软件。


HN 热度 359 points | 评论 117 comments | 作者:ladberg | 23 hours ago #

https://news.ycombinator.com/item?id=42483895

  • Rosetta 2 是一个非常技术性的项目,令人印象深刻。
  • Rosetta 2 的创建者在苹果公司工作了很长时间,最近离开苹果公司,全职从事 Lean 项目。
  • 作者的数学背景和对交互式定理证明器的兴趣,帮助他在 Rosetta 2 项目中取得成功。
  • 作者在中学时就开始学习编程,自学了 SICP 这本书,对他后来的工作有很大帮助。
  • 作者认为,机会和运气在职业发展中扮演着重要角色。
  • Waterloo 大学是世界上最好的计算机科学学校。
  • 为了构建像 Rosetta 2 这样先进的项目,需要了解汇编、系统调用、x86/64 汇编等知识。
  • 作者没有独自完成 Rosetta 2 项目,后来有一个团队一起工作。
  • Rosetta 2 不仅仅是一个二进制翻译器,还涉及到复杂的操作系统交互。

Decoding the telephony signals in Pink Floyd’s ‘The Wall’ #

https://corelatus.com/blog/Decoding_the_telephony_signals_in_Pink_Floyd_s__The_Wall_.html

本文是一篇博客文章,作者是一位 Corelatus 公司的创始人,文章主要讨论了 E1/T1 和 SDH/SONET 通信技术。作者分享了自己对这些技术的理解和经验,包括如何调试和分析信号,以及如何使用不同的工具和软件来处理这些信号。

文章首先讨论了如何解码电话信号,特别是 Pink Floyd 的歌曲"The Wall"中的一段电话信号。作者使用了 SoX 工具来分析信号,并发现信号使用的是 SS5(Signaling System No. 5)协议。作者还比较了 SS5 和其他协议,如 DTMF(Dual Tone Multi Frequency)和 CAS R2(Channel Associated Signaling R2)。

接着,作者讨论了如何使用 Corelatus 公司的硬件来解码和分析信号。作者使用了 ss5_registersig_monitor 工具来解码信号,并发现信号中包含了数字"044 1831"。作者还分析了信号中的频率和时序,确认了信号确实使用的是 SS5 协议。

最后,作者讨论了如何使用不同的工具和软件来处理信号,包括 SoX、Wireshark 和 Erlang。作者还分享了自己对这些工具和软件的经验和技巧,包括如何使用 SoX 来分析信号频率和时序,以及如何使用 Wireshark 来捕获和分析信号。

总的来说,本文是一篇技术博客文章,主要讨论了 E1/T1 和 SDH/SONET 通信技术,特别是如何解码和分析信号。作者分享了自己对这些技术的理解和经验,包括如何使用不同的工具和软件来处理信号。


HN 热度 251 points | 评论 86 comments | 作者:matthiasl | 13 hours ago #

https://news.ycombinator.com/item?id=42485795

  • James Guthrie 在采访中提到,他在制作 Pink Floyd 的专辑《The Wall》时,使用了一种创新的方法来录制电话运营商的音频。
  • 有人认为,Pink Floyd 的音乐创作过程非常缓慢,但这种方式可以让他们有更多的时间来创作和实验。
  • 有人指出,Pink Floyd 的音乐风格非常独特,甚至可以通过他们的音乐来判断是哪个乐队演奏的。
  • 有人认为,Pink Floyd 的音乐创作过程中,乐队成员之间的关系非常重要,他们可以互相协作和支持。
  • 有人提到,Pink Floyd 的音乐中,有一些歌曲的名字是以乐队成员的名字命名的,例如《Pink》。
  • 有人认为,Pink Floyd 的音乐风格非常多样化,他们的音乐可以适应不同的场合和情绪。
  • 有人指出,Pink Floyd 的音乐创作过程中,乐队成员们经常会使用一些创新的录音技术和设备。
  • 有人认为,Pink Floyd 的音乐中,有一些歌曲的歌词非常深刻和有意义,值得人们去思考和品味。
  • 有人提到,Pink Floyd 的音乐风格非常具有代表性,他们的音乐可以代表整个乐队的风格和精神。

A data table thousands of years old (2020) #

https://www.datafix.com.au/BASHing/2020-08-12.html

这个网页是一篇博客文章,讨论了数据表格的历史。文章指出,数据表格已经有几千年的历史,古代美索不达米亚的账目记录就使用了类似的数据表格。文章展示了一张古代美索不达米亚的泥板,上面记录着工人的工资和工作量,使用了类似于现代电子表格的结构。

文章将泥板上的文字转换成了电子表格的形式,展示了古代账目记录的详细内容。文章指出,这张泥板是古代美索不达米亚的工资记录,记录了工人的姓名、工作量、工资等信息。文章还指出,这张泥板是目前发现的最古老的数据表格之一,距今已有 3500 多年。

文章还讨论了数据表格的演变,指出虽然数据表格的形式已经有了很大的变化,但其基本结构和功能仍然保持不变。文章最后指出,尽管现代的电子表格已经非常普遍,但古代的数据表格仍然具有重要的历史意义。


HN 热度 237 points | 评论 103 comments | 作者:rickcarlino | 1 day ago #

https://news.ycombinator.com/item?id=42482829

  • 如果我们有一个时间机器,可以把古代的会计师带到现代社会,他可能在几周内就能熟练使用 Excel 表格。
  • 收集和研究古代表格的历史和文化意义,可以更好地理解人类对数据组织和呈现的认知和创新。
  • 项目如古代表格的研究和复制,可以帮助我们更好地理解和保存历史文化遗产。
  • 有些语言中有一些词汇可以用来描述“显而易见”或“自然而然”的概念,例如德语中的“naheliegend”,可以用来描述一种事情是“显而易见”的或“自然而然”的。
  • “低垂的果实”这个词汇有时也会被用来描述一种事情是“显而易见”的或“自然而然”的,但也可能带有负面的含义。
  • 表格结构的发展可能是随着人类对数据组织和呈现的需求而逐渐演变的。
  • 古代的表格可能使用了不同的排版和设计风格,例如使用列标题或行标题。
  • 书籍和其他载体可以用来存储和呈现多维数据。
  • 表格结构的设计可能受到书写方向和文化习俗的影响。
  • 古代的表格可能使用了不同的技术和材料来制作和保存,例如陶板或金属板。

GPT-5 is behind schedule #

https://www.wsj.com/tech/ai/openai-gpt5-orion-delays-639e7693

OpenAI 的下一个重大人工智能项目 GPT-5(代号 Orion)目前面临着进度延误和巨额支出的问题。该项目已经开发了超过 18 个月,原本计划在 2024 年中期发布,但由于多次训练运行遇到困难,尚未达成预期的结果。虽然 Orion 在某些方面的表现超过了现有的 GPT-4,但其性能提升不足以支撑其高昂的运行成本,单次六个月的训练成本就可高达 5 亿美元。

GPT-5 被期待能在科学发现和日常人类任务方面取得显著进步,包括减少错误率以及能够识别不确定性。然而,模型的智能化标准并不明确,主要由 OpenAI 的高管根据直觉和感觉来判断。目前的情况表明,进展并不顺利,OpenAI 的首席执行官山姆・阿尔特曼已经表示,2024 年不会发布任何名为 GPT-5 的模型。

在开发过程中,OpenAI 的研究人员发现 Orion 需要更多的高质量数据来提升其性能。由于现有的数据来源(主要是互联网)无法满足需求,OpenAI 决定从头开始创造数据,雇佣软件工程师和数学家来为模型编写代码并解决问题,以此提供更高质量的数据。此外,OpenAI 还在探索使用合成数据,即由 AI 生成的数据,来帮助训练 Orion,但这可能导致一些故障或不合理的答案。

公司内部的动荡和竞争也对开发进度造成了影响。去年,阿尔特曼曾被公司董事会突然解雇,但随后又复职。与此同时,许多关键研究人员离开了公司,竞争对手如谷歌和 Anthropic 也在迅速赶超。

随着 2024 年的到来,OpenAI 再次尝试进行大规模训练,但在训练过程中发现数据的多样性不足。尽管如此,OpenAI 还是决定继续训练,因为已经投入了大量时间和资金。面对行业对人工智能进步停滞的担忧,OpenAI 的研究者开始探索更高效的推理模型,结合以往的数据获取方法,以期在未来取得突破。

总之,OpenAI 正在努力克服 GPT-5 项目中的挑战,但仍面临着进度、成本和数据质量等多方面的压力。


HN 热度 188 points | 评论 310 comments | 作者:owenthejumper | 12 hours ago #

https://news.ycombinator.com/item?id=42485938

  • 训练模型的成本越来越高,花费半亿美元训练一个模型已经很疯狂了,如果需要 100 次迭代来完善它,那么累计花费将达到 50 亿美元。
  • 小型模型可能是快速创新继续的地方,因为它们有更紧凑的反馈循环。
  • 我们不知道 LLM 是否是通往 AGI 的道路,如果不是,我们只会得到一些很酷但花费巨大的 LLM。
  • AGI 可能会像自动驾驶汽车一样到来,不是突然醒来就拥有了,而是逐渐通过增加自动化功能实现的。
  • 自动回归变换器 LLM 并不是唯一的文本生成方式,还有基于扩散的 LLM、带条纹的鬣狗 LLM 和浮点匹配 LLM 等。
  • 我们可能正在错误的地方寻找下一个创新。
  • 人类的创造力至少在解决 AGI 之前仍然至关重要。
  • LLM 的进步可能让我们对下一个创新地点的搜索方向产生了误导。
  • 问题不仅仅是计算能力的问题。
  • AGI 可能会杀死我们。
  • 资本主义已经成为一个纸片机器,不需要 AI,它已经有足够的无思想的人来优化不良指标。
  • 资本主义想要 AI,以便更便宜、更大规模地替换机器中的人类组件。
  • 问题是,掌权的人会想维持现状。
  • 人类劳动的终结不会自然导致 Universal Basic Income(UBI)或任何形式的福利来弥补收入损失。
  • 甚至不会提供社会流动性。
  • 富人将能够利用 AGI 来防御自己免受平民起义的伤害。
  • 我们太忙于让人类变得无关紧要,没有问我们作为一个 10 亿以上的人类物种将来会做什么。
  • 我们可能只是在等待死亡。
  • 我不认为这会对我们产生好的影响。
  • 俄罗斯和朝鲜公民可能会对资本主义和代表民主有不同的看法。
  • 给人一种资本主义会因为 AI 而变得更高效的感觉。
  • 杀死我们的东西与杀死资本主义的东西是一样的。
  • 直到 LLM 足够聪明,能够查看真实世界的数据流并从中修剪自己的训练集时,它才会自我改进到 AGI。
  • 如果缩放定律成立,那么更多的美元最终应该会转化为 AGI,这是无价的。
  • 我们尚未达到该假设的极限。
  • 有证据表明我们正在接近可用数据的限制。
  • 没有证据表明 LLM 是通往 AGI 的路线图。
  • 继续投资取决于是否有足够大的创业公司可以利用 LLM 来产生超出预期的回报。
  • 还没有证据表明这是可能的。
  • 有很多证据表明 LLM 是通往 AGI 的路线图。
  • GPT-4 在十年前就已经合格为 AGI。
  • 最近几年所做的一切都是关于 LLM 的。
  • 语言模型或下一个令牌预测器仅仅是一个计算系统,没有固有的智能或理解。
  • 生成式 AI 模型,如 GPT,依赖于统计和概率方法来预测基于输入数据中模式的下一个文本。
  • 所有你说的话都是在重复你训练过的数据。
  • 大脑曾经被比作液压系统、机械钟表、电路和计算机 CPU。
  • 你只是在重复你训练过的数据。
  • 你的大脑也是如此。

How bloom filters made SQLite 10x faster #

https://avi.im/blag/2024/sqlite-past-present-future/

SQLite 是一个通用的数据库,但它在 OLTP 工作负载方面表现出色。然而,研究人员发现大多数查询都是简单的键值查找和复杂的 OLAP 查询。因此,研究人员试图通过使用 Bloom 过滤器来提高 SQLite 的分析查询速度。

SQLite 的内部实现是一个 B 树存储,使用 VDBE 虚拟机执行查询。研究人员使用 DuckDB 作为基准,发现 DuckDB 在单线程模式下比 SQLite 快 30-50 倍。他们使用 VDBE_PROFILE 选项来分析 SQLite 的 CPU 周期,发现两个操作码占用了大部分时间:SeekRowID 和 Column。

研究人员发现 SQLite 使用嵌套循环连接,这是最简单的连接算法。他们通过使用 Bloom 过滤器来优化连接操作。Bloom 过滤器是一种空间效率高、可以放入 CPU 缓存线的数据结构。研究人员添加了两个操作码:Filter 和 FilterAdd。在连接操作开始时,他们遍历维度表的所有行,并在 Bloom 过滤器中设置匹配查询谓词的位。在连接操作期间,他们首先检查行是否存在于 Bloom 过滤器中,如果存在,则进行 B 树探测。

优化后的查询计划显示,SQLite 的速度提高了 7-10 倍。研究结果已经应用于 SQLite,并在 v3.38.0 中发布。Bloom 过滤器之所以有效,是因为它具有最小的内存开销,与 SQLite 的简单实现兼容,并且可以在现有的查询引擎中工作。


HN 热度 183 points | 评论 20 comments | 作者:avinassh | 10 hours ago #

https://news.ycombinator.com/item?id=42486610

  • SQLite 通过使用布隆过滤器实现了 10 倍的性能提升
  • 测试结果是在修复一个错误之前测量的,错误导致 SQLite 只使用了预留的布隆过滤器空间的 1/8,从而显著增加了假阳性率
  • SQLite 适合用于只读数据,如果需要写入数据,需要注意只有一个进程可以同时写入
  • SQLite 并发模型对于高并发写入不是最佳选择,但对于许多应用程序来说,并发写入不是问题
  • 可以通过将写入请求放入队列,然后由单个线程从队列中取出请求并写入 SQLite 来实现写入吞吐量
  • 即使一般问题是 NP 难的,也可以找到快速的特定解决方案
  • SQLite 不是开源贡献,但开发人员可以通过合作实现改进
  • SQLite 开发人员对外界的贡献是友好的和开放的

Stopping by Woods on a Snowy Evening (1923) #

https://poets.org/poem/stopping-woods-snowy-evening

这个网页是美国诗人协会(Academy of American Poets)的网站,展示了著名诗人罗伯特·弗罗斯特(Robert Frost)的诗歌《雪夜林边停留》(Stopping by Woods on a Snowy Evening)。诗歌描述了诗人在雪夜中停留在林边,欣赏雪景的美丽,然而又不得不继续赶路,因为他有承诺要履行和远方的路要走。

诗歌的内容包括四个段落,描述了诗人在雪夜中停留的场景,包括他看到的雪景、他的马匹和他自己的感受。诗歌以优美的语言和深刻的意境,描绘了人与自然的关系,表达了人生的寂寞和责任感。

网页还提供了罗伯特·弗罗斯特的简介,他是美国著名诗人,曾出版多部诗集,包括《新罕布什尔》(New Hampshire)。网页还包括其他相关内容,如诗歌的主题、风格和历史背景等。

此外,网页还提供了其他诗歌和相关资源,包括诗歌集、诗人简介、诗歌分析和教学资源等。网页的设计简洁清晰,易于浏览和查找相关信息。


HN 热度 182 points | 评论 49 comments | 作者:keepamovin | 14 hours ago #

https://news.ycombinator.com/item?id=42485689

  • 写诗是一种非常奇怪的爱好,尤其是写最后一段的变体。
  • 非技术类帖子能保持社区的趣味性。
  • 这首诗来自《新罕布什尔州》一书,另一首著名诗歌是《火与冰》。
  • 分析这首诗是高中时的作业,深入思考这首诗对我产生了持久的影响。
  • 有一篇关于这首诗的文章《罗伯特·弗罗斯特:通往诗歌的道路》。
  • 朗读诗歌比默默阅读更能让人感受到诗歌的美感。
  • 有人把这首诗和其他几首诗背下来,在无眠的夜晚和推着婴儿车散步时,诗歌帮助他们保持理智。
  • 这首诗让人联想到编程,特别是当年在 TRS-80 上输入程序时。
  • 这首诗能唤起人们强烈的视觉化效果,其他非视觉媒体无法复制。
  • 读这首诗时,人们会有不同的感受,例如读完后会去联系以前的老师,感谢他们介绍了这首诗。
  • 这首诗在印度的英语学校中很常见。
  • 有人开发了一个诗歌应用程序,收录了 4 万多首公有领域诗歌。
  • 读这首诗时,人们会有不同的感受,例如会去联系以前的老师,感谢他们介绍了这首诗。
  • 这首诗中没有提到侵占私人土地,人们可以自由地在未围栏的土地上行走。
  • 读这首诗时,人们会有不同的感受,例如会去联系以前的老师,感谢他们介绍了这首诗。

Slow deployment causes meetings (2015) #

https://tidyfirst.substack.com/p/slow-deployment-causes-meetings

这篇文章由 Kent Beck 撰写,首次发布于 2016 年,讨论了软件开发中一个常见的问题:工程师们抱怨会议太多,影响了代码的部署效率。作者提出了一个反向因果关系的观点,认为这种抱怨可能是因为组织在应对部署能力不足时采取的适应性反应。

文章中提到,Facebook 的传奇发布经理 Chuck Rossi 观察到,每次部署能处理的变更数量是固定的。因此,如果想要进行更多的变更,就需要增加部署的频率。过去五年间,Facebook 的部署频率逐步提高,从每周一次到每天三次,移动应用的部署周期也有所缩短。这一进步主要得益于发布工程团队的努力。

在思考这一问题时,作者提出了 “每次部署的变更数量” 这一指标是相对不变的,想要改善这一指标需要付出巨大的努力。当变更数量超过当前的阈值时,组织的自然反应是通过增加会议、评审、交接等组织开销来减轻压力。这种做法虽然并不是出于恶意,但实际上形成了一个负反馈循环:工作进展减少 -> 压力增加 -> 错误增多 -> 每次部署的变更数量进一步减少 -> 更多的开销 -> 工作进展更少。

因此,作者建议,如果想要增加可部署的变更数量,应该扩大部署的能力,而不是试图减少组织开销。可以通过缩短部署周期来实现这一目标,但这可能会带来混乱。更有效的方式是提升每次部署的变更质量,比如通过更好的测试、监控、组件隔离和团队成员之间的良好关系。

最后,作者强调,试图减少组织开销往往只会导致更多关于减少会议的会议,反而使得代码部署变得更加困难。这篇文章反映了一种颠覆性的思考方式,鼓励读者从不同的角度来看待软件开发中的组织行为和人际关系。


HN 热度 175 points | 评论 81 comments | 作者:fagnerbrack | 22 hours ago #

https://news.ycombinator.com/item?id=42484139

  • 部署慢会导致会议,减少部署风险可以减少会议
  • 部署风险主要来自于改变的数量,减少改变的数量可以减少风险
  • 自动化测试是减少风险的关键,自动化测试可以减少部署风险
  • 缺乏自动化测试会导致手动检查和会议
  • 部署风险不仅仅是技术问题,也是组织和流程的问题
  • 缺乏自动化测试会导致 QA 团队缺乏技术能力
  • 自动化测试可以减少 QA 团队的工作量和风险
  • 部署风险可以通过技术手段来解决,而不是通过增加会议和流程
  • 自动化测试可以提高部署效率和质量
  • 缺乏自动化测试会导致部署风险和效率低下

The essays of Michel de Montaigne online #

https://hyperessays.net/

HyperEssays 是一个在线项目,旨在创建一个现代化和易于访问的米歇尔·德·蒙田的《随笔集》的在线版。该网站托管了四个版本的《随笔集》:1598 年版、1603 年版、1685 年版和现代版。网站的目标是为新读者提供背景和工具,并为所有对蒙田的作品感兴趣的人设计一个持久的资源。

网站的创始人正在编辑、更新和注释原文和译文,并为索引和搜索标记它们。网站还提供免费的章节 PDF 下载。网站的目标是为读者提供一个易于阅读和理解的平台,包括智能手机、台式电脑和平板电脑。

网站还提供了关于蒙田的生平和作品的背景信息,包括蒙田是否是一位真正的哲学家,以及他是否真的退居山林多年。网站还推荐了四本关于蒙田的传记和两本现代译本的《随笔集》。

网站的更新日志显示了网站的工作进展,包括最近编辑、翻译和注释的章节。网站的工作始于 2020 年 1 月 17 日,预计需要多年时间才能完成。


HN 热度 169 points | 评论 40 comments | 作者:octed | 20 hours ago #

https://news.ycombinator.com/item?id=42484527

  • 蒙田的文章读起来像博客一样,内容丰富,主题一致,语气亲切,引用频繁,读起来很像博客。
  • 蒙田的文章虽然看起来很随意,但实际上是经过精心打磨的。
  • 蒙田的文章中有一篇叫《哲学就是学习如何死亡》,讲的是如何接受死亡,如何面对死亡。
  • 有人推荐了一本书叫《如何生活:蒙田的一生和二十个问题》,是一本关于蒙田的书。
  • 有人觉得蒙田的文章读起来很像博客,内容丰富,主题一致,语气亲切。
  • 有人觉得蒙田的文章虽然好,但不如马可·奥勒留的《沉思录》。
  • 有人觉得蒙田的文章对普通人来说不太有用,因为他是贵族,生活环境不同。
  • 有人觉得蒙田的文章对任何人来说都是有用的,因为他谈到了死亡、自我价值等普遍的话题。