huizhou | 萝卜 RSS 预览

Go 官方再谈错误处理：新语法为何迟迟无法落地？

2025-06-04 20:14:24

Go 官方再谈错误处理：新语法为何迟迟无法落地？

近日，Go 官方博客发布了一篇名为《On | No syntactic support for error handling》的文章。这篇文章没有带来期待中的语法突破，反而再次回顾了 Go 语言过去在错误处理语法上多次尝试的失败经验。
Go 团队为什么发表这么一篇文章？

为什么 Go 团队反复探讨“错误处理”？

自诞生以来，Go 语言以简洁明了著称，但却始终背负着一个无法回避的问题：错误处理语法过于冗长。
我们熟悉的 Go 错误处理通常长这样：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13



```Go
func printSum(a, b string) error {
    x, err := strconv.Atoi(a)
    if err != nil {
        return err
    }
    y, err := strconv.Atoi(b)
    if err != nil {
        return err
    }
    fmt.Println("result:", x + y)
    return nil
}

反复出现的 if err != nil 显得单调乏味，代码中大量的错误处理重复模式经常被批评为“机械且冗余”。因此，过去数年，Go 团队多次尝试设计更为简洁的新语法，但最终都未能成功落地。

曾经尝试却未成功的那些提案

Go 团队在过去提出了几种备受关注但最终放弃的方案：

2018年：check 与 handle 提案
- 尝试用新关键字简化错误传播，但社区担忧复杂度增加，被否决。
2019年：try 提案
- 引入内置函数 try，期望简化语法。但社区认为该方案过于隐式，破坏了代码的明确性，也被搁置。
2024 年：？
Ian Lance Taylor 参考 Rust 的实现提出了 “使用 ? ”减少错误处理样板也遭遇到了大量的反对意见，我也水了一篇博客

这些尝试的失败不仅仅是技术上的，更体现了 Go 社区一种特殊的文化和理念——明确胜于隐式。

真正的动机是什么？

细读这篇博客，我们会发现 Go 团队并不是单纯地“回忆过去”，而是在认真回应社区持续发酵的讨论：

究竟有没有必要为错误处理引入新语法？

文章的字里行间传递了一个关键的讯号：

“Go 社区对于新语法的需求，并非简单的‘yes or no’，而是深入涉及到语言设计哲学和社区价值观的问题。”

换句话说，Go 团队的动机并不是要立即给出一个新提案，而是希望借此引导社区回到初心，认真审视“我们真正需要什么样的语言设计？”

“明确胜于隐式”：Go 社区无法放弃的原则

Go 语言的成功，正是因为其清晰且明确的设计哲学。任何新语法都必须经过社区的严格审视：

新语法能否保持明确性？
新语法能否带来足够的收益，值得牺牲现有的简单性？
新语法是否有可能带来其他负面影响？
在这种原则下，每个提案都难免面临严格审视和质疑。这也是过去的尝试频频受挫的根本原因。

五、未来的路在哪里？

这篇官方博客所释放的另一个信息是：

Go 团队已经接受了短期内不会推出新错误处理语法的现实。

他们似乎在暗示：错误处理的语法简化并非完全不可行，但至少现在还未找到完美的答案，社区需要更多时间的探索、实践与反思。
因此，未来很长一段时间内，Go 程序员仍需忍受现有模式的重复。但同时也意味着，Go 语言暂时保持了它清晰、直接、没有魔法的风格。

Go 团队主动发布这样一篇文章，看似回顾历史、承认失败，实则希望引发社区更深层次的讨论：

我们究竟希望 Go 变成什么样子？
为了简洁，我们愿意牺牲多少明确性？

无论你是否赞同当前的处理方式，这样的反思和讨论对于语言生态的健康发展，都是极其重要的。
也许下一次提案会再次失败，也许未来某一天，社区终究找到满意的平衡点。但至少，我们可以肯定的是：
Go 社区一直在探索，一直在反思，也一直在进步。
原文链接：https://go.dev/blog/error-syntax

本文长期链接
如果您觉得我的博客对你有帮助，请通过 RSS订阅我。
或者在X上关注我。
如果您有Medium账号，能给我个关注嘛？我的文章第一时间都会发布在Medium。

Go 的 map 为什么变慢了?.zh-cn

2025-05-20 22:18:57

这篇文章解释了为什么在 Go 1.24 版本中，你的程序可能因为 map 变慢了，以及 Go 团队是怎么计划修复这个问题的。

Golang 1.24 中最吸引我的功能就是 SwissMap，在以前的非官方实现中，有些场景能够提升50% 的性能，官方的实现中，也有不小的性能提升。
详情参考我以前的文章:
SwissTable 会成为 Golang std map嘛？
Go 1.24 的 Swiss Map：兼容性、扩展哈希与遗留问题

但是如果你在使用 Go 1.24 时可能会发现SwissMap 没有达到预期的表现，甚至程序运行变慢了，特别是在 Map很大的时候，这不是你的幻觉，确实存在这个问题。

https://x.com/valyala/status/1879988053076504761

这个问题记录在 Issue #70835 中，开发者们正在努力解决它。

问题出在哪？

Go 的 map 在新版中使用了Swiss Table，它在小 map 和高并发的场景下非常快。但是当 map 很大、数据又不在 CPU 缓存里（也就是说，数据是“冷”的），就会变慢。

为什么会这样呢？

因为 SwissMap 的内部结构比较复杂，它会分几层来存储数据：

首先是一个 map 的头部结构
它指向一个目录，这个目录是多个 table 的指针组成的列表
每个 table 里面有控制信息、key 和 value

当你查找一个 key 的时候，可能需要进行 4 到 6 次跳转，每一次都可能遇到缓存未命中。这样就会导致 CPU 忙着从内存取数据，速度就慢了。

像 Prometheus 这样的大型项目就发现了这个问题。他们升级到 Go 1.24 后，CPU 使用率上升了很多，经调查发现就是因为 map 的查找变慢了。

是怎么发现的？

问题并不是在测试用例里发现的，而是在真实的线上场景中出现的。

使用了很大的 map（比如几兆字节大小）
经常读取 map 里的数据
数据不在 CPU 的高速缓存里

Go 团队的工程师 Michael Pratt 通过做很多测试，找到了 map 访问变慢的原因，并在 Issue #70835 中详细说明。

怎么修？

为了让 map 更快，他们计划做以下几件事：

简化目录结构：把原来存指针的列表改成直接存结构，减少一次跳转
控制信息更紧凑：把控制信息安排得更集中，这样更容易被 CPU 一次加载
分离 key 和 value：改成“key-key-key + value-value-value”的结构，这样可以优化加载顺序
对齐控制字节：把控制信息按照 CPU 缓存对齐，减少未命中

这些改动并不简单，因为会影响到 Go 的运行时核心：

要确保垃圾回收能正常工作
map 扩容和缩容逻辑要更新
要确保对小 map 的性能没有影响

哪些地方在讨论这个？

这个问题被广泛讨论和跟踪，可以通过Issue #70835 了解更多的细节。 Go Release Dashboard 中已经标记这个问题将会在 Go1.25 中解决
此外 Issue #71368 中也讨论了另一个与内存布局的问题。

总结

Go 团队一直在努力让语言运行得更快更稳。SwissMap 是个好改进，但它也带来了新挑战，比如这次的冷缓存性能下降。
Issue #70835 展示了 Go 是如何通过社区反馈不断进步的。感谢像 Prometheus 这样的开源项目，他们的报告帮助 Go 做得更好。
如果一切顺利，Go 1.25 就能把速度和稳定性都带回来。
我们一起期待吧！

Green Tea GC: Golang 的 ZGC？

2025-05-05 16:30:26

近年来，Go 语言的垃圾回收（GC）机制虽然经历了多个版本优化，但它的性能瓶颈，尤其在高并发与大规模内存场景下，依然是开发者关注的重点。最近，Go 官方在 GitHub 上提出的 Green Tea GC（#73581）引发了热议：它能否进一步解决 Go GC 的耗时问题？本文将深入解析 Go GC 的设计、缺点、实测表现，并带你了解 Green Tea GC 的技术突破。

📦 Go GC 的设计与实现

自 Go 1.5 起，Go 使用并发标记-清除（concurrent mark-sweep）算法，结合“三色标记”模型与 Yuasa 写屏障。

简而言之，Go GC 会在后台并发地遍历堆内存，标记可达对象，并逐步清除未被引用的内存块。整个回收过程中，Go 追求低延迟、低停顿：

✅ 并发标记、并发清除
✅ 不会移动对象（即 no compaction）
✅ 按 span（内存块）分批清扫，减少单次 STW（Stop-the-World）时长

这种设计的直接好处是：应用大部分时间能与 GC 并行工作，最大停顿时间通常低于毫秒级。

🚧 Go GC 的已知问题

虽然 Go GC 的延迟表现优秀，但它在耗时和扩展性上仍有几个硬伤，尤其体现在：

1️⃣ 内存访问低效
GC 的标记阶段会跨对象跳跃，导致 CPU 频繁 cache miss、等待内存，约 35% 的 GC CPU 周期被耗在“等内存”。这在 NUMA 架构或多核大内存机器上尤为明显。

2️⃣ 缺乏分代收集
Go GC 没有分代机制，所有对象一视同仁，这在高分配率场景下显得笨重。Pinterest 工程师曾指出，内存压力一旦增大，GC 就会暴增 CPU 消耗，引发延迟激增。

3️⃣ 频繁 GC 带来的 CPU 占用
Twitch 工程团队曾报告：即便在中小堆内存下（<450 MiB），系统稳态下每秒会触发 8–10 次 GC，每分钟累计 400–600 次，GC 占用约 30% 的 CPU 时间。这直接挤压了业务线程的执行空间。

📊 性能测试：GC 对 Go 程序的影响

我们来看几个实际基准的变化：

Go 1.3/1.4（并发 GC 前）
大堆（10GB+）上的 GC 停顿：以秒计算。
Go 1.5（并发 GC 引入后）
相同条件下，GC 停顿压缩到 <1ms。
Go 1.6–1.8
最大堆 200GB，GC 停顿控制在 20ms 以下，甚至常态 1ms。

这些进步非常亮眼，但注意：
✅ 延迟控制好了
⚠️ 总耗时和 CPU 消耗依然显著，特别是高负载或高分配场景。

🌿 Green Tea GC：全新优化方案

面对这些问题，Go 官方提出了 Green Tea GC。它的核心优化点是：

从单对象扫描，升级为按 span（内存块）批量扫描。

具体来说：

小对象（≤512B）标记由单个对象粒度提升为 span 粒度。
每个 span 中，只有首次标记的对象会将整个 span 推入扫描队列。
GC 扫描阶段批量处理整个 span，极大提升了内存访问局部性。

此外，Green Tea 改进了并行队列管理，采用类似 Go 调度器的工作窃取机制，进一步提高了多核扩展性。

⚡ Green Tea GC 实测表现

从初步基准来看，Green Tea GC 带来了有选择性的性能提升：

✅ Tile38 基准（高扇出树结构）

GC 开销降低约 35%
吞吐、延迟、内存使用全面优化

⚠ bleve-index 基准（低扇出、频繁变异）

对象分布散乱，内存局部性差
Green Tea 与常规 GC 性能相近，有时略低

总结：Green Tea 并非“银弹”，但在内存局部性良好、多核扩展场景下，它展现了明显优势，并为未来 SIMD 加速等硬件优化奠定了基础。

🏁 总结

比较项	当前 Go GC	Green Tea GC
标记粒度	单对象	span（批量）
内存局部性	差，随机跳跃	高，同 span 内批量
多核扩展性	受限	改进，采用工作窃取队列
性能提升	已接近低延迟上限	某些场景下 GC 耗时降 35%
应用适用范围	普通场景	内存局部性好、分配密集场景

对于追求极限性能的开发者，Green Tea GC 提供了一个值得关注的新方向。想要试验 Green Tea，可以在 Go 1.25+ 开启实验标志体验。

📝 参考资料

本文长期链接
如果您觉得我的博客对你有帮助，请通过 RSS订阅我。
或者在X上关注我。
如果您有Medium账号，能给我个关注嘛？我的文章第一时间都会发布在Medium。

软件工程师的身份危机 by Annie Vella

2025-03-26 19:17:56

原文地址： https://annievella.com/posts/the-software-engineering-identity-crisis/

我们很多人选择成为软件工程师，是因为我们在亲手创造事物中找到了自我价值——而非仅仅管理或监督已有事物。

但这种身份认同正面临挑战。

人工智能（AI）编码助手不仅仅改变了我们编写软件的方式，它们还在从根本上动摇了我们对自我身份的认知。我们正在从创造者转变为编排者，从建造者转变为监督者。从工程师变成了看起来非常像……管理者的人。

这种讽刺意味，直击痛点：多年来，我们一直认为软件工程超越了单纯的编码。需求、设计、测试、运维——这些都被认为是我们的专业技能的一部分。然而，行业却将我们推向了相反的方向。我们将这些职责交给了专业人士——产品负责人、架构师、质量工程师、平台工程师——而我们则加倍投入到我们的编码专业知识中。我们成为了代码大师，成为了现代魔法的骄傲使用者。

现在，就在我们完善这项技能的同时，人工智能正威胁着要夺走它。

我们即将失去的快乐

让我们坦诚地谈谈这里存在着什么风险。我们中的许多人不仅仅是编写代码——我们热爱编写代码。我们的身份融入到我们精心设计的每一个优雅的解决方案中，融入到我们通过的每一个测试中，融入到我们通过纯粹的逻辑和创造力解决的每一个问题中。这不仅仅关乎职业或技艺，而是我们身份的真实写照。

想想那些充满成就感的时刻：当你最终追踪到那个困扰生产环境的难以捉摸的bug时，当你计算出如何优化那个缓慢的算法并看到响应时间从几秒降到几毫秒时，当你把一个迷宫般的遗留代码改造成干净且可维护的东西时。这些不仅仅是成就——它们是我们作为工程师的表达。它们是提醒我们为什么选择这条道路的时刻。

现在想象一下人工智能接管这些精雕细琢的时刻。这些工具的创造者描绘了一幅乐观的图景——他们说我们将花更多的时间在定义意图、高层架构和系统思考上。但仔细听听他们真正想说的是什么：我们将成为监督者而不是创造者，管理者而不是建造者。

软件工程师正在转变为系统思考者和高层架构师吗？

这种转变引发了关于我们作为建造者的身份的重要问题：监督是驱动我们的动力吗？是它让我们早上从床上跳起来，渴望解决下一个难题吗？

身份转变：它已经到来

我们现在讨论的并不是什么理论上的未来——而是我们正在经历的现实。当谷歌最近透露人工智能生成了他们超过四分之一的新代码时，这仅仅是个开始。Y Combinator 的首席执行官 Garry Tan 透露，对于他们大约四分之一的初创公司来说，95% 的代码现在是由人工智能编写的——标志着一个真正意义重大的转变。我自己的硕士研究也揭示了类似的景象：77% 的人花费在编写代码上的时间变少了，几乎一半的人认为我们的核心技能可能会退居二线，让位于提示工程（prompt engineering）。想想这种转变：从设计解决方案到设计提示。

提示工程会取代传统的编码技能吗？

当被问及如何培养提示工程技能时，软件工程师强调要提高沟通技巧。让 AI 按照你想要的方式行事，意味着能够清晰地表达事情——提供恰到好处的上下文，并清楚地描述任务。你与生成式人工智能（Gen AI）沟通得越好，输出结果就越有可能符合你的期望。有些人甚至建议对这些工具礼貌一些，像对待团队成员一样对待它们——好像你在引导另一个人为你做某事。

这些变化如此深刻，以至于我们正在创造新的术语来描述我们正在成为什么样的人。以 vibe coding（氛围编码，一种依赖 AI 建议进行编码的方式）为例，这是 Andrej Karpathy 最近在推特上创造的一个词。它捕捉到了我们编写软件方式的深刻转变。

在这种方式的一端是传统的方式——工匠的方式。我们有目的地编写每一行代码，每一个函数名和架构决策都反映了我们对系统的深刻理解。

在另一端呢？我们让 AI填补空白，与它的建议“产生共鸣”。我们关注的是“是什么”，而不是“怎么做”。正如 Karpathy 所说：“完全沉浸在氛围中，拥抱指数增长，忘记代码的存在。”

最后一部分让我们停顿了一下——如果我们忘记了所有关于代码的事情，我们还是工程师吗？

在最近的一次结对编程会议中，工程领域的思想领袖 Gene Kim 和 Steve Yegge 演示了这在实践中是什么样子的。他们使用 AI 编码助手，将一个 3500 行的遗留 Ruby 脚本移植到 Kotlin——这项任务通常需要一周的时间——仅用了一个小时。人工智能不仅仅翻译了代码，还改进了它，添加了他们多年来一直想要的模块化架构和单元测试，但却无法证明花费的时间是合理的。

甚至连 DevOps 的教父 Patrick Debois 也认为这种转变正在重塑我们的身份。在他最近对 AI 原生开发模式的分析中，他概述了我们工作方式的四个根本性转变：

Patrick Debois：AI 原生开发的 4 种模式

这些模式揭示了一个深刻的转变：我们正在从 AI 系统的生产者转变为管理者，从详细的实现转变为表达意图，从交付转变为通过快速实验进行发现，以及从内容创建转变为知识管理。我们的角色正在演变为将创造与组织、构建与监督相结合。

总的来说，我认为可以公平地说，我们职业身份的本质正在发生核心变化。

塑造我们身份的技艺

要理解这种身份危机，我们需要看看编码的技艺对我们产生了多么深刻的影响。从本质上讲，编写代码是关于掌握和控制——我们花费了多年时间来完善的技能。现代编程语言比过去使用的那些语言高级得多，但它们仍然需要深厚的技术理解。如今，很少有开发人员处理指针和内存管理的细节，但我们仍然以了解事物在底层是如何运作的而自豪。即使框架承担了更多繁重的工作，我们仍然保持着我们作为工匠的身份，我们对自己的工具了如指掌。

今天的编程更多的是以创造性的方式将 API、框架和库拼接在一起，以构建有意义的东西。事实上，谷歌最近的一项研究表明，软件工程中的创造力主要集中在巧妙的重用而不是纯粹的创新这一概念上。这对我来说很有意义——我经常评论说，我们现在真的都只是“集成”工程师。

尽管如此，我们仍然以了解构建某些东西所需的所有奇怪语法而感到自豪。这就像一种只有我们才能理解的秘密语言。精通一门编程语言使你能够灵活驾驭、精准操控它。它非常详细——仅仅一个错误的字符就会破坏整个程序，而且可能需要大量的时间和耐心才能让它按照你想要的方式运行。

首先，必须完美地执行。在这方面，计算机也类似于传说中的魔法。如果一个字符，一个停顿，咒语的形式不严格正确，魔法就不会起作用。

——弗雷德里克·P·布鲁克斯，《人月神话》，第一章，Addison-Wesley，1975

其他 99% 的人认为我们理解代码是魔术，而且确实，可能需要多年的刻意练习才能掌握它。那些掌握不止一种编程语言的人有幸被称为“多面手”。我们中的许多人以编写干净、优雅的代码而感到自豪。我们热情地争论不同的风格和最佳实践，而且常常对此过于认真。

一位不甘心的管理者自述

让我分享一个关于身份演变的故事，它可能会引起共鸣。

在做了十年个人贡献者之后，我遇到了技术职业道路上臭名昭著的天花板。“高级首席软件工程师”——这就是技术职业道路的尽头。当时 Staff+ Engineering（资深工程师之上的职级）还不存在，而我所在公司的唯一架构师职位也已有人选。我面临着一个会改变我身份的选择：继续做一名建造者，还是成为一名监督者。

我选择了管理。不情愿地。这就是这条路引导我的方向。我告诉自己这仍然是工程，只是在一个不同的层面上。管理系统与管理人员并没有什么不同。我仍然可以在其他任务之间继续编写代码。

听起来很熟悉吗？这其中的相似之处令人惊叹。正如我不得不将直接解决问题的工作换成会议和文档工作一样，我们现在也被要求用提示工程来代替编码。那些定义我们作为工程师的技能——掌握语法、优雅地构建我们的代码、捕获和处理边缘情况、调试复杂问题——正在被降级到人工智能。相反，我们被告知要专注于听起来非常像管理的技能：清晰的沟通、系统思考、问题定义。

但这里没有人谈论的是：身份危机。当你意识到你不再用自己的双手建造东西时的那种深深的失落感。当你的技术专长变得不如你“管理”工具的能力重要时。当你的技能变成监督时。

组织人工智能能给我们带来同样的身份认同感吗？一种作为建造者、创造者、问题解决者的感觉？

当机器挑战我们的身份时

现在，我们身份危机的根源变得清晰起来。我们花费多年时间完善的技能——那些给予我们目标、意义和自豪感的技能——现在正被机器以更快、更便宜和更大规模的方式完成。当然，质量不如你手写的代码（但目前而言）。但是现在编写代码的速度是惊人的，企业都在争先恐后地参与进来。

这就是一线希望出现的地方。还记得那种讽刺吗——我们是如何将更广泛的技能方面交给专家的？人工智能正在推动我们重新获得我们曾经知道的东西：软件工程超越了单纯的编码。这个核心真理依然存在——最终，软件工程是关于解决问题、创造解决方案、构建重要的东西。

这些更广泛的技能——Addy Osmani 在他关于人工智能辅助编码中人类 30% 的文章中称之为“持久的工程技能”——一直将伟大的工程师与优秀的工程师区分开来。沟通、大局观思考、处理歧义——这些在人工智能驱动的世界中变得更加重要。

然而，这种对更广泛技能的强调在我们的社区中引发了争论。对于某些人来说，这听起来很像重新包装过的管理。而且他们并没有完全错——最近的一篇 CIO 文章证实，开发团队已经在进行重组，以专注于监督而不是创造。这篇文章设想未来的团队由一个产品经理、一个用户体验设计师和一个主要使用人工智能生成原型的软件架构师组成。这些架构师或高级开发人员必须“理解内容……了解客户是谁以及我们试图实现什么”——这是被重新包装成技术工作的经典管理职责。

披着技术外衣的管理

这种演变引发了关于我们作为工程师的身份的根本性问题：随着传统职业阶梯的转变，下一代软件工程师将如何发展他们的技能？我们如何在拥抱这些新工具的同时，保留塑造我们职业的深厚技术理解和技能？也许最令人不安的是——随着人工智能能力的指数级进步，我们作为工匠的角色是否会像工业革命期间的手工织布工一样过时？

前进的道路

也许答案不在于抵制这种转变，而在于通过历史的视角来理解它。这些身份危机——这些通过我们的工作来定义我们自己的根本性转变——并不是什么新鲜事。它们是技术重塑一个职业时重复出现的一种模式的一部分。

在工业革命期间，工匠们也面临着类似的危机。他们经过几代人磨练的传统技能正在被机器取代。但接下来发生的事情令人着迷：许多人适应了，成为了可以修理和改进这些威胁要取代他们的机器的专业人士。其他人则找到了应用他们对材料和工艺的深刻理解来改进整个工厂运营的方法。

如果我们把这种类比应用到我们的人工智能时代，就会出现一条类似的道路。软件工程的核心——解决问题和创造价值——仍然没有改变。我们的工具正在发展，随之而来的是有效使用它们所需的技能。

问题不在于我们是否会成为机器的管理者——而在于我们是否能在这种技能的演变中找到同样的满足感。

工程师的困境

那么，这会把我们带到哪里？我们是否注定要成为人工智能智能体的监督者，而不是代码的编写者？这是一个应该抵制还是拥抱的未来？

真相，一如既往，是细致入微的。正如一些工程师自然而然地倾向于管理，而另一些工程师则更喜欢保持亲力亲为一样，我们可能会看到在如何与人工智能互动方面出现类似的范围。有些人会擅长组织人工智能系统，专注于高层设计，并使这些系统更高效和可靠——指挥一场技术交响乐，而不是进行独奏。另一些人则会在人类专业知识仍然至关重要的领域找到自己的使命——可能是在安全敏感的应用程序、人工智能缺乏训练数据的新领域，或性能和可靠性至关重要的系统中。关键不是抵制这种演变，而是在其中找到自己的位置。

显而易见的是，“软件工程师”的定义正在扩大，而不是缩小。使某人有价值的技能正在多样化。这既带来了挑战，也带来了机遇。

对于那些热爱编码技能的人来说，这种转变可能会让人感到威胁。但请记住，人工智能工具仍然只是工具。它们不了解代码背后的“为什么”、业务背景或所服务的人类需求。它们无法真正意义上进行创新，至少目前还不能。而且据我们所知，它们无法感受到解决复杂问题的满足感或创造新事物的乐趣。

也许在这个新领域中最有价值的技能不是提示工程或系统架构，而是适应性——愿意进化、学习新技能，并在一个快速变化的领域中找到自己独特的位置。

光明的一面

尽管存在这些挑战，但我们需要承认一些重要的事情：这些人工智能工具可以非常强大。借助像Windsurf 和 Cursor 这样将软件开发提升到一个全新水平的自主智能体集成开发环境（agentic IDE），就像拥有一个始终在你身边的支持性结对编程伙伴一样，随时准备帮助你解决以前可能看起来令人望而却步的问题。

对于初级开发人员或我们这些可能感到有些生疏的人来说，人工智能助手可以增强信心——在你盯着一个空白文件时帮助你入门，在你犹豫不决时验证你的方法，或者以一种对你有意义的方式解释复杂的概念。对于经验丰富的开发人员来说，它们就像拥有一个不知疲倦的助手，可以处理日常任务，而你可以专注于问题的更具挑战性的方面。

如今，我们能迅速搭建原型、探索各种方法，甚至在几分钟内掌握新技术——这速度着实令人震撼。可能需要数周的研究和反复试验才能完成的事情通常可以在几小时甚至几分钟内完成。这就像拥有超能力一样——能够放大我们的能力，并比以往更快地将我们的想法变成现实。

现实检验

但是，能力越大，责任越大。最近一项全面的 GitClear 研究分析了 2.11 亿行代码，揭示了一些令人担忧的趋势，因为人工智能代码生成工具变得越来越普遍：

复制粘贴的代码增加了 17.1%，这是人工智能辅助的代码重复首次超过重构（移动）的代码。
重复代码块增加了 8 倍，现在有 6.66% 的提交包含重复的代码段。
代码改动增加了 26%，所有代码更改中有 5.7% 在两周内被修改或删除。

GitClear：代码更改趋势

虽然我们生成代码的速度比以往任何时候都快，但我们也花费更多的时间来修复人工智能生成的错误并处理更难维护的代码。这不仅仅是速度问题——而是关于编写可持续、可维护软件的技能。

隐藏的身份危机

然而，在这些表面上的变化之下，隐藏着一个更深层次的挑战——一个触及我们作为工程师的核心的挑战。新兴的人机协作领域正在揭示关于我们未来的令人不安的真相。2024 年的一项研究表明，当人类和人工智能一起工作时，结果往往达不到预期。不是因为人工智能缺乏能力，而是因为信任在机器和人类之间的运作方式不同。

我们与人工智能建立信任的方式与我们与人类团队成员建立信任的方式不同。

对于人类来说，信任是通过共同的成功逐渐建立起来的。一起解决的每一个问题都会加强这种联系。即使是处理得当的失败也能加深信任。对于人工智能来说，信任通常开始时很高，但会迅速瓦解。

每一个不正确的回答、每一个幻觉般的错误修复、每一次放错地方的信心都会削弱我们对机器的信任。与人类关系中信任通常会随着时间的推移而增长不同，人工智能的信任通常会在早期达到顶峰并下降。

当信任消失时，生产力也会下降。

该研究揭示了原因：

人工智能在解释我们的意图方面存在固有的不可预测性
它缺乏使人类协作流畅的上下文意识
它的决策通常缺乏透明度，因此一旦失去信任就很难重建

这些挑战反映了我们许多人在转变为技术领导者时所经历的事情。正如新的工程经理必须学会信任他们团队的工作而无需自己动手一样，我们现在也面临着与人工智能类似的转变——学会指导和验证，而不是自己编写每一行代码。

现实是严峻的：尽管人工智能具有原始能力，但团队在有人工智能的情况下通常比没有人工智能的情况下表现更差。正如团队的生产力在无效的领导下会受到影响一样，当我们不了解如何使用我们的人工智能工具时，我们的效率也会降低。

重塑你的身份

从我作为一名不情愿的经理的历程以及我对这种人工智能转型的研究中，我看到了三种我们可以保留我们作为建造者身份的方式：

抵制——有些人会选择专注于人类创造力和深厚技术专业知识仍然至关重要的领域
适应——另一些人会拥抱人工智能编排，成为一种新型技术交响乐的指挥家3. 平衡——还有许多人，像我一样，会寻求一条中间道路——使用人工智能来完成日常任务，同时保留直接解决问题的乐趣

然后我意识到一个改变我观点的事实：我们不必只选择一条道路。

身份的钟摆

也许我们身份危机的答案在于工程师/经理的钟摆。我自己在这些角色之间转换的经历教会了我一些关于身份的关键知识：

管理并没有取代我的工程师身份——它扩展了它
回归亲力亲为的工作并不是倒退——而是身份的更新
钟摆的摆动本身成为了我的一部分——适应性强、不断成长、不断进化

就在那时，我突然意识到：这正是我们需要的人工智能时代的模型。如果我们不必被迫成为永久的“人工智能经理”，而是可以在以下角色之间切换，那会怎么样呢？

深入的技术工作，我们可以直接编写和完善代码
战略编排，我们可以指导人工智能系统
将这两种方法结合起来的创造性问题解决

这种平衡的方法与我从其他工程师那里听到的声音产生了深刻的共鸣。我的研究表明了一个明确的信息：保持强大的工程基础比以往任何时候都更加重要。我们需要深厚的技术知识才能有效地审查、验证和调整人工智能生成的代码——因为它通常不太正确。当被问及他们对人工智能编码助手的担忧时，软件工程师将代码质量和安全性排在工作保障之上。

软件工程师对人工智能编码助手的主要担忧

这告诉我一些深刻的事情：我们把自己视为工程卓越的守护者，确保人工智能生成的解决方案遵循可靠的软件工程原则。我们并不是想把我们的专业知识委托给人工智能——我们正在进化以新的方式应用我们的技能。

你的行动

当我们驾驭这种转型时，一个基本的真理浮出水面：我们的身份危机实际上根本不是关于人工智能的。对人机协作的研究、与管理转型的相似之处、角色的钟摆——它们都指向更深层次的东西。除了在建造者或监督者之间做出选择之外，还存在着我们作为创造者的核心。

现在我们又回到了原点：人工智能并没有抢走我们的工作，而是给了我们一个机会来重新获得我们交给专家的那些更广泛的角色方面。回到软件工程不仅仅意味着编写代码的时代。当它意味着理解整个问题空间时，从用户需求到业务影响，从系统设计到卓越运营。

钟摆的比喻在这里为我们提供了智慧。正如我们中的许多人在工程和管理角色之间摇摆一样，我们可以以类似的方式拥抱人工智能的流动性。有些时候，我们会深入研究代码，体验设计优雅解决方案的快感。其他时候，我们会退一步来指导人工智能系统——不是作为监督者，而是作为了解他们技能的每一个部分的大师级建造者。就像工业革命的工人成为优化改变他们技能的机器的专家一样，我们可以掌握这些人工智能系统——使它们成为我们创造力的工具，而不是我们创造力的替代品。

在人工智能时代，最重要的是保留我们本质的东西：构建事物、解决难题、使某些东西完全正确运行的纯粹乐趣。我们的工程卓越不仅仅是验证人工智能的工作——它源于对系统如此熟悉，以至于我们可以塑造它们、改进它们、改变它们。

选择不是人工智能是否会改变我们的行业——它已经在改变了。真正的选择是我们如何与它一起进化。我们是会坚持对成为一名工程师的过时观念吗？还是会重新获得我们的技能，不是作为单纯的编码员，而是作为人工智能增强型系统的大师级建造者？

钟摆正在摆动——你会坚守阵地，还是随之而动？

本文长期链接
如果您觉得我的博客对你有帮助，请通过 RSS订阅我。
或者在X上关注我。
如果您有Medium账号，能给我个关注嘛？我的文章第一时间都会发布在Medium。

【译】：gRPC丑陋的部分

2025-03-14 09:59:10

原文链接：https://kmcd.dev/posts/grpc-the-ugly-parts/
这篇文章是gRPC：好与坏系列的一部分。

gRPC无疑是微服务领域中的一把利器，它带来了效率和性能上的优势，但gRPC也有其丑陋的一面。作为一个在gRPC上花费了大量时间的人，我想揭示这项技术的一些不那么美好的方面。我已经讨论过gRPC的优点和缺点，现在让我们来谈谈它的丑陋之处。

代码生成

首先，我不得不说一下从protobuf生成的代码有多么丑陋。这些代码通常很冗长、复杂且难以阅读。尽管它并不是为了手动编辑而设计的，但这会影响代码的可读性和可维护性，尤其是在将gRPC集成到大型项目中时。最近在大多数语言中，这种情况已经有所改善，但仍然存在一些粗糙的地方。

语言特定的怪癖

protobuf和gRPC的初始实现常常偏离语言特定的规范，尤其是在HTTP处理方面。这在一定程度上源于强制支持HTTP/2的决定，这一决定后来被证明限制了gRPC在前端的应用。我们现在从gRPC-Web中了解到，trailer并不是像gRPC这样的协议的硬性要求。在这一决定之后，我们现在需要改进protobuf和gRPC的语言实现，使其更符合每种语言的习惯。

对于Go语言来说，避免使用net/http包是一个艰难的决定，因为这使得在与其他类型的HTTP API一起使用gRPC端点时变得更加困难，并且难以复用HTTP中间件。他们最终在grpc-go中添加了一个ServeHTTP()接口，作为使用Go标准库中的HTTP服务器的一种实验性方法，但使用这种方法会导致显著的性能损失。也许他们这样做是出于性能考虑？如果是这样，这无疑是一个将gRPC与Go生态系统其他部分割裂的权衡。

有时，语言特定的怪癖实际上会影响你如何设计protobuf类型。如果你遵循Buf的风格建议，枚举的名称应该以枚举名的大写蛇形版本作为前缀，就像这样：

1
2
3
4
5



enum FooBar {
  FOO_BAR_UNSPECIFIED = 0;
  FOO_BAR_FIRST_VALUE = 1;
  FOO_BAR_SECOND_VALUE = 2;
}

这在buf的lint规则描述中有更好的解释，但这种风格指南之所以如此，是因为C++的枚举作用域规则，这使得在同一包中无法有两个具有相同枚举值名称的枚举值。虽然这种约定源于C++的作用域规则，但它影响了你应该如何设计所有的protobuf文件。为什么枚举内部的作用域不足以让C++编译器生成唯一的名称？为什么这种缺陷会影响风格指南，并进而影响所有目标语言？对我来说，这有点丑陋，因为某些语言实现的怪癖以不直观的方式冒了出来。

生成的代码甚至不够快

生成代码的一个好处是，你可以生成一些正常人不会写的代码，以获得一些性能优化。然而，如果你查看一些从protobuf生成的代码，你会发现大量使用了运行时反射。为什么？在某种程度上，我是在说生成的代码不够丑陋。让我们看一个具体的例子。请注意，这将是一个非常Go特定的部分，因为我大部分关于protobuf的经验都是在Go中。然而，相同的策略已经应用于大多数语言。

让我们来看一个Go中的超级简单示例。以下是protobuf：

1
2
3



message Hello {
  string name = 1;
}

这是由protoc生成的类型：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13



type Hello struct {
	state         protoimpl.MessageState
	sizeCache     protoimpl.SizeCache
	unknownFields protoimpl.UnknownFields

	Name string `protobuf:"bytes,1,opt,name=name,proto3" json:"name,omitempty"`
}

// With these methods, contents are stripped
func (*Hello) Reset()
func (*Hello) String() string
func (*Hello) ProtoMessage()
func (*Hello) ProtoReflect() protoreflect.Message

实际上，并没有为这个类型定义专门的Marshal()或Unmarshal()函数。这意味着序列化是通过运行时反射来实现的。反射通常被认为较慢，因为它确实较慢。我觉得奇怪的是，没有为Go生成优化的、类型特定的序列化代码。话虽如此，你可以通过使用一个名为vtprotobuf的单独protoc插件来获得这一点，该插件将为每个protobuf类型生成专门的marshal和unmarshal函数。它还允许使用类型特定的内存池，这也有助于减少分配并提高性能。根据我的测试，只需添加vtprotobuf而不做任何代码更改，就可以将性能提高2-4%。这基本上是“免费”的2-4%，所以我觉得很奇怪，这竟然不是标准编译器的一部分。你可能不喜欢它，但这就是峰值性能的样子。无论如何，这个项目需要更多的关注和支持。

请注意，还有其他一些项目声称在标准protobuf库的基础上取得了惊人的性能提升。他们确实通过做出一些权衡来实现这些性能提升，但很多时候，额外的复杂性是值得的。

你可能会读到这一部分并想：“好吧，这会增加生成的代码量，增加二进制文件或包的大小，在某些环境中，你可能不希望这样。”这是事实，这就是为什么protobuf有一个optimize_for选项，所以你可以注释以下之一：

option optimize_for = SPEED; - 更冗长、更快的代码
option optimize_for = CODE_SIZE; - 更小的代码
option optimize_for = LITE_RUNTIME; - 旨在在较小的运行时上运行，省略了描述符和反射等功能。

请参阅官方protobuf文档中关于optimize_for的完整描述。虽然这些选项存在，但它们实际上并没有用于大多数目标语言。将来，我完全希望看到大部分vtprotobuf被整合到Go的标准protobuf编译器中，并在optimize_for = SPEED时使用。将类似vtprotobuf的优化整合到标准protobuf编译器中，可以为Go带来显著的性能提升，其他语言也可能存在类似的机会。

必填字段

Protobuf的维护者在必填字段方面学到了一些艰难的教训。他们觉得自己犯了一个严重的错误，以至于他们推出了一个新版本的protobuf，即proto3，只是为了从规范中删除必填字段。为什么？“必填字段有害”宣言的作者在一篇冗长的Hacker News评论中谈到了这一点，但重要的是：

现实世界的实践也表明，许多最初被认为是“必填”的字段随着时间的推移往往会变成可选的，因此有了“必填字段有害”的宣言。在实践中，你希望将所有字段声明为可选的，以便为变化提供最大的灵活性。

这一点在官方protobuf风格指南中得到了呼应，他们建议添加注释来指示某个字段是必填的。如果我们讨论的是将消息从A传递到B，我完全同意这种思路。然而，仅仅因为某些字段被认为是“必填”的会随着时间的推移而变化，并不意味着必填字段不存在。仍然需要代码来强制执行这一要求，老实说，我不想编写这些代码。因此，我认为在不编写大量空检查的情况下处理必填字段的最佳方法是使用protovalidate或类似的库，这些库具有protobuf选项，允许你注释哪些字段是必填的。然后在服务器和/或客户端上有代码可以使用库来强制执行这些要求。在我看来，这兼具了两者的优点：你仍然可以以不会完全破坏消息完整性的方式声明必填字段。

我不喜欢这样：

1
2
3



message User {
  int32 age = 1; // required.
}

我喜欢这样：

1
2
3



message User {
  int32 age = 1 [(buf.validate.field).required = true];
}

我是protovalidate的忠实粉丝，我已经多次使用它并为其做出了贡献。一般来说，我认为protobuf字段的自定义选项是protobuf的一个未被充分利用的超能力。

难以入门

尽管gRPC具有不可否认的优势，但其学习曲线可能很陡峭。对于新手来说，开始使用protobuf、理解工具链以及设置必要的基础设施可能会让人望而生畏，这使得初始采用的障碍比使用更简单的基于JSON的API更高。为什么它如此陡峭？嗯，它在大多数语言中引入了非惯用的工具链。有一些语言支持的例子使得protobuf生成变得无缝。Grpc.Tools for .NET就是一个闪亮的例子，展示了如何将protobuf工具链更紧密地集成到标准语言工具链中。我们需要更多这样的例子。

当许多使用和依赖protobuf和gRPC的人积极不希望gRPC扩展到前端，并认为推动这一方向会导致不了解情况的人侵入后端领域时，陡峭的学习曲线并没有帮助，他们认为只有他们足够聪明才能在后端工作。这是精英主义的守门行为，不幸的是，这种行业普遍存在。我相信gRPC在Web前端中与在微服务中一样有其地位。

我通过帮助其他人使用protobuf学到了很多。你可能会在Buf的Slack频道或相关讨论中看到我，因为我确实从中受益匪浅。许多文章的想法直接来自于在那里回答问题。如果我看到某个问题出现的频率足够高，我可能会写一篇文章来讨论它。我认为protobuf和gRPC社区需要更多这种态度。

我相信陡峭的学习曲线（可以通过工具链来缓解），加上一些后端开发者的抵制（可以通过……同理心来缓解？），已经减缓了它在Web开发中的广泛采用。

gRPC有其历史

gRPC最初专注于微服务，并且与HTTP/2的紧密联系阻碍了它在Web开发中的广泛采用。即使有了gRPC-Web的出现，仍然有一种看法认为它在前端生态系统中并不是一等公民。与TanStack Query等流行前端库缺乏强大的集成进一步巩固了这种看法。

我认为通过改进工具链，有真正的机会让更多前端开发者对gRPC感到兴奋。目前，整个行业正在围绕“前端”和“后端”之间的界限进行一场巨大的讨论，我认为无论结果如何，我们都会看到更多使用gRPC的TypeScript代码。

gRPC中的“g”

虽然gRPC项目声称 gRPC中的“g”是一个反向缩略词，代表“gRPC”，但它最初代表Google，因为是Google开发并发布了protobuf和gRPC。

关于Google对gRPC和protobuf的长期承诺，始终存在一个悬而未决的问题。他们会继续投资于这些开源项目，还是会在优先级发生变化时突然撤资？请记住，Google最近裁掉了Flutter、Dart和Python团队的大部分成员。Protobuf社区正在发展，但它是否足够自给自足以应对这种情况？

它尚未完成

其他人说gRPC不成熟，不是因为它的年龄，而是因为它的生态系统发展程度。我倾向于同意，因为它缺少我期望在一个成熟生态系统中看到的功能和工具。

缺少包管理器

在没有专门工具的情况下，跨多个项目或仓库共享protobuf定义是一个持续的挑战。虽然像Bazel、Pants和Buf的BSR这样的解决方案存在，但我在“现实世界”中使用protobuf的经验……参差不齐。有一些由Google开发的开源项目，它们使用bash脚本拼凑在一起，在手动调用protoc之前下载依赖项。想象一下，一个编程语言没有管理依赖项的解决方案。这太疯狂了。我认为Bazel和Buf工具链很好地解决了这个问题，但我只是感到沮丧，我遇到的每个使用protobuf的仓库都以最定制化的方式解决了这个问题。社区需要团结起来改进这一点。有一个名为Buffrs的开源仓库似乎正在解决这个问题。我还没有亲自使用过它，但到目前为止它看起来还不错。

关于依赖项，我想指出的是，Google的“众所周知的”protobuf类型享有被内置到protoc中的特权。虽然这些类型非常有用且无价，但它们的特权使得其他有用的protobuf类型库难以存在和繁荣。仅仅将这些protobuf定义内置到protoc（和其他工具链中）是对没有真正和一致的依赖管理故事的逃避。

编辑器支持

Protobuf代码生成的编辑器集成还有很多不足之处。如果编辑器能够智能地将生成的代码链接回其protobuf源，那将非常有帮助。这将提供更无缝的体验，但工具链还不够智能。此外，我认为每个人都应该使用Buf的编辑器支持。如今，开发者期望在编辑器中内置linter和自动格式化工具。而对于protobuf来说，有非常真实的原因需要遵循linter的建议。

像tRPC这样的项目展示了紧密集成和意见化设计选择的好处——这是protobuf由于其性质无法完全复制的。然而，我仍然希望protobuf生态系统能够发展，提供类似的简化开发者体验。

丑陋的文档

我从未见过从protobuf生成的文档不是超级丑陋的。我认为，由于gRPC历来是后端服务，后端开发者从未真正努力使用protoc插件生成漂亮的文档输出。我通过制作一个protoc插件解决了这个问题，该插件可以从给定的protobuf文件生成OpenAPI。然后我使用众多漂亮的工具之一来显示OpenAPI规范。这远比让我设计一个像样的文档容易得多。从protobuf生成OpenAPI的另一个附带好处是能够利用该生态系统，因为它不仅仅是文档。

让我们看一个真实的例子。这是使用少数几个从protobuf生成文档的工具之一，protoc-gen-doc生成的文档：

将其与一些OpenAPI工具链进行比较。这是使用Elements生成的，但还有许多其他同样精美的替代方案：

指责单个插件并说默认模板不如OpenAPI替代品好看有点不公平，因为实际上你确实在protoc-gen-doc中有更多的灵活性。它允许你指定自己的模板，因此它可以像你希望的那样漂亮。然而，这确实符合我的观点：在REST世界中，工具链比gRPC更完善和精致。这是一个可以解决的问题，但我们需要让前端开发者和设计师对gRPC感到兴奋，或者后端工程师需要开始磨练他们的设计技能。

我还想指出，OpenAPI/Swagger接口通常有一种方法可以直接从文档网站测试端点。这在gRPC世界中的等效工具中是完全缺失的。此外，使用大多数OpenAPI文档工具，你可以清楚地看到哪些字段是必填的，并会显示具有约束的字段。因此，它不仅更漂亮，而且功能也更强大。

结论

gRPC虽然在许多方面是一个强大的工具，但仍然有成长的空间。生成代码的不理想之处，加上依赖项管理和protobuf模式演变的挑战，可能会给开发者带来摩擦。缺乏直观的编辑器集成以及历史上对后端服务的关注，也阻碍了它在Web开发中的广泛采用。

然而，我认为gRPC的未来是光明的，并且可以变得不那么丑陋。社区正在积极应对这些挑战，开发诸如buf CLI、protovalidate和protoc-gen-connect-openapi等工具来弥合差距并增强开发者体验。随着gRPC的成熟和其生态系统的扩展，我们可以期待改进的工具链、更好的编辑器支持以及更顺畅地融入前端世界。

本文长期链接
如果您觉得我的博客对你有帮助，请通过 RSS订阅我。
或者在X上关注我。
如果您有Medium账号，能给我个关注嘛？我的文章第一时间都会发布在Medium。