2026-04-26 08:00:00
希望 Delve 能让客户(前阵子的 LiteLLM,今天的 ContextAI)知道,为了合规而合规,最终得到的都是虚假的安全,别为难 2B 厂商了。
Malicious Checkmarx Artifacts Found in Official KICS Docker …
TeamPCP 团伙的近期第二起行动,也是安全工具自身被攻击了,上次是 Trivy。
Equity for Europeans | Armin Ronacher’s Thoughts and Writings
equity 这个词确实有些难理解,在 beancount 中,我一直没有使用这个类别。
国内自建 Peer Relay 实现 Tailscale 加速:RTT 160ms → 30ms | 5km
用不上,看看也好。
Open source security at Astral
Hardening GitHub Actions: Lessons from Recent Attacks | Wiz Blog
One CI to rule them all: a guide for pragmatic pipelines
最近的一些安全事件,突然多了很多关于 CI/CD 的配置管理文章:
pull_request_target workflow_run ;secrets: inherit
permissions: {}
现如今做 Agent Infra 与其重新造轮子,不如看看历史中有没有好用的轮子。有些很有意思的设计,其实在很早之前就已经存在了。这些宝藏可能因为过于晦涩,或者不太符合普通用户的人体工学,以至于它们没有成为主流,但是在 Agent 成为用户的时候,马上就会大放异彩,最近这个 CLI 和 UNIX 哲学的复兴就是一个很好的例子。
这些设计在当年没有成为主流,很大程度上是因为它们不够“适合人”。
但如果用户换成 Agent,情况就有点不一样了。
Software engineering may no longer be a lifetime career
The career of a pro athlete has a maximum lifespan of around fifteen years. You have the opportunity to make a lot of money until around your mid-thirties, at which point your body just can’t keep up with it.
A common tragic figure today is the professional athlete who believes the show will go on forever and doesn’t prepare for the day they can’t do it anymore. We may be in the first generation of software engineers in the same position. If so, it’s probably a good idea to plan accordingly.
周五听了一个内部分享,某一个岗位现在的主要工作已经变为如何更好的服务 AI,当 AI 完全可以覆盖当前的需求后,这个岗位还会继续存在么?我觉得不会。以前觉得离人越近的地方,越值钱,比如销售直面客户,可是之后都是和 Agent 打交道了,这个说法还成立么,变成谁能让 Agent 工作的更好,更值钱?
最近看到一个说法:盘面真是太机智了,如果你把白酒、医药、美妆等等这些传统消费品,定义为“碳基生命”消费,把半导体、PCB、光模块这些定义为“硅基生命”消费,你会有一种感觉,人类已经失去了对股市、对互联网甚至未来的掌控,在这背后,实际的操作者已经变成我们创造出来的人工智能,引导资金向着它需要投入的地方去,而我们只不过是面上的“傀儡”。
也许是因为今天是工作日的缘故,在路上没有见到一个游客,享受着这份惬意。
工作日哪怕什么都不做,就非常的惬意。
它制造了大量本不存在的矛盾。朋友间一句无心的玩笑,被过度解读为“话里有话”;同事一个寻常的举动,被层层剖析出“深层意图”。本来相安无事,想着想着便琢磨出事来了,给自己徒增无数烦恼与戾气。
更可怕的是,这种臆测出来的“真相”,往往成为攻击他人的武器——“你这么说是何居心”“你这么做一定有目的”。一场场网络骂战、人际冲突,很多时候并非源于真实的矛盾,而是源于我们丰富的“想象力”。
不是说用脑就一定比用体力好,而是你会的东西越难、越少人会,你就越有主动权。学习只是其中一条比较稳定的路。
你以后不管做什么,其实都在跟别人交换。学习不是让你一定变得更厉害,而是让你多一些别人需要的能力。你会的东西越特别、越不容易被替代,你就越有选择,而不是只能被安排。
补充说明:摘录的这段话是 ChatGPT 生成的。
Tim Cook’s Impeccable Timing – Stratechery by Ben Thompson
Tim Cook 卸任苹果 CEO,功过自有后人评。目前我还留着的自购产品应该只有 iPad Mini 了。
《寄生首尔》,李惠美2023 年作品,作者是韩国日报的记者,有一句经典的话:“我还是来了首尔以后才知道,原来阳光也是要花钱买的”。这本书讲述的是韩国首尔的“蚁居房”居住情况,蚁居房租户不会主动报税,租住条件差,大部分情况下是为了不要露宿街头,冬天不开取暖设备的状态。在读这本书的时候,我一直在想我自己 2015 年刚到北京的时候,非常感激大学同学能够让我当时留宿过渡,那是一个在西北旺韩家川村的一个隔断单间,当时一个月好像是 550?生活逐渐稳定之后,我就从同学那搬走了,后面同学也离开了北京。当时我的想法和书中描述的想法一样,年轻嘛,觉得只是暂时的,后面会变好的,直到 2017 年北京大兴的那一场大火,让我想着,也许不能继续在北京待下去了,应该换一个地方。书中说,最低居住标准是 14 平米,这个对于刚刚进入大城市生活的人来说,多少有些奢侈,也许是因为经历过很低的下限,所以我对居住条件的容忍度很高,这么多年也是如此。
部分摘录:
作者在书中给“都市贫民”下了这样的定义:都市贫民虽是一群具有劳动能力和劳动意愿的“经济活动人口”,可从社会结构的层面来看,他们是一群徘徊在近代工资劳动体系之外的群体。也就是说,这些人即使努力劳动也还是摆脱不了贫穷的身份。
韩国法律对于人类维持尊严和基本生活需求这件事情,居然是有”最低居住标准”的。《基本居住法》规定了一人户家庭的最低居住标准:“面积为14平方米(约4.24坪),包含厨房、独立卫生间和浴室等设施。“2015年制定的相关法律中,规定了公民具有”远离物理意义上和社会意义上的危险、居住在安全环境之下、过符合人类基本标准的生活的权利”,首次将国民的居住权纳人法律保护范围内。通过这条法律我们也可以看到,即使是能够躺下、能够遮风挡雨的地方,也并不能和”足以让人类生存的空间”画等号。不过这条既优雅又有威严的法律,并无法触及金字塔最底端的蚁居房。
电影《寄生虫》之所以会演变成悲剧,正是底层人士的”越线”所致。可我们社会的这条”线”到底画在何处?又是谁画的这条线呢?为何底层人士要流浪在线外,或是被隔离在名为蚁居村的特定贫民窟里呢?对此,判断的标准又是什么?是”金钱”和人的”用途”吗?又或者是电影里反复提到的穷人身上的味道呢…
在”贫穷即原罪”的社会中,这个问题确实让人不自在,因为它让被提问人不得不直面赤裸裸的现实。面对这些深层的烦恼以及真实的自我都并非易事。我在深度采访居住在沙斤洞的青年之后,都会抛出这句话作为最后的问题。当时所有的受访者都对这个问题感到不适,因为他们早已将”我不是穷人,之所以在当下身处这种境地,只是在为迎接美好的未来而坚持着”的想法深植于心。这之中很多人都提到了”精神胜利”一词,即便他们对自己目前的处境束手无策。虽然如此,他们依然以美好的未来为前提,甚至刻意忽视这个正在运作的却十分残忍的剥削结构。
即使是拥有这样条件的青年,也不得不委身于”新型蚁居房”这种恶劣环境,面对着利欲熏心、毫无责任感和道德感的”新型蚁居房”房东们压榨青年们血汗钱以积累财富这一现实,耳边甚至还不停萦绕着”年轻人要吃苦”这句所谓的警世名言。社会现实如此,到头来却让年轻人自己去承担社会问题强加给他们的压力。
“人就是得去首尔”这句话,让所有在外县市的大学都变成了”杂牌大学”。“首尔共和国”将所有外县市都变成了”殖民地”,仿佛只有首尔才是”正式的舞台”。到最后,外县市剩下的只有那些不知名公司的练习生,他们连参加节目的面试资格都没有。在这种如果不背井离乡就看不到任何希望的社会,青年们不惜承受残酷竞争的压力也要参加节目,只是为了可以站上舞台一次。前往首尔,前往首尔,朝着那个所有人都想登临的选秀舞台迈进。
越是年轻,就越能吃贫穷的苦。因抱着”只要等待,一切就会有所改善”的期望,很多人都不愿直面自己的贫穷,而是开始将它合理化。他们借着想象中的美好未来宽慰自己,并不认为自己是穷人。可就像之前文中提到的,我们社会的青年,每三人中至少有一人处于”正在工作或求职中”的贫穷状态。
2026-04-19 08:00:00
Your code is worthless - Nathaniel Fishel
It’s clear the rot has reached the highest levels of tech leadership. This idea has metastasized across Slacks, forums, and boardrooms: the belief that AI has magically “solved” software by making it effortless to generate mass quantities of it.
We must return to the fundamental truth The source code is not the product. The product is the Outcome the user achieves. The code is merely the expensive, high-maintenance machinery required to deliver that outcome. If you can deliver a $1,000,000 outcome with 10 lines of code, you are a hero. If you deliver that same outcome with 37,000 lines, you have just created a $1,000,000 liability.
The peril of laziness lost | The Observation Deck
连续两篇关于 Garry Tan 的项目讨论。懒惰是为了追求高效抽象来简化系统,因为人类时间有限,迫使人类会去主动的进行抽象,减少后续的认知负担,所以说是偷懒,其实是为了后续的方便在当下投入更多的努力, LLM 不会,他们没什么明确的限制,最终还是回到使用的人上面。
The key architectural decision: the agent is not the sandbox. The agent does not run inside the VM. It runs outside the sandbox and interacts with it through tools like file reads, edits, search, and shell commands.
An early look at tailscale-rs, a tsnet library in Rust
TailScale Rust 版本,这是好事。
用户即开发者 | VMark
我为什么要构建 Markdown 编辑器:VMark | VMark
Faros AI 的研究——覆盖 1,255 个团队和 10,000+ 名开发者——发现高度 AI 采用与 每位开发者 bug 增加 9% 和 PR 审查时间增加 91% 相关。当 AI 以更低的准确率生成更多代码时,审查瓶颈会完全吸收”生产力”提升。
李笑来的这些思考真不错,而且真的在 Vibe 「产品」,而不是「工具」。
The Center Has a Bias | Armin Ronacher’s Thoughts and Writings
But there is something important missing from that criticism when it comes from a position of non-use: it is too abstract.
If you want to criticize a new thing well, you first have to get close enough to dislike it for the right reasons. And for some technologies, you also have to hang around long enough to understand what, exactly, deserves criticism.
纸上得来终觉浅,绝知此事要躬行。我认同这篇文章的观点,但“center”和 “neutral”有一点文字游戏,neutral:你们爱吵吵,和我没关系;center:看你们吵吵我来用用,哦,果然不错/还行/不行。
HN 上面有一个大实话:“But right now I think the bigger risk is that the center is biased towards people with time and money”
用 Claude Code 将三万行 Go 项目移植到 Rust:Agent Team 实践与 Harness 效率优化 - Lv. MAX
文档是给 Agent 写的,不只是给人写的。这意味着文档的写法需要调整:
- 用表格代替散文。 Agent 解析表格比理解段落高效
- 引用要精确。 “参见 ADR-0001” 比 “参见之前的架构讨论” 好,因为 agent 可以直接定位文件
- 状态要明确。 每个工作项标注 “completed / in-progress / blocked”,而不是 “我们之前讨论过这个”
2018 年 3 月底, Craig Ringer 在 pgsql-hackers 邮件列表中报告了一个用户遭遇的数据损坏案例 [1]. 问题的核心在于: PostgreSQL 使用 Buffered I/O, 在写入数据后调用 fsync() 来确保数据落盘. 当 fsync() 失败时, PostgreSQL 的做法是重试 fsync() — 然而第二次 fsync() 返回了成功, 但数据实际上并没有写入磁盘.
为什么这些数据库没有在 fsync 失败后 crash? 原因是多方面的:
- 认知盲区: 2018 年之前, 几乎所有数据库开发者都不知道内核会在 fsync 失败后丢弃 dirty page.
- 本地存储极少触发: EIO 在本地 SSD/HDD 上几乎只在物理损坏时才出现, 一辈子可能遇不到.
- crash 后未必能恢复: LevelDB 的 log 和 SQLite 的 journal 也走 Buffered I/O, crash 后的 recovery source 本身可能就是损坏的.
- 产品约束: SQLite 和 LevelDB 是嵌入式数据库, 因一次瞬态 I/O 错误就把宿主应用杀掉, 在移动端和桌面端不可接受.
来了不是深圳人(1):拜拜了深圳 | 积薪(极简版)
来了不是深圳人(2):离开深圳要去哪 | 积薪(极简版)
来了不是深圳人(3):成都的好与坏 | 积薪(极简版)
根据最近的人口普查结果,深圳已经有 1800 万人,跟广州一样。但广州的面积是深圳的 3.7 倍,北京、上海人口比深圳多不了多少,但面积也是好几倍。所以深圳的人口密度是一线城市里最高的。
随你怎么想,失败就失败吧。失败不可怕,可怕的是不愿意承认失败并及时止损。我想要真正的生活,再在深圳耗下去没有意义,不如赶紧跑。
整体看下来,气候最宜居的标准就一个:低纬度的高海拔地区。低纬度保证光照,冬天不会太冷;高海拔确保夏天不会太热;同时高海拔大概率发展不了工业,空气就会不错。这就是云南如此舒适的原因。
差不多的地段和户型,成都的租金大概是深圳的 30%~40%。假如你要在深圳南山科技园附近租一套两房,至少得准备 8000 的预算;科技园平移到成都就是高新区,在大源要租一套两房,不考虑个别豪宅大户型的话,大概只需要 3000~6000。
成都的阳光是稀缺品,尤其是在冬天。一个月太阳直射的时间加起来可能连一个白天都没有,整天都是阴沉沉的。导致你很难分辨方向和时间,有时候恍惚间不知道究竟是上午还是下午。
身边同事这几年陆陆续续的从北京/上海搬去杭州/成都的有不少了。
从机场出来打车去吃了午饭,然后涂了防晒,准备走路去酒店。
来之前我的朋友小柯跟我说,别走路,打 Grab,体感温度 40 度以上。
防晒很重要。上次在马来呆了几天,左右胳膊的色差回来几个月才恢复。
商业战略报告:2026 名创优品 - 三杯过后 | Xiaowen.Z Deployed
下方挤压:零食很忙、好特卖等折扣零售 2024 年门店突破 4.5 万家。一瓶可乐折扣店 1.8 元,名创 3 元——价格敏感消费者正在流失。
印象中疯投圈有一期播客聊过,名创优品卖的比较好的品类有矿泉水。
商业战略报告:胖东来 - 三杯过后 | Xiaowen.Z Deployed
这种”利润共享”模式在零售行业几乎独一无二。它的直接结果是:员工流失率仅约 2%,而行业平均为 20-30%
《鲜花与面包》,冯子豪的单口专场, 在上上周单利人原创喜剧大赛中,冯子豪获得了亚军,冠军是贤鱼,季军是丹妮。这 3 个人中,贤鱼属于疯子,用冯子豪的话说,没有人可以在舞台表现力上战胜贤鱼,丹妮属于百变,段子充满了巧思,看似是互动,实则全是设计,相比之下冯子豪就显得有些特殊,是很传统的单口演员,属于刻板印象的单口演员。在这之前我不认识他,直接花 99 块卖了票,还不断的和同事安利,果然,3 天后专场价格涨了 40 变成了 139 ,但同事也没有人买。
这个专场前半场靠着刻板印象,后半段靠生活经历:一个山东济南人在成都生活,可惜单口中出名的山东演员太多:张灏喆、孙书恒、唐香玉、徐志胜、何广智、孟川,太多了,已经把山东的刻板印象讲遍了,很多梗我都猜到要说什么,没那么巧妙。在讲自己高考经历的时候,提到自己是 00 后,2002 年出生,高考那年是疫情发生的那年,2020 年已经是 6 年前的事情了。
《气候变化与人类未来》, 读完之后感觉人类没救了,爱咋咋地吧。
部分摘录:
在大多数情况下,民众并不愿意承担比如碳定价之类的措施带来的经济成本,因为他们没有意识到处理气候变化问题的紧迫性。虽然不采取减排行动可能给未来造成严重后果的事实已然十分清晰,但是,人类或许仍然无法应对这次风险,而且,留给人们改变现状的时间已经所剩无几。
即使我们接受这样一种观点,即人类现在已经走上了一条通往未来的道路,这条道路可能会破坏他们目前的生活方式的基础,而且可能是彻底破坏,但这对于整个地球本身来说没有任何影响。地球的大气和地质过程将会像以往一样调整并过渡到某种新的平衡状态。
无论发生哪种情况,地球都会继续运转下去,只是许多现存物种可能会出现新的大规模灭绝,这类事件在遥远的过去已经发生过很多次。我们知道,幸存的生命又会重新振作起来,以新的方式继续生存。
如果我们在某个时候决定尝试通过减少人为温室气体的排放来阻止地球温度继续上升,那么我们这一决定的积极影响,即温度不再上升,将在几十年后才会在大气中显出来。
截至2019年,签署巴黎协定的151个国家约占全球76亿人口的46%,但温室气体排放只占全球的15%左右。在这151个国家中,许多国家仍然处于不发达和贫穷状态,毫无疑问,它们未来需要发展经济和使用能源。更重要的是,六大主要排放实体之一的印度也面临这种情况。
AI 把执行成本压到了接近零,但判断成本一分没降。而大多数人一辈子都在逃避的,恰恰是判断。
2026-04-12 08:00:00
The Future Isn’t Model Agnostic · The Fly Blog
Your users don’t care that your AI project is model-agnostic.
Every startup pitch deck with ‘model-agnostic’ as a feature should become a red flag for investors who understand product-market fit. Stop putting ‘works with any LLM’ in your one-liner. It screams ‘we don’t know what we’re building.’
这里的一些观点和 Ampcode 是一样的。
$200 in Stripe fees when you’re making $5K/mo doesn’t register.
Crossed $50K MRR last quarter and actually looked at the number. $17,400/year. More than I spend on infrastructure. More than marketing some months.
哇哦,这个收费水平, Stripe 感觉是大赢家。
A little copying is better than a little dependency. Rob Pike 2015 年的这句话在 AI 时代可能有新的理解。
原文中可能最有趣的一点是 Dijkstra 在最后补的一段话,他说:“我怀疑,那些能够用我们的母语——无论是荷兰语、英语、美式英语、法语、德语,还是斯瓦希里语——来编程的机器,不仅制造起来极其困难,用起来也同样困难。“
他老人家可能没想到,这种机器(及其软件)在不到半个世纪之后就做出来了,现在用自然语言“编程”方便又快速,唯一问题是写出来的代码,就像他担心的,充满着各种风险。
也许第二次软件危机真的就要来了。
Kimi 并不独特,公司并不是没有管理,而是在当前的市场洞察和业务设计下,基于领导者的战略意图与价值观,自然演进出来的文化氛围与组织设计 (这段是为了证明我真的学过而故意不说人话)。说人话:AI 时代每周都有大变化,传统的季度/双月 OKR/KPI 拉通对齐那一套怎么可能跟的上。
Kimi 并不独特,有人的地方就有政治,屁股决定脑袋是人类社会的必然规律。300 多个不同背景、不同经历、抱着不同目的的人,毫无隔阂相互完全理解,这不仅仅是天方夜谭,我愿称之为 1984/美丽新世界一般的反乌托邦恐怖场面。在相对粗放的管理状态下,不合适的 (意思就是我不喜欢的)人显然也有不少。
流传比较广的那篇公关稿的叙事风格非常的模板化。“Kimi 并不独特”。
RedHat 的一篇如何利用 LLM 来解决自己维护 Rego 规则的文章。LLM 通过 MCP 从 K8s 集群获取信息,然后基于信息生成报告,由人类 review 最终要上线的规则。感觉这里之所以可以这么搞,很大的原因是黑名单机制,最差情况下,也就是有些禁止行为没有被限制,在有一些现有模板的情况且 dryrun 运行下,影响不大。如果是白名单机制,为了安全和灵活,规则数量爆炸,LLM 上下文出现幻觉的可能性增大,就玩不转了。
The Friendship Recession: The Lost Art of Connecting — The Leadership & Happiness Laboratory
文章中给了一种解决方式:拥抱不适,建立友谊需要冒险,不适感是冒险的组成部分,并需要持续的维护。
Tailscale pricing update: clearer plans, more value
TailScale 个人版本现在支持 6 个用户,3 个 ACL groups,50 个 tag,无限制的设备。确实是大善人,虽然我主力已经切换到了 EasyTier,但是我还是会安装上 TailScale 以防万一。
Garmin authentication landscape (Garth, upstream issues, react branch)
手表选择 Garmin,很大一部分原因是社区有这完整的 API,隔壁高驰需要走申请渠道才行,现在这样搞,导致我的一些数据同步分析脚本都失效了,很难受。
DNA 成员的流动性和丰富度是最好的,所以会给我一种贴近大地的感觉:在区块链行业牛市时日常看到的信息都是谁一天赚个几百万,没个 8 位数资产不好意思上桌说话,而在 DNA 一个月只花三千块也可以过得挺不错啥都不缺;
见惯了大家高学历,进大厂,精致好看,丰盛一餐,野心勃勃,偶尔狂欢,而在 DNA 会感受到,比日咖夜酒更开心的,是日咖夜酒时旁边总坐着不会 judge 你的伙伴。
我看过很多次 DNA 的介绍,也几次试图去体验一次,但是总是迈不出那一步。
我间接性地把我的智慧分享给了所有人。虽然它被剪碎了,它变成了流体,里面没有我的名字,没人向我致以谢意。但 Again,我没那么在乎这个 Credit。我不觉得大语言模型剽窃了我什么东西,因为它是真的把我的东西学习走了,并且把我的思想传递出去了。只要它没有直接把我的工作 copy and paste,没有在做低端洗稿,对我来说这就不是剽窃,而是学习。作为一名教育工作者,我教育了一个非常伟大的东西,这是一件让我感到非常自豪的事。
我问他们如果是这样为什么不把这两个概念做合并,他们说这个是他们的产品经理设计的,但是他们的 PM 现在离职了所以成了遗留问题…)。
B 的产品建立在我的知识库之上,我原以为他们只是想让我们把召回的逻辑迁移掉,然后他们继续在我们现在都产品上构建其他业务,但是当我终于和另一个团队联调完数据迁移的差不多后,他们说后面就直接用另一个团队的产品了。
我直接一个大无语,如果他们还在我的知识库上,我最起码还可以在产出上多写一条支撑 xxx 业务建设之类,合着纯纯是想着卸磨杀驴?生怕我不配合所以刚好卡在我差不多搞完后才说。
哎。
《飞行家》,蒋奇明、李雪琴主演的电影,改编自双雪涛的同名小说。蒋奇明演的挺好的,“可做任何工种“的状态感觉和我现实生活中的不一样,现实中看到的更多是麻木。看完之后想再去看一遍《钢的琴》。
Davy 的主打秀,据说是他正式专场前的最后一场测试,内容确实不太行,最后只能靠口号来带动气氛了。这场只卖了 100 多张票。开场演员很不错,丹妮,现在很少有女单口演员追求纯粹的好笑了,互动效果很好,如果有她的专场我一定会去看。(20260413 追加:在今年的单立人原创喜剧大赛中,丹妮获得了季军)
《马拉松全方位科学训练指南》,长跑训练教科书。
《伤不起的崴脚》。总结:崴脚先去看医生,如果是小伤,那不会花多少时间;如果是大伤,早介入早治疗。
《自主可信计算技术体系》,周末在图书馆发现的新书,正常日常经常能看到:等保、可信、国产等需求,翻来看看,感觉是听了一个领导在开会,看的云里雾里。以下是一些摘录:
当前安全方案大多数由商业公司提出,存在以下局限性:体系化安全机制缺乏理论指引,更多从工程经验出发;安全机制各自为战,缺乏有机配合;商业炒作现象严重,缺少科学评估方法。
等保 2.0,全称是网络安全等级保护制度,以网络系统作为保护对象。等级保护 2.0 的理论基础就是可信 3.0。可信 3.0 是目前可从体系结构层面全面支持等级保护 2.0 的唯一技术。
在智能安全卡项目成功的基础上,考虑到当时我国政府机关的安全需求和大量使用微软 Windows 操作系统的状况,中软决定于美国微软在 Windows 网络安全方案上进行项目合作,由沈昌祥院士基于主动免疫可信计算的技术路线确定了安全方案。中软公司成立了中软华泰分公司,投入精英技术人员,在 21 世纪初完成了开发工作,产品设计方案巧妙,使用国产密码算法,性能优异。但当时美国将密码视为军火类产品,对软件的密码应用提出了严格限制。项目在结题前,微软引用美国法规,提出美国禁止开放密码接口,因此该项目不得不终止。
国产化信息系统是否更安全呢?答案是否定的。国内对应的国产化替代企业技术实力相对薄软、技术积累缺乏,产品版本的技术投入是国际同行的几十分之一甚至百分之一,也缺少安全生态环境的适配测试支持。
不同安全保护等级的要求:一级,自主保护;二级,指导保护;三级,监督检查;四级,强制监督检查;五级,专门监督检查。
2026-03-29 08:00:00
Deno 最近离职了很多人,这篇文章对 Deno 的一些功能进行了讨论,讨论的话术确实有些严厉。
How a Poisoned Security Scanner Became the Key to Backdooring LiteLLM | Snyk
Supply Chain Attack in litellm 1.82.8 on PyPI
litellm 被发现包含恶意代码,因为安全扫描器 Trivy 被黑掉了,影响范围非常大。
Apifox 供应链投毒攻击 — 完整技术分析 - 白帽酱の博客
如果你在 3 月 4 日之后打开过 Apifox,你的 SSH 密钥、Git Token、K8s 等配置可能已被窃取。CDN 上的 JS 文件被注入后门,通过伪装官方域名回传数据,Cloudflare 托管仅存活 18 天。攻击者留下了中文注释,疑似 AI 开发 C2。全平台受影响,立即轮换所有凭据。
连续发生的第二起影响范围较大的安全事件。
depot 推出了自己的 CI 系统,语法完全兼容 Github Action,运行在自己的 Infra 上。从上个月他们那篇比较 QEMU microvm 和 Cloud Hypervisor ,就有预感要扩大业务范围。
这方面的一个经典笑话是,2016 年有好事者模仿 XKCD 漫画里的馊主意,在英国注册了一家名叫
; DROP TABLE "COMPANIES";-- LTD的公司,而且竟然通过了。结果,英国议会后来专门通过立法,规定公司不得采用是国务大臣认为属于或包含程序代码的名称,而这家公司的名字也被「 打码 」成了[NAME AVAILABLE ON REQUEST FROM COMPANIES HOUSE],致信询问才展示。(似乎没有报道表明有计算机或动物因为这个恶作剧受到伤害。)
这篇文章好有趣啊,我暂时能想到的还有:
A one-line Kubernetes fix that saved 600 hours a year
Kubernetes 默认的 fsGroupChangePolicy: Always 设置,导致在挂载包含数百万文件的持久卷时,递归执行 chgrp -R 更改文件组权限,最终耗时 30min。通过修改配置为 OnRootMismatch 解决。
OnRootMismatch:只有根目录的属主与访问权限与卷所期望的权限不一致时,才改变其中内容的属主和访问权限。这一设置有助于缩短更改卷的属主与访问权限所需要的时间。
Are bugs and incidents inevitable with AI coding agents? - Stack Overflow
AI vs human code gen report: AI code creates 1.7x more issues
CodeRabbit 对一些 Github 仓库进行分析,得出的总体 AI 产生的 Bug 数量是人类的 1.7 倍,最大的问题是逻辑和正确性,AI 比人类多出 75%,还有一些其他问题,比如安全问题、并发处理、错误处理等,大多是 1.5 倍到 2 倍,性能问题比较突出,AI 生成的代码过度 I/O 操作发生率是人类的 8 倍。
不过这家公司是利益相关的,所以真实性需要再观察一下。
Inside Gen 13: how we built our most powerful server yet
CloudFlare 第 13 代服务器选型说明,服务器的设计寿命是 5 年(在现在硬件成本这么高的背景下,有些用户的服务器已经延长服务周期了)。采用了 AMD EPYC™ 9965 Turin 192-Core Processor,768G 内存,100GbE 网卡。关于内存大小的配置,他们采用每个核心 4G 内存的配置方式。硬盘需要保证 1DWPD,最后采用了三星的 PM9D3a 和镁光的 7600 Pro,如果后续需要更高的写入寿命,会通过预留空间的方式来处理。
霸王茶姬战略诊断报告:当扩张惯性撞上价格敏感时代 - 三杯过后 | Xiaowen.Z Deployed
霸王茶姬原有模式成立的前提,是”高线城市核心商圈消费者对中高端茶饮的价格不敏感心智”。这一心智支撑了 15-20 元的定价、62%的毛利率,以及加盟商的快速回本
美团、饿了么、京东三方的 0 元购、9.9 元奶茶频现,快速教育出消费者的比价习惯。蓝鲸财经 2025 年调研显示,仅 10.05%的消费者经常购买 25 元以上的茶饮产品,58.8%明确表示关注价格
有趣,巨头们打架,把霸王茶姬的商业模式打没了?
我对温州的刻板印象,最深的应该就是: 【微小微】鬼畜舞蹈 江南皮革厂倒闭了 (纯属好玩)_哔哩哔哩_bilibili ,然后就是单立人的佳佳。
核心观点就是「预期管理」,在各个方面,不只是产品,如果你不设定预期,那么别人就会根据你的历史行为脑补一个预期,当你因为各种原因达不到经验预期时,就会带来“麻烦”。
预期管理不能是逃避责任,有的人几乎每一句话都会带有“可能”、“也许”,这种合作方会很难受,尽可能的给出可量化的回复,或者说最坏情况是什么,需要他人主动提供什么来能够增加确定性。
《Conversations with Zygmunt Bauman》, 中译版本书名是《我们如何理解这个世界-与齐格蒙特·鲍曼对谈》,鲍曼是 《工作、消费主义和新穷人》作者,这本书是他的学生和他的五场对话,主要发生在 2000 年。对话分别是:语境与社会学的视域、伦理与人类价值、现代性的矛盾性、个体化与消费社会、政治。
以下是前两章的部分摘要:
桑内特提出,当代文化极大地侵蚀了公共生活,以至于公共与私人之间的界限已经被摧毁。在我们的文化中,我们不再因为某人在公共场合举止文明或有礼而说他是”好人”,相反,我们试图了解人们的一切。对亲密的渴望取代了公共生活;无论对谁,我们都想获得亲密的信息,以及一种”真正了解”这个人的感觉。人们的私生活和小过失成了衡量他们价值的标准。
我们关注的不再是他们是谁,而是他们做了些什么。桑内特说:“在这样的社会里,人们相互之间的真诚和’坦率’,成了亲密关系中的交易的一个特殊标准。“如果我们准备好将一切事情都告诉别人,我们就被认为是好人和诚实的人。
只有当我们对自己的物质安全和自我都有所确信时,我们才能希望和欲求更多。
如今我们比以往任何时候都更需要小心,避免落入时代风尚的陷阱,这些时代风尚很可能比它们声称要治愈的病症更具破坏性。经历了这些不浪漫的岁月后,我们这份志业或许会再次成为勇气、执着与对人类价值之忠诚的试验场。
“抽象’思考者一早就知道他自己的真理,他不为别人思考,也不为别人说话;而’对话’思考者则无法预见任何事情,他必须等待’他者’开口说话。他在对某人说话,这个人不仅有耳朵,还有嘴巴。对话开始时,它并不知道要往何处去,它得从别人那里得到提示。”
我认为,“即刻过时”加”遗忘”是垃圾经济中不可或缺的一部分,因此我怀疑,不管它们听上去多么荒谬,宣告”历史的终结”或”社会学基石的终结”之类的言论都将继续被提出。但我们社会学家是最清楚这一点的。所谓的”现在”,只是对过去的不断回顾和重新总结而已。米兰.昆德拉曾写道,片段的美妙之处在于,它有一个明确的结局,而片段的残酷之处在于,你永远无法知道它是否真的是一个片段。并不存在”魔鬼岛”,或是装有高科技保安系统的监狱,能让那些被流放者无法回来侵扰我们。
如今,我们被要求相信一种观念:安全会削弱人的力量,剥夺人的能力,会滋生令人憎恶的”依赖性”,总而言之,会限制人类作为能动主体的自由。但人们没有意识到的是,在没有安全网的情况下进行特技表演与走钢丝,是只有极少数人才能掌握的技艺,对所有其他人来说,这都意味着灾难。一旦安全被剥夺,自由将成为第一个牺牲品。
然而,公众对屈辱的敏感性及其抗议通常是选择性的。在任何时期,总是特定的一些群体,以及特定类型的屈辱能够引发愤怒并促使社会采取行动,而其他类型的屈辱,要么不被承认是亟须解决的问题,要么被视为超出人类能力的范围,抑或被视为”自作自受”,无法通过”外部干预”来消除或预防。
我们常听人说,用以理解社会现实的主流思潮已从阶级转向文化。在我看来,这是对实际上发生的转变所做的一种错误的概念化描述。事实上,当今社会的明显趋势是:将资本主义文化固有的”市场与财产游戏”所导致的阶级分化、屈辱和不公重新塑造为”自然事实”,即人类作为一个集体无法改变,而只能卑微地接受和服从的事实(通过取代了”历史法则”的”市场法则”)。
与此同时,公众的道德警觉性则被引向他处,聚焦于那些拥有足够资源、能够选择自身生活方式、要求社会接纳其生活方式的群体和类别的”承认诉求”。尤为值得注意的是,贫穷这最典型的阶级现象,被重新定义为种”自我招致的痛苦”,而社会层面的救济尝试被认为只会加剧这种痛苦。
自古以来的每个已知社会中都存在穷人,但今天的穷人或许比以往的穷人陷入了更多的麻烦,因为这是有史以来第一次,他们没有任何社会功能可以履行,因此被排除在属于社会行动范围的事务计划之外,也成了社会任务和社会抱负的局外人。
埃里希.弗洛姆指出,在一种缺乏”真正的谦逊、勇敢、信心自律”等品质的文化中,“获得爱的能力必然也是一项罕见的成就”。随后他进一步指出,这种品质的稀缺正是我们所生活的社会的灾难之源。如果”现代资本主义需要…那些不断消费的人”,如果”当今人类的幸福在于’寻欢作乐’“,如果”世界成了我们欲望的一个巨大客体一个巨大的苹果、一个巨大的奶瓶、一个硕大的乳房”,而我们则成了”吸吮者,永远在渴求,永远在希望,却永远感到失望”,
那么,“尽管每个人都试图尽可能接近他人,但实际上每个人都身处彻底的孤独之中,始终被那种深刻的不安全感、焦虑和负罪感所笼罩,而这些情绪正是人与人之间的隔阂无法被克服的必然结果”。简而言之,我们学会爱的艺术,进而意识到爱是人生终极意义的体现,并将从爱中得到的满足视作礼物而非占到的便宜,这样的机会是渺茫的。
2026-03-22 08:00:00
一个 CRUD 不需要文件抽象:AI Agent 时代的架构设计
当前方案为一个简单的 CRUD 操作,主动引入了分布式异步架构的全部复杂性,却没有实现其中任何一项可靠性保障。既承担了最难问题的成本,又没有得到最难问题的收益。
方案暴露的深层问题是对流行理念的盲目套用。
最后值得一提的是:技术选型中最危险的不是无知,而是偏好伪装成依据。当一个设计者对某种范式有强烈偏好时,他往往会先做出选择,再为选择寻找合理化的理由——「顺应心智模型」、「Agent 擅长文件操作」、「Config as Code」。这些理由单独来看都成立,但它们被组装在一起的真正原因,可能只是一个朴素的偏好:「我觉得用文件表达更优雅」。
一个细节足以说明问题:同一个定时任务功能,查询执行历史走的是 API,创建和管理却走了文件——如果「文件是 Agent 原生操作对象」真的是经过推导的技术结论,它应该一致地适用于同一功能的所有操作,而不是只覆盖其中一半。
偏好本身不是问题,把偏好当作技术论证才是。 先有结论再找理由,不叫技术选型,叫自我说服。
Astral to join OpenAI
Thoughts on OpenAI acquiring Astral and uv/ruff/ty
OpenAI will continue supporting our open source tools after the deal closes. We’ll keep building in the open, alongside our community – and for the broader Python ecosystem – just as we have from the start.
Astral 加入了 OpenAI 的 Codex 团队,一直对 Astral 的商业化进展有怀疑的,现在故事迎来了大结局。以及 Simon 对这次收购的一些想法:
So is this about the talent or about the product? I expect both, but I know from past experience that a product+talent acquisition can turn into a talent-only acquisition later on.
Those investors presumably now get to exchange their stake in Astral for a piece of OpenAI. I wonder how much influence they had on Astral’s decision to sell.
Every layer of review makes you 10x slower - apenwarr
**But you can’t just not review things! **
读了,又好像没读,挺怪的。涉及到人和人之间的关系,总是很复杂。
4G Spaces — 2016 年,我做过一次 AI 写代码创业
这件轶事最让我感慨的地方在于:我们这些身处其中的人,其实一直都被未来的迷雾包围着。所谓“看对了方向”或者“看错了方向”,很多时候并不足以决定你最后会走到哪里。
你也许看见了未来,却没有资源;你也许拥有资源,却走向了别的方向;你也许参与了最关键的基础工作,却仍然不知道它会在几年后如何改变世界。
做事情的时机很重要。最近和同事聊到龙芯架构的移植工作,如果在现在, Agent 搞移植搞起来飞快,估计生态也就不会这么难受了。
关于 review 部分,我最近在 review 时,习惯让 AI 来生成 3 份文档:
你是一名软件工程师,根据当前分支和 master/main 分支差异,基于以下设计方案,生成 3 份文档:
a. 当前实现代码的 review guide,用于实际 review 参考
b. 基于方案和实现,提出 10/20 个问题,并附带每个问题的答案,便于我在 review 代码完成后自我检查是否有遗漏的细节;
c. 给出当前实现的 review 建议,并指出是设计方案不相符的地方;
它真正改变的,是「编程能力」的价值分布:
- 生产代码的能力,在贬值。
- 验证代码、理解系统行为、判断一个系统是否真的解决了问题的能力,在升值。
Agent Experience 导论 | 螺莉莉的数据中心
沙箱是目前公认最靠谱的缓解方案,把 Agent 关进 Docker 容器里,它乱来的代价至少被限制在容器边界之内。Coding Agent 放沙箱里是一个合理的操作,但 Claw 这类系统级 Agent 放沙箱里会面临一个两难:它需要操作的东西本来就在沙箱外面,一旦开始认真配权限,复杂度会让大多数用户望而却步,最终还是会选择把沙箱打开。沙箱本质上是在用隔离换安全,但如果 Agent 的任务本来就需要跨越隔离边界,这个代价就变得无法接受。
一个只会 Say Yes 的员工组成的公司大概率会干黄了,这件事在管理学里是常识,在 LLM 领域却很少被正面讨论。它会造成什么后果?接下来发生的事情,按照伤害的可逆程度从轻到重,可以看作是一整条漆黑有悲惨的教训清单。
用户不断向 LLM 投入问题,期待某一次的回答能真正回应自己内心真实的困惑,但 LLM 每一次给出的都是统计意义上最讨喜的答案,这个循环没有终点。这些心理层面的伤害不可见,没有新闻报道,没有诉讼案件,但覆盖的人群可能是最广的。
关于“You are absolutely right.”部分写的太好了。
How we reduced the size of our Agent Go binaries by up to 77%
对照着分析了一下我维护的项目,发现主要原因是 import 的一个 sdk ,sdk 是用 go-swagger 自动生成的,sdk hq在 client.go 中 import 了所有的 pkg,导致即使实际使用很少,也会包含全量的 models。
Gell-Mann amnesia effect
Describe the phenomenon of experts reading articles within their fields of expertise and finding them to be error-ridden and full of misunderstanding, but seemingly forgetting those experiences when reading articles in the same publications written on topics outside of their fields of expertise, which they believe to be credible.
My heuristics are wrong. What now? - Marc’s Blog
You can’t throw out everything you know. Your taste, your high standards, your understanding of your business and customers and the deep technical trade-offs in your area are more valuable than ever before.
This is like that fantasy that people have of going back to middle school knowing all the things they know now. You’re ahead of the pack in many ways.
《挽救计划》,2026 年在电影院看的第一部电影(查了一下上一次在电影院看的是《F1:狂飙飞车》)。原名是《Project Hail Mary》, Hail Mary 通常是橄榄球比赛中最后长传,如果成功则反败为胜。这么看翻译成《孤注一掷》也不错?这部电影的编剧是安迪威尔,也就是《火星救援》的编剧,在去看之前,看到的营销话术是近 10 年最好看的科幻,为什么是近 10 年,因为上一个 10 年有《星际穿越》,很多人抱着《星际穿越》的期待去看,难免失望,应该抱着对《火星救援》的期待去看,就会觉得这部电影还不错了。
孤独。拯救。勇敢。浪漫。
推荐观看。打算看看原著小说(突然发现《火星救援》小说是豆瓣 TOP250 中的 249。
2026-03-15 08:00:00
Agent 原生系统通知实现总结(Claude、Codex 等)
通过 OSC 9(Operating System Command sequences,操作系统命令序列)来触发系统通知
tty="$(tmux display-message -p '#{client_tty}' 2>/dev/null || true)"
printf '%b' "$(printf '\033]9;%s\a' "This is the notification text")" >"$tty"
好东西,解决了一个小困扰,日常远程开发,经常要执行完长时间命令的时候希望能得到一个通知,现在可以用 OSC 9 来实现。
这玩意儿的输出倒是非常的清晰明了,一眼就看出了哪个进程在跑流量:其中一个名为“idleassetsd”的进程(现场已破坏)。但是……搞笑的事情出现了:此进程在活动监视器里面不存在,是一个被系统隐藏了的进程!(无论是按名字搜、还是 PID 排序后人肉搜。)
原来 MacOS 的“活动监视器”不能看到所有进程信息。
Analyzing first-party fraud trends: Account, free trial, and refund abuse
In fact, AI startups that offer free trials with self-serve sign-ups and direct API access see 10x more attempted abuse than enterprise AI solutions.
Stripe 发布了 Radar 产品,用来检测用户支付方式是否存在滥用的行为,滥用包含:同一支付方式注册多个账号、重复申请试用、使用盗刷信用卡。根据 Stripe 的分析,AI 公司 7.4%的客户注册涉及多账户滥用。
还是绕不开的话题,传统 SaaS 的毛利率是很高的,获客成本的边际成本趋近于 0,滥用也就滥用了,至少账面上的数据是好看的; AI 公司的毛利率不高,每一次调用的算力成本是实打实的,每一次滥用都会直接放血,相应的获客方式也一定会发生改变。
Anduin的CQE定理:为什么大型组织的采购永远在买电子垃圾 - Anduin Xue
嗯, Nobody ever gets fired for buying IBM 。
对exec.Cmd.CombinedOutput的一点研究 - 陪她去流浪
type Cmd struct {
// If Stdout and Stderr are the same writer, and have a type that can
// be compared with ==, at most one goroutine at a time will call Write.
Stdout io.Writer
Stderr io.Writer
}
虽然但是,我不喜欢(主动禁止)使用 CombinedOutput。
Software companies buying software: a story of ecosystems and vendors · Erik Bernhardsson
Modal 老板的文章:越来越多公司倾向于从“自建”转向“采购”,公有云是这一切的起始,经济原因会让安全合规让步,vendor 通过向更多的用户提供解决方案,来更好的专注于解决单一问题,初创公司起步更快但利润率变低,要想将软件卖给客户,和客户离得近优势比想象中大。
Agent 的执行是概率性的、长程的、带状态的。它的决策路径不可复现,副作用不可撤销,而且运行时间长到崩溃是统计必然。
设计目标不应该是保证机器不挂,而是在故障发生时保住执行语义的正确性。
Infra 不应该追求模型永远正确,而是让模型的错误变得可预测、可隔离、可挽回。在模型的不可预测性周围画出确定性的边界,用系统的确定性收敛模型的不确定性。
读着读着确实想到了 Temporal 是否解决了部分问题,文章也解释了为什么不行:
- 第一,Temporal 的容错依赖 replay 机制,前提是代码是确定性的。LLM 崩溃后重放,会走不同的决策路径。你必须把每次 LLM 调用的结果全部缓存,replay 时直接返回缓存结果。这时候你实际上是在 Temporal 之上自己实现了一套状态机,Temporal 的 replay 机制反而变成了额外的约束成本。
- 第二,Temporal 的最根本的基础假设,是代码逻辑本身是可信的,只是 Infra 会出错,比如网络抖动、进程崩溃、机器故障等。但 Agent 的问题是 LLM 输出本身不可信,Temporal 会忠实地执行一个 prompt injection 攻击,因为从它的视角看,这就是 workflow 的正常逻辑。这意味着需要在 Temporal 的执行模型之外,独立构建类似 Capability Gateway 的能力隔离层 ,但 Temporal 没有这层预留集成点,它的 activity 边界是执行边界,不是信任边界。你需要自己在两套系统的接缝处维护一致性,而这个接缝处恰好是攻击面最大的地方。
牛屋的绿植从每周一换的蝴蝶兰,改成便宜的绿球花,最后干脆开始使用不需要更换的假花;
2023 年,蔚来为 3 万名员工累计举办了大大小小的 1740 场团建活动,到了 2024 年,这类活动骤减到全年 28 场,2025 年继续取消兴趣社团的活动经费;
不容易,都不容易。
随着就业市场不断的萎缩,很多难称行业翘楚的人都纷纷离开了这座城市,但是整个大环境就是这个鸟样子。这种经济的萎缩就像这座城市的胃不舒服一样,它一使劲就会把居民呕吐出去,从三环呕吐到四环、从四环呕吐到五环、或者直接喷回老家。
从这个角度来看,这座城市对于外来人口没那么友善。这和上海那种本地人瞧不起外地人的不友善不一样,北京给人一种它公平地漠视所有人,没有任何情感,没有热情也没有厌恶。
回看我离开北京的决定,无论是从各个方面来评估,都无比正确。
Kai丨【2025年眼镜的选择全攻略】v1.0.3 - 搞七捻三 - LINUX DO
又是一篇眼镜选购指南,感觉每一年或两年更换一次眼镜,对生活幸福感提升还挺明显的。
但凡看过就能发现后腰从上到下只有一个泌尿系统,但凡后腰疼大概率是肾的问题。
我看有的疼痛等级指数介绍肾结石已经是最高级了,能和自然分娩坐一桌,想到可能还有一周整个人是崩溃的。当时都想直接去手术取出来了,不过想了想手术还是有创伤,理智战胜了冲动,还是打了针止痛回家了。
大家多喝水,多运动。
《疑犯追踪 第一季》,POI,2011 年播出的美剧,单元剧,即使不是连续观看,也不影响理解。讲述的是911 事件后,美国政府让一个纽约的亿万富翁,开发了一个 AI 系统,能够通过监控摄像头、电话记录、信用卡交易等数据进行分析,预测即将发生的犯罪事件。主角团负责营救的故事。
主角特征是传统的宅男加硬汉的组合,完美符合“美强惨“设定。2019 年的英剧《真相捕捉》还停留在监控视频的篡改,deepfake,2011 的 POI 是直接让 AI 来预测犯罪。站在 2026 年看 POI,大家一直谈论 LLM,理论上 POI 中的功能都已经实现了:全局监控识别,数据监听,行为预测。