2026-01-26 12:06:00
这个月读的书稍多一点点, 首先是一人公司做私域, 这本名义上是书, 实际上是引流广告而已, 没什么读的必要. 然后是一个欧亨利的短篇小说集, 这本和我高中时读过的另外一本没什么大的区别, 印象深刻的是之前那个选本没收入的公主与美洲狮, 以及他未完成的手稿, 梦. 接下来是普通人如何做小红书, 这本比我想象中要实在, 介绍了很多心得体会, 是我的本月最佳. 最后是昨天花了三个小时一口气读完的太白金星有点烦, 这本数次逗得我大笑, 也数次鄙视微信读书里那些感觉没读过原著的人没理解亲王的梗. 但是这本最大的硬伤是国内的体制实在是一种很奇葩的存在, 因此这些政治笑话不能说有太多的普适性, 水平上比是大臣/是首相这种还是要稍差一点点.
游戏来说, 玩通了逃离鸭科夫的第一个结局(也是难度最低的一个结局), 农场镇的boss都打过至少一遍了, 实验室转了几圈后懒得往里面走了. 半路劝退我的大概是这样几件事情:
Netflix里, 这个月看完的两个片子都告诉我不要害怕失败. 一个是100 meters, 里面的人物也会有挣扎, 也会有崩溃的场景, 但是无论如何, 这些人还是能够爬起来, 继续往前走. 这部的缺点是主线不够明确, 看得出来想要走多主角并行的故事, 但是在这个电影里非主角的背景交待得不够多, 所以有时候会有喧宾夺主的感觉. 第二个是昨天直播的Alex Honnold直播徒手爬台北101的Skyscraper Live, 真令人羡慕有这样的心理承受力. 另外, 无聊放松的时候随便从我的电影库里面找了两个老片看, 一个是加勒比海盗5, 视觉效果片. 另一个是更老的新龙门客栈, 这个电影豆瓣有8.7的高分, 其中9分都是张曼玉的, 其他人是在拖后腿.
另外, 这个月还看了Youtube上柴静对严歌苓的采访, 谈芳华和文革. 严的状态挺好, 敢说真话, 敢说直话, 不藏不掖. 另外, 里面有句话让我印象很深刻: “文学都是萌发于记忆的不可靠性”.
下面记录一些我最近是如何和AI协作的:
也会颔首互道一声"久仰"和静静听着都有些现代汉语的表达习惯, 在古代白话中是没有的. 这样, 至少可以避免你写中国古代背景的武侠小说里, 出现焦距这样让人出戏的词语.在和AI合作了这么长时间后, 我也有了一些自己的心得: 在这个和AI共存的时代, 高等级的鉴赏力是最稀缺的资源. 比如AI写出来的小说梗概是不是合理, 是不是有一个好的内核, 是不是值得继续衍生发展, 都需要一定的文学鉴赏力. 而选定方向后, AI写出来的内容, 节奏感, 音韵感, 都大概率是不达标的, 都是需要人来读, 来朗读, 来指导AI提高的. LLM的机制决定了AI学习到的内容的水准不会高, 所以更需要人在其中来充当阀门, 掌控内容的输出. 又比如摄影, AI固然能够保证我的拍摄能够有一个底线, 不会差到哪儿去, 但是对于如何拍出好的照片, 仍然是需要大量的联系和大量的阅读, 真正提高自己的鉴赏水平. 换句话说, 对于掺杂了主管成分的艺术创作, 不管是写作绘画还是摄影, 甚至编程也可以算得上: AI能帮你入门, 但是至少目前没办法帮你精通.
2026-01-07 06:43:00
更新: 因为GLM-ASR的单次音频识别长度只有30秒, 我回退了我的修改.
这一两年AI用得很多, 我也养成了一个口述的习惯: 虽然不太常见, 但是偶尔我会希望去口述一些内容给AI, 而不是自己逐字手打出来. 比如, 对于一些长文档的review, 或者对Claude Code的一个长的plan的review. 之前我vibe code了一个rust版本的工具, 叫murmur. 基本功能在这个页面里说得比较清楚了. 简而言之就是命令行不带参数的时候是等着语音输入, 然后转成文本, 并丢给OpenAI润色一遍后给出来. 如果带了参数, 则认为参数是音频文件名, 会提取音频文件里的文本.
在Claude Code还没有ctrl-g来打开编辑器的时候, 我使用murmur的频率还会更高一点. 除了日常当工具在工作中使用外, 我还用这个工具提取了一些纪录片的台词. 总体来说, 我对这个工具还是挺满意的. 不过要说吹毛求疵, 我主要的不满意在于对OpenAI的依赖. 根据我自己毫不科学的体验, whisper API有时候返回质量会比较差. 于是, 我一直在找一个合适的开源实现来替代.
日本旅游回来后想找点小项目练手, 就看到了GLM ASR. 这个模型比较小, 参数量为1.5B. 自己测试了一下, 基本符合我的要求: 识别率在线, 对于中英混合的语句支持也和whisper API一样好. 为了上一点难度, 我用普通话朗读了李白的春夜宴桃李园序, 保存成音频文件后丢给这两个模型横向对比, 能够看到GLM还稍胜一筹:
浮天地者,万物之逆旅;光阴者,百代之过客。而浮生若梦,为欢几何?古人秉烛夜游,良有以也。况阳春召我以烟景,大块假我以文章,会桃花之芳园,序天伦之乐事。
作为对比, OpenAI的结果为:
浮天地者, 万物之逆旅, 光阴者, 百代之过客, 而浮生若梦, 唯欢几何? 古人秉烛夜游, 良友宜也, 况阳春朝我以烟尽, 大快甲我以文章, 惠桃花之芳园, 续天伦之乐事。
两个模型对于古汉语发语词”夫”的处理都不到位, 都被录成了”浮”. 但是从那以后, GLM的输出是全对, 而OpenAI的输出就差了一圈.
接下来就简单了, 我需要修改murmur的代码, 使用GLM ASR来替代OpenAI, 这份代码之前就是Claude Code写的, 所以仍然是Claude Code来帮我完成. 最主要的一个障碍是, 我本希望用SGlang来运行模型, 但是后来发现SGLang的容器镜像实在是有点大得离谱(>10GB), 于是还是在本地起了一个python的虚拟环境. 但是总体来说, 这种套壳在技术上没什么难点, Claude Code照着spec写一次就写好了.
2025-12-31 11:23:00
这个月很多筹划相关的事情, 包括安排日本的旅游, 读书不算多. 读完了一本教练型管理者, 单纯是因为这个名字和公司内部对manager的称谓就是coach. 读完后不太满意, 这本虽说是以实操性为主, 但是可读性实在是差. 只在乎是不是把内容呈现出来了, 但是完全没把内容呈现得好看并令人信服. 另外一本是猎奇性的奢侈品经济学, 分析学习时尚这个行当如何做市场营销, 挺有意思.
游戏来说, 终于通关了丝之歌, 一共105个小时, 93%的完成度, 懒得去刷100%了. 不过这基本是本月玩的唯一一个游戏了. 在旅途上看完了是大臣和是首相, 觉得这么好的台词, 需要重刷. 另外, 在日本的一天早上看完了Netflix上的日本沉没, 在日本本岛看这个剧, 代入感很强(比如前几天刚见过的富士山), 不过剧情实在有点太胡来. 另一个沉没主题的是Netflix上的The great flood, 灾难片的主题本来很好, 却生硬地往里面塞入AI的思辨, 真是令人摇头.
按着上个月的想法, 这个月开发了一个类似于暗黑三刷装备的页游, 目前还处于残废状态, 就不放链接了. 开发过程还是挺爽的, 看着游戏按照自己的想法一点一点成型, 那种创世的成就感是无可比拟的. 为了这个目的, 还在电脑上把游戏装了回来, 查各种数据. 在开发的过程中也发现自己还是很幼稚, 做游戏系统这个事情真不简单. 本来我的想法是把暗黑三的装备数据库抄过来, 然后自己筛选一下, 剔除掉不适合页游的装备就好. 但是装备上的数值直接迁移到页游时我遇到了比较大的障碍, 装备上的秒回如果给的不够的话, 游戏人物前期会各种死, 但是如果秒回给得够的话, 怪物的攻击又完全不疼, 所以一度是前期如果随机到回复的装备就一马平川, 而如果没随机到回复, 则是各种死各种卡关. 为此, 我也是各种调整, 到现在也还没有一个完美的解决办法. 后面还是得深入一点去研究这个过程中的机制, 然后有针对性地设计系统. 另外, 暗黑三里的游戏职业有很多个, 而我目前只做了野蛮人, 各个职业之间的平衡性还完全没开始着手. 各个游戏内的系统的开发也还是ongoing, 比如游戏的关卡设计完成后, 做了商店系统和宝石系统, 但是还有赌博, 大小秘境, 传奇宝石, 卡奈魔盒等各个系统需要开发. 本以为是一个一两周的项目, 不过现在也只能慢慢往前走了.
趁着圣诞假期跑来日本旅游, 路线大概是东京-京都-东京. 出发前查过天气, 感觉全程都会下雨, 但实际上运气却非常好, 大部分时间都没有下雨, 尤其是在京都, 很多时候是大晴天. 旅游景点都是人山人海, 所以挑几点回忆记录一下:
2025-11-29 09:27:00
这个月事情超级多, 所以书只是读完了一本一个叫欧维的男人决定去死, 这本书真的很反差萌, 本来是讨论一个沉重的话题, 故事里面也经常不经意给你展示出生活残酷的一面, 但是里面的各种比喻和展现出爱的那一面, 总会让人又对生活充满期待.
玩游戏来说, 重玩了一下kittens game, 边玩边觉得心里痒痒的, 想做一个仿品出来, 主题就是Diablo-like的刷装备.
丝之歌到了月底才缓慢进展, 过了第三幕的Trobbio和织女, 清掉了翠庭. 还有一群boss需要打. 我偶尔会在Youtube上看一下BlueSR的速通. 今天早上他刚刚又刷新了世界记录, 很厉害. 而且看他一边玩一边解说, 幽默感和人格魅力都是在线的.
影视来说, 看了水形物语, 人物脸谱化比较严重, 缺乏变化. 晚上锻炼时继续在看是大臣系列, 已经看到了第三部, 马上Jim Hacker就要升级当首相了. 非常喜欢这个三人组, 笑点满满, 很好.
最后, 月中整理自己浏览器收藏的时候重看了两个视频:
看到片段中的广州网易大楼的食堂/天台, 恍如隔世.
上个月月底的时候, 公司把所有澳大利亚和新西兰的员工全部召集到了悉尼, 参加为期两三天的Canva World Tour活动. 这次公司的行政人员很辛苦, 两三个月内要安排这么多人的机票酒店. 这还不用说要为了Canva Tech Day订ICC和为了Canva World Tour的主题演讲订奥林匹克公园就需要很多组织工作了.
这次酒店不错, 住的不是公司附近的小酒店, 而是Hyatt Regency, 餐标也由$100升级到了$200. 主要的槽点是第一天的机票太早了, 6点半, 所以当我坐进ICC开始听会时就开始打瞌睡. 尤其是Cliff一上台我就彻底睡着了.

另外, Tech Day下午有一个技术讨论里面分享的细节挺有意思. 这个讨论的主题是分享今年年内的那些sev 0(canva不可访问)的原因. 我们对AWS的依赖已经达到了比较严重的程度, 而且已经开始摸到各种瓶颈了. 比如其中一个sev 0是因为某个mysql数据库比较大的时候会有锁表的情况, 又比如ALB虽然看起来是一个无限使用的服务, 但是实际上它内部有一个100台实例的上限, 而我们的流量击穿了这个上限, 从而导致了我们的服务质量下降. 这个也不太能用草台班子理论来怪罪, 而是应该说, 对于任何不是自己维护/编写的软件, 都应该有戒惧之心.
这个月主持将一个git repository合并到了另外一个repository的工作, 这儿写一点笔记.
源repo A里面是一群小工具的集合, 目的地repo B是一个更大的monorepo. 两者都用Bazel管理. A里面除了有Bazel外, 打包还使用了nix. 这是因为由于历史原因, A里面有很多功能是用python/bash来实现的, 虽然后面的主流是golang.
为了实现这个repo的merge, 我们做了很久的准备工作:
这个月做的工作主要是:
说起来不多, 实际上杂事不少. 比如为了能保证B里面的CI能够正常工作, 就需要patch一堆代码. 又比如CD pipeline创建好之后, 我们才发现CD pipeline里面构建出来的Linux可执行文件在Linux下运行的时候会segfault, 为了解决这个问题也是花了好久, 绕了些路. 不过现在来看, 算是成功落地了.
2025-10-25 09:43:00
读书来说, 比上个月稍少一点, 只读完了4本, 不过收获比上个月要多一点. 按时间顺序来说, 首先是接着上个月的进度读完了金圣叹选批唐诗六百首. 做为金圣叹的粉丝, 我很喜欢这本, 它带着我走了一遍唐朝的七律们. 这本的体例大概是作者小传, 然后是律诗, 接下来是金圣叹的两段评论, 分别对应律诗的上下联. 读的时候, 如果我觉得诗读起来不上口不喜欢, 我就会快速略过评论. 只有遇到读起来舒服的诗, 才会认真读金圣叹的评论. 上个月的旗亭画壁的故事, 就是在这本书里读到的. 这个金圣叹选的集子让我读到了很多比较少见的作者的作品. 比如这个诗集中, 被选最多的作者是许浑(恕我驽钝, 从没听过), 一共有33首. 第二是李商隐, 29首. 至于为什么王建这个作者的诗选了21首, 是李白的三倍, 我是想不通的. 当然, 李白的7首不算太少, 总比同样闻名遐迩的孟浩然, 张九龄, 王昌龄要好得多. 至于杜甫, 在这本书里根本没出现, 不是因为杜甫写得不入金圣叹的法眼, 而是金圣叹实在是杜甫的粉丝, 把杜诗专门拿出来评点出了一本杜诗选注(第四才子书). 这才是真爱啊!
这本书里我最喜欢的一首诗来自于窦叔向:
夏夜宿表兄话旧
夜合花开香满庭,
夜深微雨醉初醒。
远书珍重何曾达,
旧事凄凉不可听。
去日儿童皆长大,
昔年亲友半凋零。
明朝又是孤舟别,
愁见河桥酒幔青。
不掉书袋简单易懂, 读起来音韵感很足, 也比较贴合我现在的心境.
继续说读的书, 下一本是重读了琅琊榜, 没特别的感触, 这本书虽然在微信读书上能够得到9分的高分, 但是我认为其水准并没那么高, 经不起重读, 7分就了不得了. 然后是专业投机原理, 有些想法, 后面专门说. 最后是看不见的女性. 这本让我想起了当年读过的中国可以说不. 我认可她的观点, 认同女性在社会生活中受到了种种的歧视, 我不认为这些歧视是正确的, 但是我认为这更多是历史的惯性所导致的: 的确是有系统性的歧视, 但是更多并非出乎恶意, 而只是由于因循. 我支持非暴力条件下对这个社会问题加以矫枉过正, 但是这本书里部分的读者评论让我感觉有些被冒犯.
玩游戏来说, 丝之歌我还没通关. 最近事情比较多, 能分给游戏的时间比较少. 而且我在Act 3里面去玩跳蚤那儿的小游戏时卡了一两天(每次尝试大概一刻钟, 没通关就关游戏), 通过了之后手比较生, 都不会打架了. 另外, 我完全忘了奇迹数独是怎么解的了, 这个月有一天突然想起来, 于是在纸上画格子从头到尾解了一遍, 一次通关, 感觉还是挺开心的.
影视来说, Netflix上看了Alice in Borderland的新一季, 感觉和第一季差了不少. 准备后面即使再续貂也不跟进了. 另外看了The black bag, 总体还行, 但是我更喜欢这个导演之前的几个作品(Ocean’s 11 & 12). 这个剧本远不如Ocean系列的前两部, 最后案子的解决太过机械降神. 晚上跳绳时看完了百妖谱的前两部, 当泡面番看还是可以的. 看完了百妖谱, 现在开始过是大臣系列, 我感觉我又需要做有声书了.
股票是赌博, 我之前一直会尽量回避各种的赌博, 因为除了概率上可能净输外, 还有一定的成瘾性. 但是, 我也能够认识到几个事实:
这本书能吸引我, 一方面是因为作者的履历很好, 白手起家能够持续几十年在股票投资上获得收益, 很不容易. 而且根据他的说法, 他自己也收学生/学徒来做交易员, 虽然大部分学生不是那么成功, 但是也仍是有一些人能够脱颖而出, 走向成功的.
这本书里作者也是毫不藏私地介绍了他的操作手法以及能够保证持续盈利的手段:
当然, 更关键的是, 如何判断市场的走势. 按作者的观点, 这需要市场分析和技术分析双管齐下. 市场分析就是前面说的, 从政治经济新闻入手, 关注国际国内大事. 而对于技术分析上, 作者是道氏理论的信徒(Dow Jones的Dow). 我对此不是完全相信, 因为这本书成书在上个世纪, 当时虽然已经有一些计算机自动交易, 但是远没有现在这么多. 所以对于技术分析, 我觉得还是需要更多探索.
2025-09-26 15:55:00
读书来说, 读完了六本, 都是在微信读书上读完的, 30天阅读挑战通过后开始尝试365天的挑战. 按时间顺序, 首先是葛亮的汉字再发现, 这本书写得很不像我知道的葛亮, 完全就是一个学术论文的合集. 而这本书最大的问题在于不确定性, 我们只能推测而没有办法令人完全信服地证明这些字形变迁的源流. 当然, 文史类的研究大都也没法像科学一样真正得到确定性和可证伪的结论. 第二本是数据产品经理的自我修养, 这本书里做广告推荐那部分很有意思, 虽然现在对我一点用都没有, 但是有很多血泪教训. 接下来是很水的一本Deepseek辅助网文写作实践手册, 感觉最多可以骗骗小白, 对于已经高强度使用LLM好久的我而言, 这本完全是在说废话. 再往后是一本很有趣的书, 沃顿商学院时间管理课, 这本的书名让你感觉有权威背书, 里面的一些idea也都是挺好的, 但是我怀疑里面所有的故事都是编出来的, 而不是基于事实的. 然后是本月最佳的李飞飞自传, 我看见的世界. 她年轻时求学的经历挺值得一读, 但是后面做ImageNet的经历就让我感觉是恰逢其会了. 最后一本是做对产品, 这本虽然不是本月最佳, 但是对我来说可能是最有价值的一本, 因为里面给出了很详尽地如何验证产品的例子. 要点就是, 要想一个好的主意, 找到真正的用户, 看他们是否会愿意真金白银地买单.
没怎么看电影, 整理收藏的时候下载了邪不压正, 跳着看完了, 不算很好.
游戏玩了丝之歌, 很是顺滑, 不过难度相对于空洞骑士有明显地增加, 雪山拿二段跳花了我一整晚. 总体评价是很值得玩, 各种细节, 各种动画, 都对得起这几年的等待. 另外, 还关注了一下TI的决赛, 又输了, 而且Dota这个游戏让我觉得越来越陌生. 也许是时候说再见了. 另外, Good Sudoku最高难度的Eternal模式通了100关, 然后我觉得数独没什么好玩的了, 就删了游戏.
这个月开始了在Canva的面试工作. 之前的工作中, 在大部分公司都有参与过面试和决策的过程. 在Canva面试的感受不太一样, 首先是有一个相对比较完善的题库, 很方便面试官上手. 然后是面试的过程分得很细, 编程语言, 技术沟通, 系统设计等等分得很开, 但是这个问题是, 很多时候面试考察的点是没有办法完全区分开的. 比如我参与过的一个技术评审能力和技术沟通能力的面试, 实际上就需要面试者对系统设计, 任务切分等等有比较深厚的基础, 更不用提要能读懂Pull Request所需要的编程语言能力了.
下一次reverse shadow后就会独立开始面试了, 没啥忐忑不安, 也就是一个任务需要完成而已. 倒是我想着后面等我更熟悉这些流程之后, 想轮换着看看所有的面试环节, 这样对自己后面有更大帮助.
这是我在一本唐诗集里读到的故事, 一时手痒, 翻译成了现代汉语, 略有一点点发挥, 主要是让整个故事能上口, 读起来顺畅. 原文可以参考wikipedia. 故事名字我解释一下, 旗亭是酒楼的意思, 画壁是指在墙上画.
话说唐朝开元年间, 王昌龄, 高适和王之涣齐名, 三个人都还没当上大官, 经常一起在外面喝酒作乐. 有那么一晚, 天寒微雪, 三个人来到一家酒楼, 上二楼, 买了酒, 靠着炉子, 边喝边聊. 不久之后, 有十几个带着乐器的乐师上楼聚会. 三位诗人就躲到角落里, 隔着火炉边喝边看. 又不久后, 有四个衣着华丽, 面容姣美的歌姬也上楼和乐师们聚到了一起. 接下来, 乐师们开始演奏, 歌姬们开始依次唱歌, 唱的都是当时的名曲.
三个诗人就开始较劲, 说, 我们的诗都还挺有名气, 喜欢的人也不少, 今天我们就来排个座次. 我们就听这些歌姬的, 谁的诗被唱的次数最多, 谁就是老大. 商定之后不久, 一个歌姬就开始唱: 寒雨连江夜入吴, 平明送客楚山孤. 洛阳亲友如相问, 一片冰心在玉壶. 王昌龄很高兴, 手蘸着酒, 在墙上划了一道, 说, 我的一个绝句. 又一个歌姬唱到: 开箧泪沾臆, 见君前日书. 夜台何寂寞, 犹是子云居. 高适很高兴, 也伸手在墙上画了一道, 说, 我有一首. 下一首又是王昌龄, 王很得意, 说, 我两首了, 说着又在墙上画了一笔.
旁边的王之涣就有点不开心了, 说, 这些都是三流歌姬, 哪能算数. 于是指着歌姬中长得最美貌的, 说, 我们来等这个人唱, 如果她唱的不是我的诗, 我这辈子都不跟你们争了, 认栽! 但如果是我的诗, 你们俩得在我面前跪着叫老师. 最美的那个歌姬过了许久才开始唱, 唱的正是凉州词: 黄河远上白云间, 一片孤城万仞山. 羌笛何须怨杨柳, 春风不度玉门关. 王之涣赌中了, 揶揄另外两位, 说: 你们两个乡巴佬知道我厉害了吧? 三个人一起大笑着, 热闹得很. 那些歌姬听着喧笑, 就好奇地过来问候, 不知三人为何如此开怀. 三个人就把刚才的打赌一五一十地告诉了她们. 歌姬们赶紧下拜, 说: 我们俗人不认识神仙一般的才子, 请您们屈尊降贵, 到我们的席位上来. 三个人答应了, 当天大醉方归.