MoreRSS

site iconMiao Yu | 于淼修改

美国杰克逊实验室科学家,《现代科研指北》作者。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

Miao Yu | 于淼的 RSS 预览

万元户

2025-06-14 08:00:00

知道万元户这个词的人至少都是上世纪出厂的老东西了,不过这个词也可以在今天用来区别两类人或者两类思维,此处的万元户特指年收入超过1万美元的人。

全世界范围内年收入超过1万美元的总人口大概有14亿,这里并不是说全是中国人或印度人,而是打破国界计算一共就这么多。如果我们把消费分成必需品与改善型,那么万元户大概就是改善型消费的起点,万元户与非万元户的消费理念是完全不同的。对于非万元户而言,绝大部分收入都拿来购买维持生存的消费品了,其消费思路是基于稀缺性的经济理性,手头钱有限时利用率往往会比较高,生活必需品的生产商的定价策略基本也是成本加固定利润,对于必需品品牌往往不重要,市场也会充分竞争让价格始终处于微利状态。同时,一件商品如果被称为必需品,往往也意味着其生产工艺非常成熟,价格对非万元户也能接受,必需品目录在技术发展浪潮下是不断变长的,例如过去三十年,国内电脑、手机、电动车就从改善型消费品逐渐演变成了必需品。

万元户则开始有了改善性需求,旅游、名牌服饰、艺术品等需求就开始出现。绝大多数商业广告售卖的产品其实都是卖给万元户的,也只有万元户才愿意支付品牌溢价,此时其消费思路是基于充裕资源的政治理性,会喜欢给自己的消费上价值观,找存在感,此时钱的利用率就开始下降。而卖给万元户的商品通常最喜欢做的事就是把品牌打造成一种宗教,提供充足的优越感,这同样属于政治理性。非必需品的定价从来都不是按成本加固定利润,而是锚定万元户的最高可接受消费水平。这样我们就会看到一个有趣的个人层面上的中等收入陷阱,那就是万元户们的开支与收入等比例增加,财富净累积值其实变化不大。这主要就是其万元户政治理性的作用,他会去追求对应收入水平的地位平等并用消费展示自己的自由度,但后果就是始终觉得钱不够花。而从经济理性角度,当收入超过支出后,多出来的钱自由度是最高的,可以任意消费并带来极高的幸福感,但人毕竟是社会动物,在政治理性支配下的消费更侧重社会或团体影响而非个人体验。例如很多国内万元户在21年买了房,他们买房更多遵从的是当时对房价的信仰而非供需等经济因素,如果自住反正也不亏,但要是投资那这些年心情肯定好不到哪里去。

如果你处于一个成长型环境,那么大概会经历羡慕万元户,鄙视万元户,成为万元户,理解万元户这几个阶段。这里面经济理性与政治理性的对立是理解很多当前社会问题的关键。特别当一个社会平均收入在万元户水平时,这种对立会最大化,因为这大概意味着社会上万元户已经开始掌控话语权了,但仍然有一多半人还是非万元户,此时话语权与人数加权后综合影响力万元户与非万元户大概五五开,吵得最凶。有意思的是,当前全球尺度大概就处于这样一个临界点上,往前推几十年,少数万元户占优,但互联网带来的技术平权提高了非万元户的影响力,这种交错带来的制衡主导了当前的各种社会思潮。

首先是政治正确的流行。政治正确属于典型充裕思维,不论是男女平权、性少数群体包容性还是反歧视,基本都是构建在政治理性下的万元户思维。之所以要去关注那些传统意义上价值观弱势的群体,自然是万元户们吃饱了想上价值了,而持反对意见的则更多来自非万元户群体,他们还在生存线上挣扎,自然没法理解有限社会资源为啥要去倾斜给价值观弱势群体而非经济弱势群体。而万元户们则会借着进步的口号指责非万元户们不懂反思,思想保守,同时还能收获万元户独占的优越感。

然后是男女对立。这个议题上主张女性权利或平权更多是构建在充裕资源场景,例如同样是白领工作,对体力没有要求,而男女智力上没有本质差异,自然会要求同工同酬。这里比较充裕的是技术,当前技术条件下确实大多数重体力劳动都是机器在做,这种思维在很多工作场景下符合事实。而反女权的人通常会认为女性更适合全职居家,然后举一些当前还存在部分体力差异的职业来说明性别区分的必要性,这个思路是构建在生存资料稀缺性上的,因此需要优化资源配置,而性别与资源配置在很多场景里存在关联,此时这种思维也符合事实。也就是说,男女差异更多体现在具体场景,但对立双方的主张却是通用主张,此时各执一词是不会有结果的。万元户们多数从事的都是白领工作,而非万元户们从事蓝领工作,场景不同也很难互相理解。

家庭结构解体也是类似。万元户与非万元户的家庭结构差异很明显,对于非万元户的家庭,经济纽带是最重要的社会关系,两个非万元户的结合更多体现的是两个人的财务重组,实现1+1>2的资源优化配置,这种配置虽然更普遍但很不受待见,主流文化产品宣传的其实是万元户家庭结构。所谓万元户家庭,两口子走到一起讲的是感情或爱情,要有浪漫的叙事,例如一见钟情啥的。但这也正是万元户家庭结构脆弱的地方,一旦感情淡了,两边又都是经济独立,那解体就自然而然的。为了维护家庭,高级万元户们会继续上政治价值,例如搞门当户对或联盟式婚姻等政治经济宗教文化多层次利益绑定。但对于普通万元户,家庭的维系是需要双方持续努力的,或者简单点,当双方都变成非万元户需要互相取暖凑合过就更稳定些,但要是只有一方变成非万元户,那也是会解体的。你指望一个经济理性的人跟政治理性的人过日子,好比让葛朗台给穷人捐钱。

虽然定义上可以用年收入1万美金,但实际生活也常见万元户持有经济理性,例如绝大多数的商人,或者说非万元户想开了转成政治理性,例如丁胖子讲师或三和大神。很多人嘴上都是价值观,心里全是小算盘,而有些人面上算的是经济账,心里却全是权力欲望,心口不一的人最好远离。确实,非万元户也会被上价值,宗教就是非万元户最佳的精神消费场所。但我自己经历过匮乏,真的匮乏场景其支配作用的其实还是经济理性,很多创新产品也都是在匮乏场景下被研发出来的。与之对应的富足场景则很容易催生官僚主义、程序正义与创新困难,大量资源被狗屁工作内耗了。我很好奇除了封建体制,人类究竟能不能搞出应对富足场景的机制创新,现有的民主共和威权其实本质都是优化过封建体制,实质上都是被技术包装过的知识精英独裁。

另外,鉴于文化阵地一般都是万元户的基本盘,考虑他们的政治主张不如多去观察理解非万元户的生存现状,现实中我最怕跟那些逻辑自洽的理想主义万元户打交道,他们完全活在了自己的世界里,对很多现实处境与现状不但不理解,甚至傲慢的忽视,他们都是被理论呵护的大宝宝,只能夸不能批,只对正面反馈有反应,一遇到挫折要么甩锅,要么崩溃。这样的人如果放到体制高位,必定带来灾难。

看到这里,希望你能意识到这样的二元逻辑本身也存在很多问题,是一个过分简化的模型,我只调了支持这种划分的案例而规避了很多反例。这样的理论本身甚至不具备可证伪性,如果不想被这类理论困住,最好的方法就是自己去创建几个,从理论设计者角度出发可以看到很多其他理论设计者的小心思,这样的训练做多了自然就有免疫力了。

所有理论都在试图消解世界的复杂性,但复杂性才是世界的本来面目。

巴尔的摩

2025-06-09 08:00:00

魅力都市

巴尔的摩号称魅力都市,距离首都华盛顿很近,如果七千人规模的ASMS能放到华盛顿也许规模还能大些,但我确实想不通为啥会选这里,而且可能四五年后还会选这里。这座城市跟很多美国城市类似,支柱就是医疗服务与教育,这两个产业是为数不多盈利持续增长的行业,而且也会带动其他产业发展。曾经美国最大的钢铁厂也在这里,但2001年就已经破产了,很多美版下岗工人与退休工人都因此失去了退休保障,但你也很难去怪中国,中国的下岗潮比美国还要早两三年。美国70年代之前的制造业遵循的是赚了钱给工人分红的模式,那时候确实是工人的黄金时代,但里根上台后为了解决滞涨搞新自由主义,让资本来介入运营,这下美国制造就逐渐被亚洲制造取代了,而资本家也不再搞给工人分红的旧模式,转而把利润投资全世界找成本更便宜的地方,结果就是美国制造业的全面衰退,所以说还是共和党人会玩,一个总统制造问题,另一个总统去解决问题。另外很多人谈制造业的衰退都忽略了技术进步的影响,当今的制造业确实也不需要那么多产业工人了,并不是哪个国家的人抢了工作,一直都是机器在抢夺人的工作,所以显然川普提高关税打击外国制造业的最后结果并不会是创造更多的岗位,只会让资本家用机器赚的更多。当然红脖子也不单纯就是为了拿回工作,只是不愿意看到别人做自己相同的工作而自己失业罢了,毕竟双输也有情绪价值。我在这个城市一个明显感觉就是这边服务业从业人员工作态度很差,像极了国内国营商店时代的售货员,感觉对外来户有种天然的敌意,好像外面的人天然亏欠了他们什么一样。

火车读物

这次火车上读的是《毫无意义的工作》,这本书作者可以说是占领华尔街运动的主要参与者,而占领华尔街运动是我认为被国内严重低估的一次美国思想运动,当前很多思潮背后都可以算是占领华尔街运动的余波。这本书一个核心观点就是当前白领工作或者说办公室工作或者说基于信息流动的工作都属于狗屁工作,意义不大。这本书里已经提出了生产过剩问题,不论发达国家还是发展中国家,制造业人口比例都在20%左右,而看似承担大多数就业的服务业其实也分为两种,一种是真正的服务业,或者说照顾人的行业,这个类别的比例其实也一直都稳定在20%左右,而承担现代社会大部分就业的服务业其实是行政、顾问、信息、管理、金融等工作,这些工作存在的意义更多就是为了提供工作,且比例越来越高。这里面有些是为了让上级看起来更重要的助理,有些是凭空造牌出来没事找事的公关、律师、销售、广告,有些是给体制缺陷打补丁的冗余职位,有的是做形式主义工作,有些则是所谓的中层管理走流程的监督者,而所谓的监督只有程序意义而没有实际意义。不过最简单的判定就是那些疫情期间可以居家工作的岗位绝大多数都是可有可无的狗屁工作,除了能发不错的工资外基本无法给工作者提供任何价值实现。

作者认为管理本质就是封建体制这个观点我很认同,我也一直说全世界范围内比起反对资本主义,反对封建可能更重要。封建体制在政府、大型企业、大学、非营利组织、教会里可以说无处不在,所谓的管理学本质就是集权手段大全,而在封建语境下,职位设立最大意义并不是解决实际问题,而是通过增加被管理人数来巩固自己的权利与地位,这很明显是在生产过剩条件才有的冗余工作,所谓领导力、办公室政治、ppt展示技巧、项目管理等种种所谓提高效率的管理手段本质都是在向上讨好领导与甲方,向下精神控制员工的无聊手段。我知道很多人刚接触一些效率工具会很兴奋,但真正解决问题时这些白领技巧意义并不大,只是给自己一个努力勤奋高效的幻象罢了。这些观点对于没工作过的学生可能无法体会,但我恰好在家工作比较久,我只能说书里描述的很多心态是非常真实的,只是很多人不愿面对罢了,很多时候就是在工作的实质就是表演工作的样子。

之所以产生狗屁工作,作者认为根源是神学上对工作的洗脑,把工作与新教伦理以及工业革命来的“教育救赎论”进行结合,让现代人产生了只有努力工作才能生活的价值观,而实际上要么变成彻底的工作狂,要么就迷失在工作的无意义体感里躺平。对我们这一代人,大学以来的工作观基本就是从基层做起,一步步做到管理层,然后退休享受生活,但其实只要离开基层的实际问题,后面的工作都非常虚,都是在走程序做齿轮玩政治,虽然有人乐在其中,但我觉得这其实就是个人层面的封建事业观,把自己绑在了体制与权力形成的桎梏里。以学术界为例,很多博士都想自己独立成立课题组带学生,但课题组模式本来是为课题服务的,很多课题组到最后都成了课题组长的封建王国,这样的课题组会很像公司与政府机构,有明确分工与流程,但会损失掉学术自由探索的可能。

其实狗屁工作也有其存在的土壤,例如给人们工作满足感,其所谓提供的社会价值更多指的是个体社交与合群体验,或者说情绪价值。而讽刺的现状在于越是能给个体带来自我实现价值的工作,其经济回报往往越低,一个地狱笑话就是如果你在工作中体会到了个人价值,那么就不必要付工资了,毕竟工资的最终去向也是实现个人价值。从事狗屁工作的人往往高估自己的重要性,UBER的高管曾一度罢工,结果业务完全没受影响,这些高管赶快给自己找了个台阶回去继续假装工作,而纽约市的环卫工人罢工往往几天内市政府就会妥协,因为他们的工作在基层也确实重要。在当前人工智能的时代,我奉劝从事狗屁工作的人不要轻易辞职,因为一旦辞职就会马上暴露自己冗余的现状。当然政府也会继续大力推广狗屁工作,因为只有把人绑到封建权力体系里才会稳定,与之相比提高效率反而是次要的。人类工作辛苦的一大根源就是自己打造的这个施虐受虐的工作伦理,只有工作上无聊受虐,才会在工作之外落入消费主义提供的欢愉之中,是的,闭环了。

如果我们把现在的狗屁工作与支持狗屁工作而存在的工作岗位去掉,就会发现20世纪30年代的预言已经实现了,那就是50%-60%的人已经失去了工作,以后伴随生产效率提高,这个比例还会更高,但我们的体制还会去创造新的狗屁工作出来承接那些实质上失业的人,或者就是通过福利体制来养那些无法从事狗屁工作的人,作者在最后一节提出的解决方案就是全民基本收入,我之前也聊过这个,但读完这本书感觉政府可能还是会更喜欢创造些狗屁工作出来。虽然这本书通篇都在批判狗屁工作,但我非常理解作者那种无奈,这种无奈演化出了占领华尔街运动,也某种程度孕育了MAGA运动,这本书跟巴尔的摩很配,但当前的年轻人谁又不想去找一份体面高薪的狗屁工作呢?未来的政府的主要工作可能就是给民众提供意义感吧,谁还不是个宝宝呢?

樱桃山

来之前我查过,巴尔的摩会议中心是比较安全的,打算去逛的博物馆也在比较安全的区,只在安全区活动问题不大。但到了就发现跟想的有点出入,例如旅馆附近确实很多警车,但警车围起来恰是因为刚发生了案件。周三早上我看会场没啥有意思的报告,就打算坐免费公交去附近一个博物馆。这免费公交也是一言难尽,我坐火车到的巴尔的摩,本来打算坐免费公交去旅馆,结果等了快20分钟都没来,按地图上时刻表都应该过去两辆车了。这次免费公交倒是准点,上车前司机要对其他旅客说半天,到我这啥也没说,当时我以为可能是看我游客打扮都查好了,结果后面车开出一段时间打开手机一看,咦?这路线咋跟地图上画的不一样?跑到公交官网上一看,说是这条线上午有临时变道,但这一变道我就傻眼了,眼看着车离目的地越来越远,甚至过了一座桥,又一想不如就坐车上,了不起到终点站再回去,而终点站地图上显示为:樱桃山。

车到终点站后,司机对后面上来的人说5分钟后发车,然后我就想不如下去转转,毕竟旅游路线免费公交,怎么也不会给你带到一个危险社区。但我刚想起身就发现周围不太对,上车的全都是年轻的母亲推着婴儿车,望窗外看有教会的广告,再看下车内乘客,数我皮肤最白,瞬间我就判断这次肯定不能下车。原因很简单,单身母亲与教会广告这种组合只会出现在一种社区,那就是政府保障房,我之前关注过这个问题,美国这类社区高中升学率非常非常低,这边的生存模式就是把母亲当成一种职业,一到生育年龄,女孩就在同龄人催促下去找人生孩子,一旦有了孩子,就可以申请政府的保障房,租金非常低,这要比找工作容易很多。然后教会与黑帮就会在这里维护一定的福利秩序,单身母亲的孩子长大了男孩进帮派,女孩找男孩生孩子,当地必然没有产业,属于纯纯的吃福利救济的社区。但我最懵逼的点在于为啥一条免费旅游公交的终点站会在这里,游客要是进到这个社区那可真就是考察风土人情了。然后等了十几分钟才发车,好在回去路线是对的,我还是如愿游览了博物馆,只是晚了一个多小时。

回来后我查了下樱桃山社区,果然不出所料,这里最初是非裔退伍军人社区,长期被边缘化,存在系统性资源缺失、失业率高、贫困率高、犯罪率高等问题,单身母亲比例超过50%,当地人内部凝聚力高,或者说这边基本属于自治,警察不管也管不了,有不少黑帮与非营利组织活动,应该是幸好我当时没下车去探索这个景区,不然很可能就晚间新闻见了。

质谱年会

毕竟这次是来开会的,自然也要聊聊会议,这个会议我参加了七八年了,疫情那几年都没拉下,今年明显是被上半年的政府冲击了。参会人数略有下降但赞助肉眼可见少了,晚上厂商招待会也就日本电子跟岛津还像样,其余的虽然都有新品,但进步很常规,主要就是吃的不大行。这次国内学术界来的比去年少很多,估计是被卡签证了,但有意思的是国内展商来了不少,很符合这届政府重商抑学的调性。今年的全体大会上一位明年即将达成50年老会员成就的德州退休教授说,他活了这么久,911都没觉得美国要完,但过去几个月发生的事让他非常失望,希望在座会员去联系自己的议员表达真实情感,然后台下长久掌声。我去转了下找工作的房间,今年肉眼可见板子的荒凉,周围面试房间几乎都没有预约,可见工作机会也是非常少了。不同于其他业界,质谱工业界其实很依赖学术界的消费能力,按预计明年要砍那么多研究经费,自然业界也开始未雨绸缪了。明年在圣地亚哥,因为我之前去过,很可能就不去了,毕竟我出去开会都顺道旅游。我的海报是关于一种高通量方法的,后面等文章写完再写详细介绍,不过这次得到的会议反馈很不错。

报告

这次会议的学术报告里明显口头报告质量差于海报,不知道咋选的,后来大会上提到是分会场主席跟DEI一起选,那就比较容易猜了,分会场主席学生一个、朋友一个、女性一个、黑人一个,年轻人一个,然后留一个给投稿。其实我并不反对这种模式,毕竟我最初几年参会也都是给口头报告,很明显也是被照顾过的,而且海报其实交流时间与针对性更强,只是说有些报告质量明显低于平均水准了,对行业发展不利。今年人工智能继续发威,但不知为啥都跑去预测保留时间了,这么个典型QSPR问题成了最多被人工智能应用的场景属实有点技术倒退了。成像方面倒是有些有意思的工具,我发现去年做的东西今年有其他组也在做,很多共性问题可以一起讨论挺有意思。环境方面今年还是一边倒全是全氟化合物,听报告我恨不得有个二倍速或进度条跳过背景,这玩意不夸张我十几年前读博所在课题组就已经在做了,里面真正的新技术极少,当然今年做微塑料的也多了,我看到不少搞代谢组的今年跑到环境会场听报告,看意思这边钱好拿?比较猎奇的技术也有,新离子源、3D打印进样板啥的,对我这种理工出身的人非常舒适。

NASA

这次年会注册处有个小展区,展示的是NASA各种航空航天技术里用到的质谱。不得不说我一进去就走不动道了,我甚至放弃掉一个下午的口头报告泡在这个小展区。历史上看,NASA很早就在太空探测器上装了质谱,只不过质谱的质量范围都不到50,主要就是检测气体。太空质谱现在的版本是离子阱跟ToF,做的比较紧凑,自带载气。正好展区里有位华裔NASA科学家会说中文,我问了一些我之前写的短篇里的设想,例如自带3D打印机就地取材啥的,有些NASA其实也在考虑,但整体上如果前一个版本被证明可行,后面的改动就不会太大,不过这次不少展品都是3D打印复刻的。有意思的是这届政府似乎不打算支持航天探测,但支持载人航天,所以NASA也在想方设法看如何把无人探测跟载人结合起来,保住当前的探测计划,科研上看起来顺理成章的步骤在政府眼里变成这样也挺让人唏嘘的。我提的建议是干脆就在太空探测器上卖广告算了,让企业掏钱赞助或许更靠谱,第一个土星广告啥的对于有些喜欢讲故事的企业还是很有吸引力。当前展出的核心是蜻蜓号,预计28年发射,目标是有着甲烷降雨的土卫六,目前状态很像地球几十亿年前,而蜻蜓号实际是无人机,可以进行多种采样。这次ASMS闭幕报告也是介绍蜻蜓号的,有意思的是提问环节有人就问NASA不怕把生命带到土卫六上,其实NASA有专门的部门来研究这个事,不过鉴于土卫六表面低温,地球生物怕是很难扎根。

重聚

这次会议依然见到了不少熟面孔,见面总是不免先问一下有没有被裁,很明显很多人被影响了,有的课题组都已经给成员下达了离职时间。当然,也有朋友说影响没那么大,显然这些朋友并不来自美国。我只能说这两年找工作确实非常难了,当然不排除后面更难,钱确实也是有的,但要饭是门学问,站着要饭更是属于专业技能。年轻人更看重文章档次,但到我这个年龄更多看重文章的影响力,例如写入教科书啥的,不同阶段总有不同阶段的烦恼,一切困难也都是暂时的,要永远相信你还没吃到最难吃的菜。说到菜,巴尔的摩的chicken potpie跟炸牡蛎不错,可以尝尝。另外晚上在内港遛弯时,看到一个小伙掉水里了,警车瞬间赶到,想把他拉上来,结果他坚持先把背包救上去,然后再拉自己上来,嘴里也一直在说“That’s my research”,上岸后也紧紧抓着背包。我不知道他是不是来开会的,如果是那八成也是个苦逼的博士或博后吧,换成我肯定第一时间丢包了,我的研究显然会有备份,就算没有,也应该具备重现性,但生命可没机会尝试第二次。

大语言模型坤年记

2025-05-23 08:00:00

自从chatgpt发布已经一坤年,虽然坤这个计量单位比较随意,但放眼宇宙,拿自己的行星年来衡量全宇宙时间似乎也差不多。所谓纪念日,不过是人类过家家的孩子气行为,那么选什么计量单位其实无所谓。例如,我建议每个人都去庆祝自己的万日生日,你大概率只能在27岁、54岁与82岁庆祝三次,大体对应一个现代人成家立业、中年危机与入土为安三个阶段,虽然绝大多数人长了十个手指,但就是懒得数一千次手指。

这一坤年基本可用五个四字短语来描述:一家独大、百家争鸣、大浪淘沙、一骑当千、分工流水。Chatgpt出现前就已经有很多大公司押注人工智能,当时在深度学习的大背景下,图像处理是最早卷出圈的,彼时国内AI四小龙全是做计算机视觉的,大国叙事里人脸识别也是遥遥领先。但Chatgpt出现后,“生成式”三个字作为定语加在了人工智能上面,而自然语言处理的公众关注度也一下暴涨。不过其实22年下半年,文生图那边stable diffusion模型更符合生成式模型的定义,从噪音里不断去噪生成图像,而transformer构架模型更贴近完形填空的概念,需要上下文指导提示来生成。当然无论如何,在22年年底往后相当长的一段时间,OpenAI就是一家独大的,也大概那个时候,大公司突然意识到大语言模型的重要性,纷纷囤卡炼丹,整个23年下半年到24年上半年,各家第一批丹出货。但OpenAI那个时候已经出了GPT-4,各家新练出来的丹表现也许不错,但跟GPT-4比也就Claude在编程上好一些,大浪淘沙下其实选择并不多。不过此时国内因为用不了海外服务,反而出了不少流行的国产大模型,豆包跟kimi属于能见度比较高的,后者在广告上的投放应该非常可观。不过这个阶段,大模型的宣传语上已经为后来的趋势指明了方向,例如有的宣传可以处理长文本,有的说自己有多模态啥的。但就用户而言,此时大语言模型的主要用户可能还是程序员跟学生,所谓的出圈更多指的是新闻上可见。

24年底推出的DeepSeek可以说一骑当千。很多人认为DeepSeek的大流行是因为表现不逊于主流模型,但其实最核心的原因是开源。前面说的大厂模型几乎都走闭源路线,meta推出的llama跟阿里的qwen在开源大语言模型社区虽然流行,但因为表现相比云端模型有差距一直属于玩具状态。DeepSeek其实在V3发布前的V2在很多程序员那边就已经是本地的外挂了,V3的表现刚开始热度一般,训练成本低也是社区早就知道的了,但R1发布后情况就变了。这里有个小背景,OpenAI在24年推出o1推理模型,因为一开始只对付费用户开放,所以讨论度有限,但当时就已经出现开源复刻了,最简单的版本就是用提示词引导大语言模型进行多轮思考,而推理模型也可以大体看成模型先自言自语搞辩证思考,然后输出答案,相当于多轮对话,这也是为啥token消耗量会暴增,思考部分其实就替代了用户端的反复追问。而推理模型在R1发布那个时间点属于高端货,结果DeepSeek不但开源了自己的R1,还跑去蒸馏了很多小模型,开源用户瞬间吃上了细糠。而开源的另一个优点在于技术平权,24年底到25年初几个月,互联网上出现了大量本地部署R1或蒸馏版R1的需求,开源出的模型本地部署消解掉了很多潜在用户的隐私顾虑并提供了对模型的掌控感,很快从政府到个人都开始自己部署模型的尝试。应该说在DeepSeek之前大语言模型不被广泛应用的一个重要顾虑就是数据隐私与模型表现,开源模型可以保证本地部署的隐私,但在R1之前的表现比云端模型还是有明显差距,现在有了R1,世界上不知道多了多少个角落在跑着各种稀奇古怪需求的本地模型。

不过有一说一,我的使用体验是R1幻觉比较重,有点神经质,V3好一些。而且经过年初的本地部署浪潮,大公司纷纷感受到了危机,毕竟原来这些本地模型都是烧他们API的token的,现在相当于换新能源了。25年初开始,各大厂明显开始发力,而这一轮的重点已经不再是全能型单一模型了,大语言模型一个打十个的古典英雄主义时代已经过去,属于人工智能的分工时代降临了。其实这个苗头很明显,OpenAI炼出GPT-4后GPT-5一直难产,我推测不是他们消极怠工,而是炼出来的几锅丹药不是幻觉严重就是原地返祖,要么是模型构架需要革命,要么就是可以用来训练的数据已经不多了。虽然基础模型上大家的表现相对停滞,但应用市场的反馈其实已经给出了当前版本答案,那就是分工协作。百家争鸣时期,各家的宣传语其实已经有了暗示,甚至MoE的模型架构也从另一方面给了暗示,那就是各家模型开始在自己的小生态系统里找生态位了。

生态位是个神奇的概念,最初见到是在大学学生态学时,当时我绝没想到这个词后来竟然在商界这么流行。当时我理解生态位就是食物网里大家各自找到自己擅长捕食的那一块,这样互相之间少一点杂食性竞争,多一点井水不犯河水。在大语言模型这边,虽然研究侧可能还是想炼全能金丹,但市场侧则发现自己必须有点一技之长才能拿到后面炼丹的柴火。目前看下来,大语言模型的分工应该是“六艺”:编程、推理、多模态、记忆力(长上下文)、端侧与实时。以后我们可能不太容易看到新的全能英雄模型出现,但这六艺只要有一样突出就有明显的市场。编程不多说,cursor或copilot的付费用户体量说明一切;推理其实跟深度研究功能是紧密相连的,需要多轮反馈,这对从事文字工作的人也属于加特林级别;多模态则是照顾那些非文字数据,也是训练下一代模型的孵化器;记忆力对于所有基于agent的应用场景都很重要,RAG也可看作一种记忆;端侧则是部署在本地或机器上的简易交互模型,智能家居摆脱按钮全靠麦克风就要依赖这样的本地模型;实时则是对响应速度要求比较高的场景,例如翻译、会议总结等。其实这六艺也可以结合使用来应对更复杂的场景,不过当前可以说每一样都已经可以赚钱了。

这个分工并不适用于人,因为每一个分工场景里大语言模型都已经超过了人类普通水平或者其产物做图灵测试很难断定是专家还是大语言模型。你招不到一个熟悉各种编程语言的工程师,招不到一个几分钟就能生成一份质量过得去的报告的文员,招不到一个精通各种风格的画师,招不到一个对你特别了解的助理,招不到一堆围着你转的小仆人,也招不到能听懂各国语言的实时翻译。这些都是肉眼可见可被替代的行业或新需求,当然人的角色依然重要,就像即使塑料在绝大多数方面都优于纸与玻璃,人们依然会认为塑料代表了某种廉价感,这种廉价感对大语言模型生成的内容依然会有效。预制菜就算再好吃,也总有人会认为锅气大厨的私房菜全面碾压,但技术平权从来都不会在意这些廉价评价,你得先让大多数人吃到那些平素里被专业壁垒或价格壁垒隔离的菜再说,也得承认当前社会分工给某些职业的光环其实并不存在。举例而言,过去十几二十年程序员与公务员的红利太明显,而在一个人人都会编程写报告的年代,这部分职业溢价就应该自然消退。但不妨碍还是有过来人劝你刻舟求剑,此时要多去关注每一个职业要解决的问题与场景,只要问题与场景还在,职业就在,如果问题已经可以被廉价解决或者产生问题的场景没了,那么这个职业就会自然消亡。

要知道大语言模型虽然有分工,但其本体至少也是GPT-4的知识储备,已经强过普通大学生甚至研究生了,此时高校的专业设计可能要更侧重问题端了,不然产出的学生知识量比不上大语言模型,主动处理识别实际问题又没有训练就尴尬了。大语言模型走向分工协作其实是预示了人的训练要走向全能个体,不是说人要全能,而是有使用人类知识共同体的能力,大语言模型也是其中的一部分。越是面向场景与具体的问题,人的能动性优势就会更体现出来,当然,这也只是一个阶段,能不能持续10000天都不好说。

当前技术背景下,历史明显变短了,几周前的先进技术到今天可能就已经过时了。然而社会上并没有学校可以提供如此短周期的历史回顾,甚至有些阶段我们还没来得及回顾,下一阶段就又结束了。不过也不必惊慌,人的问题始终需要人来解决,放弃一点不必要的掌控欲,人工智能终归是好东西,与其说被担心抢了工作,不如说被担心抢了工资,但如果人工智能在技术平权下降低了生活成本,每个人可能会多一些自由的时间。

当然,现代社会规训下的现代人会不会享受生活,那就是另一个大语言模型也不好意思说的问题了。

南极谋杀案(十五)- 翻译机

2025-05-14 08:00:00

注:这段对话节选自某次自盟与第三新港市外贸活动后自盟这边的会后总结,原对话是用英文进行的,翻译机的翻译结果可能会有些不准确。

“那家伙当时说了那么半天,就翻译成他要走了就完了?“

”没啥问题吧,翻译机会替我们隔离掉无关信息。“

”也对,我们是来做事的,只要能完成任务就好了。不过你说他说这个是高兴还是不高兴?“

“有什么区别呢?跟新港市的人交流你不用翻译机会变成跟他们一样的。”

“不是说他们是因为疫情有传染性才成立新港市吗?”

“那时场面话,有传言说这个疫情根本就不存在,是杜撰出来的。”

“啊?那他们成立新港市是为了啥?”

“利益呗,你看看现在这一百多个新港市,放到五六十年前都是大都市的,据说,我是听一个20后大爷说的,当年他们城里人认为没法跟城外的交流,就宣传有流冠疫情,本来是想借口隔离搞独立城邦联合体,结果没想到成就了现在的自盟,他们反而变成保守派了。”

“那我们究竟算进步派还是保守派?”

“啥也不算,我们技术上先进主要是因为现在自盟里这些大城市很多都是对面叛变过来的,要知道进步跟保守都是相对当前的不同选择策略,进步就是所谓没走过的路,保守就是走老路,但历史告诉我们人类其实一直在换着名义走老路而已。本世纪初有次新冠疫情知道吗?那时候就有隔离与共存两条路,你觉得哪个是进步的?”

“共存吧,共同进化。”

“那你知道当年最早提这个路线的是当时的英国保守派吗?而且你也不能从结果上来反推,距离那次疫情前还有次所谓的非典疫情,也是冠状病毒,当时就是靠隔离彻底消灭掉了,隔离策略就应是最进步的,如果初期控制好了就没有后面的事了。”

“那你说的意思是我们现在的很多选择也不一定是对的?”

“不,我的意思是讨论进步与保守是无意义的,依靠定性判断来指导当下很容易触动概念背后的倾向性,此时会降低对事实的关注。”

“啥意思?”

“你改造了多少?”

“就一条腿跟新能源心脏。”

“这么说吧,新港人对时间的概念跟我们是不一样的,他们会来不及而我们不会,因此我们不需要价值观,或者说我们可以兼容任何价值观,情感波动对我们只有美学意义,但对新港人而言却可能是生存的意义。”

“所以呢?”

“所以翻译机会帮我们过滤掉那些与我们目标无关的信息,你试过关闭翻译机吗?”

“没有,不是说只能通过翻译机来接触新港人吗?”

“胡说八道,你出生那会新港市还不存在,翻译机还不普及,你说那时候怎么跟他们打交道?”

“但是……”

“今天我们去的是第三新港市,疫情前叫做孟买,你知不知道他们官方语言其实就是英语?”

“那我们为什么还需要翻译机?”

“这倒是个好问题。只要你想交流,语言不通就是个借口而已,而如果你只想做必要交流,那么翻译机是必备的。你们这一代人的耳朵从很小就被耳机保护了,或者说覆盖了,具身发电技术成熟后的大多数服装都是电池芯片混纺材料,所谓翻译机不过是衣服上能耗极低的联网应用程序,离开自盟后自动开启漫游模式很正常,据我所知很多住在自盟的人是全天开翻译机的,也不是不行。”

“不过自盟跟新港市现在基本是人口自由流动的啊?这么明显的区别怎么别人没跟我说过?”

“那我问你,你愿意关闭翻译机吗?”

“语言相通直接交流不就行了,为啥不能关?”

“如果真能正常交流,可能就不会有自盟跟新港市的区分了。你知不知道空域游民所谓的月球语其实也是英语?”

“不可能啊,我完全听不懂他们的话,那个是必须开翻译机的。”

“那恐怕你也听不懂第三新港市的英语。你知道自盟内部的官方语言也很多样,互相交流也是需要翻译机的,我们的理解语言的能力其实已经被翻译机驯化了,这样当然有好处,毕竟内部交流会非常顺畅,但自然语言里本来存在的重复、冗余还有仪式感就被当作无意义的部分切除掉了。你知道吗,现在我们可以口述编程,仿佛我们的语言就是编程语言,但倒推几十年的语言学研究重点却是如何解析自然语言,那个时代有所谓的大语言模型,终极目的就是让机器更像人。”

“机器更像人?”

“对,那时代存在很多无实际意义的工作,例如很多政府公文全是假大空话,但写这种公文却是需要专门的选拔与训练,那时亚洲很多国家的年轻人都热衷考公务员,让自已成为体制螺丝钉去运转,学一套程序语言或体制语言。但大语言模型出来后,人们发现他们特别擅长去创作这种文字,这让很多习惯了程序性工作的人失去了工作带来的意义感,而另一方面,在使用普及大语言模型的过程,语言模型本身承担了教育作用,塑造了后面这几代人更有逻辑或者更适合编程的语言风格,而大语言模型也就火了十几年,后面就是基于世界模型的元人工智能时代了,此时人们已经内化了所谓的大语言模型。我们可以自称自己的语言更进步,但需要给进步加上一些语境,而更广义上的进步新港市的人恐怕是不会接受的。”

“不过如果说慢一点,我应该也能听懂吧?”

“不一定,刚才那一段我让翻译机进行如实转录,你看看能不能看得懂,好像还是出自上个世纪的名著影视:

The relationship which I might tentatively venture to aver has been not without some degree of reciprocal utility and perhaps even occasional gratification, is emerging a point of irreversible bifurcation and, to be brief, is in the propinquity of its ultimate regrettable termination.”

“这是英语?”

“If you ask me for a straight answer then I shall say that, as far as we can see, looking at it by and large, taking one time with another, in terms of the average of departments, then in the final analysis it is probably true to say that at the end of the day, in general terms, you would probably find that not to put too fine a point on it, there probably wasn’t very much in it one way or the other. As far as one can see at this stage.”

Ps. 刚注意到《南极谋杀案》已经一年多没更新了,要是忘了前面,可以看这里

Introducing ThermoFlask: Simplifying Thermo .raw File Processing

2025-05-14 08:00:00

In the world of high resolution mass spectrometry, Thermo .raw files are a common format for storing raw data. However, processing these files into more accessible formats like mzML. To make this process easier, ThermoFlask—a Flask-based web application designed to simplify Thermo .raw file processing is developed.

What is ThermoFlask?

ThermoFlask is a lightweight, user-friendly web application that leverages the power of the ThermoRawFileParser to process .raw files. Whether you’re a researcher, data scientist, or bioinformatician, ThermoFlask provides an intuitive interface to upload, process, and download your data in just a few clicks. You can also deploy it as web service and here is a demo website using this docker image. You can also find the source code on GitHub.

Key Features

ThermoFlask is packed with features to make your workflow seamless:

  • Batch Processing: Upload multiple .raw files at once for batch conversion. Flexible Output Formats: Convert .raw files to mzML, indexed mzML, Parquet, MGF, or metadata-only formats.

  • Custom Parameters: Add custom arguments for advanced processing with the ThermoRawFileParser.

  • Debugging Support: View command output directly in the interface for troubleshooting. Download Results: Easily download processed files through the web interface.

How to Get Started

Getting started with ThermoFlask is easy! Here’s a quick guide:

You can pull the prebuilt Docker image from Docker Hub and run them locally using the following command:

docker run -p 5000:5000 yufree/thermoflask:latest

Upload and Process Files: Open the web interface, upload your .raw files, select the desired output format, and start processing. Once complete, download your results directly from the interface.

Alternatively, you can build the Docker image from the source code. Here’s how:

  1. Build the Docker Image: Clone the repository and run the following command to build the Docker image:
docker build -t thermoflask .
  1. Run the Application: Start the application with:
docker run -p 5000:5000 thermoflask

The application will be accessible at http://localhost:5000.

Acknowledgments

ThermoFlask wouldn’t be possible without the incredible work of the ThermoRawFileParser team. I also thank the Flask community for providing a robust framework for building web applications.

如何培养爱好

2025-05-11 08:00:00

首先,你要是个中年人。然后,买完菜去二手店溜腿,在这里大概率能让你发现被别人放弃但不代表你也要放弃掉的东西。这里面有很多很有创意的东西,但很明显原主人在购买后就再也没用过,然后就被捐了。例如,在最近一次闲逛中,我看到了一个滑板,我现在有理由相信当我看到滑板是脑子想到的场景跟原主人看到滑板所产生的联想是差不多的,所以刷卡带走。

回家路上,我选了一条林间小道,因为可以立即实践下几分钟前的想象,摔了也不丢人。然后,当我双脚离地了,智商就重新占领高地了,因为我发现仅是站在板上不动都很难做到。这时选林间小道的优点就出来了,你不会被路过的人看到,但会被在林间小道骑自行车的人关注。在看到我几次上板又几次跳板后,骑自行车的一个大哥过来友好打个招呼,他甚至还会说两句中文,他说我从你一进树林就注意到了,开始觉得你是个老手,板是个老板,不戴护具就敢上板,而且还背着个大背包,上板方式非常另类,完全不像新手,但看了一会发现不对劲,因为你虽然一次也没摔,但也没滑成功。额,我很友善表示对方想多了,板确实是个老板,因为我是一时兴起在二手店买的,不戴护具是因为我不知道需要护具,背着包是刚买完菜,上板方式另类是因为我根本不知道咋上板,没摔则是因为虽然不会滑,但我逃生意识还是比较强的。然后他聊起自己练滑板的经历,二十年前去中国的经历,新冠期间打疫苗的经历,然后我们交换了联系方式。

回到家我还是在想如何滑滑板,因为家里铺着地毯,所以就在地毯上又尝试了下。地毯的摩擦力明显高了很多,因此我这下可以站在板上了。但培养爱好还是要从打好基础,按照自行车大哥的说法,滑板属于童子功,他现在能滑依赖的是大学时代的肌肉记忆。我现在已经快四十了,之前只滑过两次旱冰,四个轮子的鞋都摔了很多次,别说肌肉记忆了,肌肉都没多少。万事不决就上网,很快我就搜到一套视频滑板入门教程,一口气看完,边看边在地毯上实验,教程里说练习上板要一个月左右,但基于地毯上成果我发现一个小时就可以。

然后,我来到了铺着木地板的餐厅,板往地上一放,走你!然后,我没有摔,但也没站在板上,而是一脚把板蹬飞,人冲了出去。刚开始我庆幸没摔,然后就意识到另一个问题,板去哪了?很快我就注意到板撞墙了,而且把墙撞了个洞。


真正的爱好都是在不经意间出现在眼前的。面对眼前墙上这个洞,我大惑不解,因为我理解墙应该是实心的,为啥会撞出个洞?仔细看了一下,撞碎的是一层木板,木板后面似乎还有墙。这种结构叫做隔墙板(dry wall),在骨架上盖了块石膏板,国内比较少见,但美国几乎所有非承重墙都是用这种结构,当然这种墙面你没法挂重物,但如果你知道骨架位置,也是可以挂的。别看这墙不结实,但修这种墙是有标准套装的。在研究完中美非承重墙差异后,周末我去了超市找这种套件。

这种套件一般有四个部分,一片补丁网,一桶腻子,一把刮刀,一组砂纸。跟外科手术类似,首先清理伤口,然后贴上网格化的补丁,然后用刮刀把腻子抹到补丁上,等补丁干燥后,用砂纸打磨墙面。这一套我其实不是第一次买,之前住纽约的时候墙面发霉,新冠期间不想让人上门修,就网购了一套自己在家里补墙,不过那个墙是实心墙,所以前后我买了两桶腻子才把发霉的墙面全部修好,因为没有石膏板,所以补丁也没用上,这次算是第一次补这种美国特色夹心墙。不过补完了打磨后又出了新问题,腻子的颜色偏白,补完后墙上像是多了块补丁。

我的问题必然也是大家的问题。查了下发现补墙的腻子单纯就是补墙,想修复需要自己去刷漆。然后,我的第二个课题来了,如何配色?我本身对颜色描述不敏感,在我眼里口红里存在色号差异跟五颜六色的黑是一个概念,虽然我能看出颜色差异,但不会描述。不过显然我不是个例,美国人的解法就是你带一块墙到家具店,然后让店员用一种机器来检验颜色并找出对应颜色的墙漆。在去家具店的路上,一辆车突然停到我面前,里面有个中东大哥从驾驶位拿着一条金链子说自己钱包丢了,想换点现金去吃饭,后座上一位妇女两个小孩,给了20美元链子自然是不敢要,万一来路不正麻烦更多,大哥似乎有点感激,我就当是遇上美式诈骗了。进了店里很快就找到了对应墙漆,回家几分钟就补上了,颜色这回是对上了,但还有点纹理区别,不过这就属于超纲内容了。修完墙,另一个问题就出现了,墙是如何防腐的?


为此周末我去了康州南部的神秘镇,这里有世界最大的海事博物馆。当前全球造船业基本被中韩两国瓜分,川普上任时就声称要重振美国造船业,而这家博物馆就有修复很多17、18、19世纪船只的工坊。之所以关注造船厂,主要是因为船只防腐一直是个大问题,而工业革命之前的船大多数船还是木质船,很容易长船蛆,也就是一种长在木头里的蠕虫,这跟木质墙体防腐防潮是相关的。18世纪的应对方法是在船底包裹一层铜皮,不过木质船的船钉多是铁钉,铜皮铁骨不但代表坚固,也代表原电池,曾经就出现过铁钉被腐蚀完了铜皮直接脱落的事故。工业革命后出现铁壳船,更是电化学天堂,博物馆里就有一艘训练用铁壳船,这艘船曾经沉入海中带走了几十人,后来被捞出来接着干活,现在则被放到了博物馆,这也是我第一次登上一艘已经沉过海的船。这里有一个有意思的故事,世人都知道五月花号是第一艘到达美洲的船,但其实还有三艘船到的更早,其中一艘Susan Constant号的20世纪复刻版现在就在这个博物馆里修缮,这是一艘纯正的商船,来美洲就是来做生意,没有宗教迫害,也没有五月花公约传世,甚至连感恩节火鸡的故事都套不上。但以我对美国的了解,这艘做生意的船其实更能代表美国人,当然就没有那么多传奇性了,这种建国叙事有助于巩固国家认同,但叙事跟历史一定要分开讨论,否则后面只能用更多的错误来掩盖前面的错误。

在这里,我又了解了捕鲸活动,这项业务曾经非常火爆,主要是鲸鱼油脂在煤油出现前一直是最优质的油料,后来石油时代来临才留存下了我们今天能看到的鲸鱼。鲸鱼其实跟美国颇有渊源,早在殖民地时期捕鲸就是从英国获取信贷的主要来源之一,而在美国搞淘金热的同一时代,捕鲸是美国第五大产业。有意思的是,在石油取代鲸油的过程中,石油最大的作用反而是提升了捕鲸的效率,而鲸油很长时间也被用作工业发展的润滑剂,20世纪见证了人类捕鲸的最高效时期,然后就快速衰落,毕竟过度捕捞下再高效的捕鲸技术也没法发现不存在的鲸鱼。到今天,美国鲸鱼产业则彻底转成了观鲸为主的旅游项目。

然而,日本在2019年退出了国际捕鲸委员会,重启了商业捕鲸。当然日本人不需要鲸鱼作为油脂,其重启商业捕鲸的主要动因是想保持吃鲸鱼肉的文化传统。这点我其实不太理解,就像外国人也不理解为啥中国人喜欢吃鱼翅燕窝一样,类似的不理解还有很多很多,这类打着文化传承旗号的传统在现代社会还有多少保留的必要我其实也没有答案,也许让这些东西保留在博物馆的展柜里比保留在现实生活中更合适。钻木取火是我们智人的文化传统,但不代表我们现在点火也要保留这个手段,该进入历史的就让其进入历史吧。

其实这就是我培养爱好的过程,爱好也不应该被设定为某种目的性的项目。我想练好滑板,结果真正练好的是补墙技术,而透过墙的存在又可以了解船只、捕鲸活动等有趣的主题。这些奇奇怪怪的知识并不是以有用为目的而获得的,更多像是探索迷宫时打开的一个个宝箱,里面装了些破烂但有趣的玩意儿。我观察到很多时候人们聚在一起所聊的主题更多是所有人的经验交集,房子车子票子本子孩子,这些东西聊来聊去也就那么回事,变成了一个又一个的人生主线任务,做什么事都想走个捷径找个最高效率,这样既累也没意思,早晚会被人工智能冲击成找不到存在感的行尸走肉。

窃以为爱好这张考卷,不是得分越高越好,而是你想得几分就得几分,不多也不少,这其实比一味得高分更有意思。