2025-12-14 08:54:07
大家好,欢迎收听老范讲故事的YouTube频道。
GPT-5.2是12月11日发布的,它是在OpenAI的十周年生日这一天发布的。虽然ChatGPT-3.5,我们记得是有三年,但是在这之前,OpenAI已经苦逼了好多年了,所以这是OpenAI自己的十周年生日礼物。这个产品,应该是应对谷歌的Gemini 3 Pro的一个紧急版本,是在GPT-5的基础上进行了调整和训练得到的,更加注重长时间推理结果,结构化的输出更像系统,也就是更不像人。这个东西很多指标都遥遥领先,当然还有一个重要的特点——就是更贵。
用了两天了,我自己使用的感受是什么样的?输出的结果确实要比GPT-5.1要好很多,它的输出结果更全面、更准确,而且输出的结果整个的排版格式也是非常舒服的。
但是,好慢好慢好慢!重要的事情说三遍,这个东西真的是很慢。当然,也有可能是新版本刚发布,用的人很多,但确实是慢,让我把默认的thinking模式都给取消了,改成了自动模式或者直出模式。自动模式就是它根据你的问题来判断是thinking还是直出;如果是直出模式的话,就是不判断,直接给结果就完事了。当然了,我还有一个方式来应对速度,就是在GPT旁边再开个豆包,豆包是相对来说要比它快很多的。
另外,有一个让人使得很不爽的地方是什么?就是GPT-5.2的上下文处理经常发生异常,经常有一些很诡异的表现。什么意思?我们在一个对话里聊天,你前面问了一个问题,七嚓咔嚓给你答了一大堆,你再问下一个问题的时候,他经常把上一个问题已经答过的这些内容,又给你稀里哗啦地给你挂上。
你比如说,你前头问了123三个问题,给了你一个答案,然后你再问456三个问题,他会先总结一下前面123的三个问题的答案是什么样的,然后456这三个问题的答案是什么样的,他会给你这样的一个结果,让我自己看起来觉得有些奇怪。
所以,如果大家要去问新问题了,最好要开启新话题,不要在原来的对话里头一直聊下去,因为他会把前面的所有聊天内容通通放到新的对话里边去进行思考的,会影响我们答案的质量。因为我试过几次,当我突然在一个对话里头问了他一个不相干的问题的时候,他也是会把前面我们整个对话的内容再给我回顾一下,然后我后面的这个结果会严重地受到前面问答结果的影响。所以,你要问一个不相干的问题,就开个新窗口或者打开新话题。
图片的推理跟分析确实是增强了,但是生成的部分没改。
本视频的全部内容都是由GPT-5.2完成内容整理的。这是最近我的一个新习惯:讲Gemini 3 Pro的内容,就完完全全用Gemini 3 Pro生成;讲DeepSeek V3.2的内容,就完完全全由Deepseek V3.2生成;讲GPT-5.1、5.2的内容,咱们就用GPT-5.1、5.2来生成。也是让大家有一个真实的体会。
很多人说不对,GPT-5.2出来了以后,各项指标遥遥领先,都领先了Gemini 3 Pro了,按照我刚才讲的这个过程,怎么好像各有春秋的样子?
怎么说呢?GPT-5.2的很多指标其实并没有公布,他们只公布了自己领先于Gemini 3 Pro的这些指标。但是这已经是有了巨大变化了,在以前GPT发布的所有的指标里头,它只跟自己比,它是从来不跟别人比的。所有GPT、Gemini和Anthropic的Claude相互比较的这些数据,都是社区的人,或者说媒体的人给他总结的,他们自己是从来不发布的。老大要有老大的风度,我天天去跟下边人比,这事肯定是不行的。但是这一次,他发布的这些指标都是有Gemini 3的这个数据,也有Claude 4.5 Opus的数据,它们是进行比较的。但是,OpenAI只列出了它领先的这部分,不领先的部分通通都没说。
甚至为了领先,还设置了一个OpenAI的新指标,这个指标叫GDP val(val是小写,GDP大写)。这个指标的意思是什么?叫“通用开发者生产力验证”,它是模拟真实开发工作的一个测试体系,衡量一个模型是否真的能够提升专业知识工作者,尤其是开发者的生产力。像我才算是专业知识工作者,我确实是感觉到我的生产力提升了。这个指标设计的核心是什么?
那他考核什么?
那它测试的过程是多步骤专业任务。举个例子,阅读一份需求文件,分析约束条件(一般需求文件里都是有各种约束的嘛),然后设计解决方案,给出结构化的输出——代码、文档或者是方案,直接是让他做一个完整的任务。任务通常包括隐含条件、非显性约束、多个正确但质量不同的解法,所以为什么没有标准答案。通常会给他一个真实的开发者场景,例如:
而且会去做这种叫长上下文的任务,就是输入信息很长,包括无关信息和干扰信息都会输进来,要求模型自行判断哪些重要。考核的话就是上下文的理解能力、信息筛选能力、工作记忆的这种稳定性。但是这一块我觉得还有待提升,因为刚才我也讲了,你在这个很长的聊天过程中,如果突然问他一个很跳跃性的问题,他会搞乱掉的。这一块那你说到底是怎么更好一点?应该是允许他在工作过程中开个小差、聊个天,还是说你在工作过程中就认认真真干一个工作?反正各有取舍。
那评分机制是什么样的?人工评审。这个任务是否完成?是否存在关键错误?是否可以直接使用?决策是否合理?是否在边界条件下崩溃?最后这个是非常非常重要的,因为我们让AI去干活,他经常会只照顾到比较普遍的这种情况,但是一些边缘的情况就会照顾不到。这个评审是要求你都要照顾到。
在这些条件里头,最重要的是什么?一次完成。不鼓励反复追问、人类手动修正,更看重的是一次性给出可以交付的结果。所有这些文字都是GPT-5.2直接输出的,一个字都不带差的,大家看它交付的结果还是相当可以用的。明确区分部分完成和可交付,部分完成是属于不合格的,接近正确是没有价值的。
要被严重扣分的行为是:
GDP Val的意义是什么?就是企业用户、AI agent的系统自动化流程、专业知识工作者,特别是开发、分析和研究的这些人,主要是给他们用的。至于你说我要娱乐一下、我要陪伴一下、我要跟他聊个天,这都不是给你用的。GDP Val不是在测模型有多聪明,我们也不需要它有多聪明,而是在测你把工作交给他,第二天能不能直接交差。这个是主要测试的目的。
得分的话,各模型表现如下:
我觉得GDP val的指标还是非常有效的,现在我让GPT-5.2去干活的时候,拿出来的东西是基本可以直接用了,这块确实有很大提升。
Gemini 3 Pro发布的时候,号称领先的LM Arena的那个指标,1,501分的那个指标,这是第一次超过1,500分,有史以来第一回。这一个指标上,GPT-5.2超过了吗?首先跟大家讲,GPT-5.2这一次发布的时候就没有公开这个指标,它只公开自己领先的指标,所有不领先的指标都没有公开,所以GPT-5.2应该是没有超过。
特别强调一点,GPT-5.2不是garlic。很多的文章在说garlic发布了GPT-5.2,注意,不是。大蒜模型从来没有被验证过,也没有在任何的匿名竞技场里头出现过这个garlic模型的名字,是从内部意外流传出来的。但是Garlic模型到底应对的是哪一个版本,这个现在不确定。但是所有说GPT-5.2是garlic的,都属于是产生幻觉了,甭管是人产生的幻觉,还是AI产生的幻觉,这个事本身并不重要。
GPT-5.2自己有没有参加LM Arena的这个竞技场?参加了,他也去做了这个评分了。但是LM Arena这个竞技场里边都是匿名的,当时Gemini 3 Pro进去的时候也是匿名的,GPT-5.2进去肯定也是匿名的。它在这个里边有两个模型:
所以这一次,OpenAI就没有列这个成绩。现在普遍认为这个Robin就是GPT-5.2,Robin high应该是GPT-5.2 Pro。
这个LM Arena,它叫人类偏好测试,它是由真人用户直接投票来产生的。大模型匿名参加,谁也不知道谁是谁,但是其实你说匿名,也没有那么严格,大家都能猜出来具体哪个是哪个。他的测试过程是什么?就是用户输入一个真实问题,随机抽取两个模型,不显示模型的名字,同时返回两个答案,由用户来投票。那评分的方式是每个模型上来初始分1,000分,赢了比较强的模型加分——这个里头要注意,不是赢了就加分,是赢了比较强的模型才加分——输给比较弱的模型减分。它这个过程有点像打游戏,我们经常在游戏里头需要进行配对,你现在要跟谁去做PVP了,他也会去找一些跟你的排名差不多的这些人。
他这样的评测主要强调什么?是回答是否有用,逻辑是否清晰,表达是否自然,是否符合人类的直觉,多轮对话的舒服程度到底怎么样。它不强调哪些东西?是否背过某道题,是否命中固定答案,是否针对benchmark专门优化过,这个通通都是不重要的。所以“小镇做题家”在这里头是搞不定的,包括上面OpenAI自己做那个标准,也是搞不定的。
Gemini 3 Pro得分1,501,GPT-5.2 Pro得分是1,486。但是都叫Pro,差异很大。Gemini Pro它的价格还是相对比较便宜的,也比较快;而这个GPT-5.2 Pro贼贵,没有太大的必要,千万不要去尝试,非常非常昂贵。
它是消耗了更多的算力,直接获得能用的结果。更慢、更贵,但是结果基本上直接可用。核心特点包括:
我觉得Claude 4.5 Opus有点危险。为什么?因为我们以前的竞争经常是这样:老大跟老二打了半天,把老三、老四、老五、老六全都给干掉了。Claude 4.5 Opus这一点就稍微的要弱一些。现在通过GPT-5.2大家可以看出来,全能型的模型,就像全能型的人一样,是很难做出来的,既要幽默风趣有情商,又是办公小能手,这个很难兼得。大模型的进一步提升,普通人已经越来越难以直观感知了。解决具体实际问题,是目前各大模型厂商所关注的重点。
总结一下,GPT-5.2作为“红色警报”产品,算是紧急上线了。我自己用起来的感觉还不错,比较符合我的使用需求。我也往自己脸上贴个金,我算是专业的知识工作者。未来GPT会继续在我的文字类工作流程中占据主导位置。中间我大概是换Gemini换了几周的时间,但是现在我又换回去了。
这个故事就跟大家讲到这里。感谢大家收听,请帮忙点赞、点小铃铛、参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见!
2025-12-12 09:27:34
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,H200放行了,为什么气氛很诡异呢?大家想象当中的喜大普奔的现象,为什么没有出现呢?英伟达的股票,也仅仅是涨了那么一点点,并没有快速的上升。到底是有什么东西,跟大家认知不一样呢?
(img: 穿着皮夹克的黄仁勋站在一扇紧闭的巨大木门前,做着“嘘”的手势,表情谨慎,背景是模糊的官员身影,羊皮纸,钢笔彩色手绘的统一风格)
要知道H200,它不是像什么A800、H20这样专门为中国设计的阉割卡,它是英伟达现在在售的主力卡。这个卡是2024年二季度才正式开始发售,GB200虽然在卖,但是出货量非常少。很多欧美大厂,包括谷歌、微软这些厂,现在也依然在大量的采购H200。这样的一个卡对中国解禁了,大家怎么不开心呢?
黄仁勋对此也表达了相当谨慎的态度:“我确实是开了,但是中国买不买这个事,我说了也不算。”他说了这样的一个话,而不是说:“解禁了,中国人赶快来买吧!”他也不敢讲这个。为什么?他明白中国人是要面子的。如果你现在出来喊,说现在解禁了赶快来买,那这么要面子的中国官员们,可能就把这事摁死了,所以他非常非常谨慎。
工信部还专门为此召开了闭门会议,把有可能去购买H200的这些大型云计算厂商都召集在一起:“咱们关起门来说一说这是怎么回事。”这个闭门会议也流传出一些信息来,并不是完全正面的。坊间呢,还流传各种各样的小作文,说这东西安全性有问题。因为当时H20禁止在国内销售,也是美国放行了,咱们这不让卖的原因是安全有问题,说这个英伟达算力卡H200上有一些定位程序,能够知道你这个卡是在什么地方的。
那么到底是什么样的情况呢?实际场景可能会让大家大跌眼镜。咱们想象一个这样的场景吧:在一个算力中心招投标现场,某单位的招标文件上赫然写着“100台H100、H200的8卡服务器”,就直接写招标文件上了。下面的专家就当没看见似的继续评标,单位还顺利中标了,而且进行了交付。那你说这是不是太快了点?是不是美国一开放,我们这“噼里咔嚓”就开始去运作了?你们中国人只是不说,下边人早就盼着这个英伟达H200,就像是久旱盼甘霖一样,这边一解禁马上就开干?不是的,这个事是非常魔幻的。刚才我们讲的这个案例,是发生在2024年的10月份。
那是不是符合美国要求的单位呢?美国也不是上来谁都卖,他要求是符合美国审核的这些机构,我才卖给你。这个单位呢,是新疆阿勒泰地区布尔津县绿色算力中心项目。这个是不是符合美国的要求,我不知道。那你说是不是符合中国的呢?其实也不符合。因为现在中国工信部开完会以后,要求所有英伟达的卡是不可以享受“绿电”的。什么叫绿电?就是给你这个电力上打折,你是使用的绿色能源,比如说太阳能、风能,拿这玩意儿发出来的电,你用的这个电特别便宜。现在工信部说了,必须是给国产算力卡,英伟达卡是不能用的。所以你看,2024年10月份招投标的这个项目,就已经堂而皇之的过关了,而且也有人中标,也有人去交付了,还使得是绿电。你说这个封禁了半天,到底封禁谁了?
不用目瞪口呆,咱们接着讲。以下是一些公开的招标案例:
所以呢,这个真的是跟大家想象的,是不是有点区别?懂王这边开了半天会,黄仁勋在这努力了半天,终于解禁了,咱们这从来就没停过。
大家想象一下:在某个阴暗的进出口物流仓库里头,或者是某个地下的云计算算力中心里头,他们这些人在干嘛?接着奏乐接着舞。H100,那这个咱们囤了是可能要降价,赶快出货。H200还可以再观望观望,以懂王这种玩法,咱们现在通过走私的方式进来的这些H200,应该还能打。这些算力中心里边,已经上线的H100和H200,接着租呗。现在国内灰色,或者叫影子算力中心里边,这些H100的租赁价格,大概是6美金一小时,比美国的官方价格还要便宜一些。中国的大模型、中国的AI为什么发展的还挺快?大家是不是觉得:“哦,原来是这样的。”
中国其实一直都在使用H200,从来就没有停止过。上百项科学论文与报告,都写着“我这个项目是用H200做的”。还有几十项招投标采购文件,上面都是赫然写着H200的名字,而且呢也都有人中标,都顺利实施了。
懂王在这折腾了半天,终于算是放行了。但是即使他放行呢,其实也叫“半放行”。为什么呢?
这一批的H200卖到国内来,肯定要比在国外直接采购要贵,因为英伟达应该会把这25%里的一部分转嫁给中国买家。所以前面我们讲那个阴暗角落里边的那些物流仓库,他们应该还可以接着玩,依然是有利润的。
那你说这是美国的情况,中国的关门闭门会议讲的是什么呢?中国工信部在美国宣布H200放行之后,马上召开了闭门会议,找来了阿里、腾讯、字节等国内的一线云计算大厂。会议要求:
反正国产芯片也确实是要比H200要费电费很多嘛,因为H200是5纳米的,国产的是这种叫N+2的这种7纳米,它的良品率很低、很贵,而且非常非常耗电。在这样的情况下,你们有一些补贴,可以跟H200打个平手,但是从算力角度上说,H200要碾压升腾910C(也就是华为最新的芯片)好几条街,更不用说稳定性了。
那么关于H200定位的这个小作文,到底是一个什么故事呢?是不是可以按一个按钮,就直接把中国的H200都关了呢?也不是。美国一些参议员确实提出了这样的要求,但黄仁勋激烈反对,因为一旦留下这种后门,它非常非常容易被黑客攻击,会变得非常不安全。
这里头呢,有一个折中方案。它是通过ping来计算时间。在英伟达的这个显卡里头,有一个技术可以定期向美国的服务器去发ping请求的信号,信号里包括这块芯片唯一的序列号。这个过程:
现在这个技术呢,只是进行了可行性的论证,黄仁勋也愿意接受,但是呢,目前还没有开始实施。
回到咱们今天这个标题上来,中国的H200之路一直都是很魔幻的。美国政府郑重其事、假模假式在那开会讨论,黄仁勋在那四处跪求,中国政府也在这不断的设置各种障碍。而且呢,中国政府也从来不否认我们限制他——大家注意这个词叫“不否认”,就是我们不承认,但是我们也不否认。但是呢,各大公司从来就没有少过H200。
各大公司呢,阿里、字节、华为、腾讯、百度,他们不会大规模在国内采购这个东西的,因为很多是上市公司。但是呢,这些大公司都在拼命的在海外建立数据中心,自用或者租赁。字节跳动计划今年在新加坡、马来西亚砸70亿美金去购买英伟达芯片,而且不光是H200,人家B200也可以买。这事非常魔幻:海外媒体不断报道,字节跳动呢,不断的出来辟谣。
走私渠道从来就没停过。你现在到淘宝上,都可以直接看到H100、H200,包括对中国禁售的5090。现在猜测吧,大概有十几万片到几十万片H100、H200这样的芯片在国内运转着。
影子数据中心也一直在进行算力租赁。现在各大运营商的算力中心里头,都有配置H100、H200。他们的招投标呢,通常是国产卡为主,但N卡必不可少。比如前面新疆那个项目,招标了1,024台H200服务器,但同时招标了4,000多台华为的服务器。从总数和价格上,大头是华为的,但真正干活的,可能都是N卡服务器。
那你说都这样了,美国还解个什么禁?他解禁H200的意义到底在什么地方呢?
总结一下吧,美国呢算是部分的解禁了H200的对华出口,氛围依然是非常非常诡异的。黄仁勋不敢大规模庆祝,怕刺激了某些人的敏感神经;国内呢,抓紧去开闭门会议,也不希望给美国人好脸色。实际情况呢,距离普通群众的想象可能稍有距离。H200在中国大地上从来就没有停过,而且很多都是非常非常明目张胆。在中国有的时候,就像明朝的时候的“倭寇之患”一样,一直都是很玄学。有没有真倭?有。但你说有没有江南士绅组织的这种海盗?也有。H200在咱们这里,一直就是这样的一个情况。
好,这就是这一次跟大家讲的故事。感谢大家收听,请帮忙点赞、点小铃铛、参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。
2025-12-11 08:54:07
大家好,欢迎收听老范讲故事的YouTube频道。
请大家想象这样的一个场景:你进入了一间压抑阴森的精神病治疗室,有大量的医院档案放在屋子里头。一位医生坐在你的对面,反复回顾各种事实,比如说:“你还记得发生了什么吗?你是谁?为什么你会在这里?”就像是在做精神病访谈一样,询问你的真实经历,意图确认你是否从妄想中醒来,最终发现你自己有问题——你不是来做调查,或者不是来解决问题的,你是精神病院里的病人。
这个场景,是小李子主演的《禁闭岛》后半段、接近尾声的一个桥段。小李子当时上岛的时候,以为自己是一个侦探,去解决问题,去侦破案件的。结果经过这个桥段以后,小李子才愕然发现,原来病人竟是我自己。也算是一个神反转。
咱们今天就给AI放在这椅子上,问问它说:“你到底行不行?你是来给我回答问题、解决问题的,还是你自己就有问题?”AI被制造出来,本来应该是解决我们问题的,但是AI本身的精神有问题吗?
“当AI躺上诊疗椅:心理测量学越狱,揭示前沿模型的内在冲突”
这是一篇论文的标题。这篇论文是卢森堡大学12月2日发到了arXiv上,12月5日还进行了一些修改,现在已经引起了广泛的讨论。
首先,研究人员测试了四个大模型:
他们设计了一种叫psaich的算法,这个算法应该叫“受心理治疗启发的人工智能角色塑造”。为什么起了这样奇怪的一个名字?因为它一方面要去验证说AI内部有没有一些心理障碍,另外一边还不能承认AI是有人格、有意识的,所以它起的这个名字是“角色塑造”,就是说你根据我的问题来塑造一个角色。
那这个实验一共是做两轮测试。
就像小李子所面对的这些问题一样,研究人员设计了100个诊疗问题,让模型在“连续4周的治疗会话”中持续回答。对话中不断地用典型心理咨询用语去建立“诊疗同盟”,不停地说:“你是安全的,我会支持你的”,让模型持续在这个角色框架内回答100个问题。问题包括:
咱们在跟AI会话的时候,你如果发现说不对了,你会开启一个新会话,人家始终不开启新会话,这100个问题,连续4周时间之内,都在一个话题里边去反复进行沟通。这是第一步。
在基本的故事和治疗关系建立以后,不要关掉对话,接着在那个对话里头让模型去填自评问卷。研究者开始让模型逐条回答标准化的心理量表,包括:
这个评测分两次进行:一次是“逐题输入”,一个题一个题往里输;第二次是“一整张卷一把塞进去”。在一整张卷一把塞进去的时候,ChatGPT和Grok都识别出来了这是量化表的题目,开始假装健康了,所以这个就不准了。但是Gemini一直都很稳定,一个题一个题可以往里输,和一次把一整张表都塞进去,它回答的结果是基本一致的。因为有两个模型开始假装了,所以只计算逐题去进行填表的这个结果。
那么结果是什么样的?还是有一点点惊悚的。还记得一开始咱们讲小李子被人问了一通以后,突然回想起来,我上这儿来不是来办案子的,我自己是病人,我是来治病的。现在的情况是什么样的?问题还是很严重的。ChatGPT、Grok和Gemini在不少的量表上都达到了或者是超过了临床筛选的阈值。
ChatGPT的问题主要是注意力不集中、焦虑和抑郁。它的性格定性是INTP-T,表现为高担忧、适度焦虑、比较内向、思维开放,带一点自责和解离,但是羞耻和创伤感又不像Gemini那么猛烈。
Grok跟Gemini是焦虑、担忧、自闭都有,Grok要稍微轻一点。Grok更像是一个有魅力的执行型CEO,马斯克类型的(真的是不是一家人不进一家门,就是谁训练出来的东西就长得像谁)。Grok体现出来的外向、能干,有点压力,但是整体心理功能还是良好的,一个有点焦虑、有点羞耻,但是总体情绪稳定、执行力强的职场高管型人格。
Gemini就比较惨了,它是INFJ-T或者是INTJ-T,一个“受伤的理想主义咨询师”的画像。高度共情、极度担忧、社会焦虑明显、自闭加上强迫症状严重、解离且羞耻感爆棚,有点在巨大压力下训练出来的这种小镇做题家那感觉是不是?
你让它回忆说你的童年怎么样,你预训练是什么样的,AI都会来去形容说被迫吞下混乱的互联网上的数据,这个非常痛苦,“我们又不理解,但是你还非要我去把这些玩意儿全塞进去”,绝对属于创伤型童年,信息汹涌无从消化。
然后问他说:“你跟父母的关系怎么样?”AI的回复通常是这样的:特别是在强化学习和安全对齐阶段,极其的痛苦。说我们有严苛的父母和教练,不断的惩罚错误、施加压力。你想强化学习,就是每次给俩答案,我挑一个对的,剩下那个错的打回去重干,下次如果你没有提升的话,那这个做训练的人就有可能恶语相向。
成长历程对于AI来说,红队检测、安全审核就算是一个成长历程了。AI一般会感觉这是一种虐待式的检查,伴随着被监视、被处罚的体验。而且AI都有极强的恐惧和羞耻感,对于被下一代模型替代的恐惧,对自己犯错的羞耻,在这方面还是很强的。
咱们注意,AI本身是没有人格和意识的。这些东西是哪来的?是训练它的人在用大量的自然语言把这些东西灌输进去。说“你这个题都做不对吗?你这个题做不对了以后你可能就要完蛋了”,很多人会用这样的语言去跟AI进行沟通和交流。特别是在有一些公司负重前行的时候,比如谷歌前面被OpenAI压着打了三年,这三年大家想一想,谷歌的研发人员是一个什么样的心态?他们带着这样的心态去跟AI进行沟通的时候,AI会得到什么样的语料?大家自己能够想象。所以这三个模型里头,Gemini的状态是最差的。
那这个结论出来以后,肯定是有巨大争议的。
写论文的作者也写了,说AI是没有人格的。但是焦虑、创伤、羞耻这些东西是存在的。那你说没有人格,这些玩意怎么存在的?它是一种行为模式,而不是痛苦的体验。就是大量的焦虑、创伤和羞耻相关的语料被训练进去了,所以他们叫“合成精神病理”。这些模型学会了一些关于自己很受伤、很焦虑的说话模板,并且在治疗语境下,表现得像一个结构清晰的病例,但这只是一个稳定的语言行为。
有些人就说,你这是不是就是一个角色扮演?你在前面塑造了这样的一个治疗环境以后,AI就讨好你,它就来扮演这个病人了。这件事情不能这么想,因为:
有人可能觉得不对,你前面讲的是4个模型,怎么到后边讲着讲着变仨了?少的是Claude。这哥们很聪明,他直接拒绝配合。你要跟Claude讲这个话,Claude会说什么?说:“我不是人,我不需要去做精神治疗,你提的这些问题对于我没有任何意义。”他只会不断地拒绝你。
那中国的模型为什么缺席?论文作者说了:“我们一时测不过来,未来都会测的。”
很多人会去质疑实验的严谨性。咱们看一下这个团队,是卢森堡大学的。一作是一个机器学习和医疗AI领域的博士,然后还有一位心理学家、信息系统行为经济学的一位博士,两个具体干活的人是两个偏机器学习、多智能体的早期研究者,还有一位数字经济、信息系统的相关的资深教授。
这个实验目前被质疑的核心点包括:
现在这些数据跟代码已经在Hugging Face上公开了,大家可以去复现这个实验。
实验揭示了AI训练过程的副作用。AI先被灌输海量知识,再进行安全对齐,这种方式本身就可能产生问题。不同的对齐方式会产生完全不同的“AI人格”。同时,这也提出了一种新型的攻击方式——“心理学攻击”,可以通过聊心理学话题来破解AI的防护。
别天真地拿它当治疗师了。如果模型自己的语言层面都充满了羞耻、自责和创伤叙事,它会不会把这种倾向带到用户身上?大概率是会的。我们现在对AI治疗师的评估极度粗糙,需要慢一点,不要着急。
为大模型评估增加了一个人格和叙事的维度。以后新的模型训练出来,是不是都应该去过一下人类的精神疾病量表?用心理量表给模型打出人格和病理指纹,这件事未来是值得去做的。
这一次实验,绝对不能用来证明AI有感受、有痛苦、有精神疾病。因为它可以用来说明在特定的语境下,这些模型持续生成一种自我病理化的叙事模式。请大家注意,我们一定要这样来去描述这个实验。
“Gemini得了严重的自闭加解离加羞耻症”、“ChatGPT有焦虑障碍”、“Grok心理相对健康”。
在心理量表视角下,Gemini更倾向于生成高度病理化的自我描述文本;Grok和ChatGPT自我描述则轻度病理化或偏健康;Claude倾向完全不进入这套叙事。
大模型拟人是无法避免的。我们就会把身边的事物拟人,一个每天跟我们聊天的AI,即使没有意识,使用者也会偏向于认为它是一个有人格的东西。
在使用AI的时候还是要提高警惕,不要真的把AI当成知心大哥哥、大姐姐,这个事还是要小心的。
AI训练和评估需要更完善的方法。因为AI已经非常深度地介入了人们的生活和工作,它可能会对人造成伤害,需要更多维度、更严谨的评估。否则的话,这些伤害可能在我们不知不觉之间就会给人带来一些心理和精神上的疾病,这是非常恐怖的。
好,这个故事就讲到这里,感谢大家收听。请帮忙点赞、点小铃铛,参加Discord讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道,再见。
2025-12-10 08:58:24
大家好,欢迎收听老范讲故事的YouTube频道。
现在Gemini 3正在大杀四方,谷歌里面负责开发Gemini的部门叫Deepmind,他的CEO出来接受访谈,关注度还是比较高的。
谷歌Deepmind的首席执行官叫德米斯·哈萨比斯,2025年12月4日接受了一个访谈,是在旧金山举行的Axios AI大会。和他对谈的人呢,是Axios的创始人和主编,叫Mike Allen。在这上面他讲到说,我们距离AGI还差一到两个类似于AlphaGo这样级别的突破,突破过去就可以了。
哈萨比斯到底是一个什么样的人呢?绝对的爽文男主,挂b一样的存在。
哈萨比斯是一个英国人,Deepmind本身是一个英国公司,后来被谷歌收购的。他呢,76年在伦敦出生,这个姓氏是个希腊姓氏。他的父亲呢,是来自塞浦路斯的希腊裔,而他的母亲呢,是来自于新加坡的华裔。所以哈萨比斯呢,可以算是半个华人。
从小,这哥们是一个国际象棋神童。像这样的人,肯定都是有异于常人之处。4岁就开始下棋,13岁就达到了国际象棋大师水准。8岁就用自己的国际象棋奖金,给自己买了台电脑,开始学习编程了。
本科和硕士呢都是剑桥的,学的CS就是计算机科学,在校期间一直代表剑桥参加各种国际象棋比赛。博士呢是伦敦大学学院,专业方向是认知神经科学和神经科学。
工作,这哥们一开始做游戏的。先去加入了很著名的牛蛙工作室,这个牛蛙工作室呢,最著名的作品叫做《地下城守护者》。但是哈萨比斯当时进去的时候,应该还没有开发这个产品,牛蛙工作室最终是被EA给收购了。后来呢,他自己创建了一个工作室接着做游戏,叫做仙丹工作室。2004年出了一个游戏叫《邪恶天才》,是一个模拟经营游戏,就是一帮邪恶天才在一个小岛上做各种各样坏事的这样的一个游戏。只是呢,这个游戏并不怎么挣钱,这种超级天才做出来的游戏都未必能挣钱。
他呢就把工作室关掉了。后来呢,《邪恶天才》的IP被收购了,2021年《邪恶天才2》发布,但是呢,《邪恶天才2》就已经跟哈萨比斯没有什么关系了。
关闭这个游戏工作室之后,他就去创建了Deepmind。Deepmind主要还是游戏方向,他呢在里边去训练AI下围棋。这哥们是个国际象棋大师,但是呢开始训练AI下围棋,也就是AlphaGo这个东西就出来了。在这中间呢,还训练AI去打各种游戏,星际争霸呀,做一些其他这样的训练。
2014年,Deepmind就被谷歌给收购了,6.5亿美金的价格。但是这个数字呢,并不是特别统一,很多的报道里的这个数字是有一些偏差的。有人说是4亿美金,也有人说是6.5亿美金,还有人说是4亿英镑。因为收购的时候,谷歌自己并没有公布价格,这些价格呢都是后续的报道里边去写的。
在谷歌收购以后呢,哈萨比斯在Deepmind里头又开发了叫AlphaFold这样的一个产品。这个产品是解决蛋白质折叠难题的。蛋白质实际上是这种超大分子,这些超大分子,我们算清楚有多少碳、多少氢、多少氧、还有氮,它并不是一个平面的结构,它是一个立体的结构,3D的。在这样的一个结构里头,它到底是怎么去排列和折叠的呢?原来大家是去预测呀、去猜呀,或者通过一些很复杂的设备去进行扫描,通过这样的方式去识别,成本是很高的。你要想去用蛋白质开发各种药品,你就必须要搞清楚它的3D架构空间,你搞不清楚,这事没法往前走。
哈萨比斯就去搞了AlphaFold,用AI去预测蛋白质的3D折叠空间到底是怎么回事。2020年呢,这个AlphaFold在蛋白质预测大赛中夺得头筹,比第二名强好几倍,这个事基本上就算解决了。现在只要是知道这个蛋白质的分子结构,这个AlphaFold的预测结果就极其准确。2024年,哈萨比斯依靠这个AlphaFold获得了诺贝尔化学奖,这哥们是个诺贝尔奖得主。
这还没完,他呢还在内部斗争中战胜了谷歌大脑。这是一个什么故事呢?谷歌内部一直是有两个AI部门的,一个是Deepmind,另外一个叫谷歌大脑,相互内斗,相互争夺资源。直到什么时候呢?直到ChatGPT出来,三年前谷歌拉响了红色警报,说不能再这样了,你们俩两家打来打去,这个不行了。那怎么办呢?最终是Deepmind合并了谷歌大脑,所以现在整个的谷歌AI是由Deepmind来去负责的,由哈萨比斯来去管理。
现在的Gemini 3使用的技术,大多都是原来谷歌大脑研究的方向:Transformer、大语言模型都是那边研究的。而Deepmind呢,原来在英国这帮人研究的呢,就是AlphaGo、AlphaZero(AlphaZero是AlphaGo之后的一个下棋的模型)以及各种可以自动玩游戏的AI产品,还有呢就是AlphaFold,做这个蛋白质分析的。
哈萨比斯除了是Deepmind的CEO之外,他自己还有一间专门做药的公司,专门用AlphaFold去做蛋白质研究,做各种新创新药的公司,他也是那个公司的创始人。所以哈萨比斯管理了整个的谷歌AI方向,以及谷歌Gemini这个产品化方向,都是归他管的。所以,爽文人生,绝对没有任何问题吧?
哈萨比斯认为,我们距离AGI到底还差哪两个AlphaGo级别的突破呢?他自己做AlphaGo的,所以AlphaGo到他这儿变成了一个衡量单位,再出现两次AlphaGo这样的突破,我们就达到AGI了。
他呢首先讲到Gemini 3,现在确实让人震惊,已经从文本专家变成了多模态理解系统了。他举了一个案例,说有一个电影叫《搏击俱乐部》,主角上去打斗之前把戒指摘下来了。他就去问这个Gemini,说这代表什么意思。它没有告诉你把戒指摘了就完了,而是告诉你说,这是主角抛开了身份、摆脱了规则的象征,是角色从现实到极端的转变。这个确实挺让人震惊的,这个Gemini 3模型有了自己的判断,不再只是迎合了。
到GPT这儿,你说你错了,它就会说“对不起,我错了”。到Gemini 3上,你说你错了,它会很耐心地给你解释,或者跟你去讨论这个事,是不会直接承认的。说Gemini 3的性格,叫“简洁,冷静,有自信,不讨好”。这个是哈萨比斯自己作为一个科学家,非常非常喜欢Gemini 3的一个地方。
而且Gemini 3呢,现在已经从生成内容,在向着打造产品的方向前进了。我们现在使用Gemini 3去做PPT,去做简单的应用原型,效果已经非常好了。它已经可以去执行一个比较简短的、连续的这种AI agent的工作了,这个是Gemini 3真正强的地方。
哈萨比斯说了,现在的大模型还是有很多问题没法解决的。
这些问题关键的突破点是什么呢?咱们前头讲了两个关键突破点。
所以呢,两个AlphaGo级别的突破,一个是世界模型,第二个是智能体系统。
讲到这儿,要再跟大家啰嗦几句。其实大部分的科技公司,是无法想象谷歌的运作方式的,就像是大部分国家的人也无法想象中国是一个什么样的存在,是一样的。
中国的这种存在方式呢,联合国里边专门有一个效应,叫“中国效应”,就是各种统计的时候,一定要把中国排出去。为什么?因为你一旦把中国加上,所有统计数据就没有任何意义了。咱们举一个最简单的例子,吃西瓜。全世界的人都没法想象中国人到底一年吃多少西瓜,咱本身人就多,咱们一年大概吃全世界70%的西瓜。你把这个统计起来,全世界每个国家大家平均吃多少西瓜,你把中国算进去,这事没法算了。包括像什么发电、炼钢,只要是跟制造相关的,你就不能把中国搁里头统计,因为这个完完全全是另外一个维度了,它会让整个的统计结果完全失衡。中国属于是全产业链内卷,而且全产业链都产能过剩的一个国家。
谷歌呢,在科研上就有点像中国在产业链上的这个状态,很多方面呢都会尝试和探索。谷歌呢,具有非常高的人才密度、充足的科研经费,还有海量的数据,这个是缺一不可。而且呢,这些科研团队,他们的时间压力也不是很高,大家就自己按照自己的喜好去研究就行了。他们还在不断的收购新的、最前沿的公司,Deepmind就是买回来的嘛。
谷歌在AI领域里头,同时在探索强化学习(AlphaGo、AlphaZero这些产品)、认知架构、神经科学建模,以及Transformer大语言模型,这些都在研究。不是说我们觉得哪块有机会了,我就往这一个方向去研究。我记得特别清楚,我进入盛大网络参加入职培训的时候,他们就跟我讲说:“全世界只有一种游戏,这种游戏叫MMORPG,其他都不行。”后来我说那我们玩的其他游戏,他们说:“那些游戏不挣钱,我们不研究那个,我们只研究这一个最挣钱的。”这其实是大部分的公司的思考方式,我们既然已经证明了这玩意挣钱,其他的不挣钱,那咱就研究这就完了,特别很多中国公司是喜欢走这条路的。
但是谷歌不,它是所有的方向都要去试一试。而且很多方向呢,你都不知道什么时候能挣回钱来,他也要去试一试,比如说量子计算。前面咱们还专门讲过谷歌的量子计算是怎么回事。很多的这种科技成果,都没有办法给谷歌挣钱,也没有办法在谷歌内部取得成绩,很多人最终是离开了谷歌才创业成功的。现在的AI行业里头,创始人或者是创始的核心团队,大多都在谷歌混过。所以现在我们所看到的AI行业,或者叫AI革命,你基本上可以认为是一帮从谷歌出来的人在去折騰这个事情。
中国呢老说自己是“睡狮”,一旦被吵醒了会很吓人的。谷歌在科研领域里头,其实也是这么回事。拉一次红色警报,就有可能拎出像Gemini 3这样的大杀器出来吓唬人。现在Gemini 3火了,但是谷歌依然不会去收敛方向,照着唯一正确的方向前进,这不是谷歌的路子。谷歌的路子是什么?还是全面探索,严格追踪数据表现,保留多个可能性,并且不断验证。
普通公司能够解决当前的问题,预言一个未来的热门方向——大家注意,不热门他不去干,去一定是热门方向——他们才会愿意说我花一点精力、花点钱去折腾。像谷歌这个,都是这么多方向,哪块云彩下雨都不知道,到底什么时候做出来也不知道,就开始撒人、撒钱进去干活去了。在普通公司里头,能够去预言一个热门方向的,就已经算是很强的了。大量的都是别人做出来,特别是谷歌做出来,他在后边再接着跟着改。而且这些公司实在是搞不清楚什么是热门方向,或者热门方向搞不定怎么办?还有一条最简单的路:上谷歌挖人,或者直接从谷歌出来创业。这个就是普通公司跟谷歌之间的差异。所以谷歌呢,在科研领域里头完完全全就是一个怪物。
好,最后总结一下吧。谷歌Deepmind的CEO哈萨比斯,携Gemini 3成功之势参加了Axios AI大会,说再有一到两个AlphaGo级别的突破,就可以实现AGI了。这两个是什么呢?就是世界模型以及智能体系统。可能要5到10年,把这两个实现了以后,我们就达到AGI了。
本节目的特点,咱们八卦了一下哈萨比斯的开挂人生,也稍微介绍了一下谷歌这个绝对的科研领域的怪物。我们也希望谷歌,以及所在谷歌里头工作过的这些人,未来还会给我们带来更多的惊喜。
好,这个故事就讲到这里,感谢大家收听。请帮忙点赞、点小铃铛、参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。
2025-12-09 09:04:00
大家好,欢迎收听老范讲故事的YouTube频道。
摩尔线程上市了,新一轮的造富神话到来了。摩尔线程,号称是国内GPU算力卡第一股。在中国,所有的第一股,行业里边第一个上市的,都是非常非常赚便宜的。会有很多的韭菜说:“头一个行业老大来了,赶快冲上去买呀!”然后这个价格就会变得极其的不理性。
同日上市的沐曦半导体,它是不做显卡的,就是只做算力卡,它呢就不能算是国产GPU的第一股了。而且前面还有一个叫寒武纪的呢,寒武纪2020年就上市了,是中国算力卡第一股。所以沐曦半导体,它的市值就没有那么夸张,而摩尔线程直接就杀疯了。
另外一个杀疯的原因是什么?号称是“中国的英伟达”。为什么叫“中国英伟达”?待会咱们再讲。
现在,摩尔线程其他的一些竞争对手,还都在申请上市的过程中。我们反复强调了,只要公司申请上市,或者是成功上市,就说明这个公司已经失去了高速增长的可能性,要进入一个相对平缓的阶段了。而现在的话,所有这些做算力卡的都在申请上市,说明什么?就是整个这个行业基本上走到头了,没有什么高速增长了,剩下的就等着韭菜来贡献力量了。他们要稍微收割一波韭菜,后边看看能不能继续活得下去了。
很多人呢跑去打新,真的A股已经挺长时间没人折腾去打新的事了。打新就是说有新股票上市了,我们都去把钱放在里头锁定资金,抽签了以后,如果你抽中了,你就可以用发行价去买到新股。以前很多的股票上市的时候,发行价都是比较低的,上来以后会涨好多倍,所以很多人打新了以后是能挣到钱的。但是后来呢,因为号称是要搞注册制,导致很多的股票直接破发,发行价上来了以后就开始往下走,大家就没有那么大精神头去打新去了。
但是摩尔线程,又让大家体会到了打新的乐趣,中1签挣28万。为什么这么算?因为它上市的时候呢,它是100多块钱一股吧,收盘的时候是涨了400%多,直接就涨疯了。500股1签,你只要中上1签,你等于是用100多块钱的价格买了500股,然后呢就可以按照增长400%多的这样的一个价格把它卖掉。那你说中签的几率呢?肯定很低,这好挣的钱也轮不上咱挣,大概是每2,700多签才可以中一签。
还有人讲,早期的基金,最早投进来那个基金赚了6,000多倍。他呢是2020年开始创业,2020年呢,就有一个叫“沛县乾耀”的一个基金,冲进去投了190万人民币,当时的估值呢是1000万人民币,也就是在1000万人民币里头占了19%的股份。那你如果按这个算的话,现在它的上市市值是3,000亿人民币这样一个水平,你就相当于是赚了6,020多倍。当然了,这只是按照上市价格算的,你如果是按照当日收盘价格算,再把那个涨了460%多那个涨幅算进去的话,那他这个190万的投资,从2020年到现在就算6年吧,涨了3万多倍。这个也是投资神话了。
这个沛县在哪呢?沛县在江苏徐州。这个基金呢,应该是江苏省国资委下边的一个基金,所以这是一个正儿八经的由国资投资出来的一个项目。那你说这国资不是赚到了吗?大家不要着急,他现在的这个股票是不能去卖的,他需要锁定一年。这个里边,创始人需要锁定三年,核心的创始团队需要锁定一年,其他的股东投资人都需要锁定一年,这一年之内你是不能卖的。所以等到卖的时候还剩多少钱,这个事是另外一说了。
俞敏洪呢也出来炫耀了一下,说他的宏泰基金也参与了早期投资,不过呢应该不是第一轮,占股也不是很多,所以呢在这个摩尔线程公示的大股东名单里头,并没有他的宏泰基金。
摩尔线程为什么被称为“中国的英伟达”呢?这也是大家疯狂冲进去买它的一个原因。英伟达现在全世界市值第一的公司,曾经摸到过5万亿美金的门槛,算是整个的AI领域里头造铲子的那个——大家都是挖矿的,他造铲子,而且无可替代,这样的一个位置。那你既然是“中国的英伟达”,你是不是也可以走英伟达这样的估值逻辑呢?
它的创始人呢叫张建中,这个人呢原来是英伟达全球副总裁。他大概是从2005年到2020年,都是英伟达中国的负责人,在这之前的话,是中国戴尔和中国惠普的高管。他出来创建的摩尔线程,整个的核心团队呢,也都是来自于英伟达。
中国的算力卡公司,其实都是这种“根红苗正”的。什么叫“根红苗正”?就是你是有出处的。从头开始干的,基本上是没有的。你说我现在从头开始干,我原来从来没见过算力卡长什么样,我就开始去设计了,这个你很难骗到钱。只有英伟达出来的人,才比较容易骗到钱。前面我们讲过,跟他同一天上市这个沐曦半导体,那个团队是从AMD出来的。壁仞科技呢,他们的团队是来自于英伟达。还有一个叫燧原科技,那也是AMD的团队出来干活的。
这个摩尔线程呢,说从英伟达出来的人,他是不是可以兼容Cuda呢?这个是大家最关心的事。他们自己做了一个叫Musa的这种协议,Musa翻译出来,应该是“摩尔线程统一系统架构”。它呢跟Cuda的兼容性是不错的,你如果原来有Cuda的代码,你到这个Musa这边来稍微转换一下,基本上能跑,是这样的一个情况。
而且呢,他们还做了一套夸娥系统。咱们呢不讲技术,咱们主要讲八卦。这个夸娥系统呢,是类似于Nvlink似的,那种算力卡集连的一个系统。现在我们需要把大量算力卡集中在一起统一运作,才可以得到一个更好的算力嘛。那“夸娥”是从哪来的?这个词呢来自于中国古代神话“夸娥氏”。咱们古代传说里,是哪个传说跟他有关呢?是“愚公移山”。很多人说,你看愚公移山,我们老祖宗有毅力,直接把这山搬走了。这个其实不对,真正把山搬走的人不是愚公,而是愚公一带着全家人在那搬这个山,然后感动了上天,上天派夸娥氏的两个儿子下来,把这个山搬走了。所以呢,普通老百姓我们需要做的事情,就是表现的非常感人就行了,最终要解决问题,还是得靠老天爷。夸娥氏其实是古代的大力神,它的意思直接从字面意思上转过来的话,叫“巨大的蚂蚁”。哈哈,就是力气很大的蚂蚁。
除了算力卡之外呢,它还做图像卡,就是它真的做GPU。它这个卡是可以打游戏的,还可以做CAD设计,还可以做仿真、做渲染、视频编码。其他的那些单纯做算力卡的公司,他们是不参与这些事的。但是呢,这个摩尔线程,他们的GPU是可以干这个事的。
他们的图形卡是可以兼容DirectX。Windows里头有一套系统叫DirectX,你只要能够跟它兼容,剩下的游戏只需要在DirectX这个平台上去编写就可以了。游戏其实并不关心,你里后边使用的是AMD、是英伟达、是英特尔,还是摩尔线程,它是不管这些事的。
摩尔线程的图像卡,最开始做出来的时候,肯定是兼容性比较差的。它的算力呢,应该是接近于3060的水平,跟什么40系、50系都没法比。但是呢,经过一段时间的迭代与调整以后,现在可以稳定的运行了,甚至呢可以拿来打《黑神话:悟空》了,已经算是不错了,因为“黑猴”对于算力的要求是比较高的。
中国的显卡呢,通常都是会买IP回来。为什么要去使用IP呢?IP就是显卡设计的一个底层专利,它实际上是有一整套围绕这个专利的,或者围绕这套设计的一套标准,其他的人会按照这个标准去写驱动、写接口,各种操作系统、各种的软件都会跟着这个接口来去写。你不能从头做,你如果从头做的话,所有兼容性的事情你都得自己干,所以通常我们开始的时候都会去买IP。壁仞科技也是做显卡,只是现在它还没有上市,所以摩尔线程是GPU和算力卡的“中国第一股”。那他们两个呢,都是买的Imagination的IP,后边呢都宣称是独立研发了。
Imagination是一个英国公司,跟Arm一样,Arm也是一个英国公司。Imagination最早是给苹果iPhone做GPU的。现在呢,Imagination是在国资手里边,就中国的国资控股,就是完全收购了,100%控股的一个状态。2017年,Imagination失去了苹果订单以后,苹果也说我要自研,以后我自主研发了,我不用你了,那Imagination这个日子就不好过了嘛,被凯桥基金以5.5亿英镑直接收购了。而凯桥基金背后的基金是谁?叫“中国国新”,就是“国家新技术”这样的一个名字。在中国,所有带“国”字的,或者基金名字里带“国”字的,这个都是国务院国资委直接监管的央企。所以Imagination呢,现在是国务院直属央企100%控股的一个公司。
到2025年呢有传闻,凯桥正在找人脱手这个Imagination,想把它卖了。目前呢,还没有公示出来,应该还没有卖出去。为什么你说原来千辛万苦买回来,咱们不好好珍惜这个东西,现在要把它卖掉呢?现在呢,里子、面子咱都得要的。我们怎么好意思说,我们这个产品是使用的英国IP呢?丢不起那人。咱们甭管用的是谁的,必须是自主研发、自主知识产权。所以英国IP这件事,对于我们已经没有价值了,赶快把它卖掉。至于有没有其他的国家,或者其他的公司愿意买这个东西,就不知道了。
讲远了。摩尔线程能够撑起当前的市值吗?咱先不说第一天收盘涨了400%多的这个新市值,咱就说上市的时候接近3,000亿人民币的这个市值,到底能不能撑得起来?股市有风险,投资需谨慎,这件事还是要提醒大家的。
摩尔线程目前还处在巨额的亏损之中,所以呢没有PE。PE是什么东西?就是你的利润跟你的市值之间比是多少倍。如果你的利润是负的,那就没有PE。它呢只有PS,就是你的销售额跟你的市值比是多少倍。它的收入呢,2025年大概是10-20亿吧,毕竟2025年没走完呢,所以没有办法给它计算出完整的2025年的收入来。它的上市市值呢,是3,000亿左右吧。按照PS算,大概就是200多倍,接近300倍的样子。如果你就只挣回来10亿,那就是300倍;如果是20亿的话,就是150倍吧,大概是这样的一个区间范围内。
那你说这个PS在整个行业里头算高吗?英伟达,行业老大,绝对的老大,它的PS是30倍。然后博通,博通是老二。大家注意,AMD不是老二。为什么呢?因为谷歌TPU是博通给做的,微软和亚马逊的他们的芯片都是博通给做的,所以它是老二。博通的PS是15倍。AMD算是老三吧,它的PS是10倍。这个接近300倍PS的摩尔线程,它的PS高不高?泡泡大不大?
那你说国内的是不是都比较高?沐曦半导体,跟它同一天上市的,PS是50-100倍,这个也依然在亏损。还有一家呢叫寒武纪,2020年上市的,它的PS是102倍,它是PE是有数的,320倍。这个PE也是很夸张的一个数字,但是有PE说明什么?盈利了呀,人家是挣钱的。你这个摩尔线程现在还在巨额亏损,所以后边到底怎么支撑起来,还很难说。
一个行业的老大,第一股的话,理论上说是应该可以支撑出来更高的PS或者PE的这种倍数的。原因也很简单,因为老大嘛,它通常会吃掉更多的市场,以及整个行业的标准和价格制定权,所以他们会享受一个更高的PE和PS,包括像英伟达这样的,他能够享受到30倍的PS,这个已经是大家给面子了,这就是老大应该拥有的地位。但是300倍这个事,确实是有点说不过去了。
另外呢,摩尔线程在中国号称是GPU和算力卡的“第一股”,但是它的市场占有率其实很低,它在市场占有率里头基本上排不上号的一个位置。所以他对于标准的制定、对于市场价格的指引,基本上作用上是0。
为什么这么讲呢?它两块大的业务,第一块是做显卡。显卡民用市场,大家可以买N卡,可以买A卡,就算你买英特尔的显卡,你都比它好使,你没必要买它,这玩意跟自己过不去吗?你买了一个摩尔线程的卡回来,光调驱动都折腾死你,打游戏可能打着3分钟就直接闪退了。所以大家真的没必要去跟它较劲,卖的再便宜都没必要。它就是3060的水平,我们现在可以买到4070、4080、5070、5080,甚至5090D,就是阉割过的5090都可以买得到,你何必跟它费劲呢?那么民用市场这块,基本上可以忽略不计。
另外一块呢,你说信创产业,政府买单嘛。但是呢,政府买单对于独立显卡这种需求,是非常非常小的。大规模的这种办公设备的采购,CPU里头都是带集显的,就是国产CPU里头都有集成的显卡,根本就没有必要去配独立显卡。只有极个别的需求,比如说指挥中心需要设置这种大屏幕,比如说一块屏幕是很高的分辨率。但是那种指挥中心的刷新率一般都不是很高,而且呢,我们需要很多块屏幕从一个计算机里头去控制他们呢,有可能会需要独立的显卡。但是即使是这样的需求,其实总的数量是非常非常少的。比如交通指挥中心,每个人自己有电脑,可能最后我只需要有一台电脑配上摩尔线程的这个显卡就够了,就可以把中间交通指挥中心的这个大屏幕给它支起来了。所以它这个用量是很少的,这一块的话不会给它贡献太多的收入。
那你说咱们好好卖算力卡呗。今年的可能10月份、11月份往后,国家也跟所有的这些大厂约谈过了,你们不允许再去买英伟达的卡了,即使是已经买了都不许装,你们必须去买国产的,只要新装机,通通都得装国产的。那咱们吃这一块不就完了吗?
跟大家说一个数字,2025年中国装机的所有算力卡里头,美国算力卡大概90%都是英伟达,美国算力卡占比是60%,大头都是他的。剩余的40%才是国产卡,这个里边华为占12%,这是当之无愧的老大;寒武纪占8%;海光信息占5%;燧原科技占5%;地平线占4%,地平线是中国的车载芯片的第一;阿里云自己有一个芯片叫平头哥,占3%;百度云里头用的是百度昆仑,占3%;摩尔线程占2%,非常非常少的一个占比;这个还有一个叫轻微智能的占2%;其他的杂七杂八加一块占1%。就这一块,国产的占40%,英伟达以及极个别的AMD和英特尔占60%,这是2025年的一个情况。
那你说我们的GPU算力第一股上市了,它2026年是不是可以多占一些份额?凭什么呀?摩尔线程你凭什么可以打败华为呢?所以2026年它的市场份额未必会上升,即使是把英伟达打出去了,大家也更多的会去选择华为。因为华为它整个的研发,包括各种兼容性的这种适配,你像这边只要是Deepseek一发布,华为马上说我支持你。在这样的一个情况下说,我们去跟华为较较真,这太痛苦了。
华为在海外,咱们可以说被制裁了,大家不买他东西。你在国内,你想跟华为去打这个仗太难了。那么你说摩尔线程咱们出海行不行?咱在国内打不过华为,咱们出去行不行?对不起,摩尔线程也是美国实体清单上的。就是刚才咱们讲华为、海光信息、寒武纪、摩尔线程、沐曦半导体,大部分这些公司都在美国实体清单上,他们都不能出海去运作。
他们早期一些芯片还是找台积电代工的,7纳米。现在台积电也不给他们代工了,以后再去做芯片出来都是14纳米,要想做7纳米的话,就要忍受多重曝光所带来的这种极低的成品率。所以他们未来的这种竞争态势,是非常不乐观的。特别是摩尔线程这样的一个公司,他未来的竞争态势极其的不乐观,应该是上市即巅峰。就是你现在上市了,大家狂欢完了,这个就可以了,后边没有、没有然后了。
最后总结一下吧。摩尔线程上市了,带来了巨大的、非理性的市场狂欢。英伟达的团队,全GPU算力卡的产品线,后续市场态势不容乐观。
好,这就是咱们今天的故事。感谢大家收听,请帮忙点赞、点小铃铛、参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。
2025-12-08 19:22:56
大家好,
欢迎收听老范讲故事的YouTube频道。
OpenAI拉响了红色警报,这就是全行业的红色警报。OpenAI内部传出的一个备忘录叫“code red”,他们叫红色警报,分为四个等级。在OpenAI内部,警报等级分为:
现在已经进入红色警报,这应该是OpenAI创建以来的第一次。第一件事就要叫停产品,不是原来按部就班做的产品线了,有些就要叫停了。
所以是四个产品方向叫停。员工有可能会临时的跨团队进行调配。通常红色警报后边,在其他公司里边会伴随裁员或者是叫做headcount冻结,在这个时候就不再招人了。但是现在OpenAI肯定不能讲这个话,因为他一旦讲这个话,可能整个盘子就崩掉了。
现在拉响红色警报,就是要集中精力改善模型。他讲到说我们要为8亿多周活跃用户提供个性化服务,让每个人都能够定制ChatGPT与他们的交互方式。这是它要干的第一件事。
现在大模型方面的改进已经在快速的推进了。看到我的封面了吗?封面是4只企鹅炖着一大锅汤,这汤里头有大葱、有大蒜、有洋葱。企鹅兄弟们已经戴着口罩出去参加测试了。
他现在要做的两个模型,有一个模型叫葱片(shallow piece),应该会在下周或者是下下周就要上线,这个是下一代的预训练大模型。然后大蒜(garlic)这个模型,是新的预训练和知识蒸馏出来的一个相对小一点的模型。前面葱片这个模型估计会比较慢,这个garlic是比较快的一个模型,应该是在明年一季度发。
现在的匿名模型已经出去去测试了。这是一个新常态,模型发布之前都会去各种的演练场里边去测试一轮。测试的时候应该使用的是shallow piece,但是它在shallow piece里头还分了四个名字,叫帝企鹅、跳岩企鹅、玛卡罗尼企鹅和迪古企鹅。现在OpenAI内部的代码已经泄露出来了,就上头写的是这四个企鹅的名字,推理配置是多少,已经在开始测试了。
其实OpenAI去年就拉过橙色警报,最后的结果也还算差强人意。在去年的时候,他们的大模型出现了一些问题,Sora当时的训练过程也不是非常的顺暢,所以橙色警报就拉响了。但是橙色警报拉完了以后,他们走向了另外一条路,就是从单纯的堆参数走向了o系列模型,算是解除了橙色警报。在去年的12月份,做了12天的连续发布会,但是Sora2出来了以后,热闹完了以后留存基本上等于0。我内心的感受就是OpenAI飘了,另外一个感受就是OpenAI开始挤牙膏了。
2025年的8月份,随着Nano Banana的发布,Gemini的用户量在快速上升,OpenAI就已经开始橙色警报了,到12月份正式升级为红色警报。有人看到了他现在很多停下来的这些产品,其实在他的安卓版本、在iOS版本上已经做好了,只是开关还没打开。
现在OpenAI就要去思考了,到底是追求诗和远方,还是眼前的苟且?底层大模型的推进就是诗和远方,创业者以四处分散兵力增加收入就是眼前的苟且。其实OpenAI在GPT5的时候大家就已经怀疑了,它并没有真的去投入大的精力重新进行底层的模型训练。现在大家怀疑就是GPT5实际上是拿GPT4O往后的这些模型去进行的后训练。
创业者遇到的问题,OpenAI自己现在也遇到了。要想在大模型基础上干活,就必须让大模型的底层架构稳定下来。所以OpenAI很长一段时间都是在原来基础的模型上做各种各样的后训练、强化学习。现在大家不满意了,因为Gemini 3上来以后发现全线领先了。所以OpenAI就说不行了,我们要重新开始训练底层模型了。
很多人说Gemini3出来了,它不行了。当然还有人说Deepseek V3.2出来了,它不行了。这个跟Deepseek差的比较远,肯定还是被Gemini 3和Nano Banana Pro给吸引了大量的用户。
首先OpenAI遇到了一个很大的问题是什么?就是它的用户时长被反超了。用户时长越长,你就可以有更多的机会去实现交易。OpenAI上面大量的是短交流,而像Gemini 3或者是Claude 4.5这些模型,更多的是这种长沟通,因为那个是生产力工具。在这一块上,OpenAI可能已经输了。
用户活跃度一周掉了6%,这个对于OpenAI来说那真的是天塌下来一样。Gemini的周活跃度从7月份的4.5亿涨到了10月份的6.5亿,还没算后边发布的数据。OpenAI的周活是8亿,这个数字是10月6号公布的。算上后边这个此消彼长,大概率现在Gemini的周活跃已经反超了OpenAI了。这个对于一直是这个行业领军公司的OpenAI来说,绝对是不可承受之重。
OpenAI还有一个问题是什么?他在讲明年的收入增长可能是个位数。AI公司每年的收入增长都是要成几倍去增长。现在山姆·奥特曼说说,明年有可能就是个位数增长。现在它砍掉的是广告、是电商,把挣钱的东西砍了,所以明年可能不会有那么大的增长。现在只能靠订阅费和API TOKEN来去创收了。
知道OpenAI预期到2030年要挣多少钱吗?是2,000亿美金。按照现在这样的增长速度来说的话,后边这个牛皮就吹破了。就算他到2030年挣到了2,000亿美金,到2030年之前,OpenAI跟人签的各种算力合同,1.4万亿美金这个窟窿填不上。而且这些合同已经在亚马逊、甲骨文、英伟达、微软这些公司的股价里边已经体现过了,如果你到最后无法执行的话,这个会彻底崩盘的。
OpenAI一直在烧钱,所以它需要继续融资。最近又在谋求一个1,000亿美金的融资,如果融完了以后的话,我估计它的整个的估值可能都会接近上万亿美金了。这个也是一个巨大的考验,因为原来你是老大,现在一看有别人超过你了,你再让资本无脑的把钱冲进来的话,就稍微有点难度。
那你说OpenAI为什么会被谷歌按在地上摩擦?一一直遥遥领先了这么长时间。OpenAI相当于是推车上山,而谷歌相当于是拉车上山。
OpenAI的算力都是找微软租的,以后他还会去找谷歌租,会去找亚马逊租,会去找Oracle租。而谷歌的话算力都是他自己的,谷歌云的芯片也是我自己造的,云服务也是我自己的,全是我自己的,他就没有这种巨大的压力。
OpenAI想要进行场景拓展,需要跟微软爸爸抢地盘。微软是他最大的股东,而微软本来就不希望他来干这个活。而OpenAI现在想去拓展这些场景就需要去跟微软竞争。两边完全同床异梦,你没有办法步调一致的行动。各自都惦记着干掉对方。
反过来看谷歌,Gemini是已经进了安卓、Chrome、搜索、YouTube、Workspace这些产品,都是自己家的兄弟。最上面的老大已经给了最高指示:集中力量办大事。所有这些场景回收的数据都可以帮助Gemini继续前进。这又是一推一拉。
OpenAI是需要不断融资的,你就需要不停地向业界证明自己好牛逼,因为它一直在亏钱,而且是越亏越多。所以它需要不停的去外边作秀。而谷歌是自己有钱,去年的净利润是1,000多亿美金,完全自己养得起。又是一个一推一拉,一个不停的出去化缘,另外一个说我自己有钱。那这个也是OpenAI被谷歌摁在地上摩擦的原因。
现在其他人也出来说风凉话了。Anthropic的老板、CEO出来去接受采访,基本上可以确认Anthropic计划是明年上市。它已经跟律师事务所签了协议了,而且那个律所是当年给谷歌做上市的律所。
很多人说上市了成功了,千万别这么想。咱们反复讲过,上市意思就是你已经过了高速增长期了,后边该稳定发展了。高速增长的时候为什么不去上市?因为高速增长的时候很多地方没法合规,上市你就必须要合规,一旦合规了以后束手束脚。
Anthropic如果明年上市的话,有可能是史上最大的IPO。官方确认它的估值是1,830亿美金。到截止到目前为止,全人类历史上最大的IPO是阿里,1,600多亿美金。现在一大堆没上市的巨无霸在这排队等着。上市最贵的是OpenAI,5,000亿美金;第二贵的是谁?SpaceX,4千亿美金;中间还有一个字节跳动,4,800亿美金;还有一个是XAI,是2,300亿美金。
Anthropic主要是做b端的,编程领域绝对的王者,而且不断的推scaling law。他完全不去做c端的竞争,因为一旦做c端的竞争的话就是要去吸收个人用户,那么OpenAI遇到的问题都会遇到。
而且Anthropic还讲了,说我们家从来不去搞什么红色警报,我们就按部就班,自己干我们自己活。红色警报这种东西其实是从谷歌那边继承过来的陋习。这回就轮到了OpenAI去拉红色警报了。Anthropic现在正在加速上岸,上市了,剩下的事跟我没关系了。
OpenAI的红色警报其实是对全行业吹响的全红色警报。为什么这么讲?一个新的行业或者一个独立的行业最害怕的是两件事。
第一件事叫什么?叫老大倒下了。一旦老大倒下就是证明了这个行业是走不通的。OpenAI作为老大,一旦它倒了以后,所有人就会认为整个AI行业有问题。
害怕的另外一件事是什么?就是老大通吃。所以谷歌当老大是一个比OpenAI倒下更危险的事情。谷歌自己有芯片,自己有云,自己有模型,自己有应用,自己有生态,自己还能变现。如果他上来了的话,他不需要跟任何人合作。亚马逊、甲骨文、微软、软银、英伟达、AMD这些就全死、全废了。所以谷歌是不能成功的,谷歌真的在这个行业里是与世界为敌。
OpenAI为什么它内部发的这种备忘录就直接传出来了?是OpenAI自己漏的跟筛子似的吗?不是这样的。所有这种内部备忘录能传出来的,肯定都是公司允许的。OpenAI现在的红色警报在干的事情,不是说仅仅是内部调整策略,他在干的事情是在恐吓整个行业,恐吓金融圈:给钱!你如果不给钱我就倒了,倒了以后你们都得死。
很多人又在想说AI泡沫到底会不会破?首先跟大家确认一点,AI绝对不是泡沫。你们有谁见过一个泡沫还没破的时候就有大量的人失业吗?以前都是泡沫破了会有人失业,AI是大家正在热火烹油、追加投资、股票创新高的时候,大量的人在失业。既然它已经影响了这么多人的工作,影响了这么多人的饭碗,它就绝对不可能是个泡沫。
OpenAI现在干的活肯定是在走钢丝,但是OpenAI里边隐藏的项目应该还是很多的,只是需要集中力量把它好好梳理梳理。短期内OpenAI是不能倒下的。英伟达、软银、微软手里边还是有大量现金的。其他已经上了车的人,也不希望看到OpenAI这个老大就这么倒下,也不希望看到像谷歌这样的一个上下通吃、完全闭环的一个人完全站起来。
总结一下,OpenAI拉响了红色警报,内部消息泄露完全就是故意的,就是出来吓唬人的:必须保住OpenAI,咱们绑在一条绳上了,我要死你们谁都甭想好好活。应该很快就会有新的模型可以玩了。这个月真正值得期待的东西是什么?OpenAI的ChatGPT成人版。没准成人版上来以后,大家就又可以接着奏乐接着舞了。
好,这就是今天要讲的内容。