2025-10-08 08:47:41
OpenAI开发者日,暴露了山姆·奥特曼的隐藏野心。
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们先讲结论,然后告诉大家我怎么得出这样的结论,验证一下这个结论是否正确,再让大家行动起来,看看咱们在山姆·奥特曼指明方向以后,到底能干点什么。
OpenAI的开发者日呢,隐藏在发布会背后的野心和方向到底是什么?表面上这东西咱就不重复了,说到底发布了什么东西,只讲结论。
第一个,ChatGPT要做操作系统了。
第二个,自然语言和语音交互才是未来。
第三个,全栈、全生态、全模态的开发都在OpenAI。
有三个大的结论。
那咱们怎么得到这样的结论的呢?咱们看发布会,要稍微换一个方向来看。我自己呢,举办、参加过很多发布会,也专门受过训练,主持过发布会。咱们发布会一般看什么呢?叫“wow时刻”,一看这个东西,“wow,好厉害”,叫“wow时刻”。在52分钟的发布会视频里头,有哪些“Wow时刻”呢?那你说我是不是拿了个纸、拿了个笔,52分钟的发布会反复看,在这记笔记,哪个地方有掌声?不是这样的。我到GPT里边直接下了一个指令,把YouTube的视频链接贴进去,我说:“请给我统计一下,什么时候有掌声,掌声中度还是高度,有掌声的时候是谁在演讲,在讲什么,给我画个表格出来。”剩下的事情就交给GPT去干了,效果还是很好的。
第一次掌声,是山姆·奥特曼要求观众为消耗TOKEN最多的开发者鼓掌。他呢,屏幕上打了一堆开发者的名字,分颜色的,百万、千万甚至更多的TOKEN被这些开发者所消耗掉了,他们名字是用不同的颜色标出来的。这次掌声的不算很热烈。
4分22秒有一次自发的掌声,山姆在讲什么呢?当开发者使用SDK的时候,他们的应用可以覆盖数亿GPT用户。“我们希望这对于快速帮助开发者来说是一件大事,我们可以帮助他们规模化产品。”在这个时候突然就开始有掌声了,山姆·奥特曼被打断。这个时候屏幕上出现的topic是什么呢?是“变现”这样的一个词出现在屏幕上了。这个地方为什么会有掌声?大家想一想,它已经有这么大的用户量了,几亿的月活用户在那挂着,现在说:“我愿意把这些用户分享给大家,大家在我这个上面开发了应用以后,你们就可以在这个里边去使用各自的产品了,不再是使用我这个20美金的订阅,而是你们各自都可以有一些订阅或者有一些服务在这里边进行销售,可以在里边去变现了。”大家就真的要给他鼓掌了。所以这就是我们的第一个结论,这就是操作系统了,大家可以在这个里边去做项目了。有点像什么呢?有点像微信小程序、抖音小程序,大家现在都可以在ChatGPT里去做小程序了,这个肯定是会受到欢迎的,而且topic上写的是变现,这个非常重要的一点。
在APP SDK的demo结束的时候会有掌声,这个是很正常的演示,说我们怎么让一个应用通过SDK就可以把你们的程序变成了ChatGPT小程序了。他们在里边演示了很多的嵌入的产品,怎么订机票酒店,怎么租房,怎么去做海报。演示很成功,一定会有掌声。而且这个里头有比掌声更强的这种鼓励,就是比“wow”还厉害的东西,这就已经成为了行业领袖的发布会了。就普通人发布会到“Wow”这就结束了,待会咱们讲还有什么更厉害的。
再往后一项呢,有8分钟的限时挑战。它呢,其实就是把dify、N8N、Coze这些工作流编辑相关的功能装到ChatGPT里头去了。这块呢有帮助,但是帮助到底有多大,或者说是不是这种产品一出来,dify、N8N就死掉了?其实我觉得倒不会。因为呢,它这个里边只能使用ChatGPT自己的模型,你说我想在这个里边画一个流程,在里边使用Gemini、使用Grok,这都没戏。至于说调用外部工具的话,到目前为止应该也都是集成的ChatGPT里头的一些工具是可以调用的。你说我想非常自由的调用外部的大量的工具的话,虽然他说现在用MCP是可以挂上,但是应该没有那些已经积攒了很长时间的平台生态更好、自由度更大。所以呢,并不需要太担心说一下就把他们都干掉了。
但是呢,这个8分钟限时挑战还是值得掌声的。一位美女上来说:“来,我现在设置8分钟,我们要做很多很多事情。”其实咔嚓就把事情做完了,都是可以在ChatGPT里头就可以使用这些功能,就使用agent builder做出来的东西就可以跑,跑的还很漂亮。把所有的很复杂的功能做完了以后,居然还剩49秒,8分钟没有用完,确实是值回掌声。以后大家再去做发布会可以去挑战一下,但是呢,没练好别去。开发布会的时候,现场演示是非常非常紧张的,你平时练的好好的东西,上去都有可能出错,更别说在上面还设个时间了,那个绝对是给自己增加演示难度的。
再下一次掌声呢,是山姆·奥特曼宣布“Codex is into GA”,就是Codex现在已经正式发布了。前面我们不是做过视频了吗?讲这个Codex怎么又正式发布?所有这些东西发布呢,都是分Preview和正式发布两个版本,Preview已经过去了,现在我们正式发布了。因为Codex这个产品非常非常受欢迎,OpenAI内部也是大量的使用Codex去写代码,他们说现在Codex已经解决了他们70%的pull request。这样的一个产品,说现在正式的成为发行版本了,还是值得掌声的。这是一次高级别的掌声,GPT去统计的时候,还把掌声的级别也统计出来了。前面几次呢都是中等的掌声,8分钟极限挑战这是一个中高等的,真的是为这个小姑娘捏一把汗。下边坐的人呢,应该也都自己开过发布会,知道发布会有多紧张,在这个上面敢做一个8分钟计时挑战,确实是要佩服他的勇气,所以他的掌声要比前面发布那几个要高一些。真正的高级别的掌声是“Codex is into GA”。
再往后呢是Codex的演示。Codex的整场演示没有碰任何代码,都是靠打字、自然语言描述或者是语音描述来去实现的。它控制了摄像头云台,控制了灯光,而且呢把语音接进去,这个是OpenAI着重要去推广的东西,就是一定是自然语言的语音控制,不是打字,是要跟他说。所以他就跟他讲说:“你现在给我做一个这个,跟我做一个那个。”马上这个摄像头就开始发生变化了,而且是使用的现场设备,它直接把现场的一个索尼的电影摄像机的云台就控制起来,就开始转动了,这个是可以极大的提升演示效果的。
再往后呢,是Xbox手柄控制摄像头。Codex在片尾出这个字幕,做了一个彩蛋花絮吧,这个呢是有一个中高等级的掌声,因为他有参与感。虽然前面这个摄像头也是对着下面所有人的,但是现在一下出字幕了,把大家的名字打出来了,参与感上升,这个掌声是要大一些的。其实最后一次演示是翻车了,为什么呢?就是他把那个照片拍的黑乎乎的,他没有设置好曝光。你要去设置一个电影机去拍照的话,你的光圈、你的快门这些东西还是比较复杂的,他并没有把所有的参数都设对。但是最后这个名字字幕滚动的过程还是很帅的,所以这一块是赢得了大家的掌声。Codex的核心演示是什么?就是从头到尾没有碰代码,虽然它是个代码工具,但是呢没有看到任何一行代码被打进去,完完全全就是语音交互、Xbox的手柄交互、自然语言往里打字,这些东西就可以控制这么复杂的云台灯光,还可以跟ChatGPT一起工作,这个确实是很炫酷的东西。
再往后是山姆·奥特曼宣布GPT-5 Pro进入了API。大家注意,原来GPT-5在API里头,但GPT-5 Pro API是没法调用的。你要想使用GPT-5 Pro,必须是花20美金去定它这个Pro用户。现在说这个东西进入到API里去了,最高等级的掌声。大家对这个还是非常非常期待的,虽然这个模型很贵,它好像100万TOKEN的输入是十几美金,一百万TOKEN输出可能一百多美金。但是呢,大家对于这种非常高智能的模型可以通过API调用,还是抱有巨大的期望的。
Sora 2 Preview进入API,最高等级掌声。Sora 2是我们这几天在玩的视频生成模型,现在它已经进到API里去了,这个是大家所期待的。因为你原来在一个APP上或者在一个网页上,你控制它还是比较麻烦,必须是要进到API里头才可以进行精准控制。原来就是10秒钟一条,你现在就可以生成更长的视频、其他比例的视频,或者说做一些更复杂的搭配。你可以写一个完整的故事,通过API调用,可以让这些完整的故事顺序的去生成,这个就可以直接做成生产力工具了,原来那个东西是个社交工具。这是大家非常非常期待的一个功能。我已经去试过了,调用Sora 2 API生成了15秒钟的视频,花了我20美分,大概是这样的一个成本,还是非常非常有趣的。但是要注意,即使是调用API,它的控制也是很严格的。我上传了一张自己的照片,我说:“请按照这个照片去给我生成。”他说:“对不起,照片里头有人物,我是不可以给你干活的。”未来到底是如何把这东西用起来,如何让形象进入到许可范围内,如何把整套的系统能够跑起来,这个可能过一段时间我试一试,再跟大家录视频再跟大家讲。
后面Sora 2用于品牌电商、广告概念的这种展示,就是说Sora 2一旦变成API以后,你们都能拿它干什么。就是这玩意儿生产力工具了,可以干的东西很多了,又得到了一次中等规模的掌声。
结束谢幕肯定是最高等级掌声。50多分钟接近一个小时,七里咔嚓把这么多东西都扔上来,还是值得掌声的。
那刚才吊了半天胃口说,比“Wow时刻”还让人激动人心的是什么呢?必须是行业领袖的发布会才有这样的效果——股价上涨。你说OpenAI自己还没上市呢,谁的股价涨?这里头第一个涨的是AMD。AMD呢,虽然在整个的发布会里头没有被提名字,但是呢依然上涨了24%。这块的话回头再跟大家细细解读,山姆·奥特曼又玩了个骚操作,黄仁勋1,000亿美金投资OpenAI,OpenAI说一转头我去投资苏姿丰的AMD,去让AMD给我定制芯片,那蹭一下24%就涨上去了。
Figma涨了7%。因为在前面把应用集成到ChatGPT里头去的这个过程中,演示的就是Figma。说你看Figma现在已经集成进来了,我们可以在ChatGPT里头直接调用Figma的功能就可以干活了。相当于是Figma已经成为了ChatGPT的小程序了,直接涨了7%。
然后Expedia group涨了2%,这是机+酒业务嘛,机票加酒店。那你说在这里边,ChatGPT里头规划了半天行程,你总要有人去给你订机票订酒店嘛,Expedia group直接涨。
Coursera涨了8%。这是一个在线教育平台,人家上头直接问,说我现在想去学一下AI,我想去学一下大模型,就给我看看怎么学习一下,你有哪些课程适合。Coursera你给我推荐一下,而且我就可以直接在ChatGPT里头看Coursera的视频了,直接可以看他的这个课程了,这个涨了8%。
Uber涨了4%,它为什么能涨呢?我们现在可以直接在ChatGPT里头叫车了,涨4%。
DoorDash但是相当于美国的即时零售、外卖送餐的这样的一个项目,涨了4%。我们现在可以在ChatGPT里头说给我订一份煲仔饭回来,一会当当当敲门来了。当然对于美国来说,配送应该没有那么快,它不像在国内似的。
那你说有没有提了名字带不动的呢?也有。里头有一个公司呢,叫ZILLOW,是美国一个租房的网站。为什么带不动呢?因为正在被FTC起诉反垄断,就是你一旦在上面做广告了以后,它有排他条款在里头,现在正在被起诉。还有一个是Spotify,放音乐的。里边有一个案例,请给我做Spotify的一个播放列表。这个呢,第一个是Spotify的盘子比较大,就是这公司很大了;第二个呢,就是这个场景没选好,这是一个稍微失败一点的案例。大家觉得在ChatGPT里头去定制播放列表这件事呢,不是那么有趣,也没有那么挣钱,所以在这块上,这个股价基本上没动。
明白了吧?为什么只有行业老大提名字才有用?因为不是行业老大提了名字,股价不会上涨的,股市不会听这玩意的。所以OpenAI现在已经是行业老大了,证明这件事了。
那么验证一下我前面的结论吧:操作系统、入口、商业变现、全场景。这是第一个结论,OpenAI已经向操作系统前进了,它就是超级APP,它就是微信,它就是抖音,大家可以在里边做所有的事情了。OpenAI让应用通过SDK变成小程序,直接把自己集成ChatGPT里头去,所以这个野心已经彻底暴露了。以后它就是独立的操作系统,没有什么iOS,没有安卓,没有这些人的事,这就属于赤裸裸的直接竞争了。
第二个,自然语言、语音交互,这是最核心的。虽然有编程,但是从头到尾没动代码,所有的这些交互都是用自然语言交互的。即使是Codex这样的编程模型,也都是用自然语言交互,所有做出来的项目都是可以语音沟通的。而且人家还发布了实时语音的大模型的API,而且这个API还是高速廉价版本,要比正常的这种满血版本要便宜很多,速度还很快,所以大家赶快去使用吧。山姆·奥特曼在里头讲的,说我不认为未来很多的程序是需要代码去写的,我觉得自然语言和语音交互才是未来。这个野心背后是什么?他们的硬件马上要上来了,山姆·奥特曼的整套的硬件,他的硬件应该不是一个硬件,而是一套硬件,自然语言语音交互的一套硬件。现在OpenAI已经向果链企业下单了,我们很快就可以看到这套硬件到底长什么样,以及如何跟人类进行交互和沟通。
最后,全栈、全生态、全模态都在OpenAI。我们可以去做SDK,我们有MCP,我们有agent builder,你可以在里边去画流程图,也可以Codex直接去写代码,还可以处理语音的、图片的、视频的,我们所有东西全都有。这个就是真正老大要干的活,什么都得干。像其他的公司呢,可能大多是只做其中的一部分,比如像Anthropic,他就没有办法把从上到下所有东西都干一遍。现在能够跟着跑的也就是谷歌,从上到下都在做,虽然可能好多的地方还做的没有那么好,但是从上到下都有。国内的这些平台也都被打样了,说你们想去追OpenAI吗?你看看从上到下你是不是都坐上了?这个是一个新的方向。
最后,咱们要行动起来。不能山姆·奥特曼在上头手舞足蹈了半天,我们不知道该干嘛,那个就没有意思了。咱们该干嘛呢?
第一个,学习一下山姆·奥特曼发布会的组织形式,人家发布会怎么开的,这些掌声都是怎么来的。肯定会有人学,你看雷军,一开始是穿黑色的长袖t恤的“雷布斯”,后来开始穿小西装“雷斯克”,再往后呢,发布新片的时候穿了个皮衣,学谁自己去想。未来什么时候就可以穿这种宽松的套头衫,咱们再看。
通过SDK登录ChatGPT,这个是现在大家要赶快行动起来的,谁都别慢了。而且这个里头可能还有一件事大家想不到的是什么?抢注域名。因为当时在互联网刚开始的时候,大家都去抢注域名,而现在我们要在ChatGPT里头去呼叫、起一个应用的时候靠的是什么?不是域名,就是它的名字。比如说你在里头Coursera里边去讲“开”,或者是其他的一些应用,就直接写名字,写完名字以后就会自动被识别成某一个应用,就开始去干活了。这个名字是要去抢注的,因为他没有办法控制重不重名的问题,所以这块大家要赶快动起来,先做一个能用的东西,把名字占住,等以后其他人说“我们也想用这个名字”,花钱买呗。所以这是一个可能马上能去做的事情。
再往后一件事,所有厂商一定要提供友好的SDK,普通用户都可以玩起来了。这一次他们展示了怎么去玩会场灯光,怎么去玩索尼的电影机和电影云台。以后如果大疆出SDK的话,我肯定是愿意在Codex上去玩耍一下的。而且以后出了这些SDK的话,你的产品一定会卖得更好。原来这些SDK出来以后,只有专业厂商才能用得起来,普通用户是用不起来了。但是现在有了Codex,有了这些AI编程工具了,平权了,每一个人都可以拿着这些产品自己去编个程序,去稍微收拾收拾,这个门槛一下降低了很多。当然除了像大疆这样的拍摄设备或者索尼这样的拍摄设备之外,还有很多东西,它的SDK的使用率、使用量一下就会上升上去。原来都是系统集成商或者是代理商会去用这些SDK,而现在每一个普通用户都会去用。这是什么东西?智能家居。苹果折腾了半天Homekit,谷歌也折腾了半天,小米也折腾了半天这种智能家居的这种网关、智能家居的这些SDK,现在好了,有Codex以后通通都可以跑了。整个生态的竞争会进入下一个阶段。原来比如大疆跟其他的竞争,是竞争我们的图像参数有多好,竞争我的价格怎么样,竞争这个产品的使用有多方便,做的有多轻。以后的话就是生态竞争,谁家的SDK做得好,普通用户可以在Codex的帮助下可以玩出花样来,以后就会变成这样了。
再往后,抓紧把语音交互加到系统中去。如果原来你的系统没有做语音交互的话,赶快做进去。因为OpenAI操作系统的新硬件平台应该距离我们已经不远了。如果我们现在把自己的系统加上语音了,交互的还很好,那么OpenAI再去发布他们的硬件的时候,就有可能你的产品会成为发布会上展示的那个产品。这一次你想,OpenAI点了谁的名字,谁的股价就在涨,这就属于是典型的榜样力量。如果你现在就把这个产品做好了,未来就有可能蹭上这一波巨大的流量。像我以前有一些朋友,他们在iPhone、iPad早期发布的时候,做的产品做的特别好,让苹果直接在发布会上给人展示了,那真的是泼天的流量和财富就砸下来了。所以现在大家赶快动手,把这个语音加到应用里去。
最后一项,Sora 2的API,赶快玩耍起来。这个还是非常非常好玩的,15秒视频,0.2美金,价格还可以接受吧。大家就可以写出脚本来,顺序的让它把这个内容都生成出来,做出这种几分钟的短片出来都是OK的。
好,这个故事就跟大家讲到这里,感谢大家收听,请帮忙点赞、点小铃铛,参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道,再见。
2025-10-05 08:41:08
K签证和大家想的可能不太一样。
大家好,欢迎收听老范讲故事的YouTube频道。
一条政策被这么多人骂,我也是头一回见到。从国内到国外,从粉红到反贼,从里到外、从上到下都在骂。骂的是什么呢?第一个是,自己的大学生毕业还找不着工作呢,为什么让外国人来抢咱们的工作呢?第二个呢,有很多人说,是不是我们看着美国H1B收了10万美金,我们就要出来表个态,说你们上这来吧,这可好了。
其实K签证的政策很早就下来了,是在懂王H1B十万美金之前就已经制定好的政策。大家知道懂王的政策很多是有突发性的,他不会先跟咱们商量好了,所以呢并没有说要应对它。
还有说印度是不是要占领中国了,特别是印度的一些著名网红主持人说,咱们赶快去申请K签证到那边去。这个也让中国人感到一些担忧。还有呢,就是中国的新闻联播,经常是“领导很忙,祖国很好,外国很乱”。而“外国很乱”里边最重要的一项是什么呢?就是印度人占领全世界。加拿大盖满了印度神庙,印度的神像一个比一个大,印度人还在加拿大游行示威,要把加拿大人赶出去,说印度人才是加拿大的主人。说我们这是不是中国也要出现这样的事情了?很多人就很担忧。
咱们呢,看一下K签证这种东西,其实国外也有。表面上看呢,是不会抢中国人的工作机会的。
首先呢,说美国的K签证。美国K签证实际上跟咱们是两回事,他们是未婚夫、未婚妻的签证。就是说这个人可能马上要跟美国人结婚了,这一段时间拿的是K签证,要等结婚了以后呢,就可以去申请国籍变更,因为你结婚了嘛,他是可以去改国籍的。
所以咱们的K签证呢,肯定跟他这个是不一样的。咱们的K签证呢,他不是来就业的。K签证不可以在中国工作,不可以在中国应聘取得收入,这个事都是违法的。所以呢,从表面上看呢,K签证没有办法直接抢咱们的工作。为什么说从表面上看?后边咱们再细讲。
那你说K签证拿到到了中国来,能挣钱吗?能,是可以挣钱的。但是呢,挣的钱呢,是限制很严格。比如说学术交流项目费,这边有一个学校有一个交流项目,这里头有比如说10万块钱,你可以拿这笔钱。其他的,每个月拿一个补贴,拿一个津贴,这个事都是违法的,是不允许的。拿了学术交流项目费的话,这边还要给你代扣代缴,因为国内只要涉及老外,就必须要合法合规,这块还是要求比较严格的。另外呢,就是孵化器的一些入驻补贴。国内其实盖了很多的创业孵化器,现在这些孵化器很多都空置。有老外来了,说我们要在这创业,他们也会给一些补贴。这些呢,是K签证可以在中国取得的收入,但是你说我出去应个聘,这是不行的,所有定期按月给的都违法。
还有人去举了这样的一个例子:中国公司通常不敢压榨老外。这个确实如此。你们去看,所有这些有大批外国员工的公司,他们的内部管理制度一般都是两套,管理中国员工是一套,管理外国员工是一套。中国员工就是“996是福报”,各种加班;外国的就基本上是要按照严格的劳动法去执行,绝对不去跟他们谈什么“奉献者协议”什么,这东西都不去谈的。这个是中国一些有雇佣外国员工经验的公司留下来的经验。所以愿意去接受牛马生活待遇的这些人,并不用太担心外国人来抢你的这个工作。
K签证其实是访问学者签证。美国、英国很多国家都是有这种访问学者签证的,不是工作签证,也不是学生签证。我拿着K签证在中国,我考了个学校上学去了,行不行?不行。你要是考了个学校,你必须要重新转学生签证。你要上班了,你要去转工作签证,就是Z签证。中国工作签证叫Z。有人说这玩意不是对标H1B吗?这个其实不一样。H1B其实是个工作签证,你拿到H1B签证,第一个是要有雇主担保,第二个是要抽签,有总量限制,第三个你拿到H1B签证就可以去取得收入了。K签证是不允许取得收入,不允许应聘,不允许上班的,所以这个还是有很大差别的。
K签证呢,其实也有一些比较奇葩的地方,他跟国外的普通的访问学者呀,还是不太一样。哪不一样呢?第一个,我们要求的是名校毕业或任职。你说我实在是没有名校毕业,但是我在名校里头任过职行不行?也行。其实在这块要求还是比较松的,只是现在的名校的名单还没有最终确定下来。印度理工算不算?越南的学校算不算?朝鲜的学校算不算?到底哪些学校算,哪些学校不算,这个事呢我们现在还没有确定。为什么要讲到印度,讲到越南,讲到朝鲜?待会咱们再说。然后呢,我们要求是青年,年龄是18-45岁,在这个范围内都算是青年。太小的不行,太老的也不行。期限呢是5年多次往返,你一旦申请了K签证了,这5年之内随便来随便走。每一次进来呢,最多可以停留180天。但是呢,这个180天的要求并没有那么严格。你说我想超期停在这行不行?也没事,你去申请延期就行了,最长5年。那你说我到期了以后,我溜出去转一圈回来行不行?也没什么大问题。持有K签证的人,在中国停留的期限,上限下限都没要求。你说我拿着这个签证进来,待了一天就走了,再也没回来过,到明年我还想再入境,没问题。那你说我一年里头365天都待在中国了,中间可能飞到新加坡去晃了半天回来,行不行?也没毛病,也没人管你。所以它是这样的一种签证。
拿到这个签证以后可以干嘛呢?刚才咱们讲了,不能上班,不能取得固定收入。但是呢,你可以做科研、教育、交流、创业和商务活动。首先呢,它对于科研的要求其实是很低的,你只需要拿出一些参加线上会议的视频凭证,你就可以证明你在国内参加了科研和教育交流,这个太容易了。或者是找一些第三方中介机构,拍个照盖个章,或者是你投几篇稿件,就都算是你在国内参加了科研、教育交流活动。那你说我就光在这玩行不行?也行,但是你如果想申请延期,或者你下次再入境的时候,就有可能会被质疑你入境的理由跟你申请签证的理由不符,有可能会被注销签证,然后会罚一点钱,但罚的钱也不多,几千块钱或者一两万块钱,大概也就这种水平。那你说我进来做商务活动呢?这块就更宽松了。其实很多的人都是想进来做商务活动的。因为我原来做投资的时候也遇到过伊朗人,还有亚非拉的人呢,他们都希望拿到这种叫长期多次的签证去活动,但是商务签证在中国还是稍微有点限制,没有那么容易,或者说我想大批量的申请一大堆的东西,还是挺麻烦的。那么你就可以申请K签证,进来做个生意,反正5年之内嘛,多次往返。因为呢,很多的这种外商,他们想干嘛呢?在中国去盖有国家名称的这种商品城,把自己国家的商品统一地弄过来进行集中的销售,然后再在这边集中地采购中国商品再往回运,他们是想去干这个事的。但是这块呢,要去给他们一个合法合理的身份。现在呢,只要你符合年龄学历要求,这些人5年多次往返签证,甚至是5年停留签证,就直接拿到了。至于创业呢,要稍微麻烦一点。你如果想在中国创业,只有创业筹备期你是可以拿K签证的。一旦你说我筹备期过了,真的拿到钱了,拿到孵化器的启动资金了,我要开始创业了,那你就需要去转Z签证,就是工作签证。一旦注册公司就是工作签证了,这个是要注意的。
它这个项目最奇葩的地方在哪呢?最奇葩的地方是,不需要雇主,不需要担保。任何人,你只要觉得自己是符合要求的,就可以上网填报。填报完了以后,到底怎么去通过,怎么不通过,现在不知道。现在呢是政策刚刚出来,还没有人说真正通过这样的方式进来,因为到目前为止,到底哪些大学算是他这个知名院校里头,这个名单没出来。但是呢,你只要填报了就完事了。而且这个K签证,目前是没有明确的名额限制的,H1B每年是有名额限制的。所以呢,K签证实际上是一个针对特殊人群的、类似于过境免签的一个政策,只是原来你过境免签了,只能够在一些指定的城市待多少天,你拿到K签证就是5年之内随便,它是这样的一个政策。
K签证实行之后,到底会带来一些什么样的变化呢?那么会不会有人说,量身定做、因人设岗,我们就专门为了某一类人,比如说官二代或富二代,拿到国外身份了以后,拿着这种东西进来去折腾?肯定会了。但是通常有这样能力的人,也不会非要等K签证,人家有的是办法进来。而且呢,你想,这玩意是一个不设上限的一种签证,所以呢,他们这些特殊待遇的人呢,再怎么着都是少数,不是一个大的问题。
那你说科研和教育这件事,到底有什么可交流的呢?国内其实很多科研院所和大学,还是需要这些外国专家进行交流的。原来呢,我们是大量的去参加国际会议,把国内的人派出去。现在的话,咱们可能出去也没有那么方便,签证什么的也有一些麻烦。比如申请去美国的签证,他一看你学这个的,你那个是国防七子,他不让你去。那咱干脆自己去办大量的这种学术会议,把他们弄进来。我们也盖了这么多的学校,这么多的研究所,我们也需要去把人弄进来,去做各种学术交流。所以这一块他们还是有需求的。现在等于是给这些人一张5年多次往返的签证,随时我们这开会,你就随时来,你也不用在这停留多长时间,开完会你回去就完事了。开会的时候,我们还可以给他一些这种服务费,这个事都是在K签证允许的范围内的。
商务活动呢,应该会占比较大的一块。想来中国做生意的人还是比较多,毕竟咱这是世界工厂,市场也很大。如果你生产一些原料的话,中国人还是很喜欢。像以前伊朗惦记上这边来去做商品城什么的,他也没有什么成品卖给咱们,都是各种各样的原料,这个我们还是有巨大需求的。亚非拉的兄弟们,请把你们这些学STEM、名校毕业的年轻人派到我们这来做生意,我们欢迎。他就是这样的一个情况。你说你没有受过教育,或者你的院校没有在这个范围内,这个别来。
当然,你说有没有人过来面试了?也没问题。你说我拿了个K签证进来面个试,然后转工作签证,行不行?没毛病。在中国申请工作签证呢,其实并没有那么麻烦,只是呢要求你完全合规。你必须公司是合法注册的,有实际的运营的项目,提供一些证明材料就OK了。中国的给外国人发工作签证里头呢,是分三个层级。你说你是一个专家,这没问题,我们欢迎。像K签证的,基本上都是属于这一类的。你说我是相对还不错的技术人员,这块我们也欢迎,相对来说申请也没有那么困难。但你说我是一个普通打工人,我进厂打螺丝的,或者我是一个服务员,做这种低端劳动的,这个对不起,不批。咱们是这样的一个方式。
很多公司他不愿意请这些老外的最主要原因就是没有那么合规。因为呢,你盘剥了老外,容易引起这些国际纠纷。你说我们做了一个血汗工厂,整了一堆老外进来,把他们累死在这了,这个不允许的。你像美国,你要申请H1B的话,你还需要比如公司的营业额达到多少,注册资金有多少,然后可以给你发几个指标。现在川普说了,你申请一个还要交10万美金。这个在中国都没有,申请起来还是比较方便也很快。中国申请Z签证,可能也就是一两个月就可以搞下来。而且中国呢,对于发放Z签证的数量其实是没有明确限制的,也没有公布过说中国到底发了多少Z签证。它不像美国似的,H1B一年八点几万张。中国到底有多少Z签证发出去了?从来也没说过。像我们以前的一些同事,也没感觉他们申请Z签证有多麻烦,反正就是找个代理,过两天就拿回来了一个状态。K签证的人去申请Z签证,基本上是没有什么障碍的。
但是呢,我并不认为他们就会抢中国人的这个饭碗。因为第一个,大厂要的是牛马,要的是有奉献精神的,通常不太敢去压榨老外。另外呢,就是最底层的工作,我们是不发Z签证的。以程序员为例吧,在中国能够有竞争力的,其实并不多。是,印度虽然产程序员,但是印度程序员到中国公司里头,卷死他,一点戏都没有,他跟中国程序员比是肯定不行的。我见过的或者是说听说过的,在中国能够有性价比、有竞争力的程序员是什么人呢?是越南程序员跟朝鲜程序员,特别是朝鲜程序员,在中国还是有一定的竞争力的。朝鲜其实是培养了很多的程序员在中国上班,但是他们好多其实也没有从事一个特别合适的事情,他们好多是在这边做黑客,做一些黑产、灰产的事情,这个数量还是不少的。所以刚才我讲说,学校清单里头会不会有越南的,会不会有朝鲜的,会不会有印度的。其他地方的程序员,菲律宾、印尼、马来西亚,就这些地方呢,他也有计算机学院,也有计算机专业的学生,但是他们的程序员到中国来,基本上是没有什么竞争力,性价比估计也不是很高。
那K签证呢,是可以转工作签和学生签的。所以表面上看,他不太会抢咱们的工作。但实际上呢,你说会不会有人说,因为他们进来了以后,觉得稍微有一些难了呢?现在需要跟朝鲜程序员去抢工作,这个也不是说完全不会。他们会在国内得到一定的这种岗位和机会,但是总的影响应该并不大。
那你说在中国创业,是不是一个好主意呢?其实只要市场在外面,在中国创业还真的是一个不错的选择。毕竟这里是世界工厂嘛,华强北只有你想不到,没有他们做不出来的东西。技术人才也是产能过剩。你比如说,我在中国创建一个软件外包公司,把自己国家的各种软件相关的项目外包到这边来干,也挺好的。或者说我在中国生产了各种产品,卖回到自己国家去也行。但是呢,你就千万别惦记说,我在中国做一个项目,然后一定要在中国跟中国的公司去抢中国市场,这个事呢是比较难的。你说有没有老外在中国创业,还做中国市场做得很大的呢?还真有。前几年呢,有一个酒店集团叫OYO,他呢是一个印度人创建的酒店集团,拿了软银的钱,软银大概给了他6亿美金,在中国开疆拓土。最高峰的时候是2019年,超过了华住会和如家,300多个城市有1.9万家酒店,78万间客房,达到这样的一个高峰。他的玩法是什么?他叫“软加盟”。原来都是“硬加盟”,加盟费门槛很高,我给你去做装修,然后要做这种强制管理。这个OYO呢,就是做软加盟,你不用给我加盟费,我来帮你做一个统一的品牌,定制各种的形象,我们只在所有的销售额里抽一个很少的成,我也不太管你,算是一种松散加盟。但是这个项目呢,到2019年是最高峰,然后就是疫情,就没有然后了。2024年还剩下1500家连锁酒店,只剩下最高峰的时候的8%,最终呢是关闭了所有在国内的连锁酒店,退出了中国市场。其实它也不叫关闭,因为它也跟这些酒店没有直接的隶属关系,只是说我回收这个品牌,你们以后不能再叫这个牌子了。这个OYO在中国这个生意就算结束了。现在这个项目呢,回到印度去了,在印度还发展得不错,正在谋求印度上市。
那你说印度人会不会大批量涌入呢?这个是很多人担心的事情,因为印度人呢,在全世界范围都在快速涌入。这个其实不用太担心,咱们先下结论。为什么呢?一些相对正规的公司呢,确实可以面试K签证的人,为他们申请Z签证。让懂技术的印度人转成售前、售后工程师,或者转成销售,其实是非常非常划算的一个事情。印度护照呢,在全世界各地走来走去,是要比咱们方便的。咱们有这么多产能过剩的产品,让他们到全世界去卖,挺好的一个事情。他还是学技术的,进来了以后,商品还能搞得明白。比如说比亚迪吧,招一堆印度工程师,让他们到加拿大去卖这东西,多好的一个事情。那你说他一定要进来做研发,要想卷中国的程序员,行不行?这个我觉得他们想多了。在美国他没有卷过中国程序员,在中国凭什么他们就能卷过中国程序员呢?像我以前的这个公司,里边也雇佣这些人,他们也主要是做商务,效果非常好。
咱们要看一下,哪个地方的印度人占人口比例最高,咱不说印度本地,就是在国外里头,其实是中东国家,像什么阿联酋、卡塔尔这些国家。他们还不叫印度人,他们叫“印巴人”,这印度人和巴基斯坦人占的比例是最高的。那你说他们为什么就没有闹出事来,没有像加拿大这样,只有12%的印度裔就搞得乌烟瘴气呢?差别是在这儿:第一个,这些印度人想在阿联酋、在卡塔尔这些国家想入籍,基本上是不可能的。你永远在那上班,一旦没有办法在那边继续产生收入了,基本上没法在那活下去,因为那个地方的消费非常高。他对入籍基本上是限制得死死的。你既然没有办法入籍呢,你就没有办法去竞选,或者是参加到这种公务员,都不可能。所以他就不会在当地享有任何的这种政治权利。所以中东国家就是大量引进移民,但是呢,所有福利都是本国人民的,所有的管理权都是本国贵族的,所以并不用担心太出事。加拿大也好,美国也好,印度人多了以后是怎么闹乱的?就是他给这些人发永居、发国籍。发完了以后呢,这帮人就可以去竞选公职,就可以去进入到公务员体系,进入到管理体系来,他就开始有权利了,他可以去闹。所以呢,这个是最主要的区别。
那你说中国像谁呢?中国其实有点像中东国家。我们发大量签证出去,你们可以进来,可以上班,没毛病。但是你要想入籍,这个难了。中国属于是即使结婚都不让你入籍的。像阿联酋这些,你如果结了婚还是有可能入籍的。中国是绝对不让入籍。很多人说,我现在想要一个中国国籍怎么办?你除了跟中国人结婚,你的子女有中国国籍之外,你自己这辈子也没有。中国大概从建国到现在,发的国籍也就是几千上万的一个数。现在每年呢,也还在发国籍,大概也就是个几百人这样的一个数。所以对于14亿人的国家来说呢,我们不需要担心这种事。而且这些人呢,好多都是中国人民的老朋友。中国向外国人发国籍最多的时候是刚解放的时候,但是其他人后来就基本上不发了。虽然现在我们有移民局了,就这几年刚创建的移民局,但是向国外人发国籍这件事,到目前为止都一直没有放开。即使是永居,其实我们管理的也是很严的。很多外国博主呢,都在抖音上发视频说,“我终于申请到永居了”,这个事是要出来炫耀的。
而且在中国呢,你只要工作就要去申请工作签证。你说我这个印度人,走到哪拉帮结派、拖家带口,你申请了K签证、申请了Z签证,你可以申请家属过来探亲,可以进行短期团聚,长期的也行,停留180天以上的也是允许他们过来。但是这些人是不可以在中国上班的。你一旦想在中国上班,你就要去申请Z签证,这是中国的一个政策。那你说我们现在想去做一些低端工作,偷偷干行不行?就像加拿大这些非法移民似的,或者说像美国这些非法移民似的,我们去做一些简单工作行不行?没戏。为什么?一眼就能认出来,东南亚人、非洲人、印度人,他跟咱长得不一样,一看你就不是中国人。而且你的竞争对手会很开心地去举报你。前两天好像广东还是哪就有一个,让这个老外去送外卖还是怎么着,马上就被举报了。你利用外籍人士去从事外卖这样的行业,分分钟被抓住。所以这些人去做这种低端工作,是不太可能的。而且中国人口本身非常多,14亿人嘛,虽然现在生的少了一点,但是毕竟底子在这,你往里头掺沙子,这点数应该问题也不是很大。
至于文化渗透这件事呢,我们这一块管理还是比较有经验的吧,没有那么容易让他文化渗透进来。所以呢,印度人占领中国这件事呢,是大家想多了,不太会。至于说他们想聚集闹事这个事呢,会被清理的。
那为什么现在要出K签证呢?就是中国的教育和科研机构面对地缘政治割裂,是需要更多的交流。第二个,中国大量的孵化器闲置,很多工厂的产能过剩,也需要外国人帮我们把这些东西卖出去。第三个呢,基本上是一个面向特定人群的宽松免签,我们就把它理解成这个就完了。你像这帮人,线上申请,不需要担保,不需要邀请函,不需要有任何落地的文件,找几个人在国内开个线上会议,你就可以拿到K签证了。所以我们对这个事的要求是非常非常宽松的,还没有年度上限,进来了以后停留时间其实也没什么限制。
K签证呢,是一个有利于中国对外沟通、交流和合作的一个签证吧,就有点像咱们原来推出的多少小时过境免签一样。挺多老外过来去玩耍,他们进来还是会消费的。而且他们进来了以后,也会说中国好像跟宣传的不太一样,还是有一些让我们觉得比较奇葩的地方。我们现在还是希望更多的人进来看吧。至于最终的效果怎么样,会产生什么样的负面效果的话,可能还需要等过了几年再看,短期内是看不出来的。至少现在过境免签对于我们来说,还算是有正向效果的一个政策。K签证的话我觉得,至少在过未来的可能三五年里头,应该效果都还是比较正向的。
好,这就是今天讲的故事。感谢大家收听,请帮忙点赞、点小铃铛,参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。
2025-10-03 08:53:11
Palantir成功的秘密,OpenAI都在大量招聘的岗位,FDE会不会是咱们这些毕业的软件工程师未来的出路呢?
大家好,欢迎收听老范讲故事的YouTube频道。
AI带来了很多矛盾,好像什么都能干,但是好像什么也都没有干得太好。业务都达到瓶颈了,只能通过降本增效、不断的裁员获得收益。没法开源,就只能节流。任何公司都不敢说我不拥抱AI,但是呢,真的依靠AI解决问题的效果,又不是那么很好。所以AI这一次真正带来的只有焦虑和内卷,一点希望都没有。这就是AI时代带来的最大矛盾。
现在呢,终于有了一线曙光,Palantir算是一线曙光吧。他们呢,自己有一种职位叫FDE。FDE是什么呢?叫Forward Deployed Engineers,叫前端部署工程师。他为什么有这样的一个奇怪的职位呢?而且这种职位的人数很多。他成功的一个核心原因,就是使用这种FDE职位。
大家想想Palantir是干嘛的?他主要服务的CIA、国防部、美军,他全服务这种人,就会遇到一个巨大的问题是什么?就是他们的需求千奇百怪,千人千面。你上去问说你到底需要什么需求呢,人家又跟你说不清楚,或者说完了以后呢,你也很难能够理解清楚,会有这样的问题。而且呢,他的很多的流程非常小众,就没有哪个说我把这事弄明白了以后,我开发一套系统,放之四海皆准,这个事其实挺难的。
当一个系统需求很难确定的时候,你就没有办法往前走。这种需求一方面是说不清楚,还有一方面,很多做企业AI化的项目呢,都会遇到一个问题是什么?就是甲方对于AI抱有不切实际的幻想,我觉得他这玩意儿下海能捞鱼、上天能揽月,就这样的一个状态。这个还是需要一个沟通过程的。
以前的软件交付其实主要走两条路。第一条路呢,就是工程定制。你跟我说你要什么,我派咨询团队进去出报告,出完报告了以后,咱们在后边一步一步的去实施。然后呢,咱们去验收,验收了以后发现还有什么bug,我们再去咨询,再去给你迭代更新。当然咱们现在讲迭代更新呢,基本上是以年,而且还不是一年,可能两三年迭代一次。两三年迭代一次,以这样的一个频度去把这个软件维护起来的。这是一种方式。
另外一种方式就是做标准化产品。就是我把这产品做标准了,你这个流程跟我这不一样,或者说你整个的决策机制跟我这不一样,照我这改。他是这样的一种方式。前面那个定制工程的那个呢,是肯定人家原来有流程,有决策机制,你必须得照人家那个做。做标准化软件呢,就是要求人家照你这改。你像Palantir这帮用户,那国防部或者CIA的特工,你说我把你拎回来给你做个培训,说现在决策流程是这样的,你必须这么填单子才能报销,这不是开玩笑吗?所以你必须要照人家那个流程做,但是你照人家那流程做呢,成本又非常非常高。定制工程一方面是很慢,另外一个问题是什么?就是很贵。
这个就导致没有办法,只能是上新的方法。那你说我能不能把这标准化产品,我把所有的可能性都覆盖了行不行?现在有一些SaaS系统呢,确实在干这种事情,那就功能大而全呗,非常非常臃肿,所有东西都在里头。那你做了这样的系统以后呢,就会遇到一个问题叫“辣子鸡问题”。什么是辣子鸡?大家有没有吃重庆辣子鸡这种体会?就是一大堆辣椒,你要在里边挑鸡。当有一个这样的系统交到你面前的时候,你就要在大量的、你都搞不清是干嘛的功能里头,去挑那么几个你可能用得到的功能。有可能用错了,还有可能就是你想要的这功能找不着。即使说我进行培训,或者是进行一个很复杂的配置,这种东西呢,没有专业技术人员的伴随,其实你也是搞不定的。这个有时候也是靠咨询师去搞定的,这个也很贵。
那Palantir呢就换了一条思路说,咱们算了,上FDE吧,咱们到现场给你改不就完事了吗?他叫现场或者前端交付工程师嘛,就是派人到现场去说,你哪不不满意我给你改改,或者说你需要一个什么新功能,我现场给你写一个。就是现场给人用的一个半成品的系统,人家用上了。他通过这样的方式去做,他们叫驻场工程师。
当然他们那个驻的现场呢,稍微有点危险,因为有的时候是战场,你需要让工程师到战场里去。他们呢,举了一个案例,比如说阿富汗美军,他到阿富汗去驻场去了。人家说我们的需求是出门怕地雷,看看怎么给你做一个地雷预测呀,或者说怎么去设计巡逻路线呀,还是怎么样。人说不要这么复杂,你能不能给我做一小功能,让我在这个地图上能画一圈,说这可能有地雷。然后下一个人呢,拿着地图,我能看到这个圈,说这个地方有可能有地雷,我绕着走不就完事了吗?他“我就需要这么个功能”。
以前的话,你要想搞定这件事,先上咨询师,写完报告,然后回去开各种需求讨论会,再去做系统系统更新,然后重新培训,是这样的一个过程。现在好了,他有现场的驻场工程师了,你要这功能吧,我噼里啪啦给你写一个。其实这种东西写起来并不复杂,你调这个Google Map的API就可以直接搞定,这个事相对来说还是比较简单的。
开始做完了以后,不是一个特别完善的产品,就是个半成品,人家就拿去用去了。用完了以后,发现被炸死的人少了。这个你想值多少钱?少死多少人呢?碰到地雷的几率一下就下降了,那人家就很喜欢。不算完,他再把这个功能呢,弄回到这个服务器上去,或者弄回到他们的系统架构里边去。下一个人再想要类似的功能呢,就直接可以选配这个项目了。他是这样来去工作的。
美军说我们以后在各个地方去部署你这个Palantir的系统的时候,我们都需要这个圈地雷的功能,或者我们都需要一些,比如说标注毒贩路线的功能,或者其他的在地图上画圈的功能,我们都需要。那它就把它变成了一个标准化的功能。再到现场的工程师能干嘛呢?就是圈地雷我画个红圈,圈毒贩我画个蓝圈,圈偷越边境偷渡者我画个黄圈。他可能就把这玩意稍微改一改就完了,或者我加个小图标。这些部分呢,你就没必要在服务器上,或者在整个的系统里改,这个现场工程师给人改了就可以了。
他现在通过这样的方式把这种问题解决了。最终呢,照着这条路Palantir的走下去了。很多的FDE去到不同的客户现场,现场咨询需求,现场实现。以前都是要去开需求讨论会,会有一个需求评审委员会,评审的人呢,都是离现场非常非常远的人。一评审说这不重要,我们先不做了,我们先做那个吧。这个对于现场这帮人就很郁闷。这就不用费劲了,人现场给你实现了。现场实现嘛,一定是很简陋的,先用起来解决问题,马上被地雷炸到的几率就下降了。这些小需求,他压根没有进到系统里去。但是呢,在地图上画圈这功能,大家都有了,它以后变成这样的一个东西:就是共性的上升到平台,个性的就各自实现就完事了。
Palantir是成功的,大家看看那个股价就可以了。而且大家注意一点,他们用户需求很廉价、很快速的把它解决掉以后,得到了一个什么东西?就是用户粘性不断上升。你说我把这种需求解决了,换一个供应商行不行?别开玩笑了,这样的东西你咋换?换完了以后你需要重新弄吗?这个是肯定没法换的,就属于绑死了,它的迁移成本非常非常的高。而且呢,它通过把这些功能不断的找到共性,把总的服务成本不断的下降。原来到阿富汗去,我要去做这个功能还稍微费点劲,后边呢,把它写到后台的系统里去了,比如说现在又要到哪个地方去扫毒了,要到哪个地方去执行一个别的任务,那再开发出来就简单多了呀。你的服务成本一下就下降了,合同的价值呢会不断的上升。他一开始可能会亏钱,因为你毕竟是要派人上战场嘛,你给钱少了,大家不去的呀。因为你可以解决更多的问题,而且都是高价值目标的问题,你的合同价值上升,利润上升,它最后形成了一个良性循环。
FDE呢,根据描述,好像只是换了个名字的外包和咨询。大家有没有这种感觉?你说了半天这不就是外包吗?你跑到人现场去,然后七拉咔嚓给人做了,给人交上不就完事了吗?或者说咱到现场去询问人有什么需求,这不是咨询干的活吗?那FDE到底是外包还是咨询,还是真的有一什么新东西呢?
首先给一结论:FDE呢,跟外包、跟咨询都是有差别的,但是呢,跟他们也有一定的相关性。咱们来讲一下他到底差在哪。
我上大学的时候呢,就有一种梦想,老师也在给我们讲,后边上班的时候,各个公司都在给我们讲,讲什么呢?叫“软件咨询工程师”。就是我们到现场去,用户说需要什么,我七拉咔嚓到现场给人做了,然后直接交付就完事了。我九几年上大学,那时候就在讲这个事情,但是呢,这个梦想一直没有实现。那为什么没法实现这么美好的愿景呢?原因是软件开发周期太长。你要去开发一个软件,可能正常一两年或者两三年,你才能把它写出来。那在这个过程中呢,沟通效率极低。程序员说的话,人家那个甲方听不懂;甲方说的话呢,程序员又理解不了。这个是一个非常痛苦的过程,为什么咨询服务那么贵?就是这个原因。而且呢,试错成本极高。你要一什么功能我没听明白,我七差咔嚓开始给你做了一两年,做完了交上来以后说,这不是我要的东西,跟我想的不一样,你就需要去为这个错误要买单。而且那么多软件工程师,软件工程师工资很高的,坐在空调房里写了两年,交出来的东西说不对,那你说这成本有多高?这个是以前没有办法走软件咨询工程师的一个核心原因。
原来解决的方法呢,就是要么开发一套通用产品努力销售,做SaaS就是这样的一个过程,靠销量把这个研发成本给它摊掉。另外一种方式就是定制开发了,高收费定制服务。你一旦需求分析错误了,你后边的所有研发、测试、部署成本就全都浪费掉了。为什么咨询师工资那么高?咨询师要比后边的软件工程师的工资还要高,因为他还得懂业务。它实际上相当于一个翻译,它能够把工程师的语言跟甲方的需求之间能够对齐。而且呢,有一整套的规范机制能够保证说我们确实说明白了。为什么搞这么复杂?因为一旦搞错了,你得分责任,谁错了,谁为这个错误来买单,这个事要搞清楚。当然还有一条路就是内卷了,用更低的成本、更多的人去把这事搞定,这个不建议不推广。
那么咨询跟FDE有什么区别呢?咨询是前期介入,出方案,按次付费就完事了。咨询的次数越多,你就给我越多的钱。而且咨询呢,通常是不保证结果的,我并没有说我咨询完了以后我就一定保证你这个是对的。你像华与华那就是咨询公司,能够保证所有买了他们这个方案的人一定能成吗?有些人当然看不上,他们说你这不叫咨询公司,你叫点子公司。国际上那些大咨询公司才是咨询公司。但是其实很多倒霉的公司,也都买了这种大咨询公司的服务,最后也都没玩转。所以咨询公司也好,点子公司也好,是不对结果负责任的。他们只出报告,我报告完了,把所有的该输出的东西都输出给你了,完事了,你该付钱付钱。后边你自己实施怎么样,跟我没关系。而且咨询公司核心要干的什么?就是要改变甲方的组织架构和决策流程,要让他跟SaaS系统配套。当然了,你为了干这件事还要干嘛?要神化你的SaaS系统,“这个东西是多少多少管理大师研究出来的,一定行,比你们这套土办法强多了”,这是咨询公司喜欢做的事情。华与华其实经常干这种活,就是不比价、不投标、不给钱我就不给你干。为什么一定要搞成这样?就是你得信我,你不信我这事咱没法整。而且报告交付了,你就去给钱,后边你自己执行怎么样,跟我没关系了。
外包呢是另外一条路。外包呢,是内部呢自上而下决策,我们决定要做一什么事,然后找人来实现。这个东西呢,是不可重用的。以后需要改什么东西,我就在内部决策,收集需求,然后再找人来干。日本人这种外派,其实基本上就是这种外包模式。
那么FDE跟咨询和外包的差异在哪呢?首先讲FDE呢,是一个合作模式,双人合作模式。Palantir里头呢,有两个职位,一个呢叫做Echo,他是行业里的人。比如说他要为间谍服务,他就得找几个间谍进来,他们能够听懂间谍说什么,也能够听明白说间谍上面这些管理机构他们讲的话到底什么意思。他们通常是从这样的机构出来的,而且还要求什么呢?稍微的有一些颠覆思维。你不能说你原来是间谍,你到这来说我们原来那就是金科玉律,一点都不许改,这种人不要。一定是从原来行业出来,还愿意去尝试新东西,愿意有颠覆的这些人出来做Echo。另外一种人呢,叫Delta,实际上就是软件工程师,是极客。这俩人配一对就出去了。比如说跑到人家那个战场上去,一个人就问他说:“兄弟们最近怎么样?有什么最大的痛点告诉我们,我们来给你去解决去。”把这事聊明白了以后呢,跟这个工程师拍着肩膀说:“我搞明白了,他们就要这这这这东西,你就给我做吧。”这个工程师呢,在后台很完善的、或者功能很强大的系统的支持下,在前台呢,给人做一个简单的实现。这个事就搞定了。他们就是这样的一对一对的出去干活去了。
他们跟咨询的最大差别就是,咨询就是咱们先签咨询合同,你要不愿意干,咱就别签合同,我就不来。签了合同你就要付钱,只要我交了报告出来,你就得付钱。FDE的话,前期有可能会亏钱。而且呢,FDE不是交报告的,FDE是直接出产品的,直接就交付产品出来,然后人家这个功能就可以用了。而且不断的迭代,你觉得哪不对我给你改改,再哪不对我再给你改改,他是这样来干活的,结合了外包的部分属性。这个是FDE跟咨询师的最主要区别。
那FDE跟外包的差别在哪呢?第一个是必须跟CEO和最高决策者沟通,要拿到核心需求下手。外包经常去做一些零零碎碎的东西,这个东西对核心的系统没有什么大的影响。这个其实是外包比较痛苦的地方,因为你一旦给人干了这种活呢,也挺费劲,吭哧吭哧干半天,但干完了以后呢,你的价值没有上升,你没有绑定他的核心利益。你要想绑定核心利益,必须要得到最上面人的支持。其实这块呢,有点像咨询师。咨询师的所有咨询合同,只面向CEO和老大去卖。因为他那个第一合同很贵,第二个的话,因为他需要去改人家的组织架构和决策流程,不跟老大去搞明白的话,你这项目就没法推进。所以在这一点上呢,有点像咨询师。但是外包无所谓,外包就是我找到任何一个神头鬼脸的一个小头头,他给我点小单子,我都能够把这单子做了。
FDE跟外包还有什么区别呢?外包呢,每一次都是人家有什么需求,我就从头给你做。下一次再来一个需求,我再给你从头做。而FDE的话,就是我跟人沟通了半天把项目做了,做完了以后发现这个东西可能有共性,对整个的后台系统的升级是有意义的。所以它后台系统也在不断的升级。其实外包也这么干,只是他不跟人说而已。为什么呢?这就跟现炒和预制菜的差别一样。你到一个外包公司谈合作去了,谈完了以后说:“呀,你这个我需要重新给你做,你那个我需要给你现做”,这样你才能收着钱。你不能说上来了说我们这有一个系统,我在哪干过,我给你改改就行了。这你哪去谈价钱?你谈不出价钱来。但是呢,不上预制菜,你肯定是没有利润的。所以他们一定会开发大量的现成模块,然后到现场去给你拼装去。这个也是中国的这些系统集成公司的一个习惯做法。
那你说为什么以前大家都想去做软件咨询工程师做不出来,而现在就可以有FDE了?到底发生什么样变化了呢?是彼得·蒂尔和Palantir这帮人实在是天纵奇才呢,还是有一些什么样的其他的变化出来了呢?
以前没有,是因为软件开发成本和周期实在是解决不了。现在后台是个大模型。原来你肯定是要写死的一套系统,而现在这种大模型,本身的功能很丰富很完善,啥都能干。虽然可能很多事呢,你直接让他干,他干的没有那么好,但是通过一些AI Agent呀,或者通过一些结构化提示词,你是可以让他干好的。甚至你让他做一次,发现做的有问题以后,你可以让他再做一次。现在的这种后台跟前端之间是个松耦合,以前是个紧耦合。什么叫紧耦合?原来比如说统计了姓名、年龄、族裔,但是呢,突然发现了一个问题,以前的性别只有俩:男、女。后来说叫男、女、不确定,变仨了。再后来呢,变成4个、5个、6个,不断上升。这个在原来的状态下就没法整了,你必须要重新升级版本,你要重新提需求,过需求评审会,上版本测试,然后部署,再重新培训。以前要走这么一个流程。现在后头是个大模型,他没有这个问题。你告诉他说这个性别我需要多存几个项目,或者说我现在需要多记一些字段,他什么时候开始在心理上认可自己是女的,原来没有记过,现在就直接可以干了。直接写一个备注,说某年某月,觉得自己应该心理是变成女了还是变成男了。这个对于大模型来说,都不是什么大问题。你只需要把这个数据拎出来以后,然后拿这个数据去作为上下文工程,它就直接给你输出出来了。现在有这样的一个特别棒的能力了,这是后端强大了嘛。
另外一头是前端。前端呢,有AI Coding了。大家可以快速地在AI的帮助下就可以把代码写出来了。现在前端写代码的速度比原来快好多。在AI Coding的帮助下,再加上后端是个大模型,所以以前没法干的事情,现在就能干了。而且AI Coding呢,其实最适合干这个活了。一上来说我要用AI Coding编程,写个微信、写个抖音、写个淘宝,您想太多了,这玩意不是干这个使的。这个东西最适合干的就叫“最后一公里”,我把最后你需要这点东西稀里哗啦给你抹上,它最适合干这个。所以呢,FDE这个东西以前不能有,现在有了。
那FDE这模式可以推广吗?说的这么好,大家要想清楚,Palantir的这个用户是什么样的?他是美国国防部跟CIA这帮人。一方面他们确实很难伺候,如果没有这么难伺候的甲方的话,他也不会想着上FDE这样的一个前期亏损、还吃力不讨好的一个模式。最后把前面该挨的打都挨过了,终于成为大家仰望的一个高峰了,它是这样的一个过程。但是呢,国防部跟CIA有一些别的特性:有钱。你想我帮着美国大兵少被地雷炸死几个,那你说你得给多少钱出来才算合算?他们是真的有钱,而且也舍得给,这个是他们所具备的一个独特的优点吧。另外一点是什么?就是他们的履约能力、契约执行能力和政策的一贯性都还是不错的。这个话用人话怎么讲呢?就是他们签了协议,后边真的给钱,不会说我签了协议后边就不给了。还有呢,就是很贵的协议,我们也愿意签。什么叫政策一贯性呢?就是前面人签的协议,哪怕你政府换了党派执政了,他们后边还接着执行。不像有些地方,换了一个最上面的领导,你前面的合同不认了。不会有这样的问题。所以呢,如果你的甲方具备这些特性:有钱、履约能力强、政策一贯性强,那么FDE模式是非常非常适合的,并不一定是所有项目都适合。当然了,我们中国呢更卷,程序员更多、更便宜,可能我们适用的范围会比美国要更大一些。
FDE呢还会带来另外一个好处是什么?就是创业。这些懂行的人,他们呢,其实一方面会跟客户沟通,能够理解客户需求;另外一方面呢,他们也会维持客户关系。当他维持了一堆这样的客户关系以后,再加上手头有一个能够干活的小兄弟,那这俩人干脆搭班子创业不就完了吗?所以如果现在有企业愿意招募FDE的话,这些毕了业的35岁以上的,既懂行业又懂编码的这些人,你们就搭伙去干活呗。给人解决一段问题以后,站稳了脚跟就可以创业了呀。像Palantir也在干这个活,他就不断的孵化这些人创业。因为一旦创业了以后,他就可以把这一部分成本就直接扔到外边去了,“你们以后就成为我的一个代理商、承包商,我就相当于把这事外包给你了”,这不也挺好的一个事情吗?所以呢,这是一个新的创业方向。
总结一下吧。Palantir成功背后的FDE模式,为AI时代的软件交付提供了新的模板。现在OpenAI等一些AI大厂,都在成立自己的FDE交付小组,到不同的企业里边去给人做交付去。不要老惦记做这种大而全的东西。前两天也有一个我的付费会员说,你看我做了这样的一个系统行不行。我一看我说,你这个玩意是不是不太接地气?你是不是稍微做一些能够解决具体需求的、小需求的这种东西,然后再逐渐的拓展出去?他说你说的好像也有道理。这当然这种话放之四海皆准,属于正确的废话。但是呢,你看看人家这个FDE的方式,其实这就是现在的新的方向。毕业的Echo和Delta,他们也可以重新上岗了。
好,这个故事今天就跟大家讲到这里。感谢大家收听,请帮忙点赞、点小铃铛、参加Discord讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。
2025-10-02 08:45:08
Sora 2 发布了,谁有邀请码给一个?
大家好,欢迎收听老范讲故事的YouTube频道。昨天晚上深夜,Sora 2 就突然发布了,山姆·奥特曼还跑上去祝贺了一下,但是他是远程的。现在我们也搞不清楚,他这个祝贺视频到底是他自己拍的,还是Sora 2 生成的,因为现在已经很难分出真假来了。
上来先放了用Sora 2 做的各种各样炫酷的视频。这一次呢,确实是看到了物理上基本都合理了,像原来物理上不合理的地方,现在少很多了。另外呢,就是人可以直接进到场景里去了。原来都是说先画一个人出来,这个人怎么动,而且人动的时候,衣服或者什么还要换。现在看到的演示,已经基本上没有这种问题了。
三个小哥呢,坐在那里刷了半天视频,他们整个的演示过程,实际上就是在刷视频,让你看看Sora 2 做的各种各样的东西是怎么样的。大家注意一点,这次刷的视频大部分是竖屏的,因为呢他们做了一个类似于TikTok这样的软件,展示这些Sora 2 的内容。既然是TikTok类型的嘛,在iPhone手机上一定是竖屏内容为主。
现场呢,做了两条效果都是比较炫酷的,一个是让山姆·奥特曼手舞足蹈地说了个祝贺词,这个确实是挺震撼的。另外一个呢,是让现场的一个小哥,他原来拍了一条香水的广告,然后让他再改一条帽子的广告,效果都非常非常好。但是呢,更复杂的视频到底是怎么做,现在还不确定,因为现场做的两条视频都比较简单。
现在呢,它是有iOS版本的软件,我也下载了,但是没有邀请码玩不了。所以谁有邀请码赶快给一个,拿到邀请码以后,可以再变出4个新邀请码来。这谁拿到邀请码进去了,会得到四个新的邀请码,他是希望通过这样的方式来裂变的。
这一次到底有什么不一样的呢?虽然他讲了很多我们物理模型怎么增强了,我们怎么世界模型了,我们人物怎么保持一致了,一致性怎么增强了,但是这一块呢都是刷视频,他给你看的一定是筛选出来的比较好的视频。所以这一块到底做成什么样了,还是要咱们自己上手了以后才能知道。
这一次真正不一样的地方,是做了一个AI版的TikTok,这个绝对超出想象范围了。其实我们现在看到的各种的图像生成、视频生成的这些应用,都有类似于TikTok这样的功能,你比如说像即梦或者是像可灵,即使是Midjourney,他自己没有APP,他在网站上也都是可以去浏览别人的内容的。但是浏览别人内容是什么呢?你只看最好的,或者他希望你看到的他认为是好的,这些内容会给你,他并不会让你去进行社交关注,也不会去对你进行这种个性化推荐。
原因其实也很简单,就是内容没那么多。如果是让你进行社会化关注的话,你可能会看到大量的低质内容。就相当于是两个人结为好友了,那你只能看到那个人照的各种照片、做的各种内容,甭管他长得有多难看,审美有多差,你也只能看到他的,其他人的内容你就看不太到。所以这也是为什么像可灵、即梦、Midjourney,给你看所有人里头做的最好的内容。现在呢,Sora 2 是要给大家社交关注以后的个性化推送的,这个基本上是TikTok的套路。
这次呢是直接上了iOS版本,网页上没有。你现在到Sora.com上,还是Sora 1 的这些内容。刚才我去试了一下,Sora 2 的内容基本上没出来。我呢也下载了一个,只要是你把iOS的账号切到美区,它就允许你去下载,但是没有邀请码进不去。像这个TikTok,你如果不登录的话,你还是可以去浏览视频的。Sora 2 的话,你不登录直接退出来了,这个还是挺烦的。
Sora 2 呢,不允许上传视频,必须是在里边生成。这个呢,还是非常棒的一个策略。为什么呢?它可以很好的让Sora 2 的内容溢出到别的平台上去。什么意思?就是你拿Sora 2 做了一堆视频以后,你可以把这些视频再导出到TikTok,导出到YouTube,导出到Instagram。但是呢,别人的这些做好的内容,不能够灌到Sora里头来。这个要比YouTube Short和Instagram Reels要聪明很多。因为大部分的这种内容,都是在TikTok上的,或者是在国内抖音上的。你一旦这种内容倒灌的话,你整个的社区的调性跟氛围就没了。你到现在去刷YouTube Short,大量的YouTube Short内容,最后都是有TikTok的标,就是从那边搬过来的。所以呢,现在Sora采用的这个策略就是单向的,你可以把我这东西搬走,但是你不能把外边东西搬进来。
据OpenAI的人讲,他们内部测试这个产品的时候,大家都非常喜欢,喜欢到了已经影响工作效率的程度了,大家都天天玩这样的一个东西,这不是不干活不上班了。
怎么说呢,像我们以前做这种社交产品,是有一个简单方法的。很多人呢在2010年前后都想去做社交产品,也写了非常非常多的社交产品的商业计划书出来。但是呢,我们最后就要求他们玩叫“传纸条游戏”。什么叫传纸条游戏?你想社交产品一定是你在社会上认识他,然后呢,你们的社交关系来影响信息的传播的一种游戏。在这样的情况下,你说我到底是单向关注、双向关注,实际上都是在设计社交关系如何参与到信息传播过程中的一个方法。但是怎么能够验证说你这个方法就行,他那个方法就不行呢?当时就设计了这样的一种叫“传纸条游戏”。
怎么传法?就是3个人到5个人吧,先写一个纸条,按照你设计的规则传给下一个人。传给下一个人以后呢,这个人再决定做什么样的反馈,然后再向其他地方传。你比如说我现在设计的社交规则是,我一个人发出消息来了,关注我的人可以看到,那你就是写一个条,给下边的关注你的人。关注你的人看到了以后呢,再来决定说我到底是点个赞,还是说转发呀,还是要评论,到底哪些人能看到呢?再把这个纸条复制出来了以后,按照你的这个规则设定,再去传给应该看到的人。大家相互这么玩一段时间以后,看看这个游戏玩的下去玩不下去。如果这游戏玩不下去呢,那你设计的这个社交玩法就有问题;玩得下去,就说明这个方法还是不错的。Sora 2 证明了他们现在这套社交玩法应该还是比较受欢迎的。
为什么会有这种影响工作效率的事情发生呢?就是很多没有经历过洗礼和考验的人,第一次遇到这种成瘾性极强的内容,就会出现这样的问题。跟大家讲一个小故事,我们以前去做电子书的时候,很多的清华博士工程师嘛,他们这辈子没看过网络文学,说我们为什么会看这玩意呢?纯浪费时间,一点意思都没有。但是我们把产品做出来以后,说你得看,要不然你不测试了,怎么知道这东西行不行呢?大家要知道这个小说是很上瘾的。我有一天早上起来去上班,就看到我们一位同事开着车就朝我撞过来了。我说你要干嘛?他说对不起,昨天晚上看书实在看太晚了,就是看书一直看到天亮了,所以早上起来迷迷糊糊就来了。他们就是属于从来没看过小说的人,接触网络小说以后就会变成这样。这些人原来都是觉得,看这玩意不是浪费人生命吗?OpenAI里头应该也有很多不怎么接触TikTok的人,给了他们Sora 2 这样的一个类似TikTok的工具以后,确实会很容易影响工作。所以咱们在这稍微讲远一点,千万不要相信自己的意志力,这种成瘾性极强的东西,我们现在没有上瘾,可能仅仅是因为我们没有接触过。
好,下一件事儿。像现在这样,Sora 2 到底能不能成呢?想要裂变成功,想要玩起来,其实是需要几个条件的。第一个条件可能大家没有想到是什么,就是挫折感跟成就感要平衡。什么意思呢?就是你拍了一堆视频,我制作了一堆视频,经常是会不满意的,这个叫挫折感。然后你终于找到了一条还可以的,把它发出去以后没有人点赞,那你就没有成就感。一定是什么呢?就是你获得的成就感要能够抵消你的挫折感,这样的产品才可以继续往前走。Musically,也就是后来的TikTok,之所以能够成功,就是他们利用了很多的技巧来去降低挫折感,提升成就感,让这个人拍视频、进行传播的这个过程成为可能。我告诉你,拍视频想要让人满意是非常非常难的。你想给自己拍张照片,还经常觉得这不爽那不爽的,你要拍一条视频,拍个一分钟视频,特别是这种要求比较高的小姐姐们,那她们的挫折感会很强的。所以这个里头有很多很多的技巧。
然后要有社交属性。什么叫社交属性?你说我看到了这个人是川普,但是呢川普跟我有什么关系呢?我也不能天天说川普怎么怎么样了。一定要有社交属性,这个人是我的邻居,这个人是我的同学,这个人是我的同事,那个人是我的家人,我们之间发生的各种故事,这才有意思。还记得去年OpenAI玩的那个吉卜力风吗?吉卜力风为什么会突然火起来?真的是因为他画的像吉卜力这样的一个风格吗?不是的,而是因为那个里边放的所有的东西都是你的社交好友,包括你自己在内。如果不是你自己在里面,而且看着还很像你,那这个事它也流传不起来。所以大家不要觉得因为是吉卜力才火的,是因为像,因为有社交属性才火的。
所以一定要有社交属性。这次Sora 2 怎么做社交属性呢?他们做了一个功能呢,叫做CAMEO这样的一个玩法。什么意思呢?是可以授权数字分身,也就是我们自己的形象,参与到这个视频里边去。当然了,你也可以把你的形象授权给你的朋友,让他们去使用。当然,首先你要向他证明说这是我,要通过录像、通过声音去识别这是我的形象,我对这个形象是有权利的,你可以参与到里边去。这个就有社交属性了,你们看到老范干什么什么去了,或者老范跟谁谁谁做了什么什么样事情了。如果我授权别人了,那别人也可以用老范的形象。如果谁用了老范的形象了,即使是这个视频没有发布,是一个草稿状态,他也会通知我。这个还是很危险的,如果别人不通知我就去做视频,那我可能就会“社死”。一旦是别人拿我的形象做了视频了,我自己是可以有权利决定是不是要删除这个视频的。他是这样的一个运作模式,这样的话他的传播性就绝对拉满了。
但是这件事的风险性也是极高的。虽然OpenAI做了很严格的限制,必须本人验证才能上传形象,去使用必须得到授权,你还可以知道别人用没用,还可以删除,还不允许使用公众人物的形象,比如我今天想跟川普干点什么事,这事是不允许的。他的这一块限制很严格,但是既然玩法大家都知道了,而且发现这东西有效了,这个潘多拉魔盒就打开了。Sora 你不给我玩,还有那么多开源模型呢,后边应该会有很多群魔乱舞的内容会出来。
现在呢是采用邀请制。邀请制呢,也是社交产品成功的一个核心因素。很多人可能不太理解,说我一下放出去让大家用呗,这个社交产品上来了以后,我正愁着没人使呢,我为什么还要邀请制呢?这个邀请制的作用呢,其实有三个。
第一个是什么呢?就是进来的人得玩得起来。原来我们经常讲这样的一个故事,就是两个人在这聊天呢,这时候站了第三个人,他呢可以站旁边听一会,说你们聊什么呢,然后再逐渐的参与进来。然后三个人聊天呢,比如再进来两个人,这时候就5个人了。新进来的人呢也会先听一会,看看你们在聊什么,然后逐渐的加入到话题里边来。但如果是5个人聊天呢,突然冲进1万个人来,然后就问你们聊什么呢?你干嘛呢?前面人就走了,所有的社区氛围和调性就没了。所以邀请制都是干这个用的。像新浪微博、Twitter、Facebook早期都是邀请制的,所有的社交产品一开始都是邀请制的。如果不做邀请制的话,你这个社区就不会有任何的调性和氛围,很难维持下去。
第二个邀请制的作用是什么呢?就是随时观察互动,发现问题及时解决。你要掌控这个调性跟氛围。你比如说现在有30个人了,大家聊的还都挺好,再放了20个人进来,50个人了,有点跑题,怎么都去奔政治去了,还是说奔极端去了?那看看是不是删掉一些人,处罚几个。这个时候影响不是很大,你可以维持这个调性,然后再邀请几个进来。他是这样一波一波的,这么逐渐传递出去的,中间出现问题你可以调。
第三个作用是什么呢?就是控制成本。做视频这个事的成本是非常非常高的。到目前为止呢,还没有看到Sora 2 到底是怎么收费。因为大家知道,虽然短视频这种东西是可以挣钱的,但是你的制作成本和大量废片,因为你做这东西不可能一次成功,一定是有大量的废片的,所有这些成本是很难靠短视频广告这种东西来挣回来的,这个非常非常痛苦。所以未来到底怎么收费,不知道。所以它通过邀请制的方式,一开始呢控制一下算力的消耗也是合理的。
那你说OpenAI现在做了Sora 2 这样的内容创作社区了,是不是就能玩得起来?不一定。因为原来也有一些内容创作社区,内容创作的很好,但是也没玩起来的。这个里边最典型的是大疆跟GoPro的社区。你像我们现在拍视频就用的大疆,大疆一开始也惦记做内容社区的,现在其实也还在努力做,但是呢玩不起来,他纯纯的沦为了制作工具,他自己的社区就没起来。原因很简单,因为你使用大疆制作内容的成本和门槛还是很高的。虽然大疆尽量的降低了门槛,现在有云台了,有各种的自动化了,还可以把这个东西变得很小型了,但是你后期剪辑呢,绝对是地狱级难度。所以大疆也好,GoPro也好,最后只能做工具,做不出内容社区来。所以Sora 2 到底最后能不能成为社区,还是说最后会沦为像大疆这样的一个工具,现在还不太好说。
当前的AI视频发展到了一个什么样的状态了呢?制作视频,操作方式一直是一道门槛。我们如何去操作电脑、操作手机去做一个视频?我是从跟他对话也好还是怎么样好,这个一直都非常非常难。在抖音、快手、TikTok刚刚起步的时候,大家都在研究如何在手机上创作视频这个终极难题。AI视频模型出来以后,其实现在限制它的,除了刚才我们讲过的什么物理上的违背常识、一致性有问题、画面崩坏,除了这些问题之外,还有一个很严重的问题,就是操控起来太麻烦。
你怎么能够靠语言去把这事描述清楚?你看个电影回来,来坐着说你看到什么了?说不清楚的。而且真正的电影是由很多很多镜头组成的,怎么去剪辑?怎么去切换?如何去把握节奏?这种镜头语言非常非常难掌控。目前为止VEO 3,也就是谷歌这套东西,效果其实还是不错的,但是呢只能算半成品工具,它连IDE、连这种集成的环境都没有,你整个像剪映这样的东西也行,谷歌现在都没有,只是给了你一个很简单的窗口,这种是做不出产品来的。当然谷歌呢,准备未来一段时间把VEO 3 往这个YouTube里边放,这个还是值得期待一下吧。
再往后,像阿里做的通义万象2.2、2.5这样的产品呢,它其实就是个模型,这种东西运作起来,你还需要跟ComfyUI这种工具去配合,所以呢也不是一个完整的工具链,这块还是有一些差距。至于即梦跟可灵,即梦是字节跳动家的,后边有抖音;可灵是快手家的。他们呢控制起来其实依然是不太舒服,而且呢背后的抖音跟快手对于AI内容其实还是比较谨慎的。
大型社交媒体平台有时候反而会成为包袱。为什么呢?因为你做了大量的这种内容上来以后吧,它会冲击真人制作的内容,而所有的这些大型媒体平台必须要保住制作人。如果制作人都没有了,也就没人看了。因为这些人一边在制作内容上去,一边也在看内容,还要去在上面刷广告买东西。如果没有这些人的话,他的系统可能就会“含人量”逐渐下降,商业价值快速流失。所以他们都是比较谨慎的。
另外呢,价格其实也是一个不可回避的问题。我呢是刚刚订阅了一个月5刀的即梦,当然我订阅即梦呢,现在还没太挣回来。我用即梦去做YouTube Short,上个月呢从YouTube Short里大概收回了3刀,就是每个月订阅费是5刀,我从YouTube里头收了3刀广告费回来,快要盈亏平衡了吧。
Midjourney做的视频呢,确实很漂亮很美,但是依然是这样的问题:没法控制。你很难通过自然语言对它进行精准的控制。我们举一个例子吧,你比如说像字节跳动的模型,它里头有一个参数叫“固定镜头”。我们有时候就是想拍一个场景,镜头你不要动,我们直接描述场景发生各种变化就可以了。但是在Midjourney里头就没有这样的一个参数,你只能靠语言去描述说“固定镜头”,但是呢你没法控制它一定会遵循这个指令,这个就非常非常麻烦。像我做视频,背景一般都是Midjourney画的画,我一直希望它们能够变成一个稍微有点动作的这种动态背景,但目前为止这个问题都很难解决。而且Midjourney还有一个问题是什么?就是也是很贵。因为Midjourney呢,没有怎么拿投资,所以它一直是号称自己盈亏平衡。你看人家OpenAI什么时候想过盈亏平衡这种事?人家都是挣30亿,亏100亿这样的一个玩法,反正我们接着融就完了。所以Midjourney这条路呢,应该走的没有那么远。Midjourney刚出来的时候呢热闹了几天,然后就没有然后了,大家现在已经不再那么去传播Midjourney的视频了。
Sora呢就是世界模型AI视频,这个想法最开始是OpenAI它提出来的。发布的时候呢,给出了一些操作方法,故事板确实也让大家眼前一亮。但是呢,发布出来的产品并没有引起什么社会反响,因为这个东西最后做出来的成片,它的挫折感太强,成就感太低。Sora 2 呢给出了TikTok竞品的这样的一个产品形态。现在只有iOS版本,北美地区的用户可以下载,还需要邀请码才可以玩,这个就是现在一个情况吧。
未来到底能不能成功,还要拭目以待。Sora 2 呢也准备放出API,因为视频模型必须要靠API才能进行大型的内容创作。5秒钟一个镜头,10分钟的一个短剧,有这么多的镜头出来,你没有API的话是没法整的。你把屏幕挠烂了,把鼠标挠穿了,你都做不出来。所以最了最后还是要靠API。
世界模型是不是真的来了呢?Sora 2 看到的这些东西,从演示视频上来说,基本上没有物理错误,一致性也很强。但是演示视频就是演示视频,自己没有试过都不算数。像Sora前头这么强,前面的演示视频也是很帅的,Sora 1 出来以后,大家也是觉得翻车了,没什么意思。所以Sora 2 现在大家不要着急下结论。虽然现在X平台上我已经看到有些人再去放一些内容出来了,但是惊艳程度跟他们演示的还是有挺大差距的。
世界模型呢,对于世界来说本身是很危险的。我们到底最后是不是需要一个世界模型呢?现在还很难说。世界模型到底哪危险?现在已经有人拿图片生成模型或者视频生成模型的这个内容去骗支付系统,已经能够成功的绕过支付系统去付钱去了,这事多吓人。如果世界模型真的来了,即使是有AI标记,也很容易翻车和出事。所以世界模型这件事,我们还是要稍微谨慎一点点。
最后总结一下吧。OpenAI再次震撼发布了Sora 2,这次到底是不是GPT-3.5时刻呢?因为他们自己在视频发布会上讲的是,“这是GPT-3.5时刻”,再一次要颠覆了。这个我觉得还要再等个一两个月看一看,要让更多的人拿到邀请码,更多的人把内容做出来,才可以下定论。现在下定论还稍微早了一点点。
最后,谁有邀请码请私信给我,不要公开场合传播。
感谢大家收听,请帮忙点赞、点小铃铛、参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。
2025-10-01 08:53:03
2025最惨汽修工诞生了!被三家车企起诉,索赔700万,准备关店去送外卖了。
大家好,欢迎收听老范讲故事的YouTube频道。
又一位“龙哥”这一次败诉了。大家都知道,罗永浩经常被称为“龙哥”,这一次败诉的这位老兄呢,他的外号也叫“龙哥”,他真名叫王龙,是“满格电器修”的创始人。他呢,也是“龙哥修特斯拉”、“龙哥讲电车”账号的博主,算是个百万大V。
他被三家车企起诉,索赔共计700万元人民币,其中小鹏100万,赛里斯100万,比亚迪500万。比亚迪还是比较狠的。目前,小鹏的案子已经判了,龙哥败诉,要求他消除影响,赔10万块钱。大家注意,诉讼标的跟最终判罚是两回事,小鹏这个案子诉讼标的是100万,法院判下来是赔10万。当然,龙哥说:“我修汽车的,我哪有10万块钱?我赔不起,我要把店关了。”这就是咱们前面讲的,说他要去送外卖了。
赛里斯跟比亚迪的案子呢,还没有开庭,但是赢面不大,就按照小鹏这个判法的话,大概率还是会输。这里头,赛里斯的操作最骚,要求私下道歉。一般这种判完了以后都是要求道歉的,但是赛里斯说:“你千万不要公开道歉,私下的你也不能跟任何人说是我告了你。”赛里斯也知道这事儿呢,没有那么光彩。
那700万是怎么算出来的呢?一条诋毁视频造成多少订单的损失,车厂呢也没法证明一条视频到底是损失了多少订单。每一个订单呢,按照利润7万来算——其实很少有汽车可以达到7万块钱的利润,比亚迪好多车才十来万,甚至还不到10万,它说有7万的利润,你骗谁去呢?但这玩意就是这么算出来的,再结合一些折扣,计算了一个诉讼标的。因为你要不算折扣的话,这玩意就不是700万,可能7000万都出来了。现在龙哥一共是删除了200条视频,黑比亚迪的最多,所以比亚迪的标的是500万,剩下两家是100万。
当然,龙哥呢还不算最惨的。龙哥说自己最惨呢,也要分跟谁比,跟上海的大刘、小刘比起来呢,他还真不能算最惨。上海大刘、小刘是一个什么案子呀?他们拆解蔚来的电池,用正常电池的数据去覆盖维修电池的数据,他们是直接被定了刑事责任,是“破坏计算机信息系统罪”,这个是非常吓人的,这是要坐牢的。大刘被判了有期徒刑六个月,缓刑一年;小刘拘役六个月,缓刑六个月;没收违法所得5000元。给人折腾一次,挣了人5000块钱。大家注意,这5000块钱里头还有一个坑在里头,这个“破坏计算机信息系统罪”,违法所得达到或超过5000元的,算是情节严重,如果到不了5000块钱的话,是不需要去判有期徒刑或者拘役的,达到5000了,你就够线了。然后没收作案工具,也就是计算机、读卡器、写卡器,把这玩意没收了。
那你说龙哥也帮人拆电池,怎么就算的商业诋毁,没有算“破坏计算机信息系统罪”呢?这里头就关键是看谁告。蔚来是跟其他人不一样,怎么不一样?别人都是卖电车的,这个蔚来是租电池的。你去修改电池里边的数据,会让租赁系统崩溃掉的。你按道理说,你租了人电池了,充放电几次,回来以后照这个给钱。结果你拿回来以后把这数改了,那人家的租赁系统就收不着钱了。这个是确实比较恶劣一点,这玩意就像租车公司,咱们去租个车,回来以后修改那个里程表。因为很多租车公司租了以后,每天跑多少公里是有限制的,有些人就为了跑更远,把那里程表给人改了,这个肯定是有问题。而且呢,像电车,你把电池里边的数据改了以后,这个系统就会认为是一块新电池,我就可劲往里充电,可劲让它放电,这玩意是有可能着火的。所以给他判的,叫“破坏计算机信息-系统罪”。而龙哥干的是什么呢?他叫“只修不换”,或者叫“能修我就不换”,他里头不会改这样的敏感数据。
这位龙哥是何许人也呢?他叫王龙,中国矿业大学机械工程专业的本科,加拿大卡尔顿大学机械工程硕士。这个名字我没有太听说过,我不确定他到底是个硕士,还是一个college的项目,直接到那边上了个培训班。他反正是在加拿大卡尔顿大学学机械工程,出来以后呢,就开始在加拿大修汽车了,后来回京创业,开了“满格电器修”,专修电动车。最开始呢,其实主要修特斯拉,后来呢开始修各种电车,因为最开始只有特斯拉最多嘛,你修别的车也修不着。他的原则呢,是“能修我就不给你换”,帮客户省钱,所以呢口碑一直很好。还经常呢,录制一些电车拆解和点评的视频,也算是一位高学历海归网红汽修博主吧。
这种案例呢,如果在海外根本不会发生。这个是最近一次龙哥上节目的时候讲的:“在海外修车的人,去说两句车这不好那不好,怎么会有人告我呢?在加拿大的时候我也修过车,从来没有发生过这样的事情,只有在中国才会发生。”
那龙哥他到底说错了点什么呢?被人告,而且还败诉了。几条罪状:第一个,叫“使用煽动性语言”,视频中频繁使用“千万别买某某某”、“这车根本修不好”、“工业垃圾”等具有明显贬低性质的词汇。这种是不能随便乱说的,你看看人家律师都是怎么说话的,以后修汽车都得像律师那么说话,滴水不漏才不会被人告。而且呢,他在没有任何数据支撑的情况下,直接断言小鹏P7的电池包设计有缺陷,“随时自燃”。但是人家也卖了挺多的了,并没有随时自燃嘛,直接这么去说人家是有问题的。第二个,叫“以偏概全”,因为某车型的故障问题,就全盘否定整个品牌。曾经某一辆比亚迪车型的电池故障,就在视频中建议消费者“千万别买比亚迪”,这个事是不行的。在缺乏事实依据的情况下,言论超出合理评论的边界。不是说不让评论,但是呢,有一个合理评论的边界。什么叫合理评论?就是你要有数据支撑,有专业第三方鉴定报告,在这个时候你才可以评论。自己上来就说“我觉得不行”,或者说“我修的多,听我的”,这事都是不允许的。这位修车的龙哥呢,肯定自己是没有这样的鉴定能力,或者说原来没有做过相应的鉴定,只是修了几辆车就出来说来了,这个事反正被判定为超出合理评论范围了。
还有一个,“虚构设计缺陷,夸大维修成本”,这个呢就是赛里斯干的活。他呢,录了一条视频,叫《问界电池维修坑,换个卡扣要3万》,讲什么呢?说赛里斯这个设计就是故意坑车主的,电池包外壳卡扣用易碎塑料,轻微磕碰就断裂,4S店直接要求换整个电池总成,成本32000,其实花50块换个金属卡扣就能解决。在中国呢,因为有这种指定维修,就是赛里斯必须在这家修,你如果敢不在这家修,我就给你做各种处理。所以这些维修厂呢,因为没有竞争压力了嘛,所以他就各种的过度检查、过度更换,人家也要挣钱嘛,就搞这样的事情,搞得很恶心。所以他就吐了这么一条槽。
然后呢,又录了一条视频,《问界车主注意这个故障,别被4S店忽悠换电控系统》。他讲到说,最近修了5台问界M7,都是报电控系统故障,4S店报价28000换电控单元,其实是传感器接触不良,清理触点就能好。“赛利斯这故障设计,就是故意制造维修利润的”,他讲了这样的一个话。还有一个说“问界售后双标,自费维修不质保了”,说外边修了电池,赛里斯直接取消整车质保,哪怕是维修的非核心部件。这个就是垄断,逼车主只能在4S店挨宰。他录了这样一个视频。事情呢,是某一个车主在第三方门店换了个空调滤芯,绝对是非核心部件,后续电池出现小故障,赛里斯以“私自维修”为由拒绝质保,最终车主自费12000进行的维修。导致呢,问界M5、M7车型2024年Q4订单环比下降12%,构成商业诋毁。这就是赛里斯告他的一个主要的原因。
现在呢,他根据《民法典》第1024条和《反不正当竞争法》第11条,“经营者不得捏造、散布虚假信息或误导性信息,损害竞争对手的商业信誉、商业声誉”,大概是违反了这一条被判的败诉。其实他跟赛里斯、跟比亚迪、跟小鹏都不算竞争对手,反正就是按照这一条给他判了。
现在呢,这位龙哥在积极地上诉。小鹏的案子一审已经结束了嘛,剩下两个案子还没结束,所以他现在准备就小鹏的这个案子去上诉。目前呢,正在搜集证据,证明小鹏确实有问题。原来不是说我不能直接说嘛,我没有数据支撑,我没有专业鉴定,那现在就准备联系这些车主,咱们把这车送去鉴定去。鉴定完了以后,我准备拿着这些材料,再去对小鹏进行二审的这个诉讼。其他几家呢,应该会在一审以后吧,这位龙哥继续会收集证据,再去进行一些抗辩或者诉讼的事情,这个慢慢地来,后边还有瓜。
那龙哥未来什么打算呢?第一个,把200条视频都删了,人家肯定指出这条怎么回事,那条怎么回事,这句话说得稍微有点过分了,他把这些视频都删掉了。以后说话也要小心了。车呢,可能就只修特斯拉了,其他的车就不修了。再有什么问题,能不说就不说了。如果都要求赔钱的话,他就准备把店关了,直接去送外卖了,说这事干不下去了。
总结一下吧,这呢就是中国新能源车的一个乱象吧。出了事故上来盖布,把这车整个盖上,然后抠标、删稿,甚至是起诉。有一些人说我这车坏了,马上投诉,下架你的视频,然后起诉你诋毁。因为你没法像律师那样说话,滴水不漏、四平八稳。中国的这些电动车厂商,他一直是这样去干活的,而且还经常互黑,就是这个电动车厂商去黑另外的一个电动车厂商,而且还不敢说是谁。小鹏也好,理想也好,都出来说有人黑我,而且我知道是谁干的。人家问他谁,“这我不能说”。现在变成这样的一个奇葩状态。我就记得,原来西安的特斯拉降价维权组织的这个组织者,是比亚迪西安门店的一个店长,大家自己去想都是什么样的情况。
垄断维修这件事呢,只有在中国可以,在海外是会被告的。澳大利亚竞争与消费者委员会对包括比亚迪、极氪、小鹏、smart和零跑在内的五家中资新能源品牌展开调查,指控他们涉嫌垄断售后维修业务,可能面临1000万澳元的处罚。因为你一旦指定了以后,这些维修厂就会尽可能地去提高维修价格,因为你一旦离开他们就不给保修了嘛,这个在国外是绝对不允许的,你干这活就会被告,而且会被罚死。这个只有在中国是支持他们的。
车企呢,通过法务部取得的胜利,并不能带来口碑和销量的提升。特斯拉维权女车主前两天还有一个第一次胜利,还记得前几年有一个车展上,特斯拉女车主坐在人车顶上维权的事吗?前面几次都是判的特斯拉胜诉了。这一次为什么说女车主胜诉了呢?也没有说特斯拉就有问题,或者说刹车失灵要赔她钱,没有这个,只是判特斯拉必须要提供相应的数据。因为原来这些车都是车厂自己拿着数据,我说什么就是什么,是不拿出来的。现在呢,就是判特斯拉你必须把这数据拿出来,这个也算是一次胜利吧。但是只要是跟车主进行这样的诉讼,对于品牌都是有伤害的,甭管最后谁输谁赢。
最后呢,提醒大家,对于那些法务部过于强大的车厂,稍微地小心一点,买车的时候稍微小心一点。否则的话,你买个车出任何的故障和事故,连说都不能说。因为我们没法保证自己说话的时候都像律师一样四平八稳、滴水不漏,很有可能败诉,还要赔人家商誉损失的费用,这个是非常得不偿失的。
好,这个就是今天讲的故事,感谢大家收听。请帮忙点赞、点小铃铛、参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道,再见。
2025-10-01 08:45:14
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,阿里到底是不是中国的AI之光所在呢?
这几天正在开阿里的云溪大会,9月24号到9月26号开。这一次的口号呢,叫“云智一体,碳硅共生”,提的口号很神奇。当然,最神奇的还不在这,咱们待会往后看神奇在什么地方。4万平米的展厅,500多家企业参与,6万多人到现场,这个是一个非常大规模的会。
那么还宣布了什么呢?与英伟达合作做物理AI。现在呢,谁也不敢宣布说与英伟达合作,买人家的这个RTX6000,现在只能说我们做一个别的合作吧。什么是物理AI呢?就是做机器人相关的AI,做机器人的仿真训练、量化强化学习和仿真测试,做这玩意的。英伟达在这块也确实是很强。阿里呢,也会去投资很多的这种机器人公司,所以这个宣布了以后也是一个重大利好。
而且呢,阿里现在绝对是全世界开源AI领域的扛把子。原来最早的扛把子是Meta,出了Llama,出了这么多模型以后,现在阿里接过了这一面大旗。阿里开源的模型,在Hugging Face上基本上是站到最前面的一批了。以阿里开源模型为基础再微调出来的其他的各种模型有几万个,现在基本上属于事实标准的一个状态。所以只要说开源的大模型,大概率是拿阿里通义千问的这个模型去调出来的。那这点呢,其实也很符合阿里的调性,就阿里的这些模型都属于他没有那种很强的这种个性,或者很强的这种能力,但是指令依存度、逻辑推理能力这块都是达标的,这个还是一个很好的底座。
这一次呢,提了一个新词儿叫ASI。从这个词儿呢,我们就可以看出来中美两国AI发展的完全不同路径。原来美国都在玩AGI,就叫通用人工智能,这个东西发展一段时间以后就可以达到跟人差不多的能力了,人能干的事它都能干。那阿里玩的ASI是什么呢?叫超越人工智能。就不用通用了,我们要超过人类。而且呢,是要可以自己去找知识学习,自己迭代自己升级,要快速超越人类。
那你说这里头跟中美两国的AI战略到底有什么不一样的地方呢?很多人一讲到中国AI战略呢,都会想到一个问题,说中国的有知识管控或者内容管控。但是我跟大家讲,这事呢正好跟大家想的是反的。不是说中国什么都不管,而且管的比美国严,但是呢,在做各种实验上,在做各种测试上,在做科技的发展上,中国人是百无禁忌的。什么对不对齐,是不是AI作恶,对社会、对环境、对人类有什么危害,我们先赢了再说,其他的不管了。这个是咱们中国玩的最奇葩的地方。而美国人呢,你可以认为他们是一帮左派,都在这想我的社会责任是什么样的,我要对人类怎么样,我要去开发宪法AI。所以呢,他们是一帮捆住手脚的人。而中国呢,其实我们是一帮现实主义者,只要能赢就行,其他的都不介意,等我赢了以后,我们再说后边治理的事情。所以美国人玩AGI,你别超过人类,你也不要给人类造成什么伤害。中国人就玩ASI,人在哪呢?没看着。我们冲!
这个是中美两国最大的差别。以中国现在这套ASI的玩法呢,我觉得可能会更有市场。做AI这个事情,都是要在大厂大公司里边控制去做的。而大厂大公司的这些人呢,包括国家的这些领导人,或者说这些既得利益者,所有的社会规则对于他们来说都是无效的。他为什么要去考虑社会规则?为什么要去考虑是不是有人受到伤害?他才不管这玩意呢。所以对于他们来说,拿到中国这种百无禁忌的模型再去处理,才是他们真正需要干的事情。至于说管理、过滤,那么我要用一个完全没人管的模型去管这些有人管的模型,这个是很多权力很大的政府他们所思考的问题。就像咱们禁摩一样,警察都骑着摩托车呢。为啥?摩托车方便。但是呢,我不允许普通人骑摩托车。所以呢,我们把警察的摩托车做的很大,开的飞快,但是普通人你们压根不许骑。就通过这一个词上面的一个字母,大家就知道两国的路径有多么大的区别。
前两天不还传嘛,说美国一个飞行员拒绝向以色列运军火,直接给抓起来了。那你说军队真正要的什么?军队要的就是执行命令。我不需要你有善良,我不需要你有人性,我就需要你执行命令。AI也是这样,政府都是希望AI甭管我说什么,你都去干去,不要自己去判断这事对不对。所以在这儿,中国也许会胜出。
讲远了。阿里云溪大会开的时候,股市是买单的。别人认不认咱不管,看看股市的情况:港股涨了9%,美股涨了7%。因为它是在港股跟美股同时上市的公司。而且木头姐直接出来喊大家上车了。木头姐是方舟基金的管理人,但是注意,方舟基金这样的机构呢,是不能上来说你们都买,然后再再去搞其他的。他一定是真金白银自己先买了,也不能说我买了以后喊大家来上车,这事是违法的。他是什么情况呢?他首先他买了,买了多少呢?两只基金一共买了1630万美金的股票,算是方舟基金的一个比较中等规模的操作。而且美国是有规定,这种基金重大操作必须要公开。所以呢,木头姐就趁此公示了,还要跟大家讲一讲说我为什么买,我为什么觉得这事行,他也得去募资嘛。所以这个过程,按照美国的这个法律规定,它是一个正常的披露。
木头姐呢是2021年把阿里整个清仓掉了,现在重新上车。跟大家解释说,我觉得是重新上车的时候了。它到底有什么样的不同的价值模型呢?它首先讲的是PE,PE呢就是你的市值跟你的利润之间的比数。阿里现在是多少?20倍。那20倍这是高还是低呢?你光告诉你一个数,这事是没法比较的。在电商里头算高的,电商里不能看亚马逊,待会咱们再讲为什么。京东的这个PE大概是10倍上下,经常就是个位数,所以京东的PE是非常低的。京东的什么人效比也是极差的,好几十万人你咋人效比。拼多多的这个PE是13倍。所以在这里看呢,阿里20倍其实是挺高的了。
在云计算里头,阿里算低的。谷歌也就是Alphabet,26倍;亚马逊,32倍。你看亚马逊其实跟阿里很像,一边是有电商业务,另外一边的话是有巨大的云计算业务。微软呢,37倍;Oracle呢,是67倍。现在TikTok的案子落地了以后,那还得涨。所以呢,阿里的整个的PE在电商里边算是偏高的,在云计算跟AI里边,它的估值是偏低的。所以木头姐说,我觉得这个位置很好,我要冲上来去搞一下。
AI资本支出,这个是大家都在玩的事情。华人勋跟OpenAI山姆·奥特曼在这玩的很开心。阿里也在讲,我3800亿人民币,500多亿美金的样子吧,要追加资本支出,AI基础设施建设,这个是符合主旋律的。还有什么呢?就是阿里真正比其他人都强的地方是哪儿?就是它的AI的产品线特别全,它真的叫全栈AI云平台,就跟咱们讲全栈工程师似的。大模型自己有,而且很强。投资了大量的AI初创企业,AI agent,AI编程什么全都有。更强的是在哪儿?它还有自己的用户场景,它有电商,还有自己的巨大的用户群和日常的交易数据在这儿。OpenAI其实它是没有用户场景和初用户的,这些玩意都是它后攒的。
木头姐曾经讲过,说他为什么看好X.ai,原因很简单,X.ai有X上面的特有的数据,而且X.ai还有可能会获得特斯拉的数据和脑机接口的数据,以及SpaceX的数据。所以呢,它有独特的数据,这就是它的逻辑。我们经常会去分析一个人的投资逻辑到底是什么样的。我觉得到目前为止呢,木头姐讲的这些阿里相关的这种投资逻辑,还是在我的逻辑认知范围之内的吧,就基本上是认可的。当然了,跟英伟达合作这个事,就是你怎么都要上去蹭一下嘛。
刚才咱们讲的这些呢,都属于金融行业的人他们去算的估值模型的账。深层次的,咱们要去讲一些像我们这种早期投资人去看的东西,就是他的业务逻辑是对不对的。比较一下阿里的竞争对手吧,没上市的公司呢,OpenAI、Anthropic、X.ai、字节跳动,这些呢咱就不去跟这种上市公司比较了,咱们就去比这些上市公司。
微软我们比较一下。它呢,投资了OpenAI,云计算算力投入这一块呢,它第一,花的钱最多。微软实际自己也有模型,但是实在是不好使,所以微软全面在使用OpenAI的模型。微软的用户场景丰富,用户量巨大,它有Windows,有Office,有IE,有Bing,虽然差一点但还算是有吧。阿里呢,投资了一大堆的这个AI企业,只要是国内的AI的大模型公司,基本上他全投了。投完了以后,通通都上他那去使用他的算力去。这个是不是跟微软就很像?云计算方面,在国内的阿里云算是最大的,所以跟微软能够对标上,没毛病。但是有一点它要比微软强,就是微软的模型像屎一样,阿里的模型真的是还可以用,不算最好用的,但真的是可以用。特别是千问32B、35B的这几个模型,还是非常非常好用的。用户场景也很丰富,虽然它没有Windows,没有Office,但是它有淘宝和天猫,有这个新浪微博、优酷这种内容项的,再加上出海的东西,所以它用户场景很丰富,用户量也非常非常的巨大。所以在这点上呢,它基本上完全可以对标微软,只是因为从中国起家的,所以规模上要比微软稍微小那么一点点。
下一个跟谁比?跟谷歌比。谷歌呢,是自己的模型很强大,Gemini非常非常强,据说10月份我们能看到Gemini 3了,说这个模型强的一塌糊涂,完全强到没朋友了,很期待。然后投资了Anthropic,谷歌也投了好多这样的AI公司。在云计算方面算力投入巨大,谷歌是一直在那投,但是现在它已经不行了。零几年的时候,谷歌的服务器是占全球服务器的6%还是7%,现在应该轮不上了。谷歌呢,自己的用户场景也很丰富,它有谷歌的搜索,有谷歌的Workspace,就类似于Office这样的东西,还有Gmail,再加上安卓手机,包括我们现在在YouTube上聊天。在这一点上呢,我觉得阿里跟它也是有得一比。谷歌呢,有一点没有阿里强是什么?谷歌的模型大部分是闭源的,它开源的模型其实是没什么影响力的。它的开源模型叫Gemma,Gemma在这块呢,比千问的这个模型差的非常非常远。而且呢,Gemma模型是只有小模型,没有大模型,就是为了让你在PC上,让你在手机上用的。而像千问的模型,是从大到小,从235B一直到0.6B,各个层级都有,你有多大硬件,咱就给你跑多大模型,都可以跑起来。所以谷歌就从技术的完整度上吧,还是稍微有一点点小欠缺。
再往后一个是亚马逊。亚马逊呢,真的跟阿里很像。他呢,也是投资了Anthropic,自己的模型那真的是乏善可陈。云计算绝对的王者,全球的王者就是亚马逊了。AI算力投入呢,也有,但并不是那么突出。电商的用户场景和用户量都非常非常好,这块跟阿里很像。
Oracle呢,数据库是老炮了,自己没有模型,现在呢跟OpenAI眉来眼去的,算力投入巨大。但是我觉得Oracle未来的故事,真正能看的应该是TikTok。
阿里到底是什么情况?你不要老想着说阿里买不到英伟达最新的芯片吧,他可以不在中国买,他在中东,在什么迪拜那地方都建的有算力中心,你在那买不就完事了吗?所以他是不缺这些东西的。所以呢,阿里的情况跟上面的谁最像?跟亚马逊最像,但是比亚马逊还要强一点,因为还有自己的大模型,这个而且模型很强。
这一次云溪大会都发布点什么?首先,发大模型,一堆的大模型,就像下饺子一样扔出来。第一个叫千问三Max,这个是一个不开源的模型。除了这个之外,剩下的模型都是开源的。为什么它不开源?1万亿参数,你开了源谁也布不了这东西。比如说235B,2350亿的参数的模型,还是可以去布一布的。Deepseek是671B,6710亿的这种参数的模型还是可以用。上万亿的模型一般就没法去开源了。这个模型呢,我这两天也试了一下,依存度很高,你给它各种指令,它会老老实实给你做完,生成的质量呢,就属于真的是能用的状态。它对于AI agent,对于各种的工具调用这块非常非常强,因为它的指令依存度高嘛,它就可以规划一个很好的路径,把所有的指令都调用回来,这个是做的很好的一个模型。
下一个开源的是什么呢?叫千问三OMNI,全模态预模型。支持视频,支持音频,输出也是直接可以文字输出,可以语音输出。有点像GPT-4o,或者说那种叫real time的这种模型。我直接可以拿这个手机打电话,然后拿着手机一边拍视频,一边跟人聊天,一边跟大模型聊天,这个东西就干这个事了。而且呢,超多语种的支持,支持十几二十种语言,都是可以这边实时的跟他聊,那边实时的出。所以拿这个东西出去找人去聊天,当翻译都是没有任何问题。而且可以拍着视频说,你看我这个视频里这个风景应该怎么描述一下,它都会马上给你去进行推理。而且端到端推理,不是说我先把视频识别出来,然后再去走这个大语言模型,直接端到端就开干了。这个模型呢也不大,30B MOE的模型,300亿参数。这种模型呢在电脑上都是可以跑的,还专门为苹果做了优化,就是在Mac上可以跑,但是30B模型在手机上是跑不起来的,这个是稍微有点费劲的。其实我们甭管用豆包也好,还是用ChatGPT也好,实时对话模型都是用云端的东西,没有在本地计算。千问三的这个OMNI就是干这样的一个事情的,还是很有惊喜的一个产品。
再往后呢,是千问三Image Edit 2509。其实原来就有这个模型,但是呢,它又重新升级了一遍。因为原来它的千问三Image Edit呢,只能上一张图片,你给它一张图片,要求它做各种修改是OK的。现在的话,Nano Banana出来了以后说,原来还可以这么玩。我可以上三四张图片,把它拼在一起。实际上就是拿三四张图片去进行视频推理,或者叫视觉推理,再把它们挨个抠出来了以后往一块拼。所以这就是阿里家的Nano Banana。这两天我在玩即梦4.0,豆包家的Nano Banana,那个也是玩的很开心。大家现在看到我的各种的封面,基本上都是拿这玩意做出来的。你看我那个这一期视频的封面,文字是用毛线绣上去的。这个是国内模型能干的活,就是写中文,而且用各种各样的创意字体写中文,用各种的素材去写中文。Nano banana干不了这事,Midjourney更干不了这事。中国的一个是即梦,一个是刚才我们讲的千问三Image Editor,都是可以去写中文的,效果好极了。
再往后一个呢,是千问三TTS Flash,就是专门做文字转语音的,还出了一个轻量级的模型。但是这种轻呢,也没有办法在手机上跑,都是在电脑上跑的。以及呢,出了叫千问三VL。VL是什么?叫视觉推理模型。但是这个呢,就跟前面咱们讲的这个OMNI不一样了,它是做了很重型的这种视觉推理。你像上面那就是个30B的模型嘛,它这种东西做推理的话,肯定的能力还是要差一点的。所以还是要上这个千问三VL。还有一个呢,叫千问三Next,80B MOE模型,每次激活3B。它是干啥使的呢?就是比千问三更便宜,在同等推理的能力下,用更低的成本可以完成任务。最后一个呢,叫WAN 2.5,叫通义万象2.5,这个呢是做视频生成的。原生音画同质,就是他直接做出来就可以配好口型,配好音乐,更高的画质,更长的时长,1080P、24帧、10秒钟。为什么说这玩意强呢?因为我们看到的其他视觉模型,比如说谷歌的VEO 3,OpenAI的Sora,即梦这些视频模型的话,都是闭源的。通义万象WAN 2.5它是个开源的,大家可以把它下载到本地,然后在自己的显卡上去干活。那你说我把它放在自己显卡上干活有什么好处呢?百无禁忌就是好处。中国人做的东西都是百无禁忌的,其他的这些视觉模型都是很政治正确的,而且耻感都很高。你现在有一个这么强的,基本上可以达到谷歌VEO 3这样的一个水平的视频生成模型,还是开源的,还可以下载到本地去部署去执行,想想都觉得实在是太美了。而且呢,这个模型呢是这多模态,全创造全覆盖,文生视频、图生视频、文生图、图像编辑全都有。
这是这一次发布的各种的新模型。你说云计算嘛,超节点总要有嘛。华为也在做超节点,英伟达在做,阿里肯定也少不了。阿里的超节点叫“盘久”,盘古的盘,永久的久。盘久128超节点,就是每次呢,把128个算力卡放在一起去做这种超节点运算。这个里头并没有去讲说我这个超节点到底用的是谁的,其实大概率用的是英伟达的芯片,也可以用他自己的平头哥的芯片,或者用一些其他人的芯片。所有的超节点真正考验的其实不是那个芯片,考验的是什么?就是他的连接协议和交换机。就是你不能走以太网,你必须要单独走一个光通道的网络。所以他呢,做了一个叫UA Link,就类似于英伟达的这个NVLink这种东西,自己有自己的这个模块,自己有自己的协议,自己有自己的交换机,可以把128个算力芯片串在一起去干活去。
阿里真正强的在哪?就是它全栈,什么都有。因为做云计算的嘛,他肯定有海量数据库,然后AI agent、工作流、MCP这块也是强大一塌糊涂。前面我们讲过Dify这样的东西做工作流的,现在你们可以直接把Dify的DSL文件,就是你看在Dify上做好的工作流,导出一个DSL文件来,导完了以后直接到阿里云上去导入,他就可以照着DSL的这个工作流节点就给你跑去了。原因很简单,Dify也是拿了阿里的钱了,那他作为一个股东可以提出这样的要求来。所以这块呢,真的是非常非常强。
MCP这一块现在非常非常全面了。我今儿还专门上去看了一下,现在有哪些MCP可以在上头跑了。刚才我们讲的什么画画的,什么做视频都可以包MCP,当然这不重要,重要的什么?支付宝。你现在可以在上面做支付宝的支付,支付宝的订阅,都可以直接挂MCP到你的自己的应用里头去。这样的话,我们再做的新的产品就直接里头可以支付了。各种跟电商相关的,跟这个业务相关的,因为它场景丰富嘛,自己家的东西都可以开出来,这一块全都已经包装成MCP了,可以在阿里云里头用,也可以在阿里云里头把这个MCP的接口暴露出来,在外边来用。比如说它里头有一个MCP是什么?查快递。你只要去申请一个快递100的TOKEN往里一挂,就可以直接上阿里云的MCP服务器上去把它的接口导出来,导到自己的AI agent也好,或者是工作流也好,就可以帮着用户去查快递了。你的快递走到哪了,什么时候该拿了。能够查快递,对于销售的转化是非常非常有帮助的,因为你一旦知道说我这个快递是可以查到的,这个东西走到哪我都知道,大家就觉得一个事情从不确定变成确定了,他就可以花钱去更多的下单买东西。这一块是很多很多的,现在能想到的,在国内能用得上的这些东西,都已经包装成MCP了,都可以在阿里云里边直接集成去使用。
编程这一块,他自己专门做了一个模型叫千问三Code,480B,一个开源的模型。这一次呢,阿里还发布了一个叫千问三Code Plus,一个闭源模型。就这个模型实在太大了,你们也别费劲了,搁我服务器上你们跑吧。我自己没有去测试,所以就不跟大家吹说东西好不好使了。
阿里真正做的全栈,从头到脚全做了。而且呢,英伟达的把戏在中国只有阿里能玩。什么意思?阿里做芯片吗?要准备卖芯片?不是这样。中国人谁也做不出英伟达这样一统天下的芯片来。所以呢,他干嘛?他去做云去。说我这有云,我拿云去投资,别人投资完了以后,我再把这个钱再挣回来。就是一个钱从左口袋揣右口袋,然后再揣回左口袋,GDP算三倍,这就是英伟达的把戏嘛。这个现在阿里云也可以干。
做云计算跟云计算因为AI获得很多收益,其实两回事。就阿里云的这几年的收益,特别是AI相关的收益,都是三位数增长,绝不是几百分之几十,就翻着跟头往上涨。所以在这一块上呢,还是有挺大差别的。微软云上跑的是谁的?跑的是OpenAI。亚马逊云上跑的是Anthropic。Oracle云现在是Cohere,以后应该会跑OpenAI。谷歌云上是Gemini和Anthropic。那么阿里云上跑的是谁?第一个,阿里全栈的大模型都可以在上头跑。Kimi也就是Moonshot,这个模型在上头跑。MiniMax他投资了,在上头跑,没毛病。百川、智谱、零一都可以在上头跑,都没毛病。Deepseek云本来是开源的,虽然阿里没有投资Deepseek,但是肯定阿里云上也是有Deepseek的模型的。全国大概有一多半的模型都是在阿里云上跑的,阿里每一次出来吹牛就吹这个。另外一圈比较大的是火山云,是这个字节跳动的。他讲的是什么?就是公有云对外销售的TOKEN,有一半是由火山云消耗掉的。那你说不对,怎么阿里云上那么多模型,火山云消耗的TOKEN这么多呢?这个里头就有一个问题是什么?就是火山云上大量的人是直接在上面挂这个模型去干活的。而阿里云的话,很多是由单位直接上去,连服务器带所有东西一起买下来的,它是没有办法单算你卖了多少TOKEN的。所以呢,算TOKEN,字节跳动的火山云占一半。你如果算大模型,阿里云占一多半。
黄仁勋的玩法又来了。怎么讲呢?阿里出钱投资,拿了阿里的钱呢,你就来阿里买算力。运营的不好怎么办?阿里就把核心团队收了。这点他比黄仁勋还狠。黄仁勋投了一堆项目以后运营不好,他也没办法,他也不能说:“你们上英伟达来上班吧。”阿里是这么干的,因为零一前一段时间就玩不转嘛,那零一的核心团队就直接上阿里上班去了。这就是投资协议上写的一个条款,你如果玩不转,你就把你的核心团队交出来。因为咱们都知道,做大模型需要什么东西?算力、数据和人,或者叫人才吧。那么阿里说了,我投资了,你买了我的算力,数据你自己找去我不管了,玩不好你把人才交出来,怎么着都不亏。如果这个项目运营的特别好,估值上升,那阿里肯定也是赚了。所以这是阿里真正的如意算盘。
那么,阿里是不是重新站起来了呢?阿里前头最惨的时候,市值被拼多多超越,马云必须要出来露面了,去说几句话才能稳住军心。而且阿里这几年呢,特别是吴妈上来了以后,真的是改变了很多策略。原来呢叫“1+6+n”,就是彻底要分散,自己玩自己的。现在说不分了,不需要的直接干掉,剩下的人咱们集中力量干大事。零售方面,现在在跟美团、京东拼外卖,而且在拼即时零售。AI方面,在和字节、Deepseek战斗。但是呢,在这一点上,阿里的优势是非常非常强的。字节跳动是不开源的,字节跳动有一些开源模型,但是呢大的模型都是闭源的。所以在这一点上,阿里要比字节强很多,它会形成事实标准,这个字节就没有办法。虽然豆包1.6模型真的是很强很强,现在我比较下来,千问三Max是没有字节的豆包1.6好使了,但是即使如此,你没有开源这面大旗。所以在这点上字节打不过阿里。而且因为竞争,字节的火山云上敢去部署这个Deepseek,但是呢,他就不愿意在上面部署千问模型,这个也是字节眼界稍微差一点的地方,或者说目光不够开阔的地方。字节呢,前面把整个战略投资部都裁了以后,其实也没有什么特别大的动作。这方面,美团、拼多多、京东就更不行了。所以阿里在国内的竞争优势真的是独一无二,就没什么人跟他竞争。
总结一下吧。阿里呢,肯定是未来可期,只要是他们抱着现在这个状态接着往前走,收紧拳头,大家自己配合往前走。其实阿里还有很多很神奇的东西在做,只是现在并没有开放出全量给大家来用。来等他们稍微开放一点点,咱们再去一个一个的来去解读。而且阿里在这块有可能真的会走出一条不同的路来。什么意思?就是到目前为止,这些传统的有场景、有用户的公司,比如谷歌、微软、亚马逊、字节跳动,都没有开发出新场景,都是在原来的场景上进行AI的改造。而在这点上呢,阿里呢有大量的AI agent准备去上线,他们是准备去创造新的商业模式了,准备去创造新的应用场景的。这个才是真正值得期待的。一旦他们在新的应用模式和场景上有了创新,而且站住脚跟了以后,应该又可以席卷全球一次。我觉得应该是值得期待的。
但是呢,在国内一切皆有可能,一切也皆有不可能。所以呢,我们继续吃瓜,继续往前看。我自己呢,现在有一部分的应用是跑在阿里云上,跑在阿里的大模型上,但是呢,大部分的AI人工智能的应用其实是在OpenAI、Gemini和豆包上。我准备未来一段时间更多的使用阿里云吧,希望能够发现他们一些有趣的点,特别是他的通义万象2.5,看看到底能给我做出一点什么东西来。但是跑这种东西呢,可能需要更新电脑,我现在的电脑跑通义万象2.5是跑不起来的。或者看看谁家是托管的通义万象2.5,是相对来说比较自由的,我准备去好好的玩耍一下。
最后注意,咱们不做任何具体的投资意见和建议。你说我上车了,亏了,那是你的事。你说我没上车,亏了,也是你的事。你赚了,也都是你自己的事。不要怪老范。好,这就是咱们今天的第一个故事。