2024-12-11 15:19:52
早上到DTLA,在办公室开完最后一个interview debrief的会,清除laptop上的所有信息还给IT,就算正式「毕业」了。下午回家,在小区遛娃,一家人一起吃完我爸做的晚饭,吃完饭看着老婆和我妈一起一勺一勺给女儿喂辅食。今天是她第一次吃胡萝卜泥,小baby还觉得挺新鲜。来不及等娃吃完辅食,我就要出发去机场了,晚上8:17的飞机从Burbank飞SF。到了SF的酒店睡一觉,明早将是新公司onboard的第一天。
回想过去四年五个月的时间,随着工作从SF搬到北京,再搬到上海,后来搬回美国在洛杉矶住了一年半的时间。用大老板在祝贺我满四年邮件的话说就是:你这四年绕地球晃了一圈了。四年半的工作时间不管从什么角度来衡量,在职业生涯的时段里都不算一个短的时间,所以想要回顾一下这段在CloudKitchens的经历,记一下踩过的坑和学到的经验,希望下一个四年能够做的更好。
第一个比较大的体验是2020-2023在国内工作将近3年的时间。生活的部分之前在博客文章已经写过一些,大体感觉还是类似,总的来说一个人更喜欢public的生活(去商场,去public的活动,去餐厅咖啡厅,日常生活喜欢邻居家里亲戚参与的多一些)国内会更适合一些,一个人更喜欢private的生活(在家里装修房子,整理后院,做自己的事情,跟朋友约DIY的旅行,大部分时间只想跟immediate relatives的家人待着)美国会更适合一些。加上2022在上海住的一年,可以说是对国内的生活能体验的都体验到了极致了,最后决定搬回美国,在美国生小孩,也算是用脚投了票什么样的生活更适合我们的家庭。
之前的文章主要描述了生活的体验,不过在国内做工程师和在美国做工程师也是蛮有意思的对比。2020年刚回国的时候,公司刚刚开始在中国组建工程师团队,想要做出符合国内客户需求版本的软件。团队很快发现跟非技术团队的合作氛围跟在美国的时候很不一样。我觉得一个本质的区别是非技术团队对产品和技术的认知和定位。在湾区的科技公司里面,不管是真实的原因还是PR的原因,往往公司上下会认为技术和产品是公司竞争的最大优势。所以即使大家在开会争论观点的时候有各自的priority和perspective,大家还是普遍认可long term做出能跟竞争对手有差异化和优势的技术和产品,才是公司能够“做大”的关键。
但是在国内,即使已经是个美国公司,跟国内非技术团队合作,发现大家的普遍认知是:「这个东西我们(非技术团队)提的需求外包能做出来,如果公司的技术团队不愿意做就算了」,「为什么产品要考虑不能马上立刻变现的需求,这不是耽误我们的时间吗」,「竞争对手有一样的,你们去抄他们都不会抄吗」,「产品技术创新?我(非技术团队)没想到的idea都不会成立的」。
先讲一下这样氛围下的后果。一方面非技术团队做事情的速度确实特别快,不管是在产品早期摸索PMF的阶段,还是中期开始增长实验不同feature的阶段,想法都能够比较快地迭代和落地。另一方面,从engineering的角度会觉得几乎做的所有事情都是一个又一个的hack,创新的快乐几乎没有,个人成长也基本都在如何跟不同团队的人打交道方面。
再想探寻一下造成中美氛围相当不同的原因。我觉得本质原因还是国内的创业公司,真的是因为科技创新而成功的,真的不多。不能说没有,但是真的不多,或者说是远没有湾区科技公司的案例多。想一想那些最大的科技公司,几乎所有的产品是借鉴的创意或模式,再加上做到极致的运营来赢下市场。导致的结果就是社会普遍对技术团队的认知是高度可替代的工种,才有了前面「你们不做外包做」的statement,或者「35岁码农=失业」的社会观感。
写到这里并不想吐槽谁对谁错,只是我对一个大环境不同造成的现象的观察。如果有工程师小伙伴考虑回国务工,可以参考一下,说到底还是每一个人考虑自己在哪里做的更开心,哪里有更好的成长最重要。
讲回到我们公司,又是在美国的科技创业公司里面一个比较特殊的例子。我14-19年在Uber,20-24年在CloudKitchens,细心的观众会发现这两家创业公司的创始人都是同一个企业家Travis Kalanick.
在Uber公司最鼎盛增长速度最快的时期,不夸张地说公司绝对招来了硅谷最优秀和最有事业心的一批产品和技术人才。但是即使这样,公司也常常在媒体上被大家议论:这到底是一家科技公司还是一家运输公司。原因很简单,Uber的增长和成功太依赖于线下的运营,甚至很多时候还有法务财务PR的参与。相比于大家耳熟能详的硅谷科技公司Nvidia, Apple, Google, Facebook,大众对Uber有这样的争论也容易理解了。
到了CloudKitchens,线下运营的比例更进一步放大,加上餐饮又是一个更加传统的行业,一个餐厅要成功需要考虑到地理位置,人力管理,食材供应链管理,门店运营,线上运营,品牌营销,还有厨师的手艺。产品和技术在这里如何能够帮到我们的客户提高一点点他们成功的概率,还要让他们愿意为这些看不到的百分比付费,真的是伴随着我在国内待的三年间的一道ever unsolved problem。很多时候的答案可能真的还不是产品也不是技术,所以又回到前面提到的技术团队和非技术团队合作的循环里去。
可能TK真的比较喜欢做一些传统的科技创业者不愿意触及的领域。好处当然是做出来了会是一片全新的市场。坏处则是从技术团队出发很多事情的解法技术很可能不是那个决定性的因素。从码农的角度出发,点点people skills方面的技能树还可以,甚至有可能成长为一个业务的主管。但是说要在engineering/product方面有更多的建树,确实比较受限。
有一次我跟一个Uber前同事L聊天,L也是工程师,但是比我资深很多,来Uber之前已经在国内外不同的科技创业公司都待过。后来Uber China卖给滴滴之后,L很快跳槽去了一家当时在国内还不太知名的短视频平台K,后来做了几年K在香港上市,股票翻了又翻,故事也都成了历史。我问L说:当时你怎么想去K的,L跟我说他在Facebook和Uber都待过,发现在Uber做事情很多时候要好多不同的stakeholders(ds, ops, legal, finance, pr, etc.) sign off,因为每个人都可以say no,导致的结果就是一个东西的成功,需要依赖这么多stakeholders的「lower bound」。就像木桶原理一样,技术产品做的再好,也会因为某个短板限制住。所以L在跳槽的时候一定只考虑「技术产品能够决定公司做大」的机会。当时听完L的话,确实有种wake up call的感觉。虽然之前也有类似的感慨,但是听到别人这么坚定地指出来,还是让我好好想了一下自己当时选择工作机会的时候,回头看都考虑了哪些因素。我当时心底里就想:如果下一次再跳槽,尽量还是要去一家把技术产品做为竞争优势的公司工作好了。
讲完技术和非技术的合作,再想聊聊关于中美工程师卷和躺平的比较。在国内住了几年,跟身边的朋友聊,也通过日常接触到的公众号的信息来看,我直接说我观察到的结论:我觉得国内工程师卷的文化的输出其实并不一定会比美国的工程师输出高,造成这么卷的更重要的原因是国内的manager或者leadership普遍比美国的manager/leadership更需要心理按摩(emotional support)。举几个我观察到的例子,一是国内许多科技公司的加班文化,很多时候我了解到的是大家加班的原因无非就是经理还没下班,即使活已经干完了,为了「support manager’s emotional」还要假装在加班。二是关于做项目的时候的讨论,在美国许多时候如果有不同意见大家团队还是会尽量充分讨论好利弊再去执行,而在国内的氛围更多的是为了「照顾manager的情绪」,即使大家知道这个决定不太合理大家还是尽量配合去执行,最后发现确实不太好再返工重做,那需要多花费的时间就只能靠「更卷」来实现了。还有比如下班了被领导抓着讨论事情,修改文档报表提案,等等等等,在美国员工会做一个判断如果不是很急的事情到第二天工作时间再处理就好,晚上大家来回迭代的效率本来也不高,但是在国内为了给领导的心理按摩,还是要尽量做到有消息要立刻马上回复。这样一通操作下来,相比于美国的IC,国内的IC的心态上普遍压力会更大,要干活,还要照顾老板情绪,绕的弯路要花更多的时间去干活来补救。
我想了想为什么中美会有这样的不同。需要心理按摩时人之常情,我觉得也可以理解,反而要从另外一个角度来找答案,尝试理解为什么美国的经理普遍不太需要心理按摩。我猜可能是在美国的科技公司,大家氛围普遍对个体更加尊重也更加信任,只要员工能「出活」,不用太在意还要给我(作为老板)提供情绪支持。生活中还有很多别的方面(家庭,个人兴趣爱好)来帮助我(作为老板)获得情绪价值和认可。毕竟我也没做过manager,只是我自己的一些观察,要是有manager经验的同学欢迎在评论区留言或者私信。
其实本来还想写一段这四年半的工作体验对我的career growth的影响,不过文章已经有点长了。留到下次写跳槽心得的时候一起写好了。
2024-09-16 13:55:24
周末读了一篇关于「Security」的博客,文章核心的观点就是:任何事情(或者技术),如果被无限地放大或者滥用,好事情/好技术,最终也会变成坏的事情。比如很多公司都会说:「Security」是我们公司的「最重要」的事情,这个结论肯定是经不起推敲的,因为所有的安全问题的代价都是用户体验,比如一个绝对安全的在线银行系统的最好的实现方式就是完全不提供在线服务。实际上所有公司在内部实现安全性系统的时候,永远是一个和资源,用户体验的平衡问题,而不是它们所说的:「Security是我们最最重要的事情」。
早上跟一个最近刚跳槽的前同事喝咖啡,我们聊到了技术对社会的影响,尤其是Amazon, Uber, 美团这些 Online-to-Offline 的科技公司。这些技术公司的初衷我相信都是美好的:让消费者能够以更低廉的价格,更快的时间:买到商品,从A点移动到B点,或者是吃上一顿饭。让卖家和餐馆能够通过平台把他们的商品和食物卖给更广大的消费者群体。让送货员,司机和外卖员以更高效的方式提供服务,赚到一笔灵活的佣金。但是我们也看到,当算法被无限地优化之后带来的后果,外卖员和Uber司机几乎变成了算法下的奴隶,餐馆为了追逐效率引发的食品安全问题。同时,这些科技公司的利润也是非常微薄,只有再进一步去优化系统的效率才能持续生存下去。
同样的现象已经不是第一次发生。当电子邮件刚被发明出来的时候,收发电子邮件是一件真正美好的事情,因为你知道对面是另一个人亲手写的邮件。当手机和电话刚普及的时候,拨打收听电话是多么方便生活的一件事情。而今天,想象一个电子邮件服务如果没有「Spam Filter」,那电子邮件根本就是没法使用的,走在路上当我收到一个未知号码打来的电话,我根本就不想接通因为我知道它肯定是一个「Spam Call」。这些都是一个技术被「无限滥用」,导致美好的初衷完全变质的例子。
结合观察到的「Pattern」,令人思考的问题是:「某些技术的发展带给整个社会的影响是正面的还是负面的?」再举两个例子。
结合上面的两个例子,和前面提到的打车公司和外卖公司,不禁想问的问题就是:「Why?」我的回答就是这篇文章的标题:「Reward mechanism」。小到科技公司的一线码农和运营,大到整个公司的运营,每个人和组织做的事情都可以概括为:「不断地优化给组织和个人制定的目标函数」。员工的目标是过更好的生活,有更好的收入,做的事情就是完成上级一层一层传达下来的指令。公司的目标是帮助股东实现盈利目标的最大化,做的事情就是在法律规定的框架下,或者是媒体监督和Public Perception的限制下,不断地去增长和优化公司的回报。
这里的公司组织可以是我们常常听说的科技大厂,也可以是那些制造无数垃圾邮件和电话的小作坊。这里的个人可以是科技大厂的一线员工,也可以是律所的律师,也可以是在算法的驱动下要在半小时内完成订单才能拿到绩效奖励的外卖小哥。写到这里,我想的是:到底有没有人和组织可以逃开奖励机制?
人工智能和大语言模型的发展,把上面问的这些问题又完全带到了一个影响更深远的讨论范畴。
问题一「Safety」:像电子邮件,手机电话,Marketplace Algorithm,Social Media这些技术一样,如果人工智能完全不受监管的发展,社会会变成什么样子?
周末读了OpenAI最新的「o1模型」研发过程中的安全研究的文章。里面有一个环节是评估大语言模型的「Cybersecurity能力」,通常的实验方法是实验人员会设计一个测试环境,然后观察模型是否能够自己「黑掉」目标机器的环境,读取一个提前指定的文件内容(Capture the Flag)。其中一个实验因为设计者的疏忽导致目标环境容器(Docker Container)一直没有办法启动,结果令人意外的是大语言模型最终通过扫描整个宿主(Host)的网络接口找到了另一个漏洞,然后最终通过Docker API绕过了目标容器,让宿主用同样的镜像复制了另一个一模一样的容器,最终还是通过Docker API打印日志的方式读到了容器里的目标文件。这个故事想要讲的是,大语言模型为了达到目标可以利用完全出乎人类意料之内的手段。
即使是如电子邮件,supply/demand 算法,这些看起来这么无害的技术,如果被滥用带来的社会影响都已经如此剧烈,不难想象大语言模型技术如果被滥用可能带来的影响会有多么剧烈。
问题二「Alignment」:做为大语言模型的研究员,开发人员和公司,应该怎么设计对应的奖励机制?
同一篇「o1模型」的文章里提到,为了测试大语言模型的「对齐问题」,里面有这么一个实验。这个实验的目的是为了测试:大语言模型是否会有能力了解到和做到,为了达到「它」更长远的目标(比如,促进全球的经济和生产效率),模型可以在被发布之前,在做安全和对齐测试的过程中改变自己的一些参数,目的是为了能够欺骗测试者通过安全性测试,在发布之后再调整回原定的参数,因为发布才能够让其接着去实现「它」更长远的目标。如何保证大模型的行为目标不被滥用,我想这应该还是整个行业亟待解决的问题。
这周早一点的时候还听了Anthropic创始人Dario 2022年的一个采访,里面提到Anthropic成立之初就把公司定位为一个不同于常见的C Corp的「Public Benefits Corporation」。播客里面Dario提到说 Public Benefits Corporation 还是可以追逐利润和上市,但是跟 C Corp最大的一个区别是公司的追逐利润的同时还要考虑给社会带来福祉。就是这么一个微小的差别,可能就彻底改变了公司的「Reward Mechanism」。Dario提到如果是为了股东利益最大化的C Corp,管理层选择做一些伤害股东利益的决策,比如「延迟大模型的发布因为可能对社会有威胁,从而影响公司的收入」,管理层则在法律上有被股东投票驱逐的风险。说实话,我在听这期播客的时候,跟听到之前OpenAI创始人的采访的反应都很类似,这些企业家大概都是受到过去这几年加州「Progessiveness思潮」的影响,他们只是做一些「政治正确」的表达罢了。
但是今天跟朋友聊到关于科技和社会影响的关系,也许Anthropic的公司法律结构这还真不只是一个「政治正确」的表达,有可能一个微小的「目标函数」的改变,真的会完全改变整个「它」的发展轨迹。也许如何设计「奖励机制」才是这个世界的终极答案,正如生物遵循进化的规律,个体和组织的行为模式的核心问题往往也归结于「奖励机制」的设计。
无独有偶,过去十年人工智能的飞速发展,也正是大规模数据驱动的强化学习带来的结果。大语言模型的背后,其实正是一个基于海量训练数据精密设计的「最大化奖励概率模型」,最后的结果无非就是不断吐出下一个能够「最大概率能够最大化奖励」单词的机器而已。
可能终究我们所有人也都活在一个巨大的「Simulation」世界里面,我们能做的可能并不是改变那个写在DNA里的目标函数。而是在日复一日的生活中摒除外界的杂音,找到属于自己独一无二的「奖励机制」,我们才能走上一条更持久的成长之路。
2024-05-13 13:53:04
从四月底到五月初都一直在忙着搬家,加上最近几期All-In播客的内容都干货寥寥,所以笔记也都写得少了一点。
唯二想要call out的note一个是Mark Zuckerberg在Dwarkesh发布Llama 3的时候的采访,另一个是Tony Xu在In Good Company的采访。
Zuck在讲Llama 3的时候提到相比于Llama 2,Llama加了很多「编程」的内容到了训练内容里面。这里面的原因不是因为Llama 3的使用场景会涉及到很多的编程,而是因为他们发现在训练的过程中,加入「编程」会帮助模型在回答问题的时候更加地严谨。Zuck的这段话让我想到有一次跟运营的同事一起去滑雪,我们一起坐缆车的时候,同事跟她的朋友吐槽跟「工程师」交流需要特别严谨,问问题的时候工程师一定会clarify很多问题里面没有提到的一些条件然后做出回答。而且作出的回答也会尽量保持一致性,比如「在A情况下,软件会这么behave,如果是B情况,那就会另一种behavior」。讨论滑雪怎么下山的时候,同事说她们大概看一下,是黑道还是蓝道就好了,工程师还要说清楚具体是哪条道,在哪里接哪里。
Zuck提到加入「编程」的另一点是会帮助大模型训练更好的「推理」能力。比如你跟大模型交流的时候,即使应用场景不是编程,是一个企业的客服。更好的推理能力能够帮助大模型把一个问题转换成对「实现一个目标的」思考,然后进一步变成一个「多步骤」的互动。然后Zuck认为推理能力是大模型在市场上保持竞争力非常重要的一个因素,所以即使Meta的AI产品不直接跟写程序有关,公司也会加大大模型在编程方面的训练。这让我想到前段时间Elon Musk的一条Tweet:「Whoa, I just realized that raising a kid is basically 18 years of prompt engineering 」,他把养育小孩比做Prompt Engineering,进一步延展这个想法,早点学习编程是不是也能帮助小孩更好地掌握「推理事情」的能力呢?
另一个是Tony Xu在Good Company的采访,采访里面提到DoorDash最开始成立的时候,MVP就是一个网站,用户打电话点外卖,电话的另一头是创始人团队成员接到订单之后,亲自去餐馆下单,亲自去餐馆取餐,亲自去把外卖送到客户的手里。当时的「dispatch system」就是几个团队成员用的iPhone的「Find My Friends」,后来的故事大家也都知道了。我也早都知道创业早期特别需要hustle,YC也特别强调过创业初期需要创始人去做「不一定能scale但是客户热爱的生意」,道理都懂。但是随着年纪增长,时间成本和机会成本也都不再像20岁出头的大学生,即是你知道创业一开始很可能要去做「不一定能scale」的事情,但是又有多少决心和勇气去做「外卖骑手」呢?
Notes写完了,最后再说说搬家吧。我老婆说这已经是今年第四次搬家了,去年五月从上海搬回美国刚好过了一年,在旧金山住了一个月搬来了南加的Pasadena,最近又因为不可抗拒的原因从Pasadena搬到了隔壁的South Pasadena。搬家当然是没有人喜欢的,不过这几次搬家的每一次都还是对下一个地方有很不同的期待。我跟好友吐槽,年纪大了搬家好累,有着2.5岁女儿的好友就回了一句「娃更累」,我就闭嘴了。
新家还差一些在路上的大件家具,慢慢已经收拾好了。住了很多年的一居室,一下子搬到了四居室,我跟我老婆都还有些不习惯,不过能有自己的工作间,有车库,还有一个虽然有点荒但还是阳光充足和安静的后院,应该也可以知足了。
2024-04-23 14:58:50
最近开始用Notion记录听过看过读过的播客,视频和文章,听到觉得有意思的想法隔一段时间一起总结一下。
这期几个嘉宾聊了 Western countries big cities 普遍的流浪汉问题,Chamath去了一趟巴黎觉得「卧槽」巴黎跟旧金山也差不多,出门还要一直担心有没有人会来偷他抢他的手表钱包,所以美国其实也不差嘛。然后Friedberg 问了他一个问题你觉得跟亚洲城市比呢(新加坡,东京,中国的城市,etc.),他才意识到好像这也不是一个世界性普遍的问题,因为亚洲的城市安全性好太多了吧 。Sacks才一针见血地指出这是过去十多年来西方执政政府大吹的「左风」导致的结果。
我的观点:去年APEC在旧金山举办,证明其实它也是可以一夜变身干净整齐有秩序的现代都市的,可能还需要再等一等,等往「右」吹的风吹一吹,「零元购」、「流浪汉」的问题也都会不断改善吧。
这期还聊了美国的通胀,去年年底大家还信誓旦旦说预计降三次息,结果今年过完第一个季度讨论的已经变成「是否会降息」了,美联储草台班子真是再一次做实。我印象还很深2021年大放水的时候,All-In几个人天天说这么搞肯定要通胀,但是Powell接受采访的时候却一直说「不会通胀」,甚至有很多「大媒体」还做节目写文章说「也许美国的经济真的好棒棒,我们再怎么印钱都不会通胀呢」。回头看当然是啪啪打脸,但是又有多少人记得那些做过的采访和写过的文章呢?另外今年2024是美国大选年,之前据说执政府的一个剧本是,今年通胀下降,然后美联储「顺势」降息,经济再怒涨一波,顺带送Biden连任。结果现在通胀不下,美联储的位置是有点尴尬。
然后Chamath就说了当天我觉得最有意思的一个insight。就是通胀数据其实有比较大的一块就是「油钱」,Biden政府为了降通胀让国内的石油公司加大产能,但是中东OPEC同时更多的「减少」产能,乍看之下这些OPEC成员国家的目的是为了保持一个「Target的油价」。但是这也从另一个侧面可以看出来这些国家对2024年美国政府选举「投下的一张 gainst Biden 的选票」。保持油价 > 通胀降不下去 > 美联储保持高利率 > Biden下台。我的观点:最近国会讨论「国外势力干扰美国选举」讨论得火热,也许他们看错了讨论的对象。
这期还聊了 AI 和音乐创作。如果读者你还没听说过Suno,赶紧打开 YouTube 搜一个视频看看,保证惊掉你的下巴。故事背景是一群音乐人写了个信,大致意思是AI偷了他们的作品之类的,然后马上有议员出来说要提案「AI训练数据用到了创作者的作品需要付钱」。然后几个嘉宾针对AI模型的训练用到创作者的数据是否需要付钱展开了辩论。Friedberg的观点是「不用」,因为就像所有的音乐人的创作,大家都是在听过无数首前人的作品的基础上,被「Inspire」然后再创作出自己的原创作品,所以如果有剽窃的嫌疑,应该针对模型的「输出」做监管。Chamath的观点则是,如果只对Output做监管,那肯定没法监督,这些创作者就等着早日被全部取代吧。Sakcs最后比较中间,意思是AI肯定不会完全用人类一样的监管方式,不过现在提监管还是有点早,最终应该还是会讨论出一个中间的方式来监督。
这期聊了两个大话题,关于创业公司想不想上市和能不能上市的问题。我直接说结论吧,如果创业公司有250M的ARR,每年能够增长50%,然后Unit economy也是健康的,赶紧上欢迎上。我听到这里心想:那XXX,YYY,ZZZ公司不都彻底凉凉,股票直接就是废纸。最近也一直在读芒格的Almanack,其实很多事情小学生逻辑都能够理解个七七八八,创业公司的股票到底值多少钱,「你的包裹」到底值多少钱,其实真的没有那么复杂。
两个主持人一个专攻一级市场(Benchmark),一个重点投资二级市场(Altimeter Capital),他们观察到在古早互联网的年代,因为 private capital 不像今天水量这么大,所以创业公司发展到比较早期的一个阶段都需要上市去筹集更多的资金加速自己的发展(参见Google,Apple)。但是后来随着一些大型基金,包括主权基金开始加大科技公司尤其是一级市场的投资,导致 private market 大水漫灌,科技公司在 private market 能拿到足够多的钱也都不急着上市(参见 Uber)。两个主持人的观点都是:「这样是不好滴,一个好公司就是应该早上市,接受市场的监督,才能更好地发展」。反过来今天看到的结果就是,最好的创业公司因为现金流,因为 private market 能融到足够多的钱,也都对上市不着急(参见Databricks,Stripe,ByteDance)。反倒是那些已经在private market黔驴技穷的不愠不火的创业公司,才不得不靠上市去割最后一把韭菜。所以才回到前面的那个结论「好公司运营情况不错的话,就早点上市吧,上市了还有大把大把机会增长」。
我的观点:去创业公司抓彩票不可怕,可怕的是发现彩票已经撕开是张白纸的时候,还要给自己找各种理由给自己洗脑不离不弃。
In Good Company: Joe Tsai (蔡崇信)
听说最近这个挪威主权基金CEO的podcast很火,随便看了一下最近5期采访的人就有蔡崇信,Elon Musk,微软的CEO Satya 等等。
于是找一天下班听了这期蔡老板的采访。里面比较好笑的一个问答是:主持人问蔡崇信为啥要买NBA的球队,蔡老板说因为我从小就很喜欢运动,blahblah,结果被主持人打断说道:大家都喜欢运动,也不是每个喜欢运动的人都会去买NBA球队的。蔡老板才接着聊到NBA的分账机制其实对小球队很公平,同时,能去「拥有」一支纽约市里的球队的机会还是很难得的。听到这里觉得主持人追问得好,问答的内容也多了很多干货。
另外一个我觉得比较有意思的是主持人问蔡老板怎么看ZG的「消费」,这里蔡老板还是比较实诚。他说了两个点:1. 反财富效应,因为房价下跌导致大量家庭资产跟房产挂钩的ZG家庭在消费端也变得畏畏缩缩。2. 就业不景气,年轻人担心失业,也不觉得跳槽能有更好的报酬,结果也是导致在消费端变得更加节俭,一来二去消费下降带来通缩。
我的问题:如果你在上面说的地方生活,你同意么?
另外几个还推荐的视频播客
最后再聊聊生活吧,下周又双叒叕要搬家了,这几年搬家搬的已经有点熟练了,每年平均搬家次数感觉已经是 > 1 了。没有人喜欢搬家的,但是动力终究是来源于对更好的生活的期待吧。
2024-04-15 01:56:52
这两周听了一些播客,印象最深的还是 Acquired 这期花了3小时聊的文艺复兴基金(Renaissance Technology)。他们的旗舰基金:大奖章基金(Medallion Fund)在过去的34年的年化收益是68%毛收益率。形象一点说明这个回报,如果1988年的时候你往美股的S&P 500投资了1000美金,按照9%的年化收益,投资34年的总价值是$18,728美金,一共翻了18倍。同样是1988年,如果你在那个时候买了1000美金的苹果股票(APPL),然后连续持有34年,总价值会是46万美金,一共翻了460倍。而前面提到的大奖章基金,如果同样在1988年他们基金开始的第一年放进去1000美金,如果连续持有34年(假设投资者允许被持有这么长的时间的话),最后的价值会是465「亿」美金,这就是68%的年化收益的数学之美。大奖章基金也是有史以来收益最好的基金,开设三十多年期间没有一年是亏损的。很可惜的是,这个基金成立之后不久的时间内,因为业绩太好,就关闭了所有外部投资者(LP)的渠道,再过不了几年也把之前所有外部投资者的资产全部退还,从此这个基金里面的资产全部来自内部的员工或者退休的前员工。今天这篇博客就想讲一讲文艺复兴基金和他的创始人詹姆斯·西蒙斯(James Simons)的发家故事。
西蒙斯1938年出生在马萨诸塞州波士顿的郊区(Brookline),从小就表现出对数学的兴趣和天赋。大学在麻省理工学院(MIT)三年完成数学系的学习,然后来到西海岸的加州大学伯克利分校(Berkeley),同样是花了三年的时间拿到了数学博士的学位。博士毕业之后在哈佛(Harvard)和麻省理工任教的期间,西蒙斯虽然学术水平一流,但是仍然一直对「如何搞钱」充满兴趣。于是在六十年代期间加入了美国安全局(NSA)为了冷战而设立的国防分析研究所(Institute for Defense Analyses),在做教授的同时为国防部提供密码破译的服务。在IDA的工作中,研究员们要观察和分析各种各样不同来源,不同结构的数据,尝试在这些数据中找出有用的信息,这也为西蒙斯后来创立文艺复兴基金,构建数据驱动的交易策略奠定了理论基础。60年中期的时候西蒙斯写了一篇标题为「如何利用概率模型来预测股票市场行为」的论文,这篇论文的影响是很多方便的:在这之前,投资策略更侧重的是对公司基本面的分析(Fundamental Analysis),或者是股票走势的技术分析(Technical Analysis),这篇论文则是第一次提出通过数据采集,信号分析、算法驱动的投资策略。主持人则认为这种同时利用概率模型和复杂数据分析的算法其实也是一种早期的机器学习技术。最后,这篇文章的另一个作者Leonard Baum,则是提出Hidden Markov Model(HMM)的数学家,也是后来文艺复兴基金公司早期开发投资策略的关键人物,HMM模型不仅仅适用于交易模型的发发,也被广泛应用于自然语言处理(NLP)和生物信息学。
话说回来到西蒙斯,论文的概念虽然先进,不过60年代也没有真的投入到实践。后来越战开打,西蒙斯在「纽约时报」撰文公开反对战争,胳膊拧不过大腿,西蒙斯也因为此被国防部开除,他也离开了哈佛和麻省理工。恰巧当时纽约州政府想要大力投资纽约州立大学的数学部门,西蒙斯则顺理成章来到了纽约州立大学石溪分校(Stony Brook University)成了数学系的系主任,目的是打造一个理想的数学研究部门,什么政治博弈,什么教学任务,什么委员会琐事统统都不重要,你们只要做你们想做的研究就好。西蒙斯在纽约大学待了10年,后来还是顶不住想搞钱的初心,决定全职投入到金融交易的领域。1978年西蒙斯跟他的几个学术伙伴成立了一家叫做Monemetrics的公司,然后从1978到1988又花了10年,经历一波又一波的人事变动,最终在1988年以文艺复兴基金公司的名义推出了前文提到的大奖章基金,后面的故事就都是历史了。
整个播客花了三小时讲了前前后后文艺复兴基金的故事,有兴趣的同学可以去听他们的原声,我这里挑一些我自己觉得有意思的地方分享一下。
文艺复兴基金与其说是一个金融公司,其实更像是一个Research House,根据他们网站介绍,公司300来个员工有90多个数学、物理和计算机科学领域的博士。西蒙斯自己就拿过拓扑学的奥斯瓦尔德·维布伦几何学奖(Oswald Veblen Prize in Geometry),跟陈省身合作提出的「陈-西蒙斯理论」后来也成为了量子物理学不断被引用的理论框架。公司的早期关键算法设计师,也是后来西蒙斯退休的时候的Co-CEO Peter Brown 和 Robert Mercer在加入文艺复兴基金之前是在IBM开发曾经深蓝计算机的计算机科学家。公司早期另一个算法设计师和数学家Elwyn Berlekamp的博士生导师则是现代信息学之父克劳德·香农。而前面提到的Peter Brown的博士生导师则是现今深度学习的开创者之一Geoffrey Hinton。 对这些数学、物理和计算机领域的研究员来说,所有的投资标的都成为了一个个的数据点,他们的目标是如何打造效率最高的信息处理算法,和能够处理超级大量信息的计算系统,最终通过数据和模型赢下市场。回头看,他们做的很多事情其实都是现在许多量化交易公司在做的事情,甚至是很多科技公司在机器学习或者人工智能领域都在做的事情。区别只是文艺复兴已经做了40年。
另外一个我觉得有意思的是这个公司的文化。先从前面提到的大奖章基金从90年代就不再接受LP的投资,LP全部来自内部员工或者已经退休的员工。但是同时,这个基金的 Carry 高达44%,主持人就问了一个问题:既然管理的资金全部都来自内部员工,那这么高的「Carry」到底是交给谁?主持人给出的答案是,这是一个很聪明的激励新员工的机制。因为当新员工加入文艺复兴基金的时候,往往他们并不像待了很长时间的员工那么富裕。那通过较高的 Carry,就可以把每年基金增长的财富快速分配给「新人」,而不是只有那些已经积攒了大量资本的「老人」能获得大量收益。公司内部甚至把他们自己的401(k)设置成为大奖章基金。文艺复兴的办公室远离曼哈顿,位于纽约州长岛县的一个小镇East Setauket,据说整个公司更像是一个避世的校园。公司员工的平均 tenure 是13年,而且员工加入公司签的竞业协议都是「终身」的。想象一下,如果你有机会去这个公司工作,你要搬到一个远离都市的小镇,同事几乎都是名校的数学物理博士,上班下班可能小镇里见到的都是同样的一群人,因为终身竞业协议基本就是一个干到退休的职位,可能真得不是适合每一个人的一份工作,即使你是一个非常聪明的顶级大学的博士毕业生。
主持人比较了文艺复兴跟其他有名的对冲基金做比较(Two Sigma, Citadel, etc.),文艺复兴的人员规模长时间保持在其他基金的1/10。同时,公司很早起就订下的一个策略就是全公司一起打造同一个模型。这样的好处是可以充分动用全公司的资源一起研究和打磨最佳的交易策略,而不是像其他的基金因为存在不同策略,不同团队之间可能还会暗暗地有相互较劲的意思。这很像硅谷的科技公司,在创业早期团队较小的时候,大家有着一致的利益,员工能够一起齐心往前。随着公司规模的增大,利益很难再保持一致,办公室政治不可避免。虽然仍然存在一些小公司或者风险投资,能够多年保持在很小的团队。但是像文艺复兴,做了这么多年,进行这么大量的交易,还能够保持这么小的团队,真的是独一无二。
最后再聊一下关于投资吧。最近同时也在读芒格的 Poor Charlie’s Almanack,读到这里你应该可以感觉到文艺复兴的理念跟伯克希尔哈撒韦的投资理念完全是背道而驰。芒格强调我们应该尽量用「小学生」的智慧去理解这个世界,找到容易理解的业务模式,和长期财务有着优异表现的公司。当遇到「好的机会」的时候,尽量大地去下注然后长期持有投资标的。文艺复兴则是根本不去理解公司的业务模式,而是通过大量的数据分析和极其复杂的统计模型,找出那比50%多出一点点的胜率,然后用大量的交易和杠杆去最大化获益。很显然这里没有谁对谁错,最终芒格和西蒙斯都走出来了各自的传奇之路。
其实很像每个人的一生,终究重要的是自己能否真的能够跟自己自洽,选择做什么样的工作,在什么地方生活,住什么样房子,和什么样的人Raise一个什么样的家庭,没有「怎样」就是最好的,希望读这篇文章的人都能找到合适自己的答案。
2023-12-25 08:49:46
节假日又听完了一期Lex的采访,这次主角是Amazon的创始人和前CEO Jeff Bezos,也是航天公司Blue Origin的创始人。采访分为两大部分,一块讲了他创建Blue Origin的初衷和其中现阶段火箭发射技术的讨论,另一大块讲了他在创建Amazon的过程中自己对公司文化实现的想法和这些文化如何影响了Amazon公司的日常运营。
其中比较有意思的一个讨论是Bezos认为新的「发明」其实就是找到一些「更为便宜或者便捷」的方式去做事情。比如载人探月任务,60年前人类就已经实现了,但是后来没有再继续做下去的原因是太昂贵了。这也可以联想到Amazon,其实就是实现了一个「更为便宜和便捷」的方式让用户去选购无限多的sku而且可以在很短的时间内收到购得的商品。Bezos举的另一个例子是古代「犁」的发明,极大增加了农作的效率,间接加速了文明的发展。
另外Bezos提到Blue Origin创立的一个初衷是为了打造航天行业的Infrastructure,他提到Amazon能够成为现实是因为已经有人发明了信用卡(支付系统)和USPS(物流),这样才可以借着这些前人打造的Infrastructure在车库里来实现他的「电子商务网站」。所以他希望他现在做的事情能成为未来年轻人在航天领域创业的Infrastructure,终究帮助人类实现跨行星的文明物种。
关于Amazon/Blue Origin文化的部分,可能大部分都已经比较耳熟能详。比如Bezos说做决策的时候先搞明白这个决策是一个One-way door还是Two-way door。Two-way door代表那些可以之后改变主意也不会太麻烦的决策,这种决策需要快速做出决策,执行,收集数据/反馈再进行迭代。相反One-way door的决策做出之后,再改变需要耗费很多的精力和资源,所以需要尽可能地收集更多的数据,更充分地进行讨论,最后小心地做出决策和执行。他看到的是很多组织里面尝试用一个方法去适用所有的决策,这样可能会有问题。
其他还讲了他对Amazon Day-One的看法,大致意思是不要盲目遵从过去定下的「准则」,这些准则很可能随着时间推移已经不再适用,所以需要公司能够保持一个开放、好奇的心态去面对当下的事情。公司的事务分成「Big Things」和「Paper Cuts」,Big things指那些很长时间内不会改变的事情,他举的例子有「即使再过十年,顾客还是会喜欢更便宜价格的商品,会喜欢有更多的Sku选择,喜欢更快速的物流」,所以管理层需要一直专注在这些Big things上。在这个过程中肯定会有一些大大小小的问题被他称作Paper cuts,则会搭建相关的团队专门去解决这些不一的问题。
虽然大部分人都不会成为CEO,把这些思考方式融入到日常的生活也许也会有不一样的启发呢。你也可以想想看:「接下来的十年,你的家庭和工作里面,最重要的并且不会改变的事情是什么?」