MoreRSS

site iconIndigo | 芦义修改

Hallidai 联合创始人,BrilliantPhoenix Capital 合伙人,前微博副总裁,引力创投合伙人,投资了美ONE(李佳琦),有一居。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

Indigo | 芦义的 weibo 的 RSS 预览

FSD 驱动的拼车服务马上就要在奥斯汀和旧金山湾区投入测试!不过还是需要监督的 且仅限 Tesla 员工👀 这是要拿员工先做人肉测试呀😜 indigo的微博视频

2025-04-24 07:43:03

FSD 驱动的拼车服务马上就要在奥斯汀和旧金山湾区投入测试!不过还是需要监督的 且仅限 Tesla 员工👀 这是要拿员工先做人肉测试呀😜 indigo的微博视频

娱乐下 自拍一个🤳能拍多丑拍多丑🤣 [图片]

2025-04-23 11:33:23

娱乐下 自拍一个🤳
能拍多丑拍多丑🤣

结合「The Era of Experience」再来阅读 OpenAI 研究员姚顺雨的这篇「The Second Half」网页链接 会更有感触!我们正处于 AI 发展的一个中场转折点,因为强化学...

2025-04-23 08:56:28

结合「The Era of Experience」再来阅读 OpenAI 研究员姚顺雨的这篇「The Second Half」网页链接 会更有感触!我们正处于 AI 发展的一个中场转折点,因为强化学习(RL)的泛化与新“配方”出现了。这里有三点变化:

- 强化学习开始泛化了:出现了一个结合了大规模语言预训练、规模化(数据和计算)以及推理与行动,它能够解决包括软件工程、创意写作、IMO 级别数学、电脑操作和长篇问答在内的多种复杂任务,这是以前难以想象的;

- 将“推理”(思考过程)视为一种特殊的行动,加入到 RL 的行动空间中,利用语言模型的先验知识,使得 AI 能够更好地泛化,就像人类解决问题时会先思考一样。这使得先验知识和环境(通过推理增强)变得比 RL 算法本身更重要;

- 新的焦点:AI 发展进入“下半场”,重点将从解决已有问题(训练模型)转向定义应该解决什么问题,以及如何衡量真正的进展,评估变得比训练更重要!

“下半场”需要更接近产品经理的思维方式,虽然更难、更陌生,但也更令人兴奋。其目标不再仅仅是解决游戏和考试,而是通过构建有用的智能产品来创造巨大的实际价值,可能催生万亿级公司⏩

其实 David Silver,DeepMind 的元老之一在最近一期播客中详细分享了什么是「The Era of Experience」!回顾过去几年 AI 的发展,一直处于“人类数据时代”。这...

2025-04-22 10:07:04

其实 David Silver,DeepMind 的元老之一在最近一期播客中详细分享了什么是「The Era of Experience」!回顾过去几年 AI 的发展,一直处于“人类数据时代”。这个时代的所有 AI 都基于一个共同理念:提取人类拥有的所有知识,然后将其输入机器,这是一种非常强大的方法。但还有另一种方式,这将引导我们进入“经验时代”!

在这个新时代,机器直接与世界互动,生成自己的经验。它在现实世界中进行尝试,并积累自己的经验。如果我们将这些经验数据视为驱动机器的燃料,那么它将催生下一代人工智能(Super Intelligence)。

David Silver 的主要观点总结如下:

1. 超越人类知识的必要性:为了让 AI 能够发现人类未知的新事物、实现真正的突破(如 AlphaGo 的 Move 37),AI 需要具备自主学习和探索的能力,不能仅仅局限于模仿和学习人类已有的知识;

2. AlphaZero 作为范例和“苦涩的教训”:AlphaZero 完全不依赖人类数据,通过强化学习和自我对弈达到超人水平,证明了经验驱动学习的巨大潜力。这揭示了“AI 的苦涩教训” —— 过度依赖人类先验知识反而可能限制 AI 的最终能力上限;

3. 强化学习(RL)是核心驱动力:强化学习(通过奖励信号进行试错学习)是实现“经验时代”的关键机制,是 AI 从经验中学习并不断进步的“可持续燃料”;

4. 对 RLHF 的批判性看法:虽然承认 RLHF(从人类反馈中强化学习)在改进当前 LLM 的有用性和对齐方面的重要作用,但他认为 RLHF 本质上限制了 AI 超越人类的潜力,因为它依赖于人类在事前的判断和偏好,而非事后真实世界结果的反馈。这相当于“把婴儿和洗澡水一起倒掉了”;

5. 真正的“根基”(Grounding)源于经验:基于人类反馈的“根基”是间接且可能肤浅的。真正的“根基”来自于 AI 在真实世界中行动并体验其后果(如品尝蛋糕好坏),而非仅仅是基于人类对输出的预先判断;

6. 经验在复杂问题中的应用:对于没有明确胜负的现实世界问题,AI 可以学习优化一系列与高层目标相关的、可量化的现实世界指标/信号,并通过经验自主调整这些指标的组合;

7. 对齐与安全的新视角:虽然存在风险,但能够根据真实世界反馈(包括人类的反应)调整自身目标的经验驱动型 AI,可能比固定目标或纯粹模仿人类偏好的系统更具适应性,甚至可能更安全;

8. 紧迫性与未来方向:业界需要认识到从“人类数据时代”向“经验时代”过渡的必要性和深远影响,并投入更多研究关注如何安全有效地实现这种基于经验的、可能超越人类的智能。

Is Human Data Enough? With David Silver 采访视频完整版 网页链接 indigo的微博视频

家门口的🌸又怒放了!北美的樱花和日本最大的区别 就是一点都不含蓄🤪 加拿大·Vancouver [图片][图片][图片]

2025-04-22 09:38:38

家门口的🌸又怒放了!北美的樱花和日本最大的区别 就是一点都不含蓄🤪 加拿大·Vancouver

若每个人都有个“私人 AI 助理”来帮忙投资股市,市场表面看似更高效率,但“噪音”也会以新方式迅速扩散;由于大家策略同质化越来越强,能保持领先或者创造“al...

2025-04-21 12:52:59

若每个人都有个“私人 AI 助理”来帮忙投资股市,市场表面看似更高效率,但“噪音”也会以新方式迅速扩散;由于大家策略同质化越来越强,能保持领先或者创造“alpha”的关键仍是人类更高水平的创造力与对 AI 的领导力!最新一期 Indigo Talk 邀请 @XTrader猫姐美股 来聊什么是「交易及人生」,我们能很罕见的看到不聊K线和交易的猫姐😄

AI 会像早期互联网一样,逐渐渗透并成为基础设施;同时,其对社会与经济的冲击力甚至超过当年的互联网革命,未来大量白领或中层岗位可能会被替代或重塑。现在 Xtrader 团队已经完全不需要分析师这个工种了,但人类仍有不可替代之处:

- 想象力与创新:AI 善于数据中学习,但对“全新创意”的迸发与洞察,往往需要人类跳出既定模式;

- 价值观与伦理:市场和科技应用最终还需要“驾驭者”来决定方向,如是否合规、是否承担社会责任;人类对善恶的判断和体察难以完全由机器替代;

- 情感与温度:人与人的血脉呼吸、情绪联结,在交易或管理决策中同样关键。例如市场突发事件背后的政治、社会因素,往往是机器难以穷尽的“人性层面”。

对谈猫姐 交易及人生 / INDIGO TALK - EP26 七十五分钟油管完整版👀 网页链接 indigo的微博视频