2024-12-27 15:00:00
光而不耀,静水深流。几代科研人员和从业者的探索与沉淀,在 2024 年盛放,写下人工智能发展史上至今最为璀璨的一章。
诺贝尔奖始终见证着人类智慧的巅峰。今年,AI for Science 的力量首次得到这一科学领域至高荣誉的认可。
2024 年,「百模大战」的竞争态势也愈发激烈。各大参与者不敢有丝毫松懈,持续迭代优化的同时,也显著提升了中国大模型的全球竞争力。
自 OpenAI 发布 Sora 掀起视频生成革命以来,国内顶尖科技企业竞相布局视频大模型赛道,多模态大模型正成为推动国产 AI 实力跃升的重要引擎。
与此同时,基于大模型的创新应用也如雨后春笋般涌现。创业者们抓住机遇,在智能问答、搜索、写作、翻译、视频创作等领域不断探索。当每一个应用都可能被大模型重新定义,谁能抵挡住打造下一个改变亿万人生活的「现象级应用」的诱惑?
在无数科研人员和从业者的不懈耕耘下,2024 年中国人工智能领域更加精彩。这些默默付出的汗水,这些令人瞩目的成就,都值得被铭记。这一年,我们见证了国内科技企业在人工智能领域和大模型方向的重大创新,产品和应用的落地开花;也见证了一批极具潜力的 AI 创业公司崭露头角。
然而,技术的浪潮中更需要清醒的目光。比如,在风起云涌的视频大模型赛道,谁在技术上实现了实质性突破?这些创新又将在哪些场景创造真正的价值?科技巨头和 AI 公司的技术进步包含多少实质性的技术进步?
带着这些思考与期待,机器之心精心策划了 2024 年度榜单,记录中国人工智能奋进的这一年, 勾勒技术创新的璀璨未来。
今日,「AI 中国」机器之心 2024 年度评选正式揭晓:
最强技术实力企业 TOP 10
2024-12-27 11:47:00
一些疯狂酷炫的物理发现;
最初由机器人建造的火星和月球基地;
完美的家庭教师 / 建议(快到了,需要良好的检索能力、记忆力和更多的个性);
零副作用的生物强化药物;
乘坐超级优化的无人机四处飞行;
使用核聚变、地热和大量太阳能等超级清洁能源;
一些意想不到:人工智能天文学家在望远镜数据中发现外星信号?人工智能化学家轻松设计出室温超导体?人工智能物理学家统一了一些理论?人工智能数学家解决了黎曼猜想?
2024-12-27 11:47:00
一是画面质量和相关性提升;
二是镜头运动和画面运动更可控;
三是特色场景下的生成效果提升。
2024-12-27 11:47:00
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]
论文标题:GRAPE: Generalizing Robot Policy via Preference Alignment
论文链接:https://arxiv.org/abs/2411.19309
项目地址:https://grape-vla.github.io
代码地址:https://github.com/aiming-lab/GRAPE
GRAPE 在轨迹层面通过强化学习(RL)目标对 VLA 进行对齐,赋予模型全局决策能力,而不仅仅是简单的行为克隆;
GRAPE 隐式建模了成功和失败尝试中的奖励,从而提升对多样化任务的泛化能力;
GRAPE 采用可扩展的偏好合成算法。GRAPE 通过与任意目标对齐的偏好对轨迹进行排序,进而使得 VLA 模型能被对齐到设定的目标上。
2024-12-27 11:47:00
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]
论文标题:What Matters in Learning A Zero-Shot Sim-to-Real RL Policy for Quadrotor Control? A Comprehensive Study
论文链接:https://arxiv.org/abs/2412.11764
开源代码及模型项目网站:https://sites.google.com/view/simpleflight
平滑轨迹:包括八字形和随机多项式轨迹。八字形轨迹具有周期性,研究人员测试了三种速度:慢速 (15.0s 完成)、正常速度 (5.5s 完成) 和快速 (3.5s 完成)。随机多项式轨迹由多个随机生成的五次多项式段组成,每个段的持续时间在 1.00s 和 4.00s 之间随机选择。
不可行轨迹:包括五角星和随机之字形轨迹。五角星轨迹要求无人机以恒定速度依次访问五角星的五个顶点。研究人员测试了两种速度:慢速 (0.5m/s) 和快速 (1.0m/s)。随机之字形轨迹由多个随机选择的航点组成,航点的 x 和 y 坐标在 -1m 和 1m 之间分布,连续航点之间由直线连接,时间间隔在 1s 和 1.5s 之间随机选择。
采用与未来一段参考轨迹的相对位姿误差、速度和旋转矩阵作为策略网络的输入,这使得策略可以进行长距离规划,并更好地处理具有急转弯的不可行轨迹。研究人员指出,在强化学习策略的学习中,采用旋转矩阵而不是四元数作为输入,更有利于神经网络的学习。
将时间向量添加到价值网络的输入。无人机的控制任务通常是随时间动态变化的,时间向量作为价值网络的额外输入,增强了价值网络对时间信息的感知,从而更准确地估计状态值。
采用 CTBR 指令作为策略输出动作,使用连续动作之间的差异的正则化作为平滑度奖励。在无人机控制中,不平滑的动作输出可能导致飞行过程中的不稳定,甚至出现震荡和意外偏离轨迹的情况。而现实中的无人机由于硬件特性和动态响应的限制,比仿真环境更容易受到这些不稳定动作的影响。研究人员比较了多种平滑度奖励方案,结果表明使用连续动作之间的差异的正则化作为平滑度奖励,可以获得最佳的跟踪性能,同时鼓励策略输出平滑的动作,避免在现实世界中产生不稳定的飞行行为。
使用系统辨识对关键动力学参数进行校准,并选择性地应用域随机化手段。研究人员通过系统辨识对关键动力学参数进行了精确校准,确保仿真模型能够尽可能接近真实无人机的动力学特性。然而,研究也发现,域随机化的应用需要极为谨慎。对于那些能够通过系统辨识达到合理精度的参数,过度引入域随机化可能会适得其反。这是因为不必要的随机化会显著增加强化学习的学习复杂度,导致性能下降。换句话说,域随机化并非 「越多越好」,需要通过合理选择哪些参数应用随机化。
在训练过程中使用较大的 batch size。在 SimpleFlight 的训练过程中,研究人员特别关注了 batch size 对策略性能的影响。他们通过实验发现,增大 batch size 尽管对仿真环境中的性能提升并不显著,但在真实无人机上的表现却得到了显著改善。这表明,大 batch size 在缩小模拟与现实之间的 Sim2Real Gap 方面,扮演了关键角色。这种现象背后的原因可能与强化学习的泛化能力有关。在大 batch size 的训练中,策略能够在更广泛的状态分布上进行学习,从而提升其应对真实环境中复杂情况的鲁棒性。这种改进不仅帮助策略更好地适应现实世界中的不确定性,还减少了从仿真到现实部署时可能出现的性能退化问题。