量子位AI资讯
高德"世界模型"炸场:具身智能迎来零样本自由时代?
2026/04/21 08:45
先泼盆冷水:具身智能喊了这么多年,真正卡脖子的从来不是算法,而是数据。机器人要在真实物理世界泛化,需要覆盖无数种场景、物体、交互方式——这个数据量级,靠人工采集几乎是不可能完成的任务。
高德这次押注的ABot-World世界模型,思路很直接:用高精渲染引擎直接在虚拟世界里“造”出海量训练数据,然后用VLA(Vision-Language-Action)闭环让模型自己学会对齐物理规律。听起来像是“用魔法打败魔法”——既然真实数据不够,那就用合成数据来凑。
但这里有个本质问题:渲染出来的数据终究是“假的”,模型能不能真的学到物理世界的因果规律,而不是过拟合渲染器的style?高德敢喊“零样本泛化”这个词,胆量是有的,但最终还是要看效果能不能打。
对行业来说,这条路的潜在冲击很大。如果高精渲染+闭环进化真的跑通了,那具身智能的、数据门槛会被彻底掀翻——以后可能不再需要动辄上千台机器人天天跑数据,一个仿真引擎就能搞定。这对于中小玩家是机会,对于靠数据护城河的巨头是警讯。
不过,我的判断是:这条路短期内还是“理想很丰满”。渲染域到真实域的gap(domain gap)依然是世界难题,高德自己也承认“物理优先”是关键——怎么让模型真正理解物体碰撞、重力、摩擦这些物理常识,而不是只看像素相似度,这才是真本事。
如果你在关注具身智能这场仗,别只看热闹。这波趋势里,要么卷数据,要么卷仿真——高德选了第二条路,是否选对了,两三年内见分晓。
来源 量子位
阅读原文