中国00后团队搞出全球第一的具身模型，这事比想象中更让人激动

先说清楚发生了什么。量子位最近报道了一家叫灵初智能的公司，是由00后创业者创立的新公司，他们发布了一个10万小时的人类交互数据集，然后基于这个数据集训练出的具身模型，在全球范围内取得了领先地位。这个成绩不是靠堆参数、堆算力，而是实实在在拿到了高质量的人类行为数据。

这件事的意义远超表面。首先，具身模型和咱们之前聊的大语言模型完全不是一回事。语言模型是在互联网文本上训练的，它knows everything but understands nothing。而具身模型需要理解物理世界，需要知道杯子怎么拿、门怎么开、楼梯怎么下——这才是真正的人工智能“理解”。过去几年，全球科技公司都在砸钱做这个方向，但核心瓶颈一直没有解决：没有足够多、足够好的真实人类交互数据。

灵初智能这次做对了两件事。第一，他们拿到了10万小时的数据，这个规模在行业里是领先的，而且更重要的是，这些数据是真实的人类与环境交互的数据，不是合成数据或者模拟数据。第二，他们敢用一个00后团队来做这件事，没有大公司的包袱，反而少了很多限制。

对行业的影响我认为有几个层面。第一，中国在具身智能这个赛道上，已经从跟随变成了领跑，这给了整个行业很大的信心。第二，数据正在成为继算力之后新的核心竞争力，谁拥有高质量的人类行为数据，谁就拥有未来的AI。第三，机器人公司以后可能不需要自己出海量数据了，可以直接用这些数据训练基础模型。

那么读者应该怎么看这件事？我的判断是，具身智能这个方向在未来3-5年会迎来爆发。现在的AI能说会道，但未来的AI必须会动、能干实事。不管你是的行业从业者还是普通读者，都要关注这个趋势。对于做AI的人来说，数据的价值会在接下来几年远超模型架构的价值。对于普通人来说，机器人进入家庭的速度可能比我们想象的要快。

最后说一句，00后都已经在改变AI的格局了，咱们还有什么理由不努力？

阅读原文