中国00后团队搞出全球第一的具身模型,这事比想象中更让人激动
先说清楚发生了什么。量子位最近报道了一家叫灵初智能的公司,是由00后创业者创立的新公司,他们发布了一个10万小时的人类交互数据集,然后基于这个数据集训练出的具身模型,在全球范围内取得了领先地位。这个成绩不是靠堆参数、堆算力,而是实实在在拿到了高质量的人类行为数据。
这件事的意义远超表面。首先,具身模型和咱们之前聊的大语言模型完全不是一回事。语言模型是在互联网文本上训练的,它knows everything but understands nothing。而具身模型需要理解物理世界,需要知道杯子怎么拿、门怎么开、楼梯怎么下——这才是真正的人工智能“理解”。过去几年,全球科技公司都在砸钱做这个方向,但核心瓶颈一直没有解决:没有足够多、足够好的真实人类交互数据。
灵初智能这次做对了两件事。第一,他们拿到了10万小时的数据,这个规模在行业里是领先的,而且更重要的是,这些数据是真实的人类与环境交互的数据,不是合成数据或者模拟数据。第二,他们敢用一个00后团队来做这件事,没有大公司的包袱,反而少了很多限制。
对行业的影响我认为有几个层面。第一,中国在具身智能这个赛道上,已经从跟随变成了领跑,这给了整个行业很大的信心。第二,数据正在成为继算力之后新的核心竞争力,谁拥有高质量的人类行为数据,谁就拥有未来的AI。第三,机器人公司以后可能不需要自己出海量数据了,可以直接用这些数据训练基础模型。
那么读者应该怎么看这件事?我的判断是,具身智能这个方向在未来3-5年会迎来爆发。现在的AI能说会道,但未来的AI必须会动、能干实事。不管你是的行业从业者还是普通读者,都要关注这个趋势。对于做AI的人来说,数据的价值会在接下来几年远超模型架构的价值。对于普通人来说,机器人进入家庭的速度可能比我们想象的要快。
最后说一句,00后都已经在改变AI的格局了,咱们还有什么理由不努力?
来源 量子位
阅读原文