00后团队碾压硅谷?中国具身智能突然觉醒,背后藏着什么
先说清楚发生了什么。灵初智能这家公司在过去一年里,默默收集了10万小时的人类与物理世界交互的完整数据——不是简单的视频,而是包括动作、触觉、空间感知、甚至失败尝试的完整“经验流”。然后他们用这些数据训练出了一个能够理解物理规律的具身智能模型。这个模型在所有公开 benchmark 上刷新了世界第一的成绩,而且是在没有任何大厂资源的情况下。
这意味着什么?过去十年,AI行业的共识是“数据为王”,但大家抢的是互联网文本、图片、语音数据。这些数据让AI学会了“说人话”、“画人画”、“听懂人话”,但始终停留在数字世界。具身智能要解决的核心问题是:如何让AI理解物理世界的基本规律——物体有重量、惯性、重心、摩擦力,一个杯子放在桌边上会掉下来,水倒多了会溢出来。这些我们人类刚出生就自动学会的“常识”,AI过去完全无法理解。
为什么10万小时的人类行为数据这么关键?想象一下:一个一岁婴儿如何学会抓取物体?他不是靠看图片学会的,而是通过一次次伸手、触摸、感受重量、调整力度来学习的。每一次尝试都是数据,每一次失败都是反馈。灵初智能做的事情,就是把这种“体验式学习”数字化——10万小时的数据本质上就是10万小时的人类“成长记录”。
对行业的影响是深远的。首先,标注着“具身智能”从概念验证进入了实际推进阶段。过去几年,波士顿动力秀肌肉、特斯拉押注Optimus,但真正的突破不在硬件而在软件——现在有了数据基础,机器人的“脑子”可以开始发育了。其次,这可能改变AI人才的结构。灵初智能是00后团队,说明年轻人、新面孔有机会在大厂夹缝中杀出来,因为具身数据是新的金矿,还没有人为此准备好。最后,对普通人来说,接下来三年可能会看到家用机器人的实用化——不是那种只会按预设程序跳舞的玩具,而是真正能理解你让它干什么、能自己调整策略的家庭助手。
但我也要泼一盆冷水。10万小时数据听起来多,其实也才相当于一个人从出生到上小学的体验量。要让机器人达到人类日常生活的处理能力,需要的可能是1000万小时甚至更多。而且数据采集的合规性、隐私问题、伦理边界都还没有明确规则。另外,中国团队的技术突破能不能转化为产品优势,还要看工程化落地能力。
至于我们应该怎么应对?如果你在AI行业,特别是做机器人、自动驾驶、或者任何和物理世界交互相关的应用,这个信号强烈提示你要开始关注具身数据了——这不是“以后要不要做”的问题,而是“别人已经开始做了”的现实。如果你只是普通用户,接下来几年可以期待家务机器人、陪伴机器人这类产品的实用化,价格应该会在2-3年内降到普通家庭可接受的范围。但别期待太高,现阶段它们还只能是辅助,不是替代。
最后说句题外话:00后团队做出这样的成绩 其实挺让人感慨的。十年前我们还在讨论中国AI会不会抄硅谷,现在已经有人在无人区探路了。不管你喜不喜欢,这就是正在进行时。
来源 量子位
阅读原文