量子位AI资讯
2B小模型吊打语音界!郭德纲最难贯口被AI完美复刻
2026/04/08 06:10
就在大家还在讨论大模型参数竞赛的时候,面壁智能悄悄放了个大招。他们最新发布的开源语音模型,虽然只有20亿参数,但竟然能把郭德纲相声中最难的那段《莽撞人》复刻得惟妙惟肖。这段贯口语速快、吞字清、情绪饱满,曾让无数人望而生畏,现在AI居然轻松拿捏了。
消息传到海外,评论区直接炸锅了。老外们纷纷打"Amazing",压根不敢相信这是2B小模型能做的事。在他们印象里,语音合成要么得靠天价大模型,要么就是那种机械感满满的合成音。面壁这一波操作,等于直接告诉全世界:开源模型也能做到世界级水准,而且free。
这事儿对行业的冲击不容小觑。首先,它证明了小模型并非只能"小打小闹",只要技术够硬,2B参数也能玩转高难度语音任务。其次,开源免费这个策略太狠了,直接把门槛拉到地板上,以后中小公司做语音应用,成本直接降维。第三,这给国内AI公司长脸了——不是只有OpenAI能打,我们有自己的杀手锏。
至于未来,我敢断言"小模型高性能"会成为接下来语音赛道的主旋律。各大厂会疯狂卷优化而不是单纯堆参数,毕竟能跑在手机端、嵌入式设备上的模型才是真正落地的好模型。开源社区也会因为这个好消息更加活跃,开发者们有更多弹药可以折腾了。
作为普通读者,咱们要做的就是别只当吃瓜群众。这个趋势意味着,未来你手机里的语音助手、录音转文字、AI配音这些功能会越来越强大越来越便宜,甚至可能完全free。对技术感兴趣的朋友,可以去GitHub上搜搜这个项目,亲耳听听AI版的《莽撞人》到底有多离谱。
来源 量子位
阅读原文