返回AI资讯
Google ResearchAI资讯

Google发布TurboQuant:内存暴降6倍,精度不损失

2026/03/26 14:00

Google发布TurboQuant压缩算法,通过PolarQuant+QJL两步走的方式,把大模型内存占用降低至少6倍且零精度损失。对AI部署方来说,这意味着同等硬件能跑更大的模型。

来源 Google Research

阅读原文