Google悄袭iOS！离线AI语音转写要变天？

Google这次在iOS上线的这款语音转写应用，表面上看只是又一个语音转文字工具，但它的内核可能远没那么简单。首先，它是一款“离线优先”的应用，这意味着所有的语音识别和转写都在本地设备上完成，不需要上传到云端。这在AI应用普遍依赖云端的当下，显得相当“另类”。

其次，也是更值得关注的是，它使用的是Gemma模型——Google的开源大语言模型。这不是Google第一次把Gemma推向端侧，但用在一款面向消费者的语音转写产品上，还是头一回。开源模型+端侧部署+消费级应用，这个组合本身就带有某种标志性意义：Google正在用实际行动告诉业界，端侧AI不仅可以跑，而且可以跑得很好。

对行业的影响是显而易见的。语音转写这个赛道由来已久，从传统语音识别到AI时代，各种产品层出不穷。但绝大多数产品都有一个共同特点：依赖云端服务器进行处理。这带来的问题很明显——网络延迟、数据隐私、离线无法使用。Google这次选择了一条完全不同的路径，相当于告诉市场：离线也能做到云端级别的体验。

如果Google的这款产品真的能打，那冲击最大的可能是Wispr Flow这类主打AI语音转写的应用。毕竟在同等体验下，“数据不上云”这个卖点对很多用户来说是有吸引力的。更重要的是，这种模式一旦被验证，可能会引领一波“离线AI应用”的潮流。

从更宏观的视角看，这其实反映了AI应用正在经历的一场范式转换：从云端智能到端侧智能。苹果的端侧模型、Google的Gemma端侧部署，都在传递同一个信号：未来的AI不一定非要在云端“跑”，在你口袋里、手机里就能跑。这对用户意味着更好的隐私保护、更快的响应速度；对厂商意味着更高的技术壁垒和更深的护城河。

不过，现在说“变天”可能还为时过早。离线AI转写的实际体验能否真的媲美云端，Gemma模型在端侧的效率如何，这些都需要时间来验证。但有一点可以肯定：Google这次出手，说明他们已经认定端侧AI是未来，而这场战役，才刚刚开始。

阅读原文