返回AI资讯
TechCrunch AIAI资讯

Google悄袭iOS!离线AI语音转写要变天?

2026/04/06 18:54

Google这次在iOS上线的这款语音转写应用,表面上看只是又一个语音转文字工具,但它的内核可能远没那么简单。首先,它是一款“离线优先”的应用,这意味着所有的语音识别和转写都在本地设备上完成,不需要上传到云端。这在AI应用普遍依赖云端的当下,显得相当“另类”。

其次,也是更值得关注的是,它使用的是Gemma模型——Google的开源大语言模型。这不是Google第一次把Gemma推向端侧,但用在一款面向消费者的语音转写产品上,还是头一回。开源模型+端侧部署+消费级应用,这个组合本身就带有某种标志性意义:Google正在用实际行动告诉业界,端侧AI不仅可以跑,而且可以跑得很好。

对行业的影响是显而易见的。语音转写这个赛道由来已久,从传统语音识别到AI时代,各种产品层出不穷。但绝大多数产品都有一个共同特点:依赖云端服务器进行处理。这带来的问题很明显——网络延迟、数据隐私、离线无法使用。Google这次选择了一条完全不同的路径,相当于告诉市场:离线也能做到云端级别的体验。

如果Google的这款产品真的能打,那冲击最大的可能是Wispr Flow这类主打AI语音转写的应用。毕竟在同等体验下,“数据不上云”这个卖点对很多用户来说是有吸引力的。更重要的是,这种模式一旦被验证,可能会引领一波“离线AI应用”的潮流。

从更宏观的视角看,这其实反映了AI应用正在经历的一场范式转换:从云端智能到端侧智能。苹果的端侧模型、Google的Gemma端侧部署,都在传递同一个信号:未来的AI不一定非要在云端“跑”,在你口袋里、手机里就能跑。这对用户意味着更好的隐私保护、更快的响应速度;对厂商意味着更高的技术壁垒和更深的护城河。

不过,现在说“变天”可能还为时过早。离线AI转写的实际体验能否真的媲美云端,Gemma模型在端侧的效率如何,这些都需要时间来验证。但有一点可以肯定:Google这次出手,说明他们已经认定端侧AI是未来,而这场战役,才刚刚开始。

来源 TechCrunch AI

阅读原文