谷歌近日在iOS平台低调上线了一款名为“Google AI Edge Eloquent”的语音听写应用,主打离线使用功能,直接对标Wispr Flow、SuperWhisper等同类产品。该应用通过集成Gemma模型实现本地化自动语音识别(ASR),用户完成初始模型下载后即可在移动设备上完成语音转文字操作,无需持续连接网络。
核心功能方面,应用支持实时显示转录文本,并在用户暂停时自动过滤“嗯”“啊”等口语填充词。文本处理模块提供“要点提取”“正式化”“精简”“详细”四种格式转换选项,满足不同场景需求。针对专业用户,系统可关联Gmail账户自动导入联系人姓名、行业术语等关键词库,同时允许手动添加自定义词汇。
云端与本地处理模式的灵活切换是该应用的特色设计。开启云端模式时,应用将调用Gemini模型进行文本优化;关闭后则完全依赖设备算力,确保隐私安全。历史记录功能支持按关键词全文检索,并可统计单次会话的口述单词数、输入速度及总发言量等数据。
根据应用商店描述,Eloquent突破传统听写工具逐字记录的局限,通过AI技术精准捕捉用户核心意图。系统会自动剔除语气词、重复修正等冗余内容,输出结构清晰的专业文本。这种处理方式显著提升了会议记录、采访速记等场景的工作效率。
目前该应用仅提供iOS版本,但官方明确表示安卓版本正在开发中。预告功能显示,安卓版将实现系统级深度整合,支持设置为默认键盘并在任意输入框调用。悬浮按钮设计延续了Wispr Flow的便捷操作理念,用户可通过点击屏幕边缘的固定图标快速启动语音转录。
语音转文本技术的持续进化正推动相关应用市场快速增长。谷歌此次推出的试验性产品,既展示了其在生成式AI领域的技术积累,也反映出科技巨头对高效办公工具赛道的重视。随着多平台适配的推进,这款应用有望在专业用户群体中引发新一轮竞争。








