AIPress.com.cn报道
4月7日消息,谷歌近日低调发布一款名为Google AI Edge Eloquent的AI听写应用,目前已在iOS平台上线。该应用主打离线语音转文字功能,用户下载相关模型后即可在本地设备上进行语音输入与文本转写。
该应用基于谷歌Gemma 系列自动语音识别(ASR)模型,能够在用户说话时实时显示转写内容。当用户暂停录音时,系统会自动清理语音中的填充词,例如“um”“ah”等,并对文本进行整理,使输出内容更加流畅。
在转写完成后,应用还提供多种文本优化选项,包括“Key points(要点)”“Formal(正式)”“Short(简短)”“Long(扩展)”等模式,以帮助用户快速调整文本结构。
Google AI Edge Eloquent同时支持本地处理模式。在关闭云端模式时,所有语音识别和文本处理都将在设备本地完成。如果启用云端模式,应用则会调用Gemini 模型对文本进行进一步润色。
应用还允许用户导入Gmail中的联系人名称、关键词或专业术语,以提升语音识别准确度。同时用户也可以手动添加自定义词汇。
应用会保存每次转写记录,并提供搜索功能,用户可以查看历史转写内容、语速统计(每分钟词数)以及总字数等数据。
目前该应用仅在iOS平台提供下载,不过应用介绍中提到未来将推出Android版本。在Android设备上,Eloquent预计可作为系统默认输入方式,并通过悬浮按钮实现随时调用语音转写功能。(AI普瑞斯编译)









