滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

语音转文字基准测试：ElevenLabs Scribe v2夺冠谷歌Gemini3Pro紧随其后

时间：2026-03-02 13:26:04 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在语音转文字技术领域，ElevenLabs与谷歌近期成为行业焦点。根据Artificial Analysis最新发布的AA-WER v2.0基准测试结果，两家企业在音频转录任务中展现出显著优势，其模型性能远超多数竞争对手。

ElevenLabs推出的Scribe v2模型以2.3%的词错率（WER）摘得桂冠，成为当前准确率最高的商用语音识别系统。谷歌的Gemini3Pro紧随其后，错误率控制在2.9%，尽管该模型未针对转录场景进行专项优化，但其多模态架构仍展现出强大泛化能力。测试数据显示，这两款模型在处理复杂语音场景时，对专业术语、口音和背景噪音的适应性明显优于其他产品。

中游阵营呈现差异化竞争态势。Mistral Voxtral Small以3.0%的错误率位列第三，谷歌另一款轻量化模型Gemini3Flash则以3.1%的微弱差距紧随其后。OpenAI的Whisper Large v3作为开源领域代表，此次取得4.2%的测试成绩，虽在准确率上不及头部企业，但其开放生态仍吸引大量开发者使用。值得注意的是，该模型在长音频处理和方言识别方面具有独特优势。

部分企业模型表现未达预期。阿里巴巴的Qwen3ASR Flash、亚马逊的Nova2Omni以及Rev AI分别以5.9%、6.0%和6.1%的错误率位列榜单末位。技术分析指出，这些模型在训练数据多样性、实时响应速度等关键指标上存在改进空间，尤其在处理高语速或含混发音时，错误率出现明显上升。

专项测试进一步验证头部模型优势。在针对语音助手指令设计的AA-AgentTalk评测中，ElevenLabs Scribe v2和Google Gemini3Pro延续强势表现，错误率分别低至1.6%和1.7%。这类测试重点考察模型对短句、关键词和上下文的理解能力，结果显示两家企业的产品在交互延迟和语义解析精度上已达到消费级应用标准，为智能家居、车载系统等场景提供了可靠技术支撑。

更多>同类资讯

鸿蒙智行再出击！起诉自媒体“圈内人 Xm_”索赔200万捍卫品牌声誉

05-26

打破刻板印象！XREAL子品牌xbx首秀，a01系列AR眼镜1699元起开启娱乐新体验

05-26

职场警报！九成九企业高管预计AI两年内将引发裁员潮

05-26

AI“治安官”上岗周年：抖音大模型治理谣言，处置浏览量下降62%

05-26

奔腾 4 复活赛：20 年前“古董”CPU 竟能跑通 Meta Llama 3 大模型

05-26

攻克悬置 56 年难题！谷歌AlphaProof Nexus颠覆数学界

05-26

逆势降价，高端手机市场的最后一次博弈？

05-26

小米17T新配色曝光：新增渐变白 5倍长焦成中端新标杆

05-26

“贵妃粉耳”产品包装低俗擦边？盒马致歉

05-26

索赔200万！鸿蒙智行法务正式起诉自媒体 “圈内人 Xm_”

05-26

大场面轻松玩！XREAL年轻子品牌xbx发布，首款产品a01售1699 元

05-26

OpenAI CEO萨姆 · 奥尔特曼：AI普及不太可能引发“就业末日”

05-26

字节跳动旗下公司申请注册“AGENT WORLD”商标，AI生态功能受关注

天眼查知识产权信息显示，近日，北京字跳网络技术有限公司申请注册多枚“AGENTWORLD”商标，国际分类包括教育娱乐、科学仪器等，当前商标状态均为等待实质审查。该公司成立于2018年10月，法定代表人为水…

05-26

小米商城即将上线新会员体系，原FRIEND会员权益平稳过渡新体系

05-26

京东拼拼与折扣超市整合：共享供应链资源，开启线上线下一体化新征程

05-26

点击查看更多 +

全站最新

光互连成AI算力新战场，谢崇进携奇点光子如何抢占窗口期？

昇腾AI开发者峰会2026北京启幕：共探前沿技术，携手开发者共筑AI新未来

2026年创建微信小程序全攻略：从规划到上线，选对路径是关键

字节跳动旗下公司申请注册“AGENT WORLD”商标，AI生态功能受关注

爱玛科技与华为深化合作：以技术赋能携手，共拓两轮绿色智能出行新未来

三体宇宙回应原CEO许垚被执行死刑：缅怀创始人，坚守初心续写科幻新篇

热门内容

本栏最新

字节跳动旗下公司申请注册“AGENT WORLD”商标，AI生态功能受关注

字节跳动申请注册“AGENT WORLD”商标，加速AI Agent功能产品化品牌化进程

速腾聚创与石头科技强强联手数字化激光雷达赋能割草机器人智能化升级

石头科技入选福布斯DTC影响力品牌，凭DTC战略与本土化深耕海外营收破百亿

石头科技5月25日股价下跌1.37% 主力资金净流出超亿元游资散户呈净流入

2026粤港澳大湾区车展将启，奥迪小米等品牌新车齐聚共掀科技新潮

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

语音转文字基准测试：ElevenLabs Scribe v2夺冠 谷歌Gemini3Pro紧随其后

语音转文字基准测试：ElevenLabs Scribe v2夺冠谷歌Gemini3Pro紧随其后