滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

Meta推出Omnilingual ASR：支持千余种语言转写，开源模型助力跨语言沟通

时间：2025-11-12 01:30:08 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

meta基础人工智能研究团队FAIR近日宣布推出一项名为“全语种自动语音识别系统”（Omnilingual ASR）的创新技术，该系统可支持超过1600种语言的语音转写功能，显著扩大了现有语音识别技术的语言覆盖范围。这一突破性成果有望为全球语言多样性保护与跨语言交流提供重要支持。

传统语音识别工具主要聚焦于数百种资源丰富的语言，这些语言拥有大量标注音频数据用于模型训练。然而全球现存7000余种语言中，绝大多数因缺乏训练数据而难以获得人工智能技术支持。Omnilingual ASR的研发正是为了填补这一技术鸿沟，其支持的语种中包含500种此前从未被任何AI系统覆盖的语言。

系统性能测试数据显示，在1600种测试语言中，78%的语言实现了字符错误率（CER）低于10%的识别精度。当训练音频时长达到10小时及以上时，这一比例提升至95%；即使对于训练数据不足10小时的“低资源语言”，仍有36%达到相同精度标准。研究团队强调，识别准确率与训练数据量呈现显著正相关关系。

为推动技术普惠应用，meta同步开放了“全语种ASR语料库”（Omnilingual ASR Corpus），该数据集包含350种代表性不足语言的转录语音样本，采用知识共享署名许可协议（CC-BY）供全球开发者与研究人员免费获取。此举旨在支持针对特定语言需求定制化开发语音识别模型。

系统核心创新在于“自带语言”（Bring Your Own Language）功能，该机制借鉴大型语言模型的上下文学习技术，允许用户通过提供少量语音-文本配对样本实现新语言适配。这种无需重新训练模型的技术路径，使得系统理论上可扩展至支持5400余种语言，远超当前行业水平。虽然极低资源语言的识别质量仍待提升，但已为缺乏技术支撑的语言社区提供了可行解决方案。

在技术开源方面，meta以Apache 2.0协议开放了Omnilingual ASR全部模型代码，配套数据集则采用CC-BY协议。模型家族提供从3亿参数的轻量级版本到70亿参数的高精度版本，适配从移动设备到云端服务的多样化场景需求。所有模型均基于FAIR自主研发的PyTorch框架fairseq2构建，为开发者提供了灵活的技术基础。

更多>同类资讯

吉利银河V900广州车展惊艳亮相，以全能实力开启豪华MPV新篇章

11-23

广州车展观察：华为生态崛起、合资反攻，车展与车媒的变局与新生

11-23

上汽荣威广州车展发力，荣威M7 DMH携豆包AI车机惊艳登场

11-23

别克至境世家广州车展惊艳登场携“五恒”座舱开启MPV健康出行新纪元

11-23

AMD苏姿丰力挺AI投资：当下无需忧虑泡沫，投资不足风险更大

11-23

Gemini 3登场：Google以技术利刃，开启全球AI竞争新篇章

哈萨比斯不仅是技术的信徒，更是Google AI复兴的操盘手，他在学术与商业的夹缝中，为Google杀出了一条血路。 Gemini 3的发布，宛如一颗恒星在AI宇宙中引爆，其产生的引力波——「万象天引」，正无…

11-23

猎聘2025年Q4招聘趋势洞察：行业需求、人才流向与市场新动向

《2025年Q4招聘趋势调研报告》基于猎聘大数据及企业调研，全面剖析了该季度宏观经济背景下劳动力市场与招聘领域的态势，核心内容总结如下：招聘渠道以招聘平台为主导，企业普遍面临中高端人才、技术人才招聘难的问…

11-23

中国铁塔湖北深耕：筑牢数字底座赋能5G+工业互联网新发展

湖北日报讯（记者李朝霞、刘宇、通讯员何述锋、周晓）11月22日，2025中国5G+工业互联网大会开幕式在武汉举办。开幕论坛上，中国铁塔股份有限公司总经理陈力介绍，中国铁塔在湖北已累计承建通信基站21.2万个…

11-23

英特尔携手视源股份发布优化套件，Windows IFPD书写延迟降至50毫秒

IT之家 11 月 23 日消息，在本周于重庆举办的 2025英特尔行业解决方案大会上，英特尔与以交互显示、人工智能为核心的企业视源股份（CVTE）联合发布了英特尔触摸书写优化套件及成功落地的产品。这一解…

11-23

IEEE IARCE 2025在潼南举办共探前沿技术赋能区域产业高质量发展

会议由重庆邮电大学主办，重庆电力高等专科学校、中国自动化学会智能分布式能源专业委员会等单位承办，设置主题演讲、平行会议、小组讨论等议程。作为会议承办方，重庆电力高等专科学校深耕自动化和控制领域产学研用融合…

11-23

丽水经开区“AI+非现场监管”上线，守护网络餐饮“舌尖安全”

日前，丽水经济技术开发区市场监管分局顺应数字化转型趋势，全面启用网络餐饮“AI+非现场监管”智治系统，以科技手段创新监管模式，实现从“人防”到“技防”的跨越，全力守护市民“舌尖上的安全”。当前，丽水经开区网…

11-23

东风锚定100万辆新能源销量目标科技创新赋能湖北汽车产业升级

11-23

广州车展宝马集团火力全开，超20款车型及新技术集群展现未来出行新方向

11-23

广州车展见证革新：中国长安汽车智能生态，开启未来出行新画卷

11-23

吉利银河V900全球首秀：AI增程+超大空间，能否在高端MPV市场突围？

11-23

点击查看更多 +

全站最新

坦克品牌携全系车型闪耀广州车展硬核实力与文化魅力共筑越野新潮流

岚图梦想家山河上市，70.99万开启全球最安全超混四座MPV新篇

广汽昊铂A800广州车展首秀，携手华为打造360度全天候感知矩阵

比亚迪汉L唐L焕新登场：硬核技术赋能，东方美学加持，开启高端出行新体验

广州车展观察：华为生态崛起、合资反攻，车展与车媒的变局与新生

上汽荣威广州车展发力，荣威M7 DMH携豆包AI车机惊艳登场

热门内容

本栏最新

上汽荣威广州车展发力，荣威M7 DMH携豆包AI车机惊艳登场

别克至境世家广州车展惊艳登场携“五恒”座舱开启MPV健康出行新纪元

猎聘2025年Q4招聘趋势洞察：行业需求、人才流向与市场新动向

东风锚定100万辆新能源销量目标科技创新赋能湖北汽车产业升级

广州车展宝马集团火力全开，超20款车型及新技术集群展现未来出行新方向

广州车展见证革新：中国长安汽车智能生态，开启未来出行新画卷

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.