滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

小米MiMo-V2.5语音大模型来袭：TTS合成与ASR识别双突破，开启Agent时代新体验

时间：2026-04-24 09:49:25 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

小米公司今日宣布推出面向智能体时代的全链路语音模型系列——MiMo-V2.5-TTS Series与MiMo-V2.5-ASR。该系列模型突破传统语音技术局限，通过整合语音合成与识别两大核心能力，构建起覆盖输入输出全流程的智能化语音交互体系，为智能设备赋予更自然的人机对话能力。

在语音合成领域，MiMo-V2.5-TTS Series包含三款创新模型。基础版MiMo-V2.5-TTS搭载数十种专业级音色库，支持语速、情感、语调等12维参数的精细调控，可满足有声读物、智能客服等场景需求。VoiceDesign版本通过自然语言指令即可生成全新音色，用户仅需描述"温柔女声"或"沧桑男声"等特征，系统即可在30秒内完成音色建模。VoiceClone版本则突破性实现小样本音色克隆技术，仅需5分钟音频样本即可复现目标音色，同时保持98%的风格指令遵循率。

该系列模型独创的分层指令系统引发行业关注。在处理复杂创作需求时，用户可提交包含角色设定、场景描述、对话指导的三级结构化文本，模型能精准识别各层级指令并动态组合输出。例如在游戏NPC配音场景中，系统可同时保持角色音色统一性与单句表演独立性。更值得关注的是其音频标签技术，允许在文本中嵌入类似"[愤怒][加快语速]"的标记，实现帧级语音控制。

语音识别模型MiMo-V2.5-ASR选择开源路线，其核心技术突破体现在复杂场景适应能力。经实测，该模型在强噪声环境下（信噪比-5dB）仍保持89%的识别准确率，在吴语、粤语等8种方言混合对话场景中错误率低于12%。特别针对中英混合语料（Code-Switch）优化后，模型可自动识别语种切换点，无需预先标注即可实现流畅转录。在专业领域测试中，古诗词、医学术语等知识密集型内容的识别准确率达到94.7%。

技术白皮书显示，ASR模型采用多模态预训练架构，通过融合声学特征与语义信息，在AMI会议数据集上取得14.2%的词错率，刷新行业纪录。其独创的动态标点系统可结合语音停顿与语义逻辑自动插入标点，后处理效率提升60%。目前该模型已支持实时流式识别，端到端延迟控制在300ms以内。

开发者生态建设方面，小米开放平台提供双重接入方案：TTS系列三款模型在MiMo API平台提供限时免费调用服务，配套上线的MiMo Studio可视化工具支持零代码语音创作；ASR模型则通过GitHub开源代码与模型权重，提供PyTorch实现框架及预训练检查点。文档中心显示，当前已有超过2.3万开发者注册使用相关服务，日均处理语音数据量突破1.2PB。

更多>同类资讯

国产GPU独角兽象帝先冲刺IPO

4月22日，象帝先官方微信公众号宣布，国产GPU厂商象帝先计算技术(重庆)有限公司已与国内头部券商中信建投证券正式签署财务顾问协议，全面启动IPO上市前各项准备工作。双方将围绕公司治理优化、财务规范、内部控制、信息披露等维度展开系统化梳理与建设，助推象帝先完成

04-24

GPT-5.5发布：从“答题能手”到“工作搭子”，AI融入实际流程再进一步

04-24

在AI浪潮中，以人性为帆助孩子驶向独一无二的未来彼岸

当一个普通的AI Agent能在几秒钟内写出完美的商业计划书、生成复杂的代码，甚至分析医疗影像时，当Anthropic公司不断提供最专业的工作平台，从编写代码到设计界面，连曾经被认为极具创造力的UI/UX设…

04-24

2026北京车展：拆解版小米SU7登场，展现科技与工艺的深度融合

04-24

Perplexity CEO：AI发展强化iPhone地位，个人数据成苹果关键优势

04-24

大疆Pocket 4“双机”出击：精准分层用户，开启生态闭环新征程

04-24

OpenAI推出GPT-5.5：性能提升显著，向“超级应用”目标再进一步

04-24

北京车展启幕在即小米白色Vision GT概念跑车亮相前夕准备就绪

04-24

雷军4月24日亲临北京国际车展现场讲解引观众关注热潮

04-24

HappyHorse模型4月27日开放测试定价出炉较Seedance2.0更具价格优势

04-24

英特尔Q1业绩亮眼股价大涨，数据中心与先进封装成增长新引擎

04-24

月活3.45亿的豆包放大招！送MacBook抢电脑端入口，学霸也内卷？

04-24

REDMI双旗舰亮相，天玑9500赋能开启性能与体验全维度新境界

两款新品均搭载联发科天玑 9500 旗舰移动平台，在核心性能释放、高负载场景稳定性与全场景使用体验上，都展现出了强悍的实力。无论是主打极致手游体验的 REDMI K90 Max，还是强调便携与高性能兼得的 …

04-24

特斯拉Terafab牵手英特尔背后：台积电三星无暇顾及，无奈之选？

04-24

东风汽车携手火山引擎共探AI汽车领域开启智慧出行新篇章

04-24

点击查看更多 +

全站最新

余承东放话：全新问界M9引领技术跨越汽车同行难望其项背

凯迪拉克凯威德2026年4月22日上市完善纯电矩阵剑指大型SUV市场

东风汽车携手火山引擎共探AI汽车领域开启智慧出行新篇章

东风1500伏高压快充技术突破：5分钟补能超400公里，未来应用场景更广阔

东风汽车携手火山引擎，共探AI汽车领域，加速豆包大模型融合创新

2026北京国际车展明日启幕：两馆联动，国内外汽车品牌齐聚共绘智行新篇

热门内容

本栏最新

在AI浪潮中，以人性为帆助孩子驶向独一无二的未来彼岸

东风汽车携手火山引擎共探AI汽车领域开启智慧出行新篇章

东风汽车携手火山引擎，共探AI汽车领域，加速豆包大模型融合创新

特斯拉Cybercab量产启动，自动驾驶新征程开启，Robotaxi商业化提速

小红书朱舜杰：智驾平权时代，汽车破局新动能聚焦“具体的人”

宝马三款新车全球首秀：深度融合中国科技生态，智能豪华体验再升级

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.