滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

小米MiMo-V2.5再升级：TTS系列精细控声 ASR开源应对复杂场景

时间：2026-04-24 10:22:35 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

小米技术团队在完成MiMo-V2.5系列大模型公测后，迅速推进语音技术生态建设，于近日同步推出MiMo-V2.5-TTS语音合成与MiMo-V2.5-ASR语音识别两大子系统，构建起覆盖语音输入输出的完整技术链条。此次发布的语音解决方案包含六项核心突破，其中TTS系统通过创新的声音控制机制重新定义了语音交互体验。

在语音合成领域，新发布的TTS系列包含三个差异化模型。基础版MiMo-V2.5-TTS集成超过20种专业级音色库，用户可直接调用包含新闻播报、客服对话等场景的预设音色，同时支持通过自然语言指令动态调整语速、音高及情感强度。创新模型MiMo-V2.5-TTS-VoiceDesign突破传统音色生成模式，仅需输入"30岁女性，温柔知性"等文本描述即可自动生成全新音色，整个过程无需提供任何音频样本。针对高精度复刻需求，MiMo-V2.5-TTS-VoiceClone模型展现出强大实力，通过分析3-5秒的参考音频，不仅能完美复现原声特征，还可保持对情感指令的响应能力，官方测试中成功实现了"愤怒中带着哭腔"等复合情绪表达。

语音识别系统MiMo-V2.5-ASR则聚焦复杂场景适应性，其开源版本已支持包括吴语、粤语在内的8种中文方言识别，在中英文混合对话场景中准确率突破92%。针对嘈杂环境，模型通过引入多模态降噪算法，在80分贝背景噪音下仍保持85%以上的识别精度。特别设计的多人对话模式可自动区分说话人，并实时生成带标点符号的转写文本，经实测在4人交叉对话场景中，端到端响应延迟控制在300毫秒以内。

技术实现层面，TTS系统采用分层声学编码架构，将音色特征与内容表达解耦处理，既保证音色生成质量，又提升情感控制的响应速度。ASR系统则创新性地融合了自监督学习与流式处理技术，通过40万小时多模态数据训练，使模型具备上下文语义理解能力。开发者可通过GitHub及HuggingFace平台获取ASR系统的完整代码与预训练权重，TTS系列则已在小米自主研发的MiMo Studio平台开放在线体验通道。

据技术文档披露，小米后续研发将聚焦两大方向：一是拓展音频生成维度，开发支持环境音效与音乐创作的通用音频模型；二是深化语义理解能力，构建可处理长文本上下文的记忆机制。此次发布的语音系统已与小米智能生态完成初步对接，预计将在智能客服、车载语音、无障碍交互等领域率先落地应用。

更多>同类资讯

新款福特探险者7月6日上市！外观内饰升级，2.3T+10AT实力不凡

07-03

FSD清白了特斯拉致命车祸司机人为超速、被控过失杀人

07-03

快手获投资者20.28亿美元注资，投后估值180亿美元

07-03

扎克伯格：AI智能体发展慢于预期

07-03

小米18定了，这回要掀桌子了

07-03

谷歌Snapseed 4.0.8修图应用发布帮你对齐拍摄画面

07-03

大疆国内诉影石，新案即将开庭

07-03

Meta悄然上线AI社交应用Pocket，用户可创作分享互动小游戏gizmo

07-03

快手可灵AI获超20亿美元注资未来12个月内或启动赴港上市程序

07-03

奇点前夕：顶尖头脑齐聚上海，共探Physical AI未来路径

07-03

阿里云AI原生数据库Databridge Agent将于2026年8月1日起开启商业化收费模式

07-03

SemiAnalysis：Meta算力布局“野心勃勃”，多路径变现打破“过剩”质疑

07-03

大疆国内再诉影石专利侵权深圳中院8月3日将开庭审理

07-03

Meta扎克伯格：AI智能体发展未达预期，迈向超级智能仍需持续投入时间

Meta 近期一次内部战略调整，反映该公司的 AI 战略正面临两难境地。扎克伯格及其团队正全力竞逐 AI模型的开发，并投入数百亿美元建设基础设施、招聘人才。据一位参会员工透露，扎克伯格仍在大会上告诉员工…

07-03

不向供应链低头！Meta联手台积电美光让新服务器用上旧内存

07-03

点击查看更多 +

全站最新

优必选“机器人伴侣”引热议：高售价订单火爆，是噱头还是新趋势？

京东与CIHE中国国际耳机展组委会达成深度合作共拓音频消费新未来

五常大米凭何领跑品牌赛道？自然馈赠科技赋能农文旅融合铸就传奇

韩红风波背后：公益信任受冲击，电影票房遭波及，道歉能否平息舆论？

7月SUV市场大动作！5款热门车型价格即将揭晓车友速来围观

特斯拉二季度交付48.01万辆远超预期储能业务与上海工厂成增长双引擎

热门内容

本栏最新

京东与CIHE中国国际耳机展组委会达成深度合作共拓音频消费新未来

五常大米凭何领跑品牌赛道？自然馈赠科技赋能农文旅融合铸就传奇

韩红风波背后：公益信任受冲击，电影票房遭波及，道歉能否平息舆论？

7月SUV市场大动作！5款热门车型价格即将揭晓车友速来围观

鸿蒙智行车道级导航未生效引关注官方：ADS 5.0版本将开放该功能

抖音电商上线“肖像保护功能” 协同治理AI侵权守护电商生态安全

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.