ITBear旗下自媒体矩阵:

小米发布全链路语音大模型 MiMo-V2.5,TTS 可“一句话生成新音色”,ASR 开源支持方言与多语混说

   时间:2026-04-24 11:45:58 来源:CHINAZ编辑:快讯 IP:北京 发表评论无障碍通道
 

当 AI 语音不再只是“能听会说”,而是能像导演一样精准调度情绪、语气甚至角色身份,人机交互的自然度正迈入新纪元。小米今日正式推出MiMo-V2.5全链路语音模型系列,包含三款 TTS(语音合成)模型与一款开源 ASR(语音识别)模型,全面覆盖 Agent 时代的语音输入与输出需求,让声音真正成为可编程、可创作、可复刻的智能媒介。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version