当 AI 语音不再只是“能听会说”,而是能像导演一样精准调度情绪、语气甚至角色身份,人机交互的自然度正迈入新纪元。小米今日正式推出MiMo-V2.5全链路语音模型系列,包含三款 TTS(语音合成)模型与一款开源 ASR(语音识别)模型,全面覆盖 Agent 时代的语音输入与输出需求,让声音真正成为可编程、可创作、可复刻的智能媒介。
当 AI 语音不再只是“能听会说”,而是能像导演一样精准调度情绪、语气甚至角色身份,人机交互的自然度正迈入新纪元。小米今日正式推出MiMo-V2.5全链路语音模型系列,包含三款 TTS(语音合成)模型与一款开源 ASR(语音识别)模型,全面覆盖 Agent 时代的语音输入与输出需求,让声音真正成为可编程、可创作、可复刻的智能媒介。




