滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

小米AI实验室推出ZipVoice系列模型零样本语音合成技术实现新突破

时间：2025-09-12 20:18:22 来源：凤凰网科技编辑：快讯团队 IP：北京 发表评论无障碍通道

小米集团AI实验室新一代Kaldi团队近日宣布，推出基于Flow Matching架构的ZipVoice系列语音合成模型，包含面向单说话人的ZipVoice零样本模型与专为对话场景设计的ZipVoice-Dialog模型。这两款模型通过架构创新，在语音合成的效率与质量上实现了突破性进展。

针对传统零样本语音合成模型普遍存在的参数量庞大、推理速度迟缓等问题，ZipVoice通过优化模型结构，在显著降低参数规模的同时，将合成效率提升至行业领先水平。实验数据显示，该模型在说话人相似度（SIM-o）、词错误率（WER）、UTMOS等三项客观指标，以及CMOS、SMOS两项主观评价指标上，均达到当前零样本语音合成技术的最优水准，实现了"小体积、高精度"的平衡。

面向对话场景的ZipVoice-Dialog模型则攻克了多说话人切换的技术难题。该模型突破了传统对话语音合成在稳定性和实时性方面的限制，能够在单句文本中精准还原不同说话人的音色特征，并实现自然流畅的语音切换。这种技术特性使其成为AI播客、智能客服等需要多角色语音交互场景的核心支撑。

与单说话人语音合成相比，对话语音合成需要同时处理音色分离、语音过渡、情感表达等多重挑战。ZipVoice-Dialog通过创新的Flow Matching架构，在保持低参数量的前提下，实现了对话场景下语音合成的稳定性和自然度，为动态对话内容的语音生成提供了高效解决方案。

据团队介绍，ZipVoice系列模型已通过多维度测试验证，其轻量化设计使部署成本降低40%以上，推理速度提升2-3倍。该技术成果不仅推动了语音合成领域的技术演进，更为实时语音交互类应用开辟了新的发展空间。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

苹果Apple Watch“高血压通知”功能获FDA批准，下周起多地市场上线

09-12

西贝全国门店今起推“罗永浩菜单”：可自由点选，享“不好吃不要钱”及后厨参观两大承诺

09-12

线下恋综成新宠：年轻人以趣味社交解锁脱单与交友新体验

09-12

巨星传奇携手宇树科技推出“巨星狗” 浅色调亲和外形融合可爱与科技

09-12

于东来发文致谢西贝海底捞：于纷繁中觅得放心可口之味

09-12

罗永浩微博晒图：西贝等连锁餐饮预制菜占比超八成引关注

09-12

贾国龙回击罗永浩遭质疑：舆论场不该“预制”必胜，消费者应有知情权

09-12

罗永浩西贝“预制菜之争”后：实地探访西贝后厨，外卖订单锐减收入减半

09-12

法拉第未来反击做空报告：内容严重失实，已采取多项法律措施维权

09-12

鸿蒙智行2026年产品矩阵大扩容：五界齐发新车，高端市场格局或重塑

09-12

Canalys报告：2025年折叠屏新机频发，2026年或成市场增长重要转折点

09-12

华为第五届“奥林帕斯奖”揭晓百万奖金激励全球科研攻克AI存储难题

09-12

深圳罗湖海关：一名进境旅客神色紧张，背包及衣物内藏40台旧苹果iPod touch

09-12

诺基亚与HMD再携手，新版NOKIA Logo加持，Mission-Safe手机规格性能全揭秘

09-12

男子擅拍未上市问界M9内饰并恢复发布，法院认定侵权判赔25万余元

09-12

点击查看更多 +

全站最新

新款领克08 EM-P开启预售，外观微调配激光雷达，动力续航均有新看点

吉利中国星东方曜系列：文化科技交融，重塑燃油车价值，引领中国品牌突围

车长超5米的中大型插混轿跑！领克10 EM-P限时16.38万起，智能化配置拉满

2026款腾势N9定档9月17日上市！携手高圆圆，以安全智能解锁多元生活新体验

26款深蓝S07实车到店！华为智驾+自适应悬架加持，配置升级售价15.69万起

10.99万起售！捷途X70L设计似“小路虎”，配置动力双在线

热门内容

本栏最新

科技安全新标杆！2026款腾势N9 9月17日上市，高圆圆代言共赴豪华出行

钛7聚焦“而立少年”需求，方程豹以生态之力推动方盒子成主流之选

iPhone 17系列发布后热度飙升，京东平台预约量已突破343.4万大关

老罗“炮轰”西贝预制菜，西贝破防：这闹剧背后是价格与实惠的较量

西贝贾国龙“硬刚”罗永浩，CEO冲动对线，企业该不该被卷入舆论战？

阿里通义团队开源Qwen3-Next：混合架构+极致稀疏MoE，推理性价比飙升

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.

小米AI实验室推出ZipVoice系列模型 零样本语音合成技术实现新突破

小米AI实验室推出ZipVoice系列模型零样本语音合成技术实现新突破