滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

面壁智能联合清华研发VoxCPM语音模型，高效生成自然流畅音频且支持方言

时间：2025-09-18 20:01:26 来源：财闻编辑：快讯团队 IP：北京 发表评论无障碍通道

面壁智能与清华大学深圳国际研究生院人机语音交互实验室（THUHCSI）联合研发的语音生成基座模型VoxCPM正式开源，其参数规模仅为0.5B，已在GitHub、Hugging Face等平台向全球开发者开放。这款端到端扩散自回归模型突破了传统语音合成技术路径，通过融合层次化语言建模与局部扩散生成架构，实现了从文本到连续语音表征的高效转换。

区别于CosyVoice、FireRedTTS等采用离散声学词元处理的方案，VoxCPM创新性地采用连续表征端到端TTS技术。该模型可直接解析输入文本，实时流式生成高质量音频片段，在单张NVIDIA RTX 4090显卡上实现RTF≈0.17的推理速度。权威评测显示，其在Seed-TTS-eval榜单的相似度、词错误率等核心指标均达到行业顶尖水平。

模型具备强大的文本理解能力，可自主适配不同场景的语音特征。无论是模拟天气预报员的规范播报、历史英雄的激昂演讲，还是还原方言主播的特色腔调，均能通过调整韵律参数实现精准还原。特别在中文处理方面，模型突破性地支持数学公式、特殊符号的语音合成，同时提供音素级标记替换功能，允许用户自定义读音修正。

技术团队介绍，VoxCPM通过扩散生成机制与语言模型的深度耦合，显著提升了语音输出的自然度与稳定性。其流式输出能力理论上支持无限长度音频的实时生成，为智能客服、有声读物、教育辅导等场景提供了新的技术解决方案。目前开源版本已包含完整的训练代码与预训练权重，开发者可基于现有框架进行二次开发。

更多>同类资讯

英伟达50亿美元入股英特尔，携手共研PC与数据中心芯片

09-18

俄航天局长：12月发射首批互联网卫星两年内全面部署挑战“星链”

09-18

华为全联接大会2025：昇腾950系列芯片性能升级，960芯片2027年Q4将登场

09-18

华为通用计算领域再发力，鲲鹏920、950、960芯片未来数年规划路线曝光

09-18

餐饮“表演化”浪潮：是流量密码还是昙花一现？

09-18

从东南亚到欧美：中国茶饮品牌扬帆海外，开启全球消费新体验

09-18

ChatGPT负责人谈GPT-4o下架：未顾及用户感受致失误，将优化模型人格

09-18

谷歌称广告拦截器致YouTube观看数据失真，或促创作者劝观众弃用

09-18

张文翊跨界履新：从亚马逊云科技大中华区负责人到Visa大中华区要职

09-18

无人机智能巡检：为光伏电站运维注入新活力，开启高效安全新篇章

无人机智能巡检系统集成了自主飞行、智能识别、精准定位等先进功能，实现了巡检作业的全面智能化。在具体应用过程中，无人机搭载红外摄像设备，可精准识别光伏组件的异常热斑。无人机巡检系统通过热成像技术，能够快速定…

09-18

Meta Connect大会发布AI智能眼镜Meta Ray-Ban Display，799美元起售配神经腕带

9月18日，一年一度的Meta Connect大会盛大召开，Meta CEO扎克伯格将发表主题演讲。会上，Meta宣布推出AI智能眼镜MetaRay-Ban Display，售价799美元，将于9月30日…

09-18

我国科研团队攻克难关研发“神经蠕虫”电极开启生物电子接口新范式

这项技术标志着生物电子接口（脑机接口、人机接口）从静态走向动态、从被动记录走向主动智能探测的范式转变。当前植入式电极均为“静态”的，植入后只能固定位置、局限采集，一定程度上制约了脑机接口的应用和未来发展。研究…

09-18

潍坊青州云门山景区：重载无人机助力施工突破地形难题提速增效

近日，潍坊青州市云门山景区在山顶三皇殿工程修复施工作业中，引入重载无人机调运物资，成功突破地形限制，施工效率显著提升。云门山景区副主任杨海云：“我们使用无人机往复运输建筑材料和建筑垃圾，每次运输一百公斤，单…

09-18

南京浦口中专学校新设无人机专业，产教融合助学子逐梦低空蓝天

南京浦口中等专业学校开设无人机应用技术五年制高职专业，重点培养学生在无人机技术应用方面的专业技能和操作技术，构建“政产学研”协同育人模式，深化“校研融合”，引入南航无人机研究院前沿技术标准，推动“引企入教”…

09-18

我国科研团队突破技术瓶颈成功研制新型氢负离子原型电池

中国科学院大连化学物理研究所陈萍研究员、曹湖军研究员、张炜进副研究员团队近日在氢负离子导体开发及应用方面取得重要进展，成功研发出新型氢负离子原型电池。基于上述新型氢负离子电解质材料，团队利用经典的储氢材料氢…

09-18

点击查看更多 +

全站最新

英伟达50亿美元入股英特尔，携手共研PC与数据中心芯片

英伟达与英特尔强强联手：50亿美元投资共拓AI与个人计算新未来

平头哥AI芯片PPU登上《新闻联播》，亮相次日阿里港股市值达3.02万亿港元

AI芯片新势力Groq再获53亿融资！一年估值翻倍，挑战英伟达地位

苹果iPhone 17及Pro系列预售新机开启发货，9月19日将正式与消费者见面

俄航天局长：12月发射首批互联网卫星两年内全面部署挑战“星链”

热门内容

本栏最新

Meta Connect大会发布AI智能眼镜Meta Ray-Ban Display，799美元起售配神经腕带

我国科研团队攻克难关研发“神经蠕虫”电极开启生物电子接口新范式

潍坊青州云门山景区：重载无人机助力施工突破地形难题提速增效

南京浦口中专学校新设无人机专业，产教融合助学子逐梦低空蓝天

我国科研团队突破技术瓶颈成功研制新型氢负离子原型电池

阿里通义DeepResearch开源来袭，博士难题轻松解，AI深度研究新典范

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.