滚动资讯

当前位置：首页 > 资讯 > 智能汽车 > 正文内容

中国AI语音新突破！ViiTorVoice首创局部编辑，开启语音创作新时代

时间：2026-07-02 14:01:14 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

中国AI语音领域迎来重大突破，一款名为ViiTorVoice的模型在全球权威评测榜单Seed-TTS上力压群雄，以综合排名第一的成绩惊艳亮相。这一成就标志着中国在语音合成技术领域实现了里程碑式的跨越，为全球语音技术发展树立了新的标杆。

在评测中，ViiTorVoice展现出惊人的性能指标：英文词错率低至1.32%，中文词错率更是突破性地降至0.99%。这一数据不仅刷新了行业纪录，更使其成为全球首个中文词错率突破1.0大关的语音模型。该模型由国内科技公司云上曲率自主研发，其核心优势在于解决了长期困扰行业的语音局部编辑难题。

传统语音合成技术存在明显局限，一旦生成语音内容需要修改，往往需要重新录制整段音频。ViiTorVoice的创新之处在于实现了片段级精准编辑，用户可以单独修改某个词汇或语句片段，而无需影响音频的其他部分。这项技术突破使得语音修改变得如同编辑Word文档般便捷，彻底改变了内容创作、广告营销等领域的生产流程。

实测数据显示，该模型在语音克隆和情感表达方面同样表现卓越。研发团队通过创新性的非自回归（NAR）架构，使模型能够同时捕捉音频前后文信息，确保修改后的语音在音色、节奏、情感衔接等方面与原音频保持高度一致。这种技术路径类似于"完形填空"机制，通过精准填补需要修改的音频片段，实现无缝衔接的编辑效果。

在具体应用场景中，ViiTorVoice展现出强大的适应能力。测试人员用该模型重新制作了包含知名运动员哈兰德和姆巴佩的广告音频，修改后的语音不仅完美保留了原声的独特音质，更在呼吸节奏、重音分布等细节上达到专业级水准。特别是在将姆巴佩的广告语"补水啦"植入汽车广告时，模型成功实现了魔性语调与严肃旁白的自然融合，创造出令人捧腹的喜剧效果。

该模型的技术架构具有显著优势。相比传统自回归模型存在的推理延迟高、长文本易出错等问题，ViiTorVoice采用的非自回归架构可同时生成所有时间点的语音标记，将首帧延迟压缩至60毫秒以内。通过深度优化推理结构和算子设计，配合一致性蒸馏技术将推理步骤大幅减少，模型在保持高性能的同时实现了极低的计算成本。

在语音情感控制方面，ViiTorVoice引入了创新的副语言感知技术。通过插入特殊标记，模型能够精准控制笑声、叹气等情感表达，甚至可以区分不同强度的愤怒情绪。这种词级别的精细控制能力，源于团队将图像生成领域的CFG技术成功迁移至音频领域，通过双路径推理机制显著提升了情感表达的自然度和准确性。

针对跨语种语音克隆难题，ViiTorVoice开发出无参考文本克隆技术。传统方法需要提供准确的文字内容作为参考，而该模型通过直接分析音频声学特征，即可提取说话人的音色特征并应用于多种语言生成。这项突破性技术为短剧出海、游戏配音等领域提供了高效解决方案，目前已有多家头部企业将其应用于实际生产环境。

为推动技术生态发展，研发团队已开源10亿参数规模的模型版本，包含完整的本地化组件。开发者可在GitHub和Hugging Face平台获取模型代码，自由探索语音克隆、局部编辑和情感控制等创新应用。这一开放策略将加速语音技术的普及，为内容创作者提供前所未有的创作自由度。

更多>同类资讯

长安汽车2026上半年成绩亮眼：海外与新能源交付双增长，多品牌齐发力

07-02

理想再调组织架构：产品部职能拆分融入研发加速产品决策效率提升

07-02

李斌北大毕业典礼深情分享：人生低谷是成长阶梯忠于内心方见光明

07-02

汽车充电桩选型全攻略：从技术参数到售后支持的多维度解析

07-02

宝马创新电池回收体系：数字赋能全链路，退役电池实现100%绿色重生

07-02

换机油后油耗飙升？90%车主易踩的两大误区，教你轻松避开！

07-02

丰田5月在华销量暴跌超三成燃油车成最大拖累

07-02

通用汽车与美光签存储长协，应对AI数据中心需求激增下的芯片供应挑战

07-02

上汽智己LS9 Hyper 7月16日登场，全线控转向+3秒级加速重塑大SUV体验

07-02

海豹08登场！比亚迪以深厚技术储备，精准回应市场多元需求

07-02

阿维塔获L3测试牌照智能驾驶加速落地 2030年Robotaxi市场前景广阔

07-02

摩托古兹破局之作：457cc并列双缸配“单侧”减震，能否重焕新生？

07-02

全球唯一法拉利Enzo设计原型亮相普陀邀市民共赏工业设计之美

07-02

大众ID. Tiguan谍照来袭！造型进化技术升级，或成ID系列新热门之选

07-02

比亚迪6月汽车销量超40万辆，同比增长5.46%

07-02

点击查看更多 +

全站最新

汽车充电桩选型全攻略：从技术参数到售后支持的多维度解析

宝马X5纯电版iX5 60 xDrive登场：续航700公里，配置升级价格“卷”出新高度

自驾旅行必备！车载汽油发电机给锂电池充电全流程指南来啦

技术赋能与人文坚守：杨君媒介理论三次跃迁下的传播范式革新

红旗天工08改款预售：智能化升级，17.98万剑指20万级纯电SUV市场

苏宁易购：从疯狂扩张到断臂求生，历经波折后终踏上回归原点之路

热门内容

本栏最新

汽车充电桩选型全攻略：从技术参数到售后支持的多维度解析

宝马创新电池回收体系：数字赋能全链路，退役电池实现100%绿色重生

换机油后油耗飙升？90%车主易踩的两大误区，教你轻松避开！

上汽智己LS9 Hyper 7月16日登场，全线控转向+3秒级加速重塑大SUV体验

海豹08登场！比亚迪以深厚技术储备，精准回应市场多元需求

摩托古兹破局之作：457cc并列双缸配“单侧”减震，能否重焕新生？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.