滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

苹果携手人大创新突破：VSSFlow模型实现无声视频一键生成逼真音效与语音

时间：2026-02-10 15:17:58 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

苹果公司与中国人民大学联合研发的VSSFlow人工智能模型，近日在音频生成领域实现重大突破。该模型通过创新性的技术架构，成功解决了传统方案中环境音效与语音生成难以兼顾的难题，能够在单一系统内同时生成与视频画面高度匹配的背景音和清晰人声。

传统音频生成技术存在显著短板：视频转声音模型（V2S）虽能捕捉环境声却难以生成清晰语音，文本转语音模型（TTS）虽可输出标准人声却无法处理复杂环境噪音。此前行业普遍采用分阶段训练方案，将两类模型串联使用，但这种架构不仅增加系统复杂度，更因任务冲突导致性能损耗。VSSFlow团队通过10层神经网络架构与"流匹配"技术的结合，使模型具备从随机噪声中自主重构目标声音信号的能力。

研发过程中，团队意外发现联合训练带来的协同效应。当模型同时接触包含环境音的视频、带字幕的说话视频及纯文本语音数据时，语音训练数据显著提升了环境音效的生成质量，而环境音效数据则优化了语音的自然度。这种数据融合训练方式，使模型能够精准区分不同声音元素的生成逻辑。

在实际运行中，VSSFlow采用双轨处理机制：以每秒10帧的速率提取视频中的视觉特征作为环境音效生成依据，同时通过文本脚本解析控制语音输出的内容与节奏。这种设计使模型既能生成雨声、脚步声等细节丰富的环境音，又能保持对话语音的清晰度和情感表达。

第三方测试数据显示，VSSFlow在环境音自然度、语音清晰度、音画同步率等核心指标上，均超越专门针对单一任务设计的竞品模型。目前研发团队已将完整代码开源至GitHub平台，并正在筹备模型权重公开及在线演示系统的开发工作。这项技术有望为影视制作、游戏开发、虚拟现实等领域提供更高效的音频生成解决方案。

更多>同类资讯

具身智能机器人保险新突破：首批理赔落地，产业配套逐步完善

“在具身智能机器人第三方评估和维修机构体系尚未完全成熟的阶段，由保险公司与主机厂协同开展损失确认，是当前机器人保险定损的重要路径之一。” 据悉，擎天租与人保财险自2025年12月开始合作，推出覆盖“机器人本…

04-27

第九届宿州市青少年机器人竞赛落幕科技少年共赴创新盛宴

此次大赛是对宿州市青少年科技素养的一次综合检验，宿州市青少年宫一贯重视青少年科技素养的培育和发展，通过此类活动更好的搭建更多优质平台，鼓励青少年积极参与科创类活动，为培养具有独立创新精神和实际实践能力的新时代…

04-27

DeepSeek API输入缓存价格大跳水，Pro模型限时2.5折优惠来袭

04-26

捷达品牌焕新启航，智能电动转型加速，两年内将推四款新能源车型

04-26

地平线迈向汽车“操作系统层”：新角色能否获车企认可与市场验证？

04-26

GPT-5.5 Pro突破门萨智商门槛：AI认知革命加速，未来已来

04-26

OpenClaw适配DeepSeek-V4：国产大模型赋能智能体开发，重塑行业新格局

04-26

星闪数字车钥匙亮相北京车展 2026年量产规模或超百万台

04-26

荣耀AI生态新跨越：以人本理念驱动机器人走进消费级生活场景

04-26

四维图新北京车展亮剑携智能体数据方案探路移动智能体新赛道

04-26

BBA纯电新车齐聚北京车展，中国市场引领豪华品牌电动化新潮流

04-26

思想碰撞启新程荣耀加冕展风采：未来论坛与颁奖礼共绘车展华章

04-26

北京车展长安双车齐发：蓝鲸超擎混动加持，油耗动力双升级

04-26

力合科创刘仁辰：AI时代聚焦人才与“小切口”，共探产业新未来

04-26

AI算力混战中，宏景科技凭三大法宝逆袭，斩获高额订单前景可期

04-26

点击查看更多 +

全站最新

华为余承东“自我反思”：做车曾重安全品质轻外观，现颜值实用两手抓

马自达2今夏日本停产紧凑型轿车遇冷市场格局生变？

枪声打断白宫记者晚宴！特朗普紧急撤离后发声：必须解决分歧

7岁“老小米”车展追星雷军，对超跑参数了如指掌，雷军赞其懂车弟

枪声打断白宫记者晚宴！特朗普紧急撤离后发声：必须解决分歧

热门内容

本栏最新

思想碰撞启新程荣耀加冕展风采：未来论坛与颁奖礼共绘车展华章

东风汽车“东方风起2030”：体系化布局引领产业升级新征程

国家超算互联网携手DeepSeek-V4 开启百万上下文对话普惠新篇章

2026北京车展红旗全矩阵登场：技术自研+生态共创开启中式豪华新篇章

东风汽车2026北京车展展宏图：“东方风起2030”引领未来出行新方向

特斯拉中国辟谣小型SUV开发计划强调战略重心转向AI与自动驾驶领域

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.