滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

苹果与人大携手：VSSFlow模型突破传统，无声视频秒变有声精彩大片

时间：2026-02-10 09:06:17 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

苹果公司近日宣布，与中国人民大学联合研发的VSSFlow新型人工智能模型取得重大突破。这一创新成果成功打破传统音频生成技术的局限，通过单一系统即可从无声视频中同步生成逼真的环境音效与自然人声，为多媒体内容创作开辟全新路径。

传统音频生成领域长期存在功能割裂的困境：视频转语音模型（V2S）难以处理复杂语音细节，文本转语音模型（TTS）则无法捕捉环境声场特征。行业普遍采用的"分阶段训练"方案不仅增加系统复杂度，更因任务冲突导致性能衰减。VSSFlow通过10层架构设计与"流匹配"技术的创新融合，首次实现从随机噪声到目标声音信号的端到端重构。

研发团队在训练过程中意外发现联合训练的协同效应。实验数据显示，当同时输入环境音视频、字幕对话视频及纯文本语音数据时，模型展现出跨模态学习能力——语音训练数据显著提升环境音效的真实度，而环境声场信息则优化了语音的韵律表现。这种"数据互助"机制使模型在复杂场景下的表现尤为突出。

在实际应用中，VSSFlow采用双轨处理机制：以每秒10帧的速率提取视觉特征生成环境音效，同时通过文本脚本精准控制语音生成。这种设计使系统能够同步处理动态场景中的多重声源，无论是雨滴敲击窗棂的细微声响，还是多人对话的复杂声场，均可实现像素级的声音还原。

基准测试表明，VSSFlow在语音清晰度、环境真实度、多声源分离等核心指标上全面超越专项模型。其生成的音频样本在盲测中被专业人士误认为真实录音的比例达到87%，较传统方案提升42个百分点。目前研发团队已将核心代码开源至GitHub，并计划陆续公开预训练模型权重及在线演示平台。

这项突破不仅为影视后期制作、游戏开发等领域提供高效工具，更可能重塑虚拟现实、智能助手的交互范式。随着模型持续优化，未来用户或可通过简单视频输入，即可获得包含完整声效的沉浸式内容，大幅降低多媒体创作的技术门槛。

更多>同类资讯

全球首个人形机器人格斗联赛官宣 16强角逐千万纯金腰带

现场介绍，此次赛事以众擎机器人的人形机器人为标准竞技载体，进行开源开放、安全非暴力的赛事。据了解，众擎旗下的T800人形机器人于2025年12月发布，定价18万元起。值得一提的是，在2025科技风云榜年…

02-10

996在美国硅谷蔓延科学家警告：人真的会被拖垮

02-10

“不要对AI说谢谢”疯传实测多个大模型：放心大胆用

02-10

上海影院新探索：AI机器人“入职”，多元业态融合开启观影新体验

02-10

苹果系统更新路线曝光：iOS 26.4本月测试在即，iOS 27将深耕AI与系统优化

预计 iOS 26.4 版本将首次在真实系统中展示部分在 WWDC 2024 上承诺的个性化 Siri 功能以及其他一些改进。苹果 AI相关能力已经被期待了很长时间，而从目前的信息来看，iOS 26.4 …

02-10

6G技术初露锋芒：引领万物智联新潮流，开启未来通信新篇章

太赫兹频段的开辟犹如挖掘出了一条“信息高速公路”，能够满足未来全息通信、元宇宙等超高带宽需求；而通感一体化技术则让基站不仅能发信号，还能像雷达一样“感知”周围物体的位置和动作，为自动驾驶、健康监测等场景提供更…

02-10

极星广告嘲讽特斯拉：买电动车是选择什么征服火星吗

02-10

亚信科技与格思航天携手：星载First Call成功打通，共绘低轨卫星互联网新蓝图

02-10

SGS认证加持地平线机器人“智驾安全基座”达国际功能安全标准

02-10

时代智能携手地平线软硬协同共探新能源汽车智能化新路径

02-10

同济苑克花：以热爱为帆，在科研无人区破浪前行的耀眼征程

02-10

乐聚机器人携手上海机器人产业技术研究院共促人形机器人产业升级发展

02-10

蒙特利尔团队突破：动态语音编码，标记锐减语音依旧清晰流畅

02-10

浙大与蚂蚁集团联合创新：InftyThink+破解AI推理"长篇困境"难题

02-10

南京大学团队突破AI视频生成难题：路径校正技术让长视频稳定连贯

02-10

点击查看更多 +

全站最新

春节归家路迢迢，易至EV3 PLUS以安全舒适伴您畅行每一程

小米车主频遭恶意攻击，车企护权引深思，汽车领域偏见之风何时止？

从《Her》到现实：前百川智能联创焦可创业，用AI音频造主播开启新赛道

2026春节档9部影片来袭！豪华阵容多样题材，预售开启谁将成票房黑马？

科创板AI基金表现亮眼：国产AI芯片崛起，应用领域投资潜力持续释放

极氪主动召回3.83万辆车：以技术护航安全，用责任诠释担当

热门内容

本栏最新

时代智能携手地平线，软硬协同共探新能源汽车智能化新路径

寒假新体验！湖北省科技馆携手特斯拉，引领青少年探索科技新世界

科技豪华双引领！腾势D9三连冠重塑全球高端MPV市场新格局

时代智能携手地平线软硬协同探索新能源汽车完整智能化新路径

极映科技：AI重构物理仿真范式，工业创新“天花板”如何被击穿？

2025年我国互联网发展成果丰硕：网民超11亿生成式AI用户达6亿

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.