ITBear旗下自媒体矩阵:

清华联合生数科技推出TurboDiffusion:AI视频生成速度实现飞跃式提升

   时间:2025-12-25 17:05:29 来源:ITBEAR编辑:快讯 IP:北京 发表评论无障碍通道
 

清华大学TSAIL实验室与生数科技联合研发的开源视频生成加速框架TurboDiffusion近日正式发布,该框架通过技术创新将端到端扩散模型的推理速度提升至原有水平的100到200倍,同时保持视频生成质量不变。这一突破性成果为高分辨率视频生成领域带来了显著效率提升,尤其适用于消费级硬件环境下的实时应用场景。

技术实现层面,TurboDiffusion采用双管齐下的优化策略。其核心创新包括SageAttention注意力机制与SLA稀疏线性注意力算法的协同应用,通过动态调整计算密度,将高分辨率视频处理时的算力消耗降低40%以上。另一关键突破在于rCM时间步蒸馏技术,该技术通过重构模型采样流程,在保持生成效果稳定性的前提下,将扩散模型的迭代次数减少至原有方案的1/10。

实测数据验证了该框架的卓越性能。在RTX 5090显卡环境下,针对Wan-2.1-T2V-1.3B-480P模型的测试显示,生成5秒视频的耗时从184秒压缩至1.9秒,加速倍数达97倍。对于参数规模更大的Wan-2.2-I2V-A14B-720P模型,原版1.2小时的生成时间被缩短至38秒,效率提升超过110倍。即便面对Wan-2.1-14B-480P这类重型模型,推理速度仍从27分钟优化至9.9秒,显著优于FastVideo等现有加速方案。

为满足不同硬件配置需求,开发团队提供了多版本优化方案。针对显存容量有限的消费级显卡(如RTX 4090/5090),量化版权重通过8位线性层量化技术,在保持98%以上精度的情况下将显存占用降低60%。而对于配备80GB显存的H100等专业级设备,非量化版本可充分发挥硬件性能,实现每秒生成25帧720P视频的极限效率。所有模型权重均已在GitHub平台开放下载,配套的硬件适配指南详细列出了不同场景下的参数配置建议。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version