滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

北大北邮联合攻关：AI视频生成新突破，物理渲染解锁光影真实感

时间：2026-04-18 05:21:38 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在人工智能视频生成领域，一项名为LiVER的创新研究框架正引发广泛关注。这项由多所高校及科研机构联合完成的研究，通过将物理渲染技术与AI视频生成深度融合，为解决传统工具中常见的光照不协调问题提供了全新思路。研究团队构建的LiVER框架，通过引入基于物理的渲染机制，使生成视频的光影效果首次达到专业影视制作水准。

传统AI视频生成工具依赖海量数据训练，虽能模仿真实场景的视觉特征，却在处理光照效果时暴露明显短板。研究指出，现有模型生成的视频常出现金属无高光、玻璃无反射、阴影方向混乱等物理规律错误，尤其在处理多物体遮挡场景时，复杂的光影交互关系往往难以准确呈现。这种局限源于模型对光线传播原理的缺乏理解，仅能通过数据统计进行表面模仿。

LiVER框架的核心突破在于构建了"光照-几何-运动"解耦控制体系。研究团队创新性地采用三阶段处理流程：首先通过自然语言处理模块解析用户描述，自动生成包含物体布局、材质属性及摄像机轨迹的3D场景草图；随后利用Blender渲染引擎，基于物理光学规律计算漫反射、粗糙GGX和光泽GGX三种光照分量，形成包含精确光影信息的场景代理图像；最终将物理渲染结果与AI视频生成模型结合，生成既符合物理规律又具备艺术表现力的最终视频。

该框架的技术亮点体现在光照信息的分层表达机制。漫反射通道捕捉哑光表面的基础明暗关系，粗糙GGX通道处理半光滑材质的模糊高光，光泽GGX通道则精确呈现镜面反射效果。通过将三种光照分量分别编码为RGB通道，最终形成9通道的场景代理图像，这种设计使模型能够同时处理不同材质的光照特性，显著提升复杂场景的渲染精度。

在模型训练方面，研究团队构建了包含1.1万段视频的专用数据集LiVERSet。该数据集由真实拍摄视频与合成视频按1:1比例组成，其中合成部分通过程序化控制光源旋转角度（180°-240°随机变化），创造出真实数据中难以获取的动态光照场景。训练过程采用三阶段渐进式策略：先固定预训练视频模型参数，仅训练场景代理编码器；随后引入LoRA微调技术优化控制响应；最终混合真实与合成数据进行联合训练，使模型具备处理多样化光照条件的能力。

实验数据显示，LiVER在多项关键指标上表现优异。其生成的视频FVD评分达32.56，较对比方法提升15%-48%；光照误差SI-MSE低至0.04，显著优于其他模型；用户调研显示，83.4%的参与者认为其视频质量最佳，72.1%认可其摄像机控制精度。特别在光照动态变化场景中，LiVER能准确呈现高光位置随光源移动的物理效果，而传统方法生成的阴影方向则保持静态不变。

该研究还开发了可交互的创作流程。用户不仅可通过文字描述控制场景，还能将智能体生成的3D场景导入Blender进行二次编辑，调整物体位置、光源参数或摄像机轨迹后重新渲染场景代理。这种"AI生成+人工精修"的模式，既保证了创作效率，又为专业用户保留了精细控制空间。

尽管取得突破，研究团队也指出当前局限：自动生成的3D场景几何细节仍较粗糙，复杂结构的重建精度有待提升。未来改进方向包括优化场景重建算法、增强文字描述的解析能力，以及探索更高分辨率的视频生成技术。这项研究的完整技术细节已通过arXiv平台公开，为AI视频生成领域的研究人员提供了重要参考。

更多>同类资讯

三星电子调整家电生产策略：聚焦高端自主制造低利润产品外包

04-30

斑陌易行硅谷亮剑：T6无人车亮相，载重续航双优助力物流新变革

04-30

中国科大率先获批“商业人工智能”本科专业，2026年将迎首批学子

04-30

DeepSeek开启“识图模式”灰度测试图片理解功能迈入内测新阶段

04-30

大连云与AI大模型融合平台：破企业升级难题，铺就智能化发展新坦途

04-30

大连云与集团AI大模型融合平台：破行业痛点，促企业智能化协作升级

04-30

ChatGPT问世后互联网内容巨变：超三成新增内容现AI生成痕迹

04-30

寒武纪2026年Q1业绩亮眼：营收28.85亿，净利润同比大增185.04%

04-30

中用科技超级玛丽7.0发布：AI驱动工业运维全链路自主智能升级

04-30

应对老龄化与劳动力短缺日本航空5月启动中国人形机器人机场测试

04-30

应对劳动力短缺难题日本航空携手科技公司引入人形机器人助阵

04-30

大别山革命老区新县：少年逐梦科创机器人战队绽放科技之光

04-30

魔法原子硅谷GEIS大会收官：世界模型与硬件齐发中国智造领航具身智能新程

04-30

WOMMER沃姆伺服电爪：以五大优势，解锁智能制造“最后一厘米”新可能

04-30

神州数码深圳站亮“养虾三件套” 助力AI智能体落地产业结硕果

04-30

点击查看更多 +

全站最新

比亚迪第1600万辆下线！第二代腾势D9携长续航闪充等黑科技亮相

新款比亚迪海鸥将至：激光雷达加持续航升级，代步电车新选择？

2026北京车展：小米YU7 GT预告来袭，Vision GT首秀，展现造车硬实力

AI应用商业化加速：从场景创新到价值重构驱动数字经济新增长

科大讯飞学习机怎么选？7款热门型号实测解析，帮你精准匹配孩子学习需求！

科大讯飞2025年报揭晓：营收271亿净利润8.39亿研发投入占比近两成

热门内容

本栏最新

华为混合云“Data+AI”双轮驱动，以创新架构筑牢安全基石释放数据潜能

MG品牌双车齐发：2026款MG4加码性价比，MG 07携高阶智驾重塑轿跑格局

第二代腾势D9上市：硬核科技加持，重塑豪华MPV出行新体验

芯驰科技战略进阶：汽车“芯”突破，跨界赋能具身智能新赛道

芯驰科技战略进阶：汽车芯片领航，跨界布局具身智能新赛道

吉利银河2026北京车展首发银河之光第2代，以AI与美学重塑汽车新体验

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.