滚动资讯

当前位置：首页 > 资讯 > 数码极客 > 正文内容

德国波恩大学研发3DTV系统：三台摄像机实现实时自由视角合成

时间：2026-04-23 22:39:18 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在实时自由视角视频合成领域，德国波恩大学计算机科学系团队提出了一套名为3DTV的创新系统。该系统仅需三台摄像机的画面，即可在25毫秒内生成任意角度的新视角图像，帧率达到每秒40帧，满足直播、电竞转播等场景对低延迟互动渲染的需求。相关研究以预印本形式发布，论文编号为arXiv:2604.11211。

自由视角技术的核心挑战在于，如何从少量固定视角的画面中推断出未拍摄角度的场景信息。这一过程需要同时处理三维结构理解、遮挡关系、光影变化等复杂因素。现有方案分为两类：一类是基于神经辐射场或三维高斯泼溅的方法，需针对每个场景单独训练模型，生成时间长达数分钟；另一类采用通用模型直接推算，虽速度快但精度不足，易出现重影或几何扭曲。3DTV系统试图在两者间找到平衡，实现无需场景适配的实时高质量合成。

系统首先通过几何学方法解决摄像机选择问题。研究团队引入德劳内三角剖分算法，将所有摄像机位置投影到二维平面，用接近等边的三角形连接各点。当目标视角确定后，系统通过穆勒-特朗博尔射线-三角形相交算法快速定位包含该点的三角形，其三个顶点即为最优的三台源摄像机。针对环形摄像机阵列，团队设计了两步投影流程：先将摄像机位置投影到圆柱面消除径向偏差，再透视投影到水平面进行三角剖分。实验表明，将原点设在圆柱轴线下方1米、投影平面设在圆柱顶端上方1米时，剖分结果最接近等边三角形。

深度估算采用“粗到细”的金字塔策略。系统设置7个层级，从最低分辨率开始逐步细化。第7层在0.5米至8.5米范围内均匀设置32个深度候选值，后续层级搜索范围缩小至上一层预测值周围的小窗口内。每个层级通过计算三台摄像机特征图像的相似度确定深度，相似度高的候选值更可能是真实深度。系统还引入先验引导机制，将上一层的中间特征传递至当前层作为参考，提升估算效率与精度。

特征提取环节采用GhostNet和GhostNetV2架构，通过深度可分离卷积生成“幽灵特征图”，大幅降低计算成本。骨干网络为每台摄像机生成7个层级的特征金字塔，与深度估算层级对应。最深层特征图加入L-ASPP模块，用多尺度卷积核捕捉全局上下文信息。特征融合时，置信度预测网络根据摄像机方位信息生成权重图，对三台摄像机的特征进行加权求和。

图像合成同样采用金字塔式解码器。每个层级接收融合特征、深度图、透明度图及上一层的潜变量特征，输出新的潜变量。最终在第1层通过精化头生成RGB图像。训练过程中，团队设计了七种损失函数，涵盖像素级重建、几何一致性、感知质量等维度，并在不同训练阶段动态调整权重。模型先在512×512分辨率下训练100轮，再在1024×1024分辨率下微调25轮，使用单张NVIDIA A40显卡完成。

为解决真实数据深度标注困难的问题，研究团队构建了包含24753个样本的合成数据集。数据集涵盖357个三维资产，包括沙发、化学实验台等室内物体，以及通过HumanGenerator3D插件生成的虚拟人物。摄像机布置完全随机化，目标视角在三角形内随机采样，并在深度方向加入抖动。数据增强环节模拟了色彩偏差、背景噪声、镜头模糊等真实采集中的常见问题。

在六个公开数据集的评测中，3DTV系统表现优异。在人体捕获类数据集上，其PSNR指标超过GPS-Gaussian和FrugalNeRF等方法，与ENeRF基本持平。运行效率方面，TensorRT优化后的版本推理时间仅24.5毫秒，峰值显存占用2.2GB，实现每秒40帧的实时运行。研究团队将完整配置与模型权重开源，确保结果可重复性。

消融实验验证了各设计组件的必要性。减少至两台摄像机时，PSNR指标下降约2个单位；特征通道数减半导致高频纹理细节变差；金字塔层级减少至3层时，PSNR急剧下降。实验表明，残差深度更新机制是系统稳定运行的核心，三视角输入和金字塔深度估算对质量提升贡献显著。

尽管3DTV系统在室内场景中表现突出，但其适用范围仍存在局限。当前训练数据深度范围局限于0.5米至8.5米，难以处理开放户外环境或大尺度场景。在视角外推场景中，系统稳定性和质量会显著下降。遮挡复杂场景中，深度估算易混淆，导致前景与背景特征渗透。研究团队提出，增加特征图密度或引入时序特征传播是潜在改进方向。

更多>同类资讯

光伏组件产线升级：三菱A系列PLC借以太网模块实现高效数据互通

三菱A系列PLC凭借高可靠性、强抗干扰性，广泛应用于光伏组件封装产线的逻辑控制环节，但该系列老旧型号未配置内置以太网接口，仅保留单一圆形串口，无法满足现代光伏产线Modbus TCP设备并发、数据远程传输的技…

04-23

荣威家越07概念车首秀：昂扬美学设计，AI赋能重塑家庭出行新体验

04-23

疑似一加16配置曝光：没有主动散热风扇两套影像方案待定

04-23

一加16配置新动态：无主动散热风扇影像双方案或聚焦长焦升级

04-23

柔性热电塑料薄膜：让热量“变身”电能，开启绿色能源新可能

04-23

美系豪华新标杆凯迪拉克凯威德上市硬核配置诠释安全与质感

04-23

从月球回望地球：那一刻的震撼与感动，让宇航员泪洒宇宙

1968年阿波罗8号的宇航员们，不仅目睹了这一震撼场景，还完成了一项意外的壮举，他们没有提前准备拍摄设备，却凭借过硬的技术，在高速行驶的飞船上，拍下了人类首张从月球视角拍摄的地球升起的照片，也就是后来风靡全…

04-23

神舟二十一号出舱引热议：太空本真之色与人类探索的多元视角

这个问题的关键不在太空本身，而在摄像机的工作原理，航天员出舱时，摄像机需要拍摄的主体是空间站和航天员。正是这种低曝光设定，使得星光这种极其微弱的发光源被“过滤”掉了，这并不是星星消失了，而是摄像机为了拍清…

04-23

科技与艺术的完美融合：HIFIMAN Edition XS耳机开启声学新体验

这款耳机采用纳米级超薄振膜，配合隐形磁体技术，能够精准还原音乐中的每一个细节，从低频的深沉到高频的清澈，都能完美呈现。 HIFIMANEdition XS隐形磁体版平板振膜耳机以其卓越的音质表现和舒适的佩戴…

04-23

OPPO Find X9s Pro发布：配置拉满价格持平行业涨价潮中坚守不涨

昨日OPPO举行了OPPO X 哈苏影像新品联合发布会，带来了OPPO Find X9s Pro、Find X9 Ultra、EncoClip2、Watch X3 Mini、Pad Mini、Pad5 Pr…

04-23

AI掀了桌子，贾樟柯们的底牌在哪儿？

04-23

经典小车焕新颜，smart精灵#2概念车发布，续航超300公里引期待

04-23

AI“换桌”重塑电影业：变革浪潮下，电影人的破局与坚守

04-22

荣耀新品发布会亮点抢先看：多款笔记本与配件新品即将登场

【CNMO科技消息】4月22日，数码博主“林林-一枝小白兔”汇总了在荣耀WIN游戏本暨全场景新品发布会上，将推出的笔记本电脑、配件及音频设备等新品。荣耀WIN游戏本笔记本电脑方面，荣耀将推出WIN游戏本H…

04-22

明基PD2770U 27英寸4K显示器明日开售色彩精准内置校色仪售价12499元

04-22

点击查看更多 +

全站最新

三一重工(06031.HK)获摩根大通增持21.9万股

樾系标杆落地！香山樾交付，彰显越秀在京高端人居打造硬实力

海尔智家(06690.HK)获Pzena Investment Management, LLC增持180.92万股

康臣药业（01681.HK）投资者交流日：稳增长、高分红双轮驱动获青睐

华为乾崑智驾里程突破100亿公里，迟林春称10月有望超特斯拉登顶全球

当乳业进入"科技时代"，飞鹤以"原料自研、鲜活标准、全龄布局"给出答案

热门内容

本栏最新

荣威家越07概念车首秀：昂扬美学设计，AI赋能重塑家庭出行新体验

美系豪华新标杆凯迪拉克凯威德上市硬核配置诠释安全与质感

荣威家越07概念车首秀：以“昂扬美学”勾勒AI时代家庭出行新图景

智能体AI赋能汽车新纪元大众集团加速技术转型与产品布局

荣威家越07概念车登场：“昂扬美学”与AI原生能否重塑家庭出行新体验？

荣威家越07概念车首秀，“昂扬美学”诠释AI时代家庭出行新范式

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.