ITBear旗下自媒体矩阵:

阳明交大TED-4DGS:动态3D场景压缩新突破 开启高效存储新纪元

   时间:2025-12-31 06:36:57 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在动态3D场景压缩存储领域,一项突破性研究为行业带来了新的发展契机。由研究团队共同完成的研究成果发表于arXiv论文库,论文编号为arXiv:2512.05446v1,该研究针对动态3D场景的压缩存储难题提出了创新性的解决方案。

当我们用手机拍摄视频时,实际上是在记录一个不断变化的3D世界。近年来,3D高斯点云渲染(3DGS)技术在静态3D场景重建方面表现出色,能精准地还原场景,如同用无数发光小球拼出完美雕塑。然而,当场景中的“雕塑”开始运动,如何高效存储和传输这些动态变化的场景,成为亟待解决的问题。

传统方法在处理动态3D场景时存在明显不足。一种方法类似为每道菜每个步骤准备独立食材的空间 - 时间4DGS方法,虽能做出精美菜品,但需要巨大存储空间;另一种方法如同用同一套基础食材通过不同烹饪手法变出菜品,即典型3DGS配变形方法,虽节省空间,但会出现食材错位问题,导致处理过程复杂。

研究团队提出的TED - 4DGS方法则巧妙地解决了这些问题。该方法基于ScaffoldGS稀疏锚点结构,在3D空间布置“控制点”,每个控制点管理周围区域的显示效果。其核心创新在于为每个锚点添加“时序激活参数”,就像为演员安排上台和下台时间,每个锚点有“出场时间”(as)和“退场时间”(af)以及过渡平滑程度。这样,物体被遮挡或消失时,对应锚点自然淡出,无需通过奇怪变形隐藏。

在变形建模方面,研究团队采用“嵌入式查询”机制。构建一个“变形词典”,记录各种运动模式,每个动态锚点凭借“身份标签”(时序特征)在词典中查找合适的变形方案,既能捕捉复杂运动,又避免单独存储完整变形信息。

为实现高效压缩,研究团队引入基于隐式神经表示(INR)的超先验模型,配合通道级自回归模型捕捉锚点属性相关性。这如同智能压缩算法,能判断信息重要程度并预测后续信息,提高压缩率。

在动态3D场景重建中,处理遮挡和去遮挡现象是重大挑战。传统典型3DGS方法要求所有高斯基元在整个序列中保持存在,如同演员从戏剧开始到结束都必须留在舞台上。为解决此问题,以往方法采用“强制隐身”策略,通过不自然变形将不需要显示的高斯基元移到视野外,这不仅导致训练不稳定,还产生不规则变形场,影响压缩效率。TED - 4DGS的时序激活机制提供了更自然的解决方案,研究团队为每个锚点引入学习型时序激活参数τ = [(as, bs), (af, bf)],通过巧妙的激活函数设计,让锚点在正确时机自然出现和消失。为确保训练稳定,还采用渐进式学习策略,先让锚点学会稳定3D表示,再引入时序控制,平衡了表示能力和压缩效率。时序激活机制还实现了时序感知的透明度剪枝,进一步提升存储效率。

在动态场景表示中,建模复杂多样的运动模式是核心挑战。传统基于坐标的方法需学习密集4D网格,消耗大量内存和存储;简单参数化运动模型又难以捕捉复杂非线性运动。TED - 4DGS采用嵌入式变形方法,以全局变形库为核心,每个动态锚点通过独特时序特征查询共享库,实现高效灵活的运动建模。得到锚点专属时序潜在特征后,系统将其输入变形解码器,预测位置偏移和特征残差,同时分离处理几何形状和外观属性,平衡了变形精度和比特率。

高效的属性编码是动态3DGS压缩的关键。传统网格化超先验方法难以适应动态场景时变特性,TED - 4DGS提出基于INR的超先验框架,以多层感知机网络学习锚点属性先验分布,无需预定义网格结构,减少存储开销。针对锚点特征,引入通道级自回归模型利用特征内部相关性,降低编码比特数。整个压缩框架还包括偏移掩码和时序掩码,通过稀疏化正则项学习,在保证重建质量的同时提高压缩效率。

为验证TED - 4DGS的有效性,研究团队在Neural 3D Video(Neu3D)数据集和HyperNeRF数据集上进行全面评估。在Neu3D数据集上,实验覆盖多个包含复杂动态内容的序列,结果显示在相似感知质量下,TED - 4DGS相比E - D3DGS和4DGaussians有显著压缩效果提升。在HyperNeRF数据集上,进一步验证了方法的泛化能力,在3D printer场景中,相比率失真优化的ADC - GS实现了比特率削减。研究团队还通过消融实验分析各组件贡献,揭示了变形场设计、时序激活机制、渐进式训练策略和压缩框架等方面的重要发现。

TED - 4DGS的技术贡献不仅在于压缩率提升,更在于解决了动态3D场景表示领域的基本问题。通过引入时序激活机制,实现了真正的4D表示,使系统能更自然处理遮挡,提供额外正则化,提高可压缩性。嵌入式变形建模在表示能力和参数效率间找到新平衡,其设计原理反映机器学习普遍原则。在实际应用中,该技术为虚拟现实、自动驾驶、电影制作等领域带来新可能,降低存储成本和传输时间,提高制作流程效率。

以下是关于该研究的问答环节。问:TED - 4DGS相比传统方法在压缩效果上有怎样提升?答:在保持相似画质情况下,相比E - D3DGS实现超过14倍文件大小缩减,相比4DGaussians实现超过18倍压缩比,在HyperNeRF数据集3D printer场景中,相比率失真优化的ADC - GS方法实现28%比特率削减。问:时序激活机制如何解决动态场景中的遮挡问题?答:传统方法处理遮挡会将不需要显示的高斯点云移到视野外致不自然变形,TED - 4DGS为每个锚点引入时序激活参数,定义出现和消失时间,让锚点自然出现和消失,避免奇怪变形,提高压缩效率。问:TED - 4DGS的技术突破对普通用户有何实际意义?答:该技术应用将带来更流畅VR/AR体验、更高质量视频通话和更丰富数字娱乐内容,使实时传输高保真度动态场景更可行,推动虚拟现实、远程协作和沉浸式娱乐等领域发展。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version