](https://deep-paper.org/en/papers/2025-10/2401.02436/images/cover.png)
将3D高斯溅射场景压缩31倍,渲染速度提升4倍
3D高斯溅射技术因其仅需少量图像即可实现照片级场景重建和实时渲染,在计算机图形学界引起了广泛关注。该技术通过数百万个微小、半透明、带颜色的斑点——即3D高斯——来建模场景,每个高斯都对最终图像做出贡献。 问题在于,这些重建场景的体积非常庞大,通常达到数GB。这使得它们难以进行流式传输,不适合在移动设备上运行,更难集成到对每一兆字节和每一毫秒都至关重要的VR/AR或游戏中。 来自慕尼黑工业大学的一个团队在他们的论文 《压缩3D高斯溅射以加速新视角合成》 中解决了这一挑战。他们设计的多阶段压缩流程使文件大小最多减少 31倍,渲染速度提升至 4倍,同时几乎不影响视觉质量。 图1. 未压缩与压缩后渲染效果的并排比较。压缩显著减小了文件大小并提高了帧率,而对质量的影响微乎其微。 在本文中,我们将深入解析他们成果背后的技术——敏感度感知压缩的工作原理、量化感知训练如何在低比特率下保持质量,以及他们重新设计的渲染器如何利用紧凑格式实现最大速度。 快速回顾: 3D高斯溅射的背景 在深入探讨压缩之前,让我们先回顾一下其底层技术。多年来,神经辐射场 (NeRFs) 在新视角合成领域占据主导地位——即从输入图像生成新的视角——它通过训练神经网络来表示连续的体积场景。 虽然NeRFs可以实现很高的保真度,但其训练和渲染速度较慢,因为每个像素都需要进行昂贵的网络查询。 2023年,Kerbl等人提出了3D高斯溅射 (3DGS) ,用一种显式的基于点的方法替代了隐式的神经表示: 每个高斯由以下参数定义: 位置 (\(x\)): 3D坐标。 协方差 (\(\Sigma\)): 形状与方向,通过旋转四元数 (\(q\)) 和缩放向量 (\(s\)) 表示。 不透明度 (\(\alpha\)): 透明程度。 视角相关颜色 (球谐系数) : 编码随视角变化的RGB颜色的球谐参数。 渲染过程涉及将每个3D高斯投影成一个2D椭圆: \[ \Sigma' = J W \Sigma W^{T} J^{T} \]其中 \(W\) 是视图变换矩阵,\(J\) 是投影的雅可比矩阵。像素按从后到前的顺序混合排序后的溅射体: \[ C = \sum_{i \in N} c_i \alpha_i \prod_{j=1}^{i-1} (1 - \alpha_j) \]这种显式表示相比NeRFs显著加快了渲染速度。但为数百万个高斯存储位置、旋转、缩放、不透明度以及数十个球谐系数,数据量会迅速膨胀至数GB。 压缩流程: 优先保留关键参数 这一压缩方案的核心洞见是,部分参数对最终图像几乎没有影响,而另一些参数则至关重要。通过测量参数的敏感度,对影响较小的部分进行更高比例的压缩,团队在减小数据规模的同时尽量保留了视觉质量。 ...