这篇论文的标题是 CaRtGS: Computational Alignment for Real-Time Gaussian Splatting SLAM,由来自中山大学、香港大学和WeRide公司的研究人员共同完成。
摘要:同时定位与地图构建(SLAM)在机器人技术中至关重要,照片级场景重建正成为关键挑战。为了解决这一问题,我们介绍了实时高斯溅射SLAM(CaRtGS),这是一种新方法,它提高了实时环境中照片级场景重建的效率和质量。利用三维高斯溅射(3DGS),CaRtGS实现了卓越的渲染质量和处理速度,这对于场景的照片级重建至关重要。我们的方法通过一种自适应策略解决了高斯溅射SLAM(GS-SLAM)中的计算不对齐问题,该策略优化了训练、解决了长尾优化问题,并改进了密集化处理。在Replica和TUM-RGBD数据集上的实验表明,CaRtGS在实现高保真度渲染方面非常有效,并且使用的高斯原语更少。这项工作推动了SLAM向实时、照片级密集渲染的方向发展,显著推进了照片级场景表示的进步。
研究背景: 在机器人领域,SLAM(Simultaneous Localization and Mapping,即定位与地图构建)是核心任务之一。随着自动驾驶、虚拟现实/增强现实和具身智能等应用的快速发展,对场景重建提出了更高的要求,如照片级真实感。然而,现有的基于3DGS的SLAM方法在实时性能和渲染质量之间存在计算不对齐的问题。
主要贡献:
1. 对GS-SLAM中的计算不对齐现象进行了深入分析。
2. 提出了一种自适应计算对齐策略,有效解决了训练不足、长尾优化和弱约束密集化问题。
3. 在两个流行的数据集上进行了全面的实验和消融研究,证明了所提方法的有效性。
研究方法: CaRtGS通过以下三个方面来解决计算不对齐问题:
1. 快速Splat-wise反向传播:通过减少线程争用来提高迭代优化过程。
2. 自适应优化:根据训练损失选择重新训练的关键帧,以实现更公平的迭代分配。
3. 不透明度正则化:通过鼓励学习低不透明度来有效管理内存使用和模型大小。
实验结果: CaRtGS在多个数据集上的表现超过了现有的GS-SLAM方法,实现了更高的渲染质量和更少的高斯原语数量,同时保持了超过22帧每秒的实时性能。
结论: CaRtGS通过计算对齐策略显著提高了SLAM过程中的渲染质量和计算效率,朝着实时、照片级密集渲染的方向迈进了一大步。
一句话总结: 这篇论文提出了CaRtGS,一种通过计算对齐策略改进现有SLAM系统以实现实时照片级场景重建的新方法。
论文链接https://arxiv.org/abs/2410.00486
项目链接https://dapengfeng.github.io/cartgs/