三维重建了解

SeventhBlue

已于 2022-06-14 10:21:03 修改

阅读量3.2k

点赞数 6

分类专栏：三维重建 Python 文章标签：计算机视觉

于 2022-06-14 09:41:35 首次发布

本文链接：https://blog.csdn.net/qq_31112205/article/details/125271772

版权

Python 同时被 2 个专栏收录

50 篇文章

订阅专栏

三维重建

4 篇文章

订阅专栏

本文深入探讨了三维重建的传统方法与学习方法，包括RGBD、VMS技术以及单帧图像重建。同时介绍了3D形状表示，如深度图、点云、体素和网格，并详细阐述了极线约束与本征矩阵在多视图立体（MVS）重建中的应用。MVS的三种重建路线对比表明，基于光度一致性的方法在精度上有优势。SFM算法流程中，从特征点提取到三维点云计算，再到重投影和优化，详尽展示了三维重建的过程。此外，讨论了基于深度学习的MVS重建在精度和鲁棒性上的提升，但面临内存和数据依赖的问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、三维重建方法

1.1 传统方法

RGBD(D来源结构光或者TOF)：缺点，重建范围受限，一般不能重建大模型；比如，kinectFusion，DynamicFusion，BundleFusion。

VMS(多帧图像重建模型)：比如，OpenMVS，PMVS，MVE。

1.2学习方法

单帧图像重建mesh模型：比如，if-Net，PifuHD。
单帧/双目/MVS重建深度图：比如，MVSNet，JDACS-MS，PatchMatchNet。

二、一些基础知识点

2.1 3D shape representation

深度图（depth）：每个像素值代表的是物体到相机xy平面的距离。

点云（point cloud）：某个坐标系下的点的数据集。点包含了丰富的信息，包括三维坐标X，Y，Z、颜色、分类值、强度值、时间等等。

体素（voxel）：是三维空间中的一个有大小的点，一个小方块，相当于是三维空间种的像素。

网格（mesh）：是全部由三角形组成的多边形网格模拟复杂物体的表面。

2.2 极线约束与本征矩阵

假设在世界坐标系中有一点p，坐标为X，它在1相机中的像为x1，在2相机中的像为 x2（注意 x1和 x2为齐次坐标，最后一个元素是1），如下图所示。

公式太难码了，直接贴图片了。

三、MVS(Multi-View Stereo)重建方法

3.1 一个初略的流程是

多图片集输入，pose计算（计算采用slam/SFM算法），mesh模型重建，文理贴图。

3.2 MVS重建的三种路线

Images camera parameters，silhouette extraction， visual hull，final refinement，polished voxels/mesh。
Images camera parameters，depth range initialization，depthmap reconstruction，depthmaps，boundingbox initialization， volumetric fusion，voxels/mesh， final refinement，polished voxels/mesh。
Images camera parameters，point cloud reconstruction，point cloud，boundingbox initialization， volumetric fusion，voxels/mesh， final refinement，polished voxels/mesh。

其实后面两种路线可以归为一类，前提都是重建深度图。