立体视觉深度估计

立体视觉是从一个场景的多个二维视图中提取三维信息的过程。立体视觉被用于诸如高级驾驶员辅助系统(ADAS)和机器人导航等应用中,其中立体视觉用于从摄像机估计感兴趣的物体的实际距离或范围。

通过估计场景中点的相对深度,可以从一对图像(也称为立体对)中获得三维信息。这些估计在立体视差图中表示,该视差图由立体对中对应点的匹配构造而成。

使用一对立体图像(左上和右上)重建一个场景。为了可视化视差,右通道与左通道结合创建一个复合(左中)。还显示了场景的视差图(中间)和场景的3D渲染(底部中心)。MATLAB代码和解释见示例

对立体图像进行校正以简化匹配,使一幅图像中的对应点可以在另一幅图像的同一行中找到。这将二维立体对应问题简化为一维问题。立体图像校正有校正和未校正两种方法。通过确定一组匹配感兴趣点,估计基本矩阵,然后推导两个投影变换,实现了未标定立体图像的校正。校准立体校正使用来自立体摄像机校准过程的信息。

校正立体像对。注意,匹配点位于同一行。MATLAB代码和解释见示例

显示校准立体图像校正的立体浮雕。MATLAB代码和解释见示例。

立体相机标定用于确定立体对中摄像机的内在参数和相对位置,利用这些信息进行立体校正和三维重建。

使用指针校准使用棋盘图案的立体对立体相机标定App

立体视觉也用于3D电影录制和制作、目标跟踪、机器视觉和距离感知等应用。有关立体视觉的更多信息,请参阅计算机视觉工具箱™

参见:对象检测,图像和视频图像处理,RANSAC,特征匹配,特征提取,RANSAC,点云,同步定位和绘图