双目视觉简介

发布网友发布时间：2024-10-01 15:31

共1个回答

热心网友时间：2024-11-10 23:03

双目立体视觉，作为机器视觉的一种核心形式，其原理是通过两台相机从不同角度捕捉被测物体的图像，利用视差原理计算图像中对应点的偏移，以此获取物体的三维空间信息。

未来的科技世界将更依赖于三维感知，因为二维空间在许多场景中无法满足需求。在双目视觉中，关键概念是视差，它源自于两眼视角的差异，如同手指在不同距离下产生的视觉变化。通过测量这种差异，形成深度图，深度图是记录物体距离的信息，其获取方法多样，如激光雷达、计算机立体视觉等。

深度图与点云是相关但不同的概念，深度图可以转化为点云，反之亦然。例如，绝对差值法简单地通过左右视图的像素差异计算出视差图，尽管它并非严格意义上的视差，但因其计算简便，常作为初步参考。此外，UV-disparity mapping方法通过统计视差值来构建深度信息。

利用视差，我们可以实现如障碍物检测和行人分类这样的功能，如"UV disparity based obstacle detection and pedestrian classification in urban traffic scenarios"。在双目视觉中，射线的概念很重要，它们连接着图像上的点和光心，对于理解对极几何，即两幅图像之间投影关系的基础，至关重要。

对极几何描绘了摄像机参数和相对位置对图像之间关系的几何特性，包括对极线、对极点和基础矩阵等概念。这些理论在实际应用中，如深度计算和图像匹配中发挥关键作用，如通过基础矩阵推导出像素点在另一视图的对应位置，如Kinect等设备的工作原理即基于此。

像素大小（Pixel size）和视差值（Disparity value）等参数对双目视觉的性能有直接影响，像素尺寸越小，系统深度范围越大，而视差与深度成反比，小的视差对应于较远的深度。