关于双目立体视觉的标定及定位检测的研究文献综述

 2021-09-25 08:09

毕业论文课题相关文献综述

1. 双目立体视觉的背景与意义

双目立体视觉是机器视觉[1]的一种重要形式,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法。立体视觉直接模拟了人类视觉处理景物的方式[2]。与平面视觉相比,立体视觉在虚拟现实、多媒体教学、工业产品的外观设计、三维轮廓测量、艺术雕塑、建筑等领域有着更广泛的应用[3][4]

双目立体视觉的开创性工作始于上世纪的60年代中期。美国MIT的Roberts通过从数字图像中提取立方体、楔形体和棱柱体等简单规则多面体的三维结构,并对物体的形状和空间关系进行描述,把过去的简单二维图像分析推广到了复杂的三维场景,标志着立体视觉技术的诞生[5]。20世纪70年代末,以Marr[6]、Barrow等人为代表的研究者提出了一整套视觉计算的理论来描述视觉过程,其核心是从场景的图像中,推导出该场景的精确的三维几何描述,并定量地确定场景中物体的性质[7]。随着研究的深入,研究的范围从边缘、角点等特征的提取,线条、平面、曲面等几何要素的分析,直到对图像明暗、纹理、运动和成像几何等进行分析,并建立起各种数据结构和推理规则。特别是上世纪80年代初,Marr首次将图像处理、心理物理学、神经生理学和临床精神病学的研究成果从信息处理的角度进行概括,创立了视觉计算理论框架。这一基本理论对立体视觉技术的发展产生了极大的推动作用,在这一领域已形成了从图像的获取到最终的三维场景可视表面重构的完整体系,使得立体视觉已成为计算机视觉中一个非常重要的分支。经过几十年来的发展,立体视觉在机器人视觉、航空测绘、反求工程、军事运用、医学成像和工业检测等领域中的运用越来越广。

2.国内外研究现状的介绍以及应用

2.1.国外研究现状

立体视觉是机器视觉的一个重要分支,其基本原理是从两个或多个视点去观察同一场景,获得在不同视角下的一组图像,然后通过不同图像中对应像素间的视差,推断出场景中目标物体的空间几何形状和位置。国外对立体视觉的研究开展的比较早,也取得了相当大的成果,立体视觉技术已广泛应用于生产、生活中。

日本大阪大学自适应机械系统研究院研究了一种自适应双目视觉伺服系统[8],利用双目体视的原理,以每幅图像中相对静止的三个标志为参考,实时计算目标图像的雅可比矩阵,从而预测出目标下一步运动方向,实现了对运动方式未知的目标的自适应跟踪。该系统仅要求两幅图像中都有静止的参考标志,无需摄像机参数。而传统的视觉跟踪伺服系统需事先知道摄像机的运动、光学等参数和目标的运动方式。

日本东京大学将实时立体视觉和机器人整体姿态集成,开发了仿真机器人动态导航系统[9]。该系统实现分两个步骤:首先,利用平面分割算法分离所拍摄图像对中的地面与障碍物,再结合机器人身体姿态的信息,将图像从摄像机的二维平面坐标系转换到描述躯体姿态的世界坐标系,建立机器人周围区域的地图;其次,根据实时建立的地图进行障碍物检测,从而确定机器人的行走方向。

麻省理工学院计算机系提出了一种新的用于智能交通工具的传感器融合方式[10],由雷达系统提供目标深度的大致范围,利用立体视觉提供粗略的目标深度信息,结合改进的图像分割算法,能够在高速环境下对视频图像中的目标位置进行分割,而传统的目标分割算法难以在高速实时环境中得到令人满意的结果。

华盛顿大学与微软公司合作为火星卫星探测者"号研制了宽基线立体视觉系统[11],使探测者号能够在火星上对其即将跨越的几千米内的地形进行精确的定位导航。系统使用同一个摄像机在探测者"的不同位置上拍摄图像对,拍摄间距越大,基线越宽,能观测到越远的地貌。系统采用非线性优化得到两次拍摄图像时摄像机的相对准确的位置,利用鲁棒性强的最大似然概率法结合高效的立体搜索进行图像匹配,得到亚像素精度的视差,并根据此视差计算图像对中各点的三维坐标。相比传统的体视系统,能够更精确地绘制探测者"号周围的地貌和以更高的精度观测到更远的地形。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。