基于语义信息辅助的视觉定位与建图技术研究文献综述

 2022-10-27 10:10

文献综述(或调研报告):

本课题主要涉及语义SLAM与基础语义地图的构建等技术,本节将针对语义SLAM与语义地图的研究现状进行陈述。

  1. 语义SLAM研究现状

目前在国外对语义SLAM已有不少初步探索。2012年,Sid Yingze Bao等人尝试了同时估计相机位姿和图像语义。这种联合估计的方式显著提高了物体识别精度和鲁棒性,展现了位姿信息对语义的帮助。2013年,帝国理工学院的Renato F.Salas-Moreno等人预先对场景中的物体进行3D建模,通过点云和物体的匹配来估计物体位姿。该方法可以认识预先建模的物体,并同时生成稠密、精准的物体级别的语义地图,体现出语义级物体模型对SLAM的帮助。

由于在当前较为成熟的视觉SLAM方案中所采用的图像特征的语义级别太低,造成特征的可区别性不够强,同时采用当前方法构建出来的点云地图对不同的物体并未进行区分。因此基于以上问题,语义SLAM是把相机拍摄并处理得到的特征点进一步进行归纳组织,达到人所理解的分类层面。通过查阅文献,语义SLAM的研究有如下几种思路:

(1)目标识别算法

第一类目标物体的识别算法是采用人工特征加分类器的架构,具有代表性的方案就是使用HOG(梯度直方图)特征与支持向量机进行行人检测。而在基于IMAGENET大规模图像识别数据集的Bag of Visual Word与支持向量机结合的方法也得到了很多研究人员的应用。2012年,Geoffrey Hinton教授与Alex Krizhevsky一起发表了基于卷积神经网络(CNN)进行物体识别的工作Alexnet,将ILSVRC数据集的错误率降低了近10%,开拓了一种目标识别的新方法。随着深度网络的不断发展,有效的网络层数逐年增加,在ILSVRC等测试数据集上的识别错误率也逐年递减。

第二类的目标识别算法是借鉴较为成熟的SLAM算法中的特征点识别,首先提取图像的SURF特征点,同时建立预识别物体数据库,对数据库中的每一个目标,通过最近邻距离比率(NNDR)计算图像之间的匹配点对,然后检查这些匹配点对的几何一致性。通过RANSAC算法选取其中至少五对不同的SURF特征点对,然后在SLAM图像和目标图像之间建立一个有效的变换,利用PnP算法计算平移量和旋转量,这就定义了从图像特征到三维点之间的变换关系。

  1. 目标物体的指定类别划分与相互联系的构建算法

这部分的研究目前正处于初步阶段,由于各类工业应用场景的不同,导致指定类别划分的方法也不尽相同。

一种研究采用的方法是通过提升词包模型中分类器提取特征的数量、密度,完善目标模型的构建,来达到实现指定类别的划分。

另一种研究则采用深度学习模型,其基本思想是通过有监督或者无监督的方式学习层次化的特征表达,来对物体进行从底层到高层的描述,进而达到某些类别的划分。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。