基于语义信息辅助的视觉定位与建图技术研究文献综述-文献综述网

文献综述（或调研报告）：

本课题主要涉及语义SLAM与基础语义地图的构建等技术，本节将针对语义SLAM与语义地图的研究现状进行陈述。

语义SLAM研究现状

目前在国外对语义SLAM已有不少初步探索。2012年，Sid Yingze Bao等人尝试了同时估计相机位姿和图像语义。这种联合估计的方式显著提高了物体识别精度和鲁棒性，展现了位姿信息对语义的帮助。2013年，帝国理工学院的Renato F.Salas-Moreno等人预先对场景中的物体进行3D建模，通过点云和物体的匹配来估计物体位姿。该方法可以认识预先建模的物体，并同时生成稠密、精准的物体级别的语义地图，体现出语义级物体模型对SLAM的帮助。

由于在当前较为成熟的视觉SLAM方案中所采用的图像特征的语义级别太低，造成特征的可区别性不够强，同时采用当前方法构建出来的点云地图对不同的物体并未进行区分。因此基于以上问题，语义SLAM是把相机拍摄并处理得到的特征点进一步进行归纳组织，达到人所理解的分类层面。通过查阅文献，语义SLAM的研究有如下几种思路：

（1）目标识别算法

第一类目标物体的识别算法是采用人工特征加分类器的架构，具有代表性的方案就是使用HOG（梯度直方图）特征与支持向量机进行行人检测。而在基于IMAGENET大规模图像识别数据集的Bag of Visual Word与支持向量机结合的方法也得到了很多研究人员的应用。2012年，Geoffrey Hinton教授与Alex Krizhevsky一起发表了基于卷积神经网络(CNN)进行物体识别的工作Alexnet，将ILSVRC数据集的错误率降低了近10%，开拓了一种目标识别的新方法。随着深度网络的不断发展，有效的网络层数逐年增加，在ILSVRC等测试数据集上的识别错误率也逐年递减。

第二类的目标识别算法是借鉴较为成熟的SLAM算法中的特征点识别，首先提取图像的SURF特征点，同时建立预识别物体数据库，对数据库中的每一个目标，通过最近邻距离比率（NNDR）计算图像之间的匹配点对，然后检查这些匹配点对的几何一致性。通过RANSAC算法选取其中至少五对不同的SURF特征点对，然后在SLAM图像和目标图像之间建立一个有效的变换，利用PnP算法计算平移量和旋转量，这就定义了从图像特征到三维点之间的变换关系。

目标物体的指定类别划分与相互联系的构建算法

这部分的研究目前正处于初步阶段，由于各类工业应用场景的不同，导致指定类别划分的方法也不尽相同。

一种研究采用的方法是通过提升词包模型中分类器提取特征的数量、密度，完善目标模型的构建，来达到实现指定类别的划分。

另一种研究则采用深度学习模型，其基本思想是通过有监督或者无监督的方式学习层次化的特征表达，来对物体进行从底层到高层的描述，进而达到某些类别的划分。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

免费ai写开题、写任务书：免费Ai开题 | 免费Ai任务书 | 免费降AI率 | 免费降重复率 | 论文免费排版

注册

找回密码

基于语义信息辅助的视觉定位与建图技术研究文献综述

您可能感兴趣的文章

登录

注册

找回密码

您可能感兴趣的文章