基于深度学习的点云数据目标检测方法研究文献综述

 2022-11-22 04:11

  1. 简介

在城市环境中部署自动驾驶汽车(AVs)是一项艰巨的技术挑战。除其他任务外,AVs还需要实时检测和跟踪移动的物体,如车辆、行人和骑自行车的人。为了实现这一目标,自动驾驶车辆需要依靠多种传感器,其中激光雷达无疑是最重要的。

点云目标检测就是一种针对激光雷达点云数据进行处理并得到其中目标及目标位置的技术。

  1. 历史发展

为了实现能够实时检测和跟踪移动的物体,自动驾驶车辆需要依靠多种传感器,其中激光雷达无疑是最重要的。激光雷达使用激光扫描仪测量与环境的距离,从而生成稀疏点云。传统上,激光雷达机器人流程通过使用自下而上的流程将这些点云应用于目标检测,这其中包括背景去除、时空聚类和分类的算法[3,5]。随着计算机视觉中深度学习方法的巨大进步,大量的文献研究了这种技术在多大程度上可以应用于激光雷达点云的物体检测[1,4,7,8,10,11,13,14,15,16]。虽然这些模型之间有许多相似之处,但是有两个关键的区别:1)点云是稀疏的,而图像是密集的;2)点云是三维的,而图像是二维的。因此,标准的图像卷积流程并不适用于点云目标检测。

一些早期的工作集中在使用3D卷积[3]或者将点云投影到图像中[6]。最近的方法倾向于从鸟瞰角度观察激光雷达点云[1,4,15,16]。这种俯视角度具有一些优点,如较少的尺度模糊,几乎没有遮挡物。然而,鸟瞰图往往非常稀疏,这使得直接应用卷积神经网络不切实际,效率低下。解决此问题的常见方法是将地面划分为一个规则的网格,例如,然后对每个网络单元中的点使用自定义的提取特征编码方法[1,4,11,15]。然而,这种方法可能是次优的,因为硬编码的特征提取方法在没有大量项目努力的情况下可能无法推广到新的配置。为了解决这些问题,在Qi等人开发的PointNet[9]的基础上,VoxelNet[16]是在此领域真正做到端对端学习的首批方法之一。VoxelNet将空间划分为voxel,将PointNet应用于每个voxel,然后使用一个3D卷积来合并垂直方向的量,之后使用2D卷积检测框架进行检测。尽管VoxelNet的性能很强,但其处理的效率为4.4Hz,它太慢了而不能实施部署。最近RECOND[13]改进了VoxelNet的处理速度,但3D卷积仍然是一个瓶颈。之后提出的PointPillars[12]:一种用于3D目标检测的方法,它仅用2D卷积层就能实现端到端学习。

  1. 基于深度学习的点云目标检测

3.1.基础问题

点云数据具有一些显著的特点——数据点无序性、数据点数量可变性等。无序就表示网络必须能够在改变数据点顺序的情况下输出相同的结果,数量可变就表示网络必须能够处理不同采样点的三维模型。

  • 点云的无序性:

点云本质上是一长串点。在几何上,点的顺序不影响它在空间中对整体形状的表示,例如,相同的点云可以由两个完全不同的矩阵表示,如图1_1所示:

图3_1:点云无序性示意图

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。