基于深度学习的车辆目标检测技术研究文献综述

 2022-04-30 10:04

引言:

随着智能化的发展,智能家居、智能工厂等智能控制系统已经获得了显著成果。智能交通系统与人类生活息息相关,现代的交通堵塞、拥挤等现象屡遭诟病,降低了生产力的发展。因此智能交通系统的设计迫在眉睫。

深度学习属于机器学习,并经过发展演变为深度神经网络。深度学习包括图像识别与卷积网络的构建,在提取图像信息后,通过构建深层的神经网络模拟人脑进行分析,可以实现机器获得与人类接近的识别能力,从而在生产生活中得到应用。同时随着大数据时代的到来,深度学习在人工智能领域中得到发展,并已在计算机视觉、语音识别及人机博弈等方面取得了良好的效果。

与此同时,随着社会生产力的发展,轿车已经成为当代人类生活的重要组成。根据中国社科院颁布的2012-2030汽车工业蓝皮书,我国已与2012年进去汽车社会,这意味着汽车产业已成为我国经济重要组成部分。因此,为有效提高人类的驾驶舒适性及解决汽车发展所引发的交通拥堵及交通事故,智能交通这一概念应运而生。智能交通系统中的智能交通工具主要指无人驾驶汽车和汽车辅助驾驶系统。基于深度学习下的车辆目标识别及定位为智能驾驶提供了视觉功能,随着GDP的发展以及计算机数据处理能力的提升,图像处理及计算机视觉迅猛发展并成为了智能交通系统的重要组成部分。

为此,本课题拟运用基于深度学习的车辆目标检测算法,建立目标检测框架,如SSD或YOLO V3或MASK RCNN等,研究内容为: (1)相机参数标定; (2)车辆识别及车辆距离检测 (3)建立不变检测框架; (4)训练神经网络; (5)建立测试集并对神经网络进行测试。检测图像中是否有汽车,并检测到与自车的距离,车辆目标检测对行车安全、交通流预测等具有重要的研究意义。

关键词:深度学习,卷积神经网络,智能交通,自动驾驶,SSD,YOLO-V3

国内外研究现状:

车辆识别与目标检测是自动驾驶的核心内容,其中车辆识别是对车辆类型进行分类,目标检验则是在视频图画中检测车辆是否存在,上述两项的数据在最终传输给终端进行逻辑判断,从而使汽车做出反应。因此,车辆识别与目标检测相当于自动驾驶的视觉,起到了人眼的作用,其发展对智能交通系统的发展意义重大。传统的车辆检测与识别技术采用人工检测,在视频图像的背景建模从而获得车辆位置,依赖于先前的经验手工选取还有车辆特征的对象,从而达到车辆识别的目的。人工检测的弊端显著,不仅耗费大量的时间与人工,同时算法的检测识别性能受到先知经验的限制,因此泛化能力差,对数据的精度要求也较高。在1997年Wren等人使用了单高斯模型,并设计了检测框架Pfinder检测行人[1]。随后KaewTraKulPong等人提出的混合高斯模型(GMM)[2]以及Kim等人提出的码本模型[3]有效的改善了基于背景建模方法的检测效果。

将机器学习运用在图像识别的核心内容为将训练数据中提取车辆特征并让机器学习算法训练从而进行特征检验。目前可提取特征主要有,HOG、Haar、SIFT、SUFR等[4]。Dalal等人为提取目标物体各个方向上的特征,提出了一种解释性图像特征,梯度直方图特征(HOG)[5]。近年来HOC计算速度慢的问题已被广泛应用的GPU解决。2015年,张红兵等人通过提取汽车前脸的HOG特征,利用投影细定位和形态学粗定位相结合的方法提取视频中车辆前脸区域,并采用线性判别的分析算法提取车辆前脸的梯度方向直方图特征,降低了特征维数,大幅提高了运算效率[6]。Haar-like适用与检测水平、垂直和对称的多方位检测结果,并可以通过使用积分图是特征提取加快,适用于实时计算的GPU。SIFT特征检测也可利用与检测车的尾部,包括有遮挡的情况。激光雷达扫描不受到光照条件影响,能够获得扫描平面中的距离信息,但障碍物形状纹理等具体特征无法获得[7]

随着计算机数据处理能力的提升,深度学习在图像处理中的得到广泛的应用。深度学习相比传统依赖经验知识提取特征的算法可以灵活的在训练数据下进行自主学习的能力。在深度学习中,卷积神经网络发展迅猛,在图像识别中得到广泛利用。早在20世纪60年代除,Hubel和Wiesel等通过对猫大脑视觉皮层系统研究,提出了感受野[8]的概念,发现了动物视觉皮层对于信息的分层处理机制。卷积神经网络相比人工提取,特征量小,不需要对原图片进行预处理,仅需将原有图片输入。现代卷积神经网络在图像识别、语音识别多方面以获得显著成果。卷积神经网络早在20世纪80年代中期建立雏形,Fukushima等以感受野为理论基础,第一次建立了基于神经元之间的局部连接性和层次结构组织的人工神经网络,是第一次卷积神经网络的实现[9]。2006年,Geoffery Hinton教授及其学生Rulan Salakhutdinov在《Science》发表文章,首次提出深度学习的观点,并主要提出两个观点:1)由于含多个隐层的人工神经网络特征学习能力极强,因此通过对训练模型进行已提取特征的特征训练,可实现特征可视化及分类问题;2)使用无监督学习算法实现统一的“逐层初始化”方法,实现对输入信息的分层表达,可以有效地降低深度神经网络的训练难度[10]。2012年,加拿大教授Hinton等人提出的AlexNet在ImageNet图像分类挑战赛上获得冠军,再次掀起了深度学习的热潮。2014年香港中文大学教授汤晓鸥等人所研发的DeepID人脸识别技术,将当时最为流行的3种子空间方法——主成分分析子空间(Principal component analysis,PCA)[11]、贝叶斯子空间[12]和线性判别子空间(Linear discriminant analysis, LDA)[13]有机地结合到同一个理论框架中,提出了统一子空间分析方法[14],此算法将LBP和Gabor等特征对人脸图像中邻域像素区块的灰度值或颜色值进行局部特征提取,对这些局部特征进行特征变化,从而得到识别准确率超过99%的人脸识别率,证明了卷积神经网络在图像检测与识别上具有巨大的潜力[7]。2015年IEE ROBIO会议上,张云飞等人提出了一种基于深度学习,神经网络可用于自然环境下的的车型识别方法[15]

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。