1.1前言

近年来，随着人工智能领域的发展，而图像识别作为人工智能的重要领域，图像识别技术也逐渐渗透到交通、军事、医学等领域。由于汽车市场越来越繁荣，二手车的交易市场也越来越广阔，汽车牌照作为进出库车辆的目前唯一的图像识别标识符，在一个二手车交易车库时会出现一些问题，例如在进入一个车库，通常是根据图像识别扫描车牌，离开车库也是扫描车牌，是根据车牌号码来判断是否是同一辆车，但是二手车交易过后，会有车牌变号或变空车牌等问题，这样识别设备不能准确精准的识别，所以基于这一问题，本论文将从车辆的其他特征，例如划痕，进行图像识别研究汽车所特有的特征，有助于克服传统识别只识别车牌号码的这一缺点，从而便于更加精准有效地识别，避免出入库时的纠纷。

1.2国内外研究现状

图像识别技术是人工智能的一个重要领域。为了编制模拟人类图像识别活动的计算机程序，人们提出了不同的图像识别模型。例如模板匹配模型。这种模型认为，识别某个图像，必须在过去的经验中有这个图像的记忆模式，又叫模板。当前的刺激如果能与大脑中的模板相匹配，这个图像也就被识别了。图像识别技术包括目标识别、目标检测等任务，其中目标识别主要是判别图像中目标的类型，而目标检测则规约为图像中多目标识别的问题。迄今为止，图像识别技术经过研究者们的努力取得了大量的成果，用于解决图像识别问题的许多方法、模型被提出，虽然这些方法模型的理论基础不尽相同，但图像的识别过程主要由图像视觉特征的提取与表示和机器学习算法对视觉特征的分析与预测两大部分组成。

1.2.1图像识别理论研究现状

国内外研究：1959 年，Hubel 和 Wiesel^[1]发现动物视觉皮层的细胞负责探测局部范围内的光，首次提出感受野的概念。受这一启发，日本学者Kuniniko Fukushima 在 1980 年提出了神经认知机，即CNN原型。

1990 年，LeCun 等人开创性地提出了现代 CNN 框架 LeNet-5该方法具有多层结构，能够通过反向传播算法进行训练而学习得到原始图像的特征表示。该方法可以对手写数字进行分类，使得直接从原始图像像素中识别视觉模式成为可能。同时，张等人提出使用平移不变的人工神经网络（Shift-invariant Artificial Neural Network, SIANN）来识别图像中的字符。由于有限的计算能力和缺乏大规模的训练数据，使得这些网络对尺寸较大、内容较复杂的图像进行处理时仍显得能力不足。直到 2006 年 Hinton 等利用逐层预训练的方法缓解局部最优解问题，使得具有 7 层隐含网络的高效训练成为可能，该方法实现了真正意义上的深层网络。

2012 年 Krizhevsky 等人提出名为 AlexNet的深度卷积神经网络（Deep Convolutional Neural Network, DCNN）由 5 个卷积层、最大池化层、Dropout 层和3 个全连接层组成。He 等人提出的 ResNet，利用残差学习的思想，通过跳跃连接（skip/shortcut connection）直接将输入信息跳跃式的绕道传到输出，保护信息的完整性，整个网络只学习输入和输出有差别的部分从而简化了学习的难度和目标，避免了传统卷积神经网络在信息传递过程中或多或少的信息丢失、损耗等问题，该方法证明了跳跃连接对于具有数百层极深网络学习的有效性。受 ResNet 网络结构的启发，Szegedy 等提出的 InceptionResNets 将Inception 网络与跳跃连接相结合，表明跳跃连接可以显著加快 Inception 网络的训练速度，并且性能也有所提升。

Huang 等人对 ResNets 进行扩展，提出了一种由密集块（dense blocks）构建的 DenseNet，密集块以前馈的方式使得网络中任何两层之间都有直接的连接，从而具有缓解梯度消失、加强特征传播、促进特征复用、极大减少了参数量等引人注目的优点。Hu 等人提出了一个子结构 Squeeze and Excitation（SE）block，该结构根据网络损失去学习特征权重的方式训练模型以达到更好的效果，它可以嵌入其他网络结构中，以最小代价的额外计算提升它们的性能。

2014 年，Girshick 等人首次采用 DCNN 进行目标检测，提出开创性的通用目标检测算法 RCNN，该方法用 AlexNet 代替传统的手工设计特征，并与生成目标区域建议（Region proposal）的选择性搜索（selective search）方法相结合，在 PASCAL VOC 2012 数据集上的性能达到 53.3%的平均检测精度（Mean average precision，mAP）。

基于这一开创性的工作，许多研究者随后提出各种改进方法，旨在获得更好的检测效果。此后，通用目标检测算法大致可分为基于回归的一阶段方法和基于区域的两阶段方法。一阶段方法是直接从整幅图像中识别预定义类别实例和回归其位置，如 YOLO、SSD，该方法速度快可实现实时检测，但识别精度较低。两阶段方法首先从图像中生成与类别无关的候选区域，然后利用 RCNN 确定区域的类别，回归区域的位置。Faster RCNN提出基于 CNN的候选区域建议网络（RPN），首次利用单一的网络完成候选区域生成和区域分类，该算法同时具备精度高，速度快的优点。

Mask RCNN通过添加候选区域二进制掩码输出的分支扩展 Faster RCNN 实现实例分割，该算法精度高，结构简单灵活。另外，基准数据集（PASCAL VOC，MS COCO 等）的最新领先结果都是基于 Faster RCNN 的，如 ORN、MegDet。然而，这些主流的算法对大尺度物体的检测效果较好，但不擅长对小尺度物体进行检测，效果较差。针对多尺度目标检测问题，FPN利用特征金字塔不同尺度的特征图实现多尺度目标检测。Libra RCNN就检测框架的三个重要组成部分，即 region proposal、不同层级的特征、损失函数，指出存在不平衡的问题，在 FPN 基础上进一步融合特征信息，提升目标检测的性能。为了解决小目标检测的问题，Bharat 等深入分析目标检测中的尺度问题，从而提出了 SNIP 算法，然后通过实验验证了对卷积特征进行上采样有助于小目标物体的检测。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

免费ai写开题、写任务书：免费Ai开题 | 免费Ai任务书 | 免费降AI率 | 免费降重复率 | 论文免费排版

注册

找回密码

基于图像识别的停车场车辆识别系统研究文献综述

1.1前言

1.2国内外研究现状

1.2.1图像识别理论研究现状

您可能感兴趣的文章

登录

注册

找回密码

1.1前言

1.2国内外研究现状

1.2.1图像识别理论研究现状

您可能感兴趣的文章