钢卷喷号自动识别软件设计文献综述

 2022-11-16 21:00:39

文献综述

1. 引言

迄今为止，人类识别文字的能力远远胜于计算机，无论是变形的字符、模糊的字符，甚至是破损的字符，人类都能很好地识别。然而在识别量过大的情况下，人类易产生疲劳，由此应运而生了OCR技术。在工业中光学字符识别技术(OCR)已经得到了越来越广范的运用。OCR技术的运用有读取产品标示或其序列号，以便自动追踪货物的整个生命周期；在数据库中记录产品存放的位置和产品信息；读取药品或食品的包装或有效期以决定何时出仓或者废弃^[1]。这些都是光学字符识别技术替代人工手动输入的例子。它的优势在于面临大量的识别需求时，比人工识别更为迅速高效准确。

本文将会在第二节中介绍OCR系统的预处理过程；在第三节中介绍字符分割的四种方法，分别为垂直投影法、聚类分析法、递归最大匹配法和识别寻优法；在第四节中介绍五种识别算法，分别为主成份分析法、模板匹配法、BP神经网络、支持向量机和卷积神经网络；第五节为本文的小结章。

2. 预处理

字符分割前的预处理一般包括灰度化、二值化、图像增强、去除噪点、倾斜矫正、图像滤波、边缘检测等。不同的识别方法,对预处理的要求有所差别。

（1）RGB空间图像的灰度化

定义于RGB空间的彩色图，其每个像素点的色彩由R、G、B三个分量共同决定。每个分量在内存所占的位数共同决定了图像深度，即每个像素点所占的字节数^[2]。对于RGB图像进行灰度化，方法有通常如下几种：

1）Gray=B；Gray=G；Gray=R

2）Gray=max(B G R)

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。

注册

找回密码