钢卷喷号自动识别软件设计文献综述
2022-11-16 21:00:39
文 献 综 述
1. 引言
迄今为止,人类识别文字的能力远远胜于计算机,无论是变形的字符、模糊的字符,甚至是破损的字符,人类都能很好地识别。然而在识别量过大的情况下,人类易产生疲劳,由此应运而生了OCR技术。在工业中光学字符识别技术(OCR)已经得到了越来越广范的运用。OCR技术的运用有读取产品标示或其序列号,以便自动追踪货物的整个生命周期;在数据库中记录产品存放的位置和产品信息;读取药品或食品的包装或有效期以决定何时出仓或者废弃[1]。这些都是光学字符识别技术替代人工手动输入的例子。它的优势在于面临大量的识别需求时,比人工识别更为迅速高效准确。
本文将会在第二节中介绍OCR系统的预处理过程;在第三节中介绍字符分割的四种方法,分别为垂直投影法、聚类分析法、递归最大匹配法和识别寻优法;在第四节中介绍五种识别算法,分别为主成份分析法、模板匹配法、BP神经网络、支持向量机和卷积神经网络;第五节为本文的小结章。
2. 预处理
字符分割前的预处理一般包括灰度化、二值化、图像增强、去除噪点、倾斜矫正、图像滤波、边缘检测等。不同的识别方法,对预处理的要求有所差别。
(1)RGB空间图像的灰度化
定义于RGB空间的彩色图,其每个像素点的色彩由R、G、B三个分量共同决定。每个分量在内存所占的位数共同决定了图像深度,即每个像素点所占的字节数[2]。对于RGB图像进行灰度化,方法有通常如下几种:
1)Gray=B;Gray=G;Gray=R
2)Gray=max(B G R)
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。
