基于Tensorflow技术的工业字符识别系统文献综述

 2022-04-14 09:04

随着计算机视觉的飞速发展,作为计算机视觉的经典问题之一的光学字符识别(opticalcharacterrecognition,OCR)技术迅速突破了传统技术框架的瓶颈,在自然场景文本识别、车牌识别、证件票据识别等诸多领域得到了广泛的应用。

1 光学字符识别的发展

11OCR的历史阶段

1929年德国人Tausheck取得了光学字符识别的专利[2],之后各国逐渐开始针对OCR技术进行研究。早期的研究内容主要是针对识别方法的理论研究,后来开始针对简单的0~9数字进行识别。直到1966年IBM公司的Casey和Nagy才开始了针对汉字等复杂字符的识别进行研究,并且使用模板匹配的方法识别了1000个印刷体汉字。20世纪70年代初日本的学者也开始了汉字识别研究,

其中有代表性的成果有1977年东芝综合研究所研制的可以识别

2000个单体印刷汉字的OCR识别系统。

中国在OCR技术方面的研究工作起步较晚,直到70年代才逐渐开展了对于光学字符识别的研究。我国在1986年提出“863”高新科技研究计划,“863”计划的信息领域课题组织了清华大学、北京信息工程学院、沈阳自动化所三家科研单位展开中文OCR的研发工作,将中国的汉字识别的研究进入一个实质性的阶段,并由清华大学率先推出了国内最早的OCR产品。早期的OCR技术研究是基于模式识别的基础上进行的,模式识别的每一个模块都需要很好的设计,才能使整个系统达到较好的识别效果。

随着近年深度学习的不断发展,基于卷积神经网络的OCR技术打破了传统OCR技术的框架,在识别效率以及准确率上都有了质的飞跃。国际文档分析与识别大会于2003年大会设立“Ro⁃bustReadingCompetitions”,该竞赛主要评测和检验自然场景、网络图片、复杂视频文本自动提取与智能识别最新技术的性能,并设立了丰厚的奖金。该竞赛极大地促进了OCR技术的发展,目前已经成为OCR技术研究进展重要的国际赛事及标准。由于竞赛强大,实际应用性、高技术难度、诸多科研院校、科技公司都参与其中,目前已有89个国家的3500多支队伍参与。OCR技术的发展前景一片繁荣。

1 2 OCR 技术流程

传统 OCR 技术已经形成了成熟的技术流程体系,大体包括如下几个阶段:

a) 预处理。 主要包括对图片的降噪、灰度化、二值化、倾斜校正。 二值化的过程帮助了识别模型确定文字区域的位置。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

免费ai写开题、写任务书: 免费Ai开题 | 免费Ai任务书 | 降AI率 | 降重复率 | 论文一键排版