基于深度学习的手写汉字识别方法研究文献综述

 2022-11-25 03:11

文 献 综 述

研究背景与意义

手写汉字识别顾名思义就是将手写汉字进行数字化,自动输入到计算机中。关于字符识别处理这项工作早期一直被视为一个非常困难的模式识别问题,直到当下利用深度学习技术可以将印刷体的字符识别极大的简化,并已经取得了许多喜人的成效,技术也趋于成熟。但是关于手写汉字的识别还有很大的发展空间,例如银行票据、统计报表等纸质的表单的数字化依旧非常占据人力物力,造成极大的浪费,手写汉字识别可以快速将汉字信息数字化,实现汉字的高速输入,一旦其取得成功将具有很高的应用价值。

对于手写体的英文字符研究也早在进行,但英文字符单体数量少、结构简单,特征显著,相对而言较为容易识别,而汉字是一种象形文字,其数量庞大、字体结构复杂,这使得汉字的识别,特别是手写体的识别变得相当困难。

国内外研究现状

传统的文字识别技术通常是通过图像处理和统计机器学习的方法从图像中提取文本信息。识别阶段主要通过逻辑回归、SVM、Adaboost等分类器进行识别,最后通过语言模型和语义规则进行后期处理。对于简单场景下的识别工作,使用传统的图像处理算法和统计学的结合已经可以达到较好的效果,这是因为传统方法是针对特定场景进行建模的,一旦跳出该场景,识别效果将变得很差劲。随着近些年深度学习技术在各个领域的大显身手,基于深度学习的文字识别也逐步发展起来,能够灵活应对不同场景下的识别需求。

Zhuoyao Zhong在《Convolution Neural Network for Traditional Chinese Calligraphy Recognition》中指出手写汉字识别这个问题已经被研究了40多年,尽管如此,由于手写汉字识别的词汇量大,手写风格的多样性,太多的相似和易混淆的汉字等等,仍然是一个尚未解决的难题。

基于现有的研究成果,印刷体的文字识别已经趋于成熟,而起步不久的手写汉字识别也逐渐落地,已经应用于多个领域。例如:1、各大银行证券的票据识别,由于大部分票据都是手写的,导致对于票据的系统录入变得非常费时费力,将手写汉字识别技术应用其中可以大幅度提高录入效率,将各类不规则的票据信息进行格式化录入数据库,方便统一处理和存储。2、邮件自动分拣系统,邮件自动分拣系统是邮政系统提高信函分拣速度有效手段,国bai外已普遍使用,其核心技术就是手写体数字的识别。3、对手写文件的快速识别录入,这是如今很多办公部门经常使用到的,各类扫描仪应用、APP已经逐渐深入人们的日常生活。

主要工作与方法

目前基于深度学习的文字识别方法主要分为两大类,第一种是将整个识别过程分为文本检测和文字识别两个阶段,第二种是通过端对端的模型一次性完成文字检测和识别。

    1. 文本检测 文字识别

文字检测的准确度直接影响后续文字识别的过程,文本检测的方法主要有以下三类:CTPN、TextBoxes、EAST。

  1. CTPN

CTPN是ECCV 2016提出的一种文字检测算法,由Faster RCNN改进而来,结合了CNN与LSTM深度网络,其支持任意尺寸的图像输入,并能够直接在卷积层中定位文本行。

CTPN由检测小尺度文本框、循环连接文本框、文本行边细化三个部分组成,具体实现流程为:

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。