基于注意力模型的非规范书写文字识别方法研究文献综述-文献综述网

全文总字数：3238字

文献综述

文献综述该课题是对基于注意力模型的非规范书写文字识别方法研究的综合设计，该课题是毕业实践的重要环节，主旨在于培养学生对于大学四年所学的关于软件设计，编程技术等专业知识的综合运用能力，提高学生综合分析、解决问题的能力。

一、设计背景及原则1.1. 文字识别文字识别（OCR），传统意义上指对文本资料的图像进行识别处理，然后以计算机可理解的文本形式返回。

汉字识别从类型角度来说，主要分为两个方面，一个是印刷汉字识别，另一个则是手写字体识别。

手写体汉字识别进一步可划分为在线手写汉字识别和离线（脱机）手写汉字识别两种。

脱机手写汉字识别指的是文字已经书写完成，或已经呈现在书籍或者图片中，再利用扫描仪或摄像头等硬件设备进行图像捕捉，通过一系列数字图像处理步骤进行识别，识别难度较高。

目前针对扫描文档的汉字识别技术其实已经比较成熟了，但非规范书写的文字，由于笔画长短不一、部件大小差异大等不确定因素存在，想要进行识别依然有不小的难度。

针对现有非标准字体汉字识别技术的不足，本课题提出研究非规范书写文字的识别方法。

1.2. 注意力模型（Attention model）近年来，注意力模型被广泛使用在自然语言处理、图像识别及语音识别等各种不同类型的深度学习任务中，是深度学习技术中最值得关注与深入了解的核心技术之一。

注意力模型，就是在计算能力有限的情况下，将计算资源分配给更重要的任务，同时解决信息超载问题的一种资源分配模型。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付