基于机器视觉的高速流水线文字识别与缺陷检测文献综述

 2022-09-25 02:09

文献综述(或调研报告):

摘要:机器视觉技术是近几年的研究热点之一,许多尖端科技在机器视觉技术的基础上得以实现。本文在参考大量文献资料的基础上,了解机器视觉在各个领域的利用以及国内外研究现状,初步掌握如何利用文字识别技术来检测流水线产品。针对人工目检的局限性,本文意在试图通过运用机器视觉及图像处理等手段对工业流水线产品进行检测与评价,来改善人工目检的种种缺点,降低生产成本。

  1. 机器视觉国内外的研究现状

国外机器视觉检测技术起步较早,从二十世纪六十年代到现在,经过半个多世纪的发展,机器视觉技术已经很成熟并广泛应用于农业、国防、航天、医疗、勘探、工业等领域。二十世纪八十年代,国内才有少数机构研究机器视觉技术,并且研究进展缓慢。直到最近十年,机器视觉技术才受到广泛关注,发展非常迅猛。

所谓机器视觉 ,就是用机器代替人眼来做测量及判断。具体来讲, 是指通过镜头将被测目标转化为图像信号 ,投射至影像接受器件(一般为 CCD 元件)上,再通过计算机进行分析处理。工业化生产中, 应用机器视觉代替人工视觉可以提高生产的柔性和自动化程度。机器视觉系统通过摄像机将检测目标转换成图像信号,由图像系统对这些信号进行处理, 提取目标信息和判别 ,进而控制现场的设备动作, 进行产品质量的控制、分析 。文字印刷质量检测与判定正是机器视觉技术的典型应用 。机器视觉系统主要由图像采集 、图像处理、结果输出等 3 部分组成 。机器视觉的重要基础和核心是图像处理技术 ,主要包括:图像预处理技术 、二值化分割技术 、感兴趣区域提取以及边缘提取技术等, 这些图像处理技术为后续的几何特征提取和目标参数计算做了充分的准备 ,是整个机器视觉检测系统不可缺少的部分[1]

  1. 文字识别技术研究

2.1 文字识别发展概述

中国在文字识别领域的研究比较晚,据史料记载,是从19 世纪 80 年代开始,与英文字母数量小有所不同,汉子字集庞大,所以汉子识别难度较大,但经过科研人员的反复究出现了一些不错的成果,其中比较著名的有汉王、清华紫光等。国内主要有清华大学电子工程系研制的清华 TH-OCR产品和由汉王集团开发的尚书 OCR 产品,目前能对 6000多个常用汉子有比较高的识别率。随着因特网,智能手机以及微信,QQ 等社交网络的发展,给我们带来的大量的图片资源,图片成为因特网信息交流的主要媒介之一。传统意义上的搜索目前还不能完全摆脱文字搜索的局限,在这种情况下,OCR 技术的研究和学习就变得意义非凡[2]

2.2文字识别研究现状

文档图像识别技术经过多年的研究,取得了非常大的进展,出现了很多实用的商用化 OCR 软件。但视频图像中文字检测识别与文档图像存在较大的差异,由于视频图像中文字排列方式不统一、图像背景复杂、噪声干扰较大以及图像分辨率低等特点,使得传统的文档图像的识别技术已经不再适用,众多研究人员做了大量的研究工作,提出了很多复杂场景下文字的检测和识别方法,概括起来主要分为基于边缘特征的方法、基于连通区域的方法、基于纹理特征的方法、基于机器学习的方法和一些其他的方法[3]

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。