客户信息识别与保护方法研究文献综述

 2022-11-25 03:11

客户信息识别与保护方法研究的综述

1.引言

数字化仪器的联网共享和管理给用户带来方便,也给开发人员提出了怎样有效地采集数据问题,即如何摆脱传统采集数据的困境是本课题需要解决的。由于客户提供的信息源形式多样(有文字、图片等),对于采集客户信息工作带来不便,需要为系统使用人员提供对这些信息源的识别功能,并保存到客户数据库中,同时,为了在网络环境中,保护客户隐私信息不被泄露,需要提供保护措施,保护客户信息(数据)的安全。

  1. 客户信息识别

本项目注意研究的是识别客户的文字信息,因此本部分着重介绍不同场景下的文字信息的识别。

文字是我们认知这个世界最主要的手段之一,在人们日常的学习和生活中发挥着不可代替的作用。图像和视频中的文字包含了丰富而精确的高层语言描述,富含丰富的语义信息,而准确有效地提取这些文字信息在多媒体检索、人机交互、机器人导航和工业自动化等领域具有重要的应用。

场景文字通常是由不同类别的文字构成,而且每一种文字具有固定的空间结构,但将不同类别的文字组合成文本行时就会呈现杂乱的视觉特征,而且有些相邻的文字沿任意方向排列的,且文本行大小不一,其长宽比也不确定,文字颜色多变,文字位置不确定; 此外,场景文字包含不同的语言文字,每一个语言文字包含规模不等的文字,不同语言或者相同语言的不同文字类型间的视觉特征也有很大的差异,这些因素都使得场景中的文字具有多样性。

早期的文字检测与识别研究看作是文档分析与识别的自然扩展研究,其主要是基本的预处理、检测和 OCR技术。其中,文字检测是从整幅输入图像中定位出文字的具体位置,并用一个多边形包围盒将文字区域在输入图像中表示,文字识别是假定文字区域已经被检测,将文字区域从图像裁剪出来并进行相应的操 作,得到计算机能够处理的字母序列,再通过相应的组合算法得到文字信息。基于图像分割的文字检测方法这类方法受最近的图像分割工作的启发,将图像分割思想用于场景文字的检测,首先完成场景文字与背景的语义分割,得到场景文字块区域,然后精细分割获取文字行,最终输出文字行的位置和几何属性。

  1. 信息保护

3.1隐私权

“隐私权”最早在 1890 年 12 月美国人沃伦和布兰代斯所写的《隐私权》 中被正式定义为“生活的权利”和“不受干扰的权利”。哥伦比亚大学Alan Westin 教授认为 :隐私是个人能够决定何时、以何种方式和在何种程度上将个人信息公开给他人的权利。狭义的个人隐私权可以理解为个人信息隐私权 , 即公民对个人信息的知情、拥有、使用、公开的控制权,以及享有不被侵犯的权利。从隐私的种类来看,可以将其分为个人事务、个人信息和个人领域三类。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。