基于稀疏表示SRC的图像目标自动标注方法研究文献综述

 2022-05-31 10:05

基于稀疏表示的图像自动标注研究文献综述

摘 要:文章主要以稀疏表示分类法为本体对象,通过对该方法多种应用方式,理解稀疏表示分类法的运行机制,在不同的运用之中发现其所拥有的优点和缺点。文章主要会分析国内外部分文献,从不同的研究过程中认清自己的课题所需要做的准备,以期为进一步的研究作一简单的回顾性综述。

关键词: 稀疏表示 算法分析 自动标注 应用范围

引言

随着大数据时代的到来,图片信息的传递变得越来越流行。在过去的图片处理中,图像标注大多采用人工的形式,这种方法效率低下,耗费时间长,人力物力资源消耗巨大,且带有一定的主观性。图像自动标注则会对图片自动进行内容的标注,为图片的分类和查询奠定了基础,也可以对图片中关键词进行准确提取。通过稀疏表示对高光谱图像进行分类,从中提取空间特征与光谱特征,并以此来确定目标的类别,对图像进行自动标注。

  1. 稀疏表示分类的概念与应用

高维数据的稀疏表示是近些年是机器学习和计算机视觉研究领域的热点之一,其基本假设是:自然图像本身为稀疏信号,用一组过完备基将输入信号线性表达出来,展开系数可以在满足一定的稀疏度条件下,获取对原始信号的良好近似。研究人员发现,尽管稀疏表示的优化模型是从信号重建的角度建立的,但其表示结果在模式识别中都有很好的表现,许多当前最好的分类系统往往都会选用稀疏表示作为其关键模块[1]。信号稀疏表示是过去近20年来信号处理界一个非常引人关注的研究领域,众多研究论文和专题研讨会表明了该领域的蓬勃发展。信号稀疏表示的目的就是在给定的超完备字典中用尽可能少的原子来表示信号,可以获得信号更为简洁的表示方式,从而使我们更容易地获取信号中所蕴含的信息,更方便进一步对信号进行加工处理,如压缩、编码等[2]。

目前,对于稀疏表示的应用大体可划分为两类:重构和分类。重构的应用有图像去噪、压缩与超分辨、SAR 成像、缺失图像重构以及音频修复等;分类的应用有盲源分离、音乐表示与分类、人脸识别、文本检测等。

  1. 稀疏表示的运用

基于多特征和改进稀疏表示的高光谱图像分类中运用的局部特征选取为局部二值模式(LBP)特征,全局特征选用Gabor特征,分类器设计使用稀疏表示。能去除图像光影、位移角度等的影响,运行效率高,且具有对光照变换不敏感和良好的方向选择特性。但是存在问题:空间信息没有被充分利用,仅用一个范式不能完全探索出不同特征之间的相似性和多样性。[3]后提出多特征方法(MFISR)对高光谱图像进行分类,并对不同特征同时使用两种范式,从而保留他们的多样性。该实验中字典是直接由特征构建的,因此运行效率有待提升。

基于稀疏表示和支持向量机的人脸识别算法若干研究中研究了人脸识别方法中两种典型的识别方法,即基于稀疏表示分类(Sparse Representation-based Classification ,SRC)的人脸识别和基于支持向量机(Support Vector Machine ,SVM)的人脸识别。[4]它结合了疏表示和支持向量机的人脸识别方法,提升了识别效率,具有较好的鲁棒性和稳健性。但是无法在动态图像或视频中获取和识别面部表情,所选取的支持向量机的参数大都为默认值,准确率有待提升。

改进稀疏表示法在人脸识别中的应用中提出一种联合判别性低秩分解与快速稀疏表示分类的人脸识别算法,首先对训练样本进行低秩分解,结合低秩分解和结构不相干来进行字典学习。其次,将训练出来的判别性低秩字典和稀疏误差字典结合,作为测试时使用的字典。然后,利用坐标下降法求解测试样本在联合字典下的稀疏表示。最后,在求解的稀疏表示系数和字典的基础上,对测试样本进行类关联重构,并完成测试样本的分类识别。[5]该算法较 SRC 及 ESRC 算法相比,不仅识别率有明显提升,识别时间也大大缩短,但是字典不完备的问题任然有提升的空间。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。