胃镜下基于卷积神经网络的图像相似性检索文献综述

 2022-11-03 09:11
  1. 文献综述(或调研报告):
  2. 前言

随着图像数据的迅猛增长,基于文本的图像检索已越来越不合时宜。对此,研究者逐渐将研究的重心转向基于内容的图像检索[1]。深度学习模拟人类大脑的组织结构,通过探索深层的体系结构来自动从数据的多层次抽象中学习特征,深学习方法允许系统学习复杂的功能,直接将原始的感官输入数据映射到输出,而不依赖于使用领域知识的人工编制特征,许多最近的研究报告了在各种应用中应用深度学习技术特别卷积神经网络(CNNs)的令人鼓舞的结果:包括语音识别,对象识别以及自然语言处理等[3]。为了在大规模图像集中进行快速有效的检索,哈希技术将图像的高维特征保持相似性地映射为紧致的二进制哈希码。由于二进制哈希码在汉明距离计算上的高效性和存储空间上的优势,哈希码在大规模图像检索中非常高效。由于深度卷积神经网络在特征学习上的优越性以及哈希方法在检索中计算速度和存储空间上的优越性,近几年也出现了深度卷积神经网络与哈希技术相结合的方法[2]:首先,利用卷积神经网络强大的学习能力挖掘训练图像的内在隐含关系,提取图像深层特征,增强图像特征的区分性和表达能力。然后,将图像特征输入到哈希层,学习哈希函数使得哈希层输出的二进制哈希码分类误差和量化误差最小,且满足独立性约束。最后,给定输入图像通过该框架的哈希层得到相应的哈希码,从而可以在低维汉明空间中完成对大规模图像数据的有效检索。

2、相关技术概述

2.1 深度学习

在过去的几年中,一个富裕的深度学习技术集已经被提出并得到广泛研究,例如,深信念网络(DBN),玻尔兹曼机(BM),受限玻尔兹曼机(RBM),深度玻尔兹曼机(DBM),深度神经网络(DNN)、稀疏编码等等。

在各种技术,深度卷积神经网络,实现了国家的最先进的计算机视觉和图像识别的各种任务。CNN模型由几个卷积层和池层组成,它们层叠在一起。在图像识别领域得到了广泛应用。如Hinto等人用卷积神经网络对最大的图像识别数据集 Image Net 进行图像分类取得了巨大成功。

2.2 距离度量学习

图像检索中的距离度量学习在机器学习和多媒体检索领域中都得到了广泛的研究[9]。距离度量学习的核心思想是学习一种最小化相似图像之间距离的最优度量,同时最大化不同图像之间的距离。在这种情况下,另一种称为相似学习的技术与距离度量学习密切相关。

在基于内容的图像检索中,检索图像和图像库中的目标图像间的相似性通过

语义特征上的相似度进行匹配,选取恰当的度量方式对图像检索至关重要。比较

常见的度量方法包括:余弦距、 Minkowski 距、二次距、直方图相交距、K-L距离、汉明距离等。相似性度量方法的选择在很大程度上影响着检索效果。由于这些方法依赖于图像的特征,因此没有一种相似性度量方法能够同时适合所有的度量问题。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。