基于神经网络的图像风格迁移的实现文献综述

 2022-03-18 09:03

文献综述

选题名称: 基于神经网络的图像风格迁移的实现

近年来,神经网络飞速发展,在对海量数据的处理方面展现出了惊人的效果,其凭借着强大的学习和处理数据的能力,在部分领域已经超过了正常人类的所能达到的程度。

人脑是人类思维的物质基础,思维的功能定位在大脑皮层。人脑含有大约10^11个神经元,每个神经元又通过神经突触与大约103个其它神经元相连,形成一个高度复杂高度灵活的动态网络。人工神经网络是一种以模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。它的主要任务是根据生物神经网络的原理和实际应用的需要建造实用的人工神经网络模型,设计相应的学习算法,模拟人脑的某种智能活动,然后在技术上实现出来用以解决实际问题。如今的神经网络广泛应用于图像识别,自动驾驶等方面,不断推动社会进步。

在神经网络的各类广泛应用中,有一类应用叫做图像风格迁移。图像风格迁移是一种用不同风格渲染图像语义内容的图像处理方法,指让计算机自动完成图像风格的转移,将一张具有艺术特色的图像的风格迁移到一张自然图像上,使原自然图像保留原始内容的同时具有独特的艺术风格。迁移前后的图片不只是颜色发生了变化,边缘,对比度,以及笔触都会变化以给人艺术风格改变的认知。如今图像风格迁移已经取得了一系列突破性的研究成果,并引起了学术界和工业界的广泛关注,具有重要的研究价值。

一、国外研究现状

早期的图像风格传递方法通常直接从参考图像提取颜色或纹理特征传递给目标图像。例如Hertzmann [1]于 1998 年提出的基于画笔的油画风格化算法,主要是提取输入图像的多层金字塔参考序列,结合 Sobel 算子得到边缘,一层一层逐步绘制。Ashikhmin[2]专注于传递高频纹理信息,也在这一方面取得了优秀的成果。但这类方案完成后只能进行特定的一种风格迁移,较为局限。

直到2015年,Gatys等人[3-4]首次提出基于神经网络的图像风格迁移。Gatys发现,尽管从严谨的文学意义上讲,需要花费大量描述指出一系列图像的风格,但是单独处理一张图片时,这张图片的纹理可以直观上反映这一张图像的风格。多层神经网络中,每一层神经网络都可以看做很多个局部特征的提取器,使用格拉姆矩阵计算不同局部特征的相关性,即可获得一个统计模型,这就是一个不用手工建模生成纹理的方法。再次使用完整的神经网络,把局部特征看做近似的图片内容。最后使用梯度反向传播,把图片内容与图片纹理合起来,找到能让合适的特征提取神经元被激活的图片。通过这样的方法,Gatys将一张随机初始化的图像调整成一张在风格上和名画相近,但是内容还是那张普通照片的图像。

2016年Johnson 等人构建了可以进行快速风格迁移的前馈神经网络[5]。任意一张图像经过该网络处理以后,直接得到风格化以后的结果。Li等人[6]将生成的马尔科夫随机场作用在深度卷积神经网络上进行图像合成任务,该任务增强了Gatys等人的框架,通过用维持图像风格的MRF正则项来替代格拉姆矩阵匹配。Ulyanov等人[7]同样提出了基于转换网络的图像风格化方案,但是采用的是多层次的网络架构。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。