基于深度学习的人体姿态预测文献综述

 2023-09-18 11:09

文献综述

本课题的现状及发展趋势:

近年来,行为识别技术成为机器视觉领域的研究热点之一。人体行为识别技术被广泛应用于智视频监控等方面。前期人体动作识别主要是基于静态图像进行的,Delaitre和Raja等人[1,2]提出了基于“特征包”的方法,提取静态图像中的人体动作特征,然后进行匹配。相比于静态图像,基于视频的人体动作包含了更多的反映动作特征的信息,如时间信息等。目前基于视频的人体动作的主流识别方法是采用深度学习算法。为了更好的利用视频图像中的时间信息,Yang[3]在常规2D卷积神经网络的基础上提出了3D卷积神经网络模型有效的提取视频图像空间特征的同时也提取了视频的时间信息特征,实验结果表明,对视频图像的时间特征的提取能够很大程度上提高视频中人体动作的识别率;Simonyan等人[4]提出了双流卷积神经网络模型,将视频的空间信息和时间信息分别采用卷积神经网络进行特征提取,然后再进行融合达到人体动作识别的效果;除了单一的使用一种神经网络模型外,Donahue等人[5]提出了长期循环卷积神经网络模型,通过卷积神经网络提取视频图像的空间特征,然后将按帧提取的图像特征依次导入长短时记忆网络中提取视频图像的时间特征。

尽管异常行为检测在检测技术方面是人体行为识别方面的一个环节,却被许多研究人员单独研究。Junejo等人[6]以轨迹的位置、速度、空时曲率等作为特征,提出了基于DBN的异常行为检测;Yang等人[7]提出了基于轨迹和多示例学习的局部异常检测方法;Wang等人[8]引入加速度信息,构建混合光流方向直方图,采用稀疏编码对视频中行为进行异常检测;Zhang等人[9]结合视频中行人的运动信息和外观信息进行异常检测尽管以上这些异常行为检测的方法具有可观的精确率,但却没有合适的异常行为判定指标,就像胡学敏等人[10]将行人聚集度作为人体异常行为的评价标准;韩飞龙[11]选择KTH数据库中的4类行人动作,规定正常行走为正常行为,摔倒、挥拳和奔跑是异常行为。为了更加突出异常行为检测的意义,本文结合视频图像的采集场景,提出了具有4类动作的异常行为集合,视频图像中发生任意一类动作均视为异常行为。

异常行为往往伴随着安全问题,为了避免安全事故的发生,提前发出安全警示能够较大程度上避免生命财产损失,因此提前预测视频图像中的行为特征就变得尤为重要。Mathieu等人[12]提出了三种不同的互补特征学习策略用于训练卷积网络生成给定输入序列的视频图像的下一帧;Liu等人[13]将基于光流和基于神经网络的合成视频帧的算法优点相结合,提出了基于深度体素流的方法,通过训练一个深度网络来学习如何从已有的像素值中流动来合成视频帧,从而达到预测视频图像下一时刻内容的效果;Srivastava[14]和Patraucean[15]以及 Luo[16]等人利用长短时记忆网络的短时记忆特性,提出了基于长短时记忆的视频帧预测模型,实验结果表明预测的视频图像有助于后期的动作分类;近年来随着生成对抗网络模型的提出[17],生成对抗网络不仅被应用在图像生成,图像复原等方面,也被应用在视频图像的预测方面。Liang[18]等人提出一个双运动生成对抗网络模型,通过对两个对抗性鉴别器的对称反馈信号的学习,以及未来帧生成器和未来流生成器的互补作用使得该方法在视频帧预测方面表现性能更佳。

本课题的价值:

随着人工智能时代的到来,国家大力推动相关产业智能化,如智能家居,智能医疗,智能交通等。基于对抗网络的视频预测在国内外处于起步阶段,存在较大的研究空间和应用前景。深度学习能够自动提取用于识别图像目标的特征,在图像识别方面有着得天独厚的优势。在实用性方面,由于异常行为往往伴随着安全问题,为了避免安全事故的发生,提前发出安全警示能够较大程度上避免生命财产损失,因此提前预测视频图像中的行为特征具有重要意义、有前瞻性和较好的应用前景,有必要及早立项研究,以突破关键技术,推动深度学习在视频理解中的发展和应用。

参考文献:

[1]Raja K, Laptev I, Peacute;rez P, et al. Joint pose estimation and action recognition in imagegraphs[C]. In: Proceedings of the IEEE ICIP 2011.Brussels:IEEE, 2011.25-28.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。