基于图卷积网络的交互行为研究文献综述-文献综述网

全文总字数：5314字

文献综述

1. 研究背景人类对外部世界的感知途径有视觉、听觉、嗅觉、触觉等，有研究表示超过80%的信息是通过视觉获取的。

赋予计算机以视觉，使其能够理解图像，对图像、视频进行分析和处理，是计算机研究的重要方向之一。

而视频中对人体行为进行识别是计算机视觉领域的重要组成部分[1]。

对人体行为识别的研究有很广泛的应用前景，例如在视频监控中，可以将其应用于视频监控中跌倒、攀爬、打斗、聚众、求救等异常行为的监测；此外，行为识别在视频搜索、虚拟现实、人机交互、医疗等领域也有其应用价值[2]。

根据研究对象复杂程度的不同，人体行为可以分为四个层面：基元行为、单人行为、交互行为以及群体行为。

基元行为描述的是人体部分部位的基本动作；单人行为描述的是单个研究对象对一系列基元行为组合后的动作；交互行为描述的是多人之间互相关联的动作；群体行为描述的是团体行为[3]。

在研究对象方面，起初对人体行为识别的研究集中在RGB视频上，经过多年的研究取得了一定的成果。

但是受到背景、光线、视角以及遮挡的影响，基于RGB视频图像的人体行为识别准确率仍比较低，没有很好的鲁棒性[4]。

随着深度摄像机的问世，采集人体的深度图信息成为可能，例如微软公司旗下的Kinect传感器可以跟踪人体骨架关节点，并以三维坐标的形式存储信息。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付