基于图卷积网络的交互行为研究文献综述

 2021-12-28 08:12

全文总字数:5314字

文献综述

1. 研究背景人类对外部世界的感知途径有视觉、听觉、嗅觉、触觉等,有研究表示超过80%的信息是通过视觉获取的。

赋予计算机以视觉,使其能够理解图像,对图像、视频进行分析和处理,是计算机研究的重要方向之一。

而视频中对人体行为进行识别是计算机视觉领域的重要组成部分[1]。

对人体行为识别的研究有很广泛的应用前景,例如在视频监控中,可以将其应用于视频监控中跌倒、攀爬、打斗、聚众、求救等异常行为的监测;此外,行为识别在视频搜索、虚拟现实、人机交互、医疗等领域也有其应用价值[2]。

根据研究对象复杂程度的不同,人体行为可以分为四个层面:基元行为、单人行为、交互行为以及群体行为。

基元行为描述的是人体部分部位的基本动作;单人行为描述的是单个研究对象对一系列基元行为组合后的动作;交互行为描述的是多人之间互相关联的动作;群体行为描述的是团体行为[3]。

在研究对象方面,起初对人体行为识别的研究集中在RGB视频上,经过多年的研究取得了一定的成果。

但是受到背景、光线、视角以及遮挡的影响,基于RGB视频图像的人体行为识别准确率仍比较低,没有很好的鲁棒性[4]。

随着深度摄像机的问世,采集人体的深度图信息成为可能,例如微软公司旗下的Kinect传感器可以跟踪人体骨架关节点,并以三维坐标的形式存储信息。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

免费ai写开题、写任务书: 免费Ai开题 | 免费Ai任务书 | 降AI率 | 降重复率 | 论文一键排版