全文总字数:5314字
文献综述
1. 研究背景人类对外部世界的感知途径有视觉、听觉、嗅觉、触觉等,有研究表示超过80%的信息是通过视觉获取的。
赋予计算机以视觉,使其能够理解图像,对图像、视频进行分析和处理,是计算机研究的重要方向之一。
而视频中对人体行为进行识别是计算机视觉领域的重要组成部分[1]。
对人体行为识别的研究有很广泛的应用前景,例如在视频监控中,可以将其应用于视频监控中跌倒、攀爬、打斗、聚众、求救等异常行为的监测;此外,行为识别在视频搜索、虚拟现实、人机交互、医疗等领域也有其应用价值[2]。
根据研究对象复杂程度的不同,人体行为可以分为四个层面:基元行为、单人行为、交互行为以及群体行为。
基元行为描述的是人体部分部位的基本动作;单人行为描述的是单个研究对象对一系列基元行为组合后的动作;交互行为描述的是多人之间互相关联的动作;群体行为描述的是团体行为[3]。
在研究对象方面,起初对人体行为识别的研究集中在RGB视频上,经过多年的研究取得了一定的成果。
但是受到背景、光线、视角以及遮挡的影响,基于RGB视频图像的人体行为识别准确率仍比较低,没有很好的鲁棒性[4]。
随着深度摄像机的问世,采集人体的深度图信息成为可能,例如微软公司旗下的Kinect传感器可以跟踪人体骨架关节点,并以三维坐标的形式存储信息。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
