在线视频监控行为预测系统文献综述

 2022-03-16 22:49:04

1.概述

该在线视频监控行为预测系统主要针对油田视频监控中工人是否穿着工装、佩戴安全帽以及一些其他明显的违规行为进行检测,能够减少人力对监控的参与和执勤人员的疏忽以保障油田工作的有序和规范进行。

本文使用人像识别模型YOLOv3和分类模型ResNet152对离线视频和在线视频进行检测,通过人像识别模型对视频采样帧中的人像进行提取,并将提取的人像切片传递给分类模型判断采样帧中是否存在违规行为,最终将含有违规行为的采样帧进行保存。

2.研究背景

人工智能的蓬勃发展使得机器能够在更多的工作中取代人,智能化时代也成为一种大趋势。人工智能在发展的过程中也形成了不同的研究领域例如:计算机视觉、自然语言处理和模式识别等,其中计算机视觉是最重要和应用最广泛的领域之一,无论是目标检测、人脸检测、人脸支付、行为检测都逐渐成为人们日常生活中的一部分。

视频监控是保障工作有序稳定进行必不可少的一部分,在视频监控中融入计算机视觉技术使用相关的技术取代传统的“需要执勤人员实时盯住电脑中视频影像”的工作方式,能够提高工作效率,较少人力投入,并且能够减小人员疏忽造成的不必要的损失。

油田的工作环境复杂,工作范围相对较大并且工作地点较为开放,也正是因为这样的工作环境,经常会有非工作人进入生产平台进行违法破坏活动,危害油区安全,造成财产损失。除此之外,施工人员在工作区域内进行工作时经常出现操作不当或偷懒停工的情况,易发生事故危害人身安全,诸如此类因小失大而出现的事故完全可以有效避免。所以实时的在监控视频中判断工人行为是否违规成为不可缺少的一环,如果仅仅依靠人工完成海量图像的处理,需要消耗大量的人力、物力和时间成本。如何利用人工智能技术自动、快速、有效地对海量的图像挖掘出隐含的信息和潜在规律,进行识别、检索和分类已成为目前计算机视觉识别领域的研究热点。

图像分类作为图像信息分析的重要方法之一,其基本思想是对给定的图像数据及其标签,利用某种分类算法对其进行图像特征识别,预测待测图像的标签类别。一般来说,图像分类可划分为图像信息的获取、信息加工与处理、特征提取、特征选择以及分类器设计等五个过程,其中,信息加工与处理过程是针对图像分辨率差异、光照不均匀等问题,进行预处理,获得大致相同的图像数据;分类器设计的原理是采用归纳、综合、演绎等数学学习规则,利用提取的图像特征,建立图像分类模型,用以预测待测图像的标签类别;特征提取和特征选择概括为特征表达,其作用是挖掘图像的类别特征并进行降维,优质的特征表达是获取图像信息的高效手段,对提高图像分类的准确性起着决定性的作用。例如,在某图像分类任务中,采用某种特征表达算法对同一类别的图像提取的特征向量呈现一致或相近的出分布,而对非一类别的图像提取的特征向量呈现出的分布差异较大,若采用的特征表达算法对图像信息的挖掘能力不强,则易产生不具有判别特征的向量,以至于模型无法高效地完成分类任务。[1]

然而,传统的图像分类方法一般是基于图像的颜色、纹理或直方图等低级可视特征或人工设计特征来进行图像描述,低级可视特征对于内容简单的图像识别任务,能有很好的识别效果,但对于内容复杂的图像识别任务时,则不能有效表征图像性质,无法高效地对图像类别进行正确判别。而人工设计特征需要花费大量的人力和时间设计符合图像本质的特征,且具有较强的主观性,故用这些人工设计特征训练出来的模型对图像的测试或识别任务有着较大的影响,模型的鲁棒性较差。因此,如何设计高效的特征表达算子,快速、有效、自动地捕捉优质特征成为图像分类领域研究的焦点。

近几十年,人工智能取得了高速发展,卷积神经网络(Convolutional Neural Networks,CNNs)作为一种常用的经典实现人工智能化的数学方法之一,不借助人工特征,以端到端的学习方式逐层对图像进行高层次、抽象化的特征提取,在处理低分辨率图像或复杂场景图像时,能够充分地挖掘图像信息,表征图像内容。对比于传统图像分类方法,CNNs凭借网络深度来突出特征的层级表达的特点,拥有更强的特征提取能力和非线性映射能力,更大的模型容量和更强的模型鲁棒性。[2]

3.研究现状

人的行为会因为不同的场景和不同的执行者的不同产生较大的差异,并且人的行为种类复杂多样,但行为检测的识别方案总体集中在特征学习的研究上。但根据识别对象的不同,其主要分为三个子研究方向:剪切视频中的行为识别、无剪切视频中的时序行为检测和时空行为检测[1]。识别剪切视频中的行为是在一段剪切好的视频中确定包含某类行为,属于分类问题,而识别未剪切视频中的行为除了需要确定视频中是否包含某类行为之外还需要确定其起始时间,属于检测问题。目前,视频中的行为识别已经成为视频检索,智能监控,人机交互,机器人等领域的一项重要技术。虽然目前国内外研究人员在视频行为识别领域已经取得了一定成果,但依旧面临环境干扰与遮挡,视角多样性,行为多样性,时空语义多样性等困难,仍然是一个极具挑战性的研究课题。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。