基于DirectShow和OpenCV的视频图像处理系统的设计文献综述

 2022-03-21 21:07:07

1选题的背景与意义

随着多媒体技术及计算机网络技术的迅速发展,多媒体已广泛地应用于如公共信息业、广告、教育、医学、商业及娱乐等多个领域。数字视频的传播也变得:越来越容易,数字电视、多媒体广播、视频会议已经开始逐步走入人们的日常生活中,视频己经逐渐成为人类信息传播的主流载体之一。当今人们面临的问题已不再是视频内容的匮乏,而是面对浩如烟海的视频信息,如何快速、有效地找到自己需要的内容,已经成为迫切的需求。当用户希望从浩瀚的视频数据库中检索感兴趣的资源时,却发现传统的基于关键词的数据库检索方法难以实现。其主要原因在于:一方面,在许多情况下很难用一个或多个关键词来充分描述视频中的丰富信息,而且这种描述也存在很大的主观性;另一-方面,用户很难将其需求清晰地表达出来,而且这种表达和媒体自身的描述也存在很大差异。为了实现对视频等多媒体信息的有效检索,人们开始研究视频中包涵的“内容”。 因此,基于内容的视频检索技术应运而生,并成为一一个 新的研究领域。视频检索就是要从大量的视频数据中找到所需的视频片段。例如,从一场比赛近两个小时的录像带中如何能把射门镜头迅速提取出来,如果用传统的视频检索通过快进或快退等顺序的方法进行人工查找,不仅耗时而且非常繁琐,这显然无法满足巨容量的多媒体数据库的要求。而用户则希望只要给出一一个射门的例子或是特征描述,系统就能自动检索到所需的射门视频片段,这就是基于内容的视频检索。目前,基于内容的视频检索的工作主要集中在识别和描述图像的颜色、纹理、形状、空间关系的基础.上,对视频数据进行镜头边缘检测、关键帧选取以及故事情节的重构。由此可见,这是一门涉及面很广的交叉学科,涉及到图像处理、心理学、脑科学、计算机视觉、信号处理、统计方法学、模式识别、数据库、计算机网络、视频通信和人机交互等诸多方面的理论,同时还需从认知科学、人工智能、数据库管理系统、人机交互、信息检索等领域引入新的媒体数据表示和数据模型,从而设计出可靠有效的检索算法、系统结构以及友好的人机界面。目前,基于内容的视频检索技术已经成为近年来国内外研究的热点问题,也成为未来信息高速公路、数字图书馆等项目中的关键技术。在信息化社会的今天,基于内容的视频信息检索有着广阔的应用前景,可应用于军事、医学、生产、娱乐等各个方面。随着视频处理和检索技术的完善,它们将对人们生活的改善发挥重要的作用。如今互联网已成为人们日常生活中的重要组成部分。在最近的统计报告中得出传统的信息检索是基于关键词的检索,它先对人们大多数情况使用网络是进行求职、学习购物、文本用关键词标注,再根据用户键入的检索词,按销售、网上订阅、网上银行等,而这些行为事实上是关键词匹配程度查找相似文本。这种检索方式对人们对网络资源的一--种需求,这就要求网络能迅速检索结构化的文本信息方便有效。检索出人们需要的信息资源。随着网络信息的迅随着互联网多媒体信息资源逐渐增多,基于关键词的检索己无法满足多媒体信息检索需求,原因在于多媒体信息是非结构化的,通常是流式媒体,其表示复杂、变换多样,内容具有多义性,同一信息用在不同场合表达内容也可能不同,于是用关键词描述多媒体信息可能存在主观性、繁琐性和片面性等缺点。比如人们需要的是视频中的一部分内容,如某个场景,这就需要能够描述多媒体的内容特征。于是,基于内容的信息检索方式应运而生。.

2国内外研究现状和发展趋势

2.1国内外研究现状

2.1.1国内研究现状

国内在进行媒体内容检索方面工作的高校主要有:北大、清华、中科院等,并且已经取得了一定的研究成果。目前已经成型的系统有国防科大的“NewVideoC AR”新闻节目浏览系统、“MIRC'多媒体信息查询和检索系统;清华大学的TV-FI视频节目管理系统等。目前,本项目所使用的开发工具OpenCV在国内外计算机视觉处理界广泛用作图像、视频的处理,能实现运动分析和目标跟踪,图像分析,结构分析,目标实现和3D重建等功能。在媒体内容检索领域,OpenCV 主要用作结构分析和运动分析。在安防等领域,OpenCV 图像处理已经得到了广泛而深入的应用。

2. 1.2国外研究现状

目前基于内容的媒体内容,视频检索系统还不成熟,但是作为商业软件包的视频检索系统已经问世。国外有很多研究机构和高校在基于内容的视频检索上已经取得了不少进展和成就。比较著名的有QBIC、CVEPS、JAKOB等。QBIC是IBM Almaden 研究中心研究开发的基于内容的搜索平台之一,该系统提供了如下功能:自动分割,场景关键帧提取,使用图像检索视频,使用基于文本的关键字查询。QBIC搜索引擎在IBM OS/2和UNIX下运行。CVEPS是美国哥伦比亚大学开发的媒体内容检索软件测试版本,支持对视频中场景进行自动分割,可以使用关键帧对媒体内容进行搜索。JAKOB是意大利Plermo大学研发的媒体数据检索项目,平台使用镜头提取器把媒体内容分割成各种场景,从每个场景中选出具有关键意义的帧。根据颜色和纹理描述这些代表帧,然后计算与这些短序列相关的运动特征并给出-一个动态描述。当向该系统提交-一个查询或是例子直接查询时,查询模型会对它做出解释,排列好匹配参数,给出相似的镜头。用户可以预览这些结果,也可以改变查询因子来进一步进行查询。谷歌公司的也有足球视频搜索引擎,是与阿姆斯特丹大学开发的足球视频分析系统。该系统基于B/S架构,用户通过远程的浏览器等终端就能找到如进球,黄牌,红牌,换人,或者搜索到特殊的球员。

2.2视频检索技术的发展趋势

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。