基于人眼感知质量评价的视频编码优化文献综述-文献综述网

文献综述

1 研究的背景和意义

人眼是我们感知外界事物的视觉接口，通过眼睛这个“窗户”，我们感受着缤纷绚丽的世界，人类科技也不断满足着我们的视觉需求。随着科技的进步，从黑白画面到彩色动画，从广播电视到数字视频，得到广泛普及，近些年来，超高清（Ultra High Definition，UHD），全景（Panoramic），虚拟现实（Virtual Reality，VR）和三维（Three-Dimensional，3D）视频也逐渐步入我们的日常生活。可以预见，对更丰富的视觉体验的需求将促使广色域（Wide Color Gamut，WCG）、高动态范围（High Dynamic Range，HDR）、光场[1]等技术得到更深入的发展，这势必会带来爆炸的数据量。据中国互联网络信息中心统计，截至2020年6月，我国网络视频用户规模达8.88亿，占网民整体的94.5%，截至2019年6月，移动互联网接入流量消费已553.9亿GB。

在这样带宽和比特率受限的实际情境中，视频编码通过减少视频中的冗余成分，能够有效减少视频传输的数据量。自上世纪80年代以来，国际标准化组织一直致力于探索高效的视频编码方法，并且不断制定新的国际视频编码标准来高效压缩不断增长的数据量。2020年7月，国际电信联盟ITU-T和国际标准化组织ISO/IEC制定的 H.266[2] /通用视频编码（Versatile Video Coding,VVC）正式发布，其编码效率约是上一代视频编码标准H.265[3] /高效视频编码标准（High Efficiency Video Coding,HEVC）的两倍，是目前广泛使用的视频编码标准 H.264 / AVC[4]的四倍。

传统的视频编码技术只是剔除了视频中时间、空间等冗余，没有充分剔除视觉感知冗余。考虑到人类视觉系统的对比敏感度、视觉注意力机制以及掩蔽效应等感知特性，利用人类视觉系统的感知特性，将感知模型加入到视频编码框架中，进行感知编码从而消除视觉感知冗余，可以带来更好的压缩效率和视觉体验。

现有主流的视频编码方案主要以客观质量为指标指导编解码设计，这样并不能有效反应编解码方法对解码重建的视频的主观质量影响。本课题研究视频编解码优化算法，目标在于通过在视频编解码中引入基于人眼感知质量评价模型的率失真优化算法，提升视频的编码效率，特别是主观质量。

2 国内外研究进展

感知编码主要应用在视频编码框架中的码率控制和率失真优化模块。码率控制用于进行视频编码框架中各层级的比特分配和量化参数确定；率失真优化是在拉格朗日乘子确定的前提下，使率失真函数最小化，指导块划分，帧内、帧间决策等最优编码参数的选择。以下着重介绍感知编码在率失真优化应用中的研究进展。

人类视觉系统（Human Visual System,HVS）存在视觉灵敏度、掩蔽效应[5]、视网膜凹特性和注意力机制等感知特性。我们在文献[6]对人类感知机制模型的分类基础上进行讨论。

第一类是基于感兴趣区域（Region of Interest,ROI）的编码模型。该类模型的关键问题在于区域划分和量化参数的确定。文献[7]在H.264/AVC的框架下通过缩小非ROI区域的运动搜索范围及减少非ROI区域预测模式的选择，实现编码率失真性能的提高。不同于传统设备，针对移动设备的类似的编码策略在文献[8]中被提出。在率失真优化中，不同的模式选择会带来不同的比特率和失真，不同的拉格朗日乘子会影响率失真优化的性能。文献[9]提出了一种基于感兴趣区域的拉格朗日乘子调整方法。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

免费ai写开题、写任务书：免费Ai开题 | 免费Ai任务书 | 免费降AI率 | 免费降重复率 | 论文免费排版

注册

找回密码

基于人眼感知质量评价的视频编码优化文献综述

您可能感兴趣的文章

登录

注册

找回密码

您可能感兴趣的文章