论文部分内容阅读
屏幕内容是指由电子设备生成的图像/视频,例如漫画,3-D游戏,捕获的计算机屏幕,有文字覆盖的视频等。随着移动互联网和云计算的兴起,屏幕内容编码受到广泛关注。现有的基于预测加变换的视频编码技术如HEVC对屏幕内容的压缩效果并不好。本文对屏幕内容的显示原理、特性以及HEVC压缩影响进行了分析,并根据屏幕内容的特性在HEVC编码框架基础上提出了一种图案匹配模式用于提高屏幕内容编码效率。论文具体的研究工作如下:(1)分析了原始屏幕内容和视频应用中的屏幕内容的显示原理。对屏幕内容的特性进行分析,将其与自然视频比较,并分析了HEVC编码框架对压缩屏幕内容的影响。最后用HEVC分别压缩自然视频和屏幕内容进行实验,验证了基于预测加变换的HEVC编码框架对屏幕内容编码效果不理想。(2)提出了一种图案匹配模式,作为一种额外的编码工具融合进HEVC编码框架中,用于提升屏幕内容编码效率,该模式首先对屏幕内容进行色彩预处理,将YUV像素值转换为基本色和索引映射,即对应的色彩分量和结构分量。由于屏幕内容的色彩分量和结构分量有不同的特性,对其采用不同的编码。对基本色进行预测编码,预测情况采用两层分级编码,未预测成功的基本色采用显式差分编码。对索引映射值采用字典的编码方法,以充分利用屏幕内容中的重复图案,减少结构分量冗余。对待编码索引值字符串首先查找字典是否存在匹配字符串,若存在匹配串则将其编码为偏移值和匹配长度,若不存在匹配串则对索引值采用预测编码。(3)在图案匹配模式的索引值字典编码中,为了提升编码效率需要在字典中寻找最长的匹配字符串,可能需要多次字符串匹配操作,由于字符串匹配很耗时,为了减少编码时间,提出了一种基于哈希表的快速字典搜索算法,可显著减少字符串匹配次数。由于图案匹配模式采用和HEVC不同的编码框架,因此定义了新的句法元素和熵编码流程。此外,由于图案匹配模式的索引值字典编码中的匹配长度为非等概分布,提出了一种类似k阶指数哥伦布码的匹配长度编码方案。(4)提出了一种基于FFMPEG的屏幕内容提取方案,可以无损地将原始屏幕内容保存成指定帧率的YUV文件格式。并对提出的基于HEVC的图案匹配模式的编码性能进行实验分析,最后分别使用提出的图案匹配模式和HM对采用上述FFMPEG屏幕内容提取方案捕获的屏幕内容进行压缩编码,对解码重构图进行了主观质量评价。