论文部分内容阅读
近年来,随着互联网和移动网络的快速发展,多媒体业务得到了广泛的应用。由于系统平台和终端的多样性,多媒体业务通常要求视频数据能适应各种平台和网络,并能兼容各种新老设备。视频转码技术可以将一种格式的视频流转换成另一种格式的视频流。它可以有效而经济地解决视频数据跨平台、跨终端兼容性问题。尽管视频转码技术已经研究了很多年,但最近几年随着多媒体云平台中海量视频数据的涌现,以及高清视频的逐步推广应用,它依然面临诸多挑战,如视频转码的计算复杂度偏高仍然制约着多媒体网关的并发处理能力。因此,研究一种快速而高效的视频转码技术重新成为视频应用中的一个重要研究领域,具有广阔的应用前景。本文跟踪研究视频转码领域的最新技术与方法,研究模式识别及机器学习方法在视频转码方面的应用问题,以提高视频转码的速度。本文取得的主要成果如下;1.本文分析了已有的基于数据挖掘的宏块模式快速判决算法,在此基础上提出了一种改进的Jrip决策树模型。该模型改善了原有方法决策树结构复杂,实现困难以及代码执行效率低的问题。2.本文提出了一种基于数据挖掘的宏块运动矢量快速估计方法。该方法直接对宏块运动矢量的已编码信息进行快速判决,获得目标码率的运动矢量信息,提高了宏块运动估计的速度。测试结果表明,改进的MPEG-2→H.264和H.263→H.264转码器可以在转码质量下降少许的情况下降低36%的转码时间,其转码性能优于改进前的性能。3.本文亦对深度学习方法在视频转码方面应用做了探索和尝试,提出了一种基于深度置信网络(DBN)的宏块模式快速判决方法。实验结果表明基于该模型的判决准确率高,转码得到的视频质量较高。初步验证了将深度学习方法用于视频转码的有效性。