论文部分内容阅读
当今计算机技术和移动互联网迅猛发展,在移动平台上的多媒体应用已经越来越多。而移动终端具有移动带宽和屏幕尺寸有限的特点,这就要求其对图像和视频的处理要更加人性化和智能化,视频摘要的相关技术应运而生。本文研究并实现的正是一个移动终端上以关键帧为主要摘要形式并具有良好用户体验的视频摘要系统,主要内容如下:首先,本文介绍了课题相关的技术背景,包括视频摘要相关技术的简介和现状调研。主要介绍了视频摘要的两种基本形式:静态视频摘要和动态视频摘要技术,以及两种摘要之间的比较。另外,为了进一步研究关键帧这种摘要形式,需要把包含模糊的人脸的图片从关键帧序列中排除,所以介绍了两种人脸模糊检测算法:DCT(Discrete Cosine Transform)算法和边缘检测算法。然后,论文从视频摘要系统的需求分析入手,描述了视频摘要系统的总体设计、算法验证、详细实现和测试过程。在总体设计中,本文将视频摘要系统分为了摄像头及关键帧管理模块、视频文件管理模块以及用户交互模块三大部分:在算法验证过程中,本文提出了一种基于部分上下文和运动检测的关键帧提取和更新算法,并在进一步对包含模糊人脸的关键帧图像处理的研究中,提出了针对模糊人脸检测的基于DCT方法和基于边缘检测方法,并对这两种方法的人脸模糊检测分类结果进行了测试和对比;在详细设计中,本文详细介绍了以上三大模块的详细设计与具体实现,主要包括新的摘要的产生方式、场景边界的界定、最优摘要的判定方法以及用户交互的拍摄、播放和文件Gallery界面的设计与实现;之后,本文介绍了视频摘要系统的测试过程,验证了视频摘要系统的可用性和用户体验。最后,论文对全文做出了总结,并描述了两个系统存在的不足和仍需进一步改进的工作,同时总结了本人在硕士研究生期间的工作和学术成果。