基于新闻视频字幕的检测与提取分析

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:zhouyu2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新闻节目作为人们获取信息的一种方式,在人们日常生活中起着非常重要的作用。基于新闻视频的字幕检测与提取是基于内容的视频信息分类检索的一部分,是多媒体信息处理研究领域中的重要课题。本文以新闻视频为研究对象,对视频中常见的三类主题字幕进行检测与提取。主要包括:镜头检测、主题字幕帧检测、字幕分割、字幕二值化、字符分割与识别等。针对视频结构化问题,本文在分析常用镜头检测方法的基础上,采用了基于时空切片的镜头检测方法,实现了对新闻视频结构化。针对字幕检测问题,本文提出了基于时空切片纹理特征的字幕帧检测方法。在镜头内,实现了对新闻视频中常见的两类型非滚动字幕边界帧的检测,避免了对所有相同字幕帧的检测,降低了检测的复杂度。根据切片中滚动字幕表现出来的纹理特征,对新闻视频中的上下型滚动字幕帧进行检测,并给出了字幕帧检测原型系统,取得了较好的检测效果。字幕提取部分,在分析两文献方法不足的基础上,本文首先提出了基于融合小波加权重构-形态学字幕定位方法,然后用投影法分割出字幕行,为了提高字幕的分辨率,用双三次插值法增强字幕,其次对比几种二值化方法,用Otsu全局阈值法二值化字幕,投影分割出字符,对投影分割字符时出现的问题给予分析与解决。最后经现成的汉王OCR软件识别出字符,取得了较好的实验效果。
其他文献
迫于环境污染和能源危机的压力,世界各国越来越重视电动汽车的发展,期待将来能用它逐步取代燃油汽车。但是电动汽车的发展尚有很多问题需要解决,动力电池及其管理系统就是几个关键技术中的一个,而电池荷电状态(SOC)的估算更是电池管理系统中的重要技术。本文的主要任务就是对电动汽车用镍氢电池组的SOC估算方法进行研究。本文首先明确了SOC的量化表达式,分析其影响因素和估算的困难所在,然后对当今存在的SOC估算
含缺失成分的矩阵低秩分解在计算机视觉领域有许多应用。不采取任何先验信息用来最小化所有已知矩阵元素总重构误差的原始模型能为应用提供一种非物理意义上的解决方法。本文
随着智能电网的发展,各类非线性负荷日益增多,引起了一系列电能质量问题。由于电压骤变发生频率高,影响范围大,不断危害用电设备运行安全,电压骤变问题越来越受到关注。电压
在信息化社会中,社会对计算机网络的依赖越来越强,网络对社会的影响也越来越大。随着网络上各种新业务的兴起,使得安全问题显得越来越重要。本文从Internet的安全问题出发,讨论了
钢铁工业在我国基础工业中占据了举足轻重的作用,钢铁的质量直接影响着我国的经济发展。在钢条的生产过程中,温度分布和冷却速率对于钢铁的微观结构有着非常重要的影响,从而
非接触式感应耦合电能传输(Inductively Coupled Power Transfer,ICPT)技术,是一种新型的电能传输技术,它通过高频磁场搭建供电设备与用电设备之间的能量传输通道,实现了非接触方式传输能量,以其高可靠性、高安全性、低维护性等优点得到了迅速的发展。由于LCL复合谐振型ICPT系统比传统的单级LC谐振型ICPT系统有更大的谐振容量,在传输同等大功率等级下,这种系统的开关管
随着互联网、移动通讯、无线网络、个人多媒体业务以及工业网络中大量多媒体数据的出现,对路由器的队列调度和队列管理能力的要求越来越高。路由器在转发传统数据包业务的同时
现实世界的很多问题都是多目标优化问题。在多目标问题中,各目标之间通常不是独立存在的,往往互相冲突,因而,不存在单一解向量使得所有目标最优,这使得多目标问题难于优化。
随着信息技术的发展和工业过程自动化水平的不断提高,多相流在工业过程中出现的频率越来越高,从而在科学研究和工业过程中对多相流参数的实时检测提出了更高的要求,对多相流
视觉里程计(Visual odometry,VO)是一个利用与运动物体相关联的单目、立体或者三维相机获取图片信息,进而通过计算图片间的关联关系来估计物体运动情况的装置,可为视觉导航定