视频字幕检测与提取的算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lintso1101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了视频信息检索中的一个关键技术——视频字幕的检测与提取,提出了三种算法。(1)基于自适应定位和FCM 分割的视频字幕提取算法。该算法首先进行镜头切换和字幕事件检测,然后采用自适应方法和投影法确定字幕区域。通过视频帧平均方法增强待提取的字幕,最后用FCM 聚类的方法对所得的彩色字幕块进行分割。(2)基于空时信息的视频字幕自动检测与提取算法。首先,采用量化空间差密度(QSDD)测度检测有字幕变化的帧,然后,对有字幕变化的相邻帧计算差图像,在差图像上进行特征提取,利用模糊聚类神经网络(FCNN)分类器进一步定位字幕区域,对字幕区域进行增强以消除背景的影响,最后,从字幕区分割出单个字符,对每个字符作进一步的背景滤除和插值放大,从而得到最终的清晰字幕。(3)基于时间特征矢量的视频字幕提取方法。利用时间特征矢量产生一个抽象的二值图像序列,通过比较相邻两个图像中象素点的变化,能有效的定位字幕出现帧和消失帧。然后对含有同一字幕的视频帧构造时间特征矢量,并利用它从背景图像中分割出字幕。实验结果表明,本文所提出的视频字幕的检测与提取算法具有较高的准确性和较强的鲁棒性。另外针对字幕区域定位技术在字幕提取算法中的重要意义,本文又重点讨论了三种字幕区域定位算法的原理及实现过程。(1)新闻视频字幕定位的连通域法及模板匹配法。(2)基于小波变换的视频字幕定位方法。(3)基于支持向量机的视频字幕自动定位方法。
其他文献
市场对业务的需求促进了现代电信网从传统语音网络向基于IP 分组传输的下一代网络NGN 进化。NGN 的业务体系结构不但能将已有多媒体业务和各种增值业务等各种业务统一承载,而
无线局域网通信是计算机网络技术和通信技术结合的产物,其给网络通信的移动化,个人化和多媒体应用提供了很高的灵活性。随着无线网络的业务类型不断发展,人们对服务质量也不断的
主动轮廓模型(Active Contour Model)也被称为snake模型,是近年来被广泛使用的图像分割技术之一。自从Kass在1987年首先提出该模型以来,很多研究者从不同方向对模型进行着改
星载合成孔径雷达(SAR)是一种工作在微波波段的主动式遥感器,在各种性能指标中,分辨率和测绘带是两个关键性指标。传统星载SAR模式如条带式(Stripmap)、波束扫描式(ScanSAR)和
多输入多输出(Multiple Input Multiple Output, MIMO)技术通过充分利用空间资源以提高系统容量,但同时也增加了接收端信号检测的难度,因此如何设计性能较好且复杂度更低的检测
在信息检索领域,如何有效地理解、检索大规模的数据库以及从海量图像中获取所需信息已成为一项极具价值的研究。因此,探索一种实用的基于内容的图像检索模型,尤其是寻求优秀的特
移动用户的日益增加,对运营商的服务能力和质量提出了更高的要求。这同时就要求分布广、数量多的GSM设备在发生故障时,必须能及时、迅速地发现和处理。因此,为能及时掌握基站设
期刊
  随着通信技术和计算机技术的迅速发展,数字视频在信息社会中发挥着越来越重要的作用,得到越来越广泛的应用。但是数字视频的庞大数据量给数字视频的存储、传输和处理带来极
期刊