基于时空域信息的视频字幕提取算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:h4975915
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频字幕往往包含了丰富的语义信息,与视频其它特征相比,更适于用作视频索引,因而对于视频字幕提取方面的研究备受关注。 本文针对字幕提取算法开展了研究。为了便于后续的视频分析,提出了一种基于模糊聚类神经网络(FCNN)的镜头突变检测算法,实现视频镜头分割,该算法具有检测精度高、对运动稳健等优点;区域定位是字幕提取的关键一环,同样利用FCNN分类器可实现字幕定位,但其运算量大,定位精度不高,因此提出了一种改进的投影分割方法实现字幕区域定位分割,实验表明其简单实用,适于实时处理;考虑到单个字符背景相对简单,为此提出了一种基于单字符的字幕二值化算法,最终在经由字符分割、二值化及残留背景像素清除之后,得到了清晰、高质的字幕图像,字符识别结果证明了这一点。
其他文献
随着高校扩招,学生数不断增长,学生工作日益繁重,信息汇总难等问题严重制约高校学生工作的开展。 数字化校园的构建为教育管理信息化提供了良好的网络基础和系统运行环境。信
目前,在网络上传输音视频(A/V)等多媒体信息可用下载也可用流式传输方式。下载的方式延迟大,流式传输避免了用户必须等待整个文件全部下载完毕才能播放的缺点。流媒体实现的关
随着社会信息化程度的越来越高,一个企业要想生存就必须使自身具有强大的生存能力和竞争能力。真正有实力的企业不仅要有精明的经营手段,更为重要的是它能够掌握各方面的第一手
随着计算机技术的发展,多媒体技术的应用越来越广泛,它的一个重要应用领域—计算机辅助教学(Computer Assisted Instruction简称CAI)越来越受到教育界的青睐。高质量CAI具有
中国电信业打破垄断的以来,面对复杂多变和日趋激烈的竞争压力,电信运营商需要真正关怀客户,电信运营商的经验战略也逐步从"以业务为中心"向"以客户为中心"转变."以客户为中
本文的研究工作开展包括如何对面向软件过程中对软件开发项目中产生的各类知识进行知识建模以实现异构分布式的知识共享、如何对所需知识资源的获取和采取什么样的用户权限管
本论文主要研究柔性工作流的相关理论和实现技术,包括工作流的发展历史回顾、工作流的体系结构和参考模型、工作流在各个领域的应用、工作流系统的不足之处和研究的主要方向。
本文主要叙述了基于Windows2000平台下的个人防火墙系统的设计及具体实现。通过参考目前市场上多种个人防火墙的设计方案,并且分析比较各个设计方案的优缺点,结合目前个人防火
随着网络技术的高速发展,以网络为媒介的分布式远程教学正在走出传统教学的框架,逐步改变了“教”与“学”的方式。基于Web的远程教学已成为一种新的教学模式。本论文重点讨论
本文的研究目标是在应用系统分列,缺乏整合的情况下,实现基于角色的权限分配和管理系统。权限管理是一个长期存在于各类应用开发系统中的问题。由于其不可或缺性,同时要灵活地适