基于多帧融合的视频文本检测

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:coralcn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频文本能够提供重要的视频语义信息以供视频检索和视频摘要,因此获取视频文本对于视频语义分析具有重要作用。有效地检测出视频中的文本无疑是其中一项关键的技术。文本检测最主要的困难来自复杂背景的存在。通过文本检测方法减小复杂背景的干扰,检测出视频文本图像是本文主要解决的问题。基于静态图像的文字检测和识别方法基本上都不能很好地解决复杂背景带来的干扰。针对视频中文本背景复杂、干扰强烈等问题,在对前人相关工作进行分析、研究的基础上,本文提出一种基于多帧融合的视频文本检测方法。该方法首先采用信息熵和角点信息分析相结合的方法对视频进行镜头分割,将视频分割成较小的语义单位,提高系统处理效率;然后,在基于静态图像检测到的文本区域的基础上,利用多帧验证方法确定文本区域以及文本所在的帧序列;最后,对帧序列中的文本块进行多帧融合,降低文字区域的背景复杂度,以减小后续文本定位、文本提取等过程的处理难度。本文提出并实现的基于多帧融合的文本检测方法在视频文本提取系统中得到成功的应用,使该系统完整地实现了从输入视频到产生OCR识别结果的总体流程。实验结果表明,本文提出的文本检测方法具有较高的准确率和处理效率。
其他文献
三网融合已被正式提上日程,基于融合网络提供融合类业务也已是迫在眉睫的任务。本文所提出的面向融合网络的Parlay X网关(PXGW),正是基于这个网络和业务环境背景而提出的,目
网络安全问题是下一代互联网研究的关键问题之一,而加密算法又是网络安全问题的核心。为了满足下一代互联网多媒体实时性安全通信的要求,既需要选用复杂性高的加密算法,以增
随着网络节点数量的增多、用户对网络服务质量的要求越来越高,无线接入网变得庞大且难以管理,网络优化成本较高。LTE (Long Term Evolution)无线接入网具有自主管理的设计需
航天型号软件,即作为航天型号产品的一部分而发挥作用的软件产品。由于型号软件工作环境及用途的特殊性,其对可靠性要求很高。甚至可以这样认为:可靠性是型号软件的生命线.是系
随着3G(3rd-generation)及后3G无线通信技术的成熟和发展,使得视频通信业务成为可能,人们也越来越期待能在手机智能终端上享受更多丰富多彩的业务,比如互联网业务。随着呼叫
雷达辐射源信号识别是电子情报侦察(ELINT).电子支援侦察(ESM)和雷达威胁告警(RWR)系统中的关键处理过程,也是电子干扰的前提和基础,其识别水平是衡量雷达对抗设备技术先进程
随着软件在航天型号系统中得到广泛的应用,软件在系统中的作用也越来越重要。在很多的安全关键性应用领域,特别是航天型号中,对软件的有效测试的需求也在不断增长。其中,在软件确
无线传感器网络(wireless sensor network, WSN)由部署在监测区域内大量的、微型的传感器节点组成,其目的是协作地感知、采集和处理监测区域内感知对象的信息,并发送给观察者
随着智能手机和3G网络的逐渐普及,移动用户规模的快速增长,手机正朝着智能、互联、开放等方向发展,安全问题也日益突出。人们越来越需要一款安全软件,能够监控手机联网行为,实时的
微代码存储在中央处理器(CPU,Central Processing Unit)的解码单元中,通常是由类似汇编语言所编写的代码。处理器将变长的x86指令翻译成一系列微操作,以便于由CPU内部以类似精简