视频中的文本提取及其应用

来源 :河海大学 | 被引量 : 4次 | 上传用户:aiwen8431071
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本是视频中重要的内容信息。视频中文本的检测和识别在视频分析过程中起到很大的作用。文本可以作为视频片断的内容标识和索引,例如在新闻视频中出现的新闻摘要,可以作为该段新闻内容的描述,用于新闻视频资料的检索。所以对视频文字的检测和分析是视频分析的重要内容。而检测视频中文字的出现及其准确位置,并将文字从复杂多变的背景中分割出来,是视频文字分析处理的基础。文本信息提取系统主要包括文本检测,文本定位,文本跟踪,文本提取,文本增强和OCR识别六个部分。本文重点研究了文本定位的方法,提出了一种基于投影分析与支持向量机学习相结合的文本定位方法,试验表明该方法比单纯的基于边缘的方法或是学习的方法都要好。首先采用投影分析的方法将可能的文本区域提取出来,然后再采用基于支持向量机学习的方法将提取出来的文本区域中的虚假文本区域排除掉。该方法虽然比基于边缘的方法多了一步,但文本区域的检准率有了较大的提高。与一般的基于学习的方法相比,该方法不必对整个图像区域进行特征计算,减小了计算的时间复杂度。在使用支持向量机进行文本分类时本文采用了小波,角点,扫描线和区域内边缘点的重心位置等特征。论文最后用该方法用于广告视频文本的检测,采用基于多分辨率分析的方法定位广告文本。通过比较发现,新闻中的文本出现位置比较固定而且各个电视台的文本都有各自固定的格式,但广告中的文本无论是大小,字体都是不一样的,利用这一差别可以对广告片断的起始位置有一个更加精确的定位。实验结果表明该方法可以很好的定位出广告文本。
其他文献
许多无线传感器网络的协议和应用都需要知道网络中节点的地理位置。节点随机部署的传感器网络具有与ad-hoc网络类似的特点,其分布式和高自由度的网络环境对定位算法提出了很高
互联网络的发展使得VoIP技术得到了更为广泛的应用,并逐步取代传统的PSTN网络.现有的基于C/S模式IP电话系统,用户必须向中心服务器注册才能与其他用户通信,因此中心服务器将
数据分析类系统存在着因用户需求多变导致的核心功能单元变化频繁的特点,使这类系统的开发、应用和维护比较复杂,重复开发现象普遍。因此,迫切需要研究具有一定柔性的系统框架来
QoS(服务质量)多播路由问题已经成为网络领域中研究的重要课题。它是寻找带有约束条件的可行多播树解的NP-Complete问题。QoS约束可以分为连接约束(如带宽),路径约束(如点到
人类基因组计划的目的之一在于阐明人的约10万种蛋白质的结构、功能、相互作用以及与各种人类疾病之间的关系。蛋白质的三维结构与功能有着密切的关系,对蛋白质结构的研究是蛋
图像配准是将两张或多张在不同时间,从不同角度,来自不同传感器以及在不同条件下拍摄到的图像进行匹配的过程。图像配准的目的就是寻找两幅图像之间的变换关系,它在计算机视觉,图
随着各行业对计算能力及计算速度要求的增加,并行计算成为当今计算机科学中一个重要的研究领域。但是并行程序设计是一个复杂且耗费精力的过程,在编码阶段、测试和调试阶段都
随着社会的发展,互联网中的数据信息处于爆炸式的增长状态,每天互联网中都会产生海量的数据。可以想象,以后人们所面临的数据规模会越来越巨大。从这些巨大的数据中如何能够
第三代移动通信系统的主要特点是提供数据、语音、图像和视频等丰富的移动多媒体业务。3GPP UTMS体系标准的R5版本中引入的IP多媒体子系统(IP Multimedia SubSystem)即是为支
企业为取得市场生存和竞争的优势,适应瞬息万变的市场环境,需要快速响应市场需求,不断调整自己的组织模型和业务流程。工作流管理系统是实现计算机辅助协同工作的工具,能够实