视频图像中的文字识别研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:gaiwenru
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频图像中的文本信息作为其内容描述的一种形式,包含了十分丰富且重要的表达信息。采用文本这种高级语义形式,在对视频内容理解和索引方面,具有十分重要的科研价值和应用前景。本文研究的是对复杂背景下视频图像文字的提取识别,主要由视频图像中文本信息的定位,以及提取稳健的字符表达特征两大部分组成。   在视频图像文本区域定位方面,考虑到文本在边缘图中表现出高密度分布的特征,本文在基于边缘特征检测的基础上,引入动态制定检测窗口的尺寸大小的文本定位方法。在边缘图投影后对大小进行估算时,由于字符笔画具有较为密集边缘信息,因此对投影出的连续峰值处作为文本行来分析,从而有效的确定出符合当前检测需求的窗口尺寸。利用动态获取到的检测窗口,在边缘图像中依据其边缘强度检测其中的文本像素,通过精定位和细定位两步得到文本区域。   在字符表达特征提取方面,考虑到字符笔画结构的连续性在其划分出网格中的分布,本文构建一种基于笔画相关性进行自适应加权的特征提取方法。首先,采用弹性网格方法将字符划分成多个网格,字符笔画被切分在多个不同但彼此相邻的子网格中;其次,正是由于笔画分割在相邻的网格中,可以计算出邻接子网格在其位置上对应笔画对中心网格有贡献率;最后,分别为不同的子网格中的笔画采用自适应得到的权值对特征进行加权。   将文字研究的算法和图像文字识别的相关技术结合法,编码实现了视频图像文字识别系统。实验结果表明:本文算法能够在复杂的背景中较好的定位到文本区域,并得到满意的识别结果。
其他文献
如今,伴随着数据量地快速增长,海量数据成为困扰企业发展的因素之一。如何有效处理数据,减小数据访问的并发压力,成为大数据解决方案不断发展的动力。MapReduce是分布式计算
网络上的产品评论对消费者和生产厂商都有重要意义。随着国内网络用户的增多,产品评论数量激增,但因缺乏合理的组织方式,导致信息获取困难。本文针对产品中文评论,使用自然语言处
目前无线传感器网络节点仍然使用电池供电,能量资源有限使得如何提高节点能效,延长网络寿命成为了一个重要挑战。而网络拓扑的设计和路由的选择将对节点能耗产生重大的影响。
事件抽取是信息抽取领域中一项重要的研究任务,旨在从含有事件信息的非结构化文本中抽取出用户感兴趣的事件信息。微博是一种通过关注机制分享简短实时信息的广播式的社交网络
粗糙集理论作为一种新的处理模糊信息和不确定信息的软计算工具,于1982年由波兰科学家Z.Pawlak创立。知识约简是粗糙集理论研究中的核心内容之一,如何快速有效地对海量数据进行
互联网的飞速发展,使得互联网用户的需求越来越多,促使了P2P应用类型的多样化,造成P2P流量连年大量增加。近年来,由于P2P网络用户需求的大增,导致P2P网络资源短缺,互联网中的带宽被
微电子技术、计算机技术、无线通信技术的迅速发展孕育了Ad Hoc网络。Ad Hoc网络通常是指在没有固定网络基础设施的情况下,由一组带有无线收发装置的节点自组织形成的一个多跳
为保护用户的身份隐私,研究人员设计了多种匿名通信系统,如Tor、Crowds、Anonymizer等。然而,匿名通信系统在为用户身份隐私提供保护的同时,也可能被滥用以从事网络犯罪活动,身份
随着硬件的快速发展,使得多核计算成为了可能,为解决海量数据的计算提供了一种有效的方法。本文针对游戏和计算机仿真问题当中的真实感图形的显示实时性要求和渲染效果,对计算机
视频监控系统具有其他非图像信息所没有的丰富内容、直观以及方便等特点,被广泛应用于住宅社区、交通、金融、医院、公安、海关等领域。今天,计算机网络技术,数字信息技术、通信