基于MSER的自然场景文本定位算法研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:qjw335471690
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景图像中的文本含有大量语义信息,是对图像场景的重要补充。随着智能手机、平板电脑和数码相机的普及,人们越来越容易获取高质量的场景图像。从自然场景图像中提取文本信息不仅有助于人们更深层次地理解场景,而且在检索、查询以及视觉辅助系统中有重要用途。准确提取自然场景中的文本信息的前提是精确定位文本区域,自然场景文本定位面临着图像背景复杂、字体多样以及遮挡、模糊等难题,是一个极具挑战性的研究课题。本文对自然场景文本定位的相关技术进行探索,提出了一种新的基于最大稳定极值区域的自然场景文本定位算法框架。本文的主要贡献如下:(1)针对MSER检测器检测文本候选区域的重复检测问题,提出了一种基于区域变化率的MSER重复嵌套区域删除规则。首先对图像进行预处理,从各个颜色通道中提取出MSER,然后根据区域的变化率以及包含关系,删除重复检测的区域。(2)针对低分辨率或者有阴影的图像,相邻字符之间存在边缘粘连的问题,本文用边缘增强的MSER作为字符候选区域,并且在此基础上设计了一种由粗到细的字符候选区域验证规则。首先利用区域的形状特征设计了验证候选字符区域的启发式规则,然后结合区域的笔画宽度变换和支持向量机实现字符区域的确认。(3)设计了一种基于字符区域特征相似性的文本行建立方法,将从多个通道中提取出的字符区域合并为能够表达完整语义信息的文本行。为了验证提出算法的性能,分别在ICDAR 2003、ICDAR 2013和SVT三个公开数据库进行了仿真实验,得到了良好的实验效果。
其他文献
多波束测深声呐是当代海底成像及海底表征最有效的工具之一,因为它们能在垂直航迹方向的宽条带上提供共点定位的高分辨率测深数据和反向散射强度数据。深度数据形成海底地形图
近年来,信息技术和网络技术的发展给人类社会和国民经济的各个领域带来巨大而深刻的变化。物联网的出现,打破了人们之前较为传统的观念,所有的物品都能通过射频识别的技术相互连
本论文对无线自组织网络的几种主要路由算法进行了探讨,并分析了井下无线传输环境的特殊性。通过对供电电缆、巷道支护材料、煤层电特性、粉尘、水汽、雾滴的分析,得出井下电磁
基于数字条纹投影的形貌测量是目前最有潜力的非接触式光学测量技术之一。由于该技术具有设备要求简单、易于控制和实现、测量精度较高的特点,在机械制造、工业检测、模式识
随着经济社会的迅速发展和城市人口的不断增加,基于计算机视觉的视频图像处理技术的人流量统计系统给人们日常生活带来了很多的方便。系统中包含的行人检测、目标跟踪以及流量
目前,我国煤矿井下通信系统以光纤传输为主,具有通信容量大、传输损耗低、抗电磁干扰能力强等优点,但同时面临着成本高、维护复杂、现场施工难度大等缺点。研究并设计一种低
桥梁等大型基础工程的使用期比较长,对它们进行健康监测的概念很早就提出了。近年来,桥梁坍塌现象的增多给国家和人们带来了巨大的经济损失,桥梁的安全状况越来越引起人们的重视
为实现“泛在信息社会”目标,未来的通信网络将呈现泛在性、异构性、对称性、融合性、环境感知性、自组织性和自愈性等特点。环境感知性作为其显著的特点,必然受到业界的热捧
我国的煤矿产业在国民经济中占重要地位,煤炭安全开采和社会大局的稳定紧密相关。近年来,许多国内外大型矿山开始将工业监测技术运用到生产中,起到了一定的安全保障作用。但是现
随着数码科技以及互联网通信的迅速发展,数字图像已经渗透到人们的日常生活中,如交通监控、医疗卫生以及新闻媒体等。而大多数数字图像都以无序的状态存在,图像中的一些重要