基于稀疏编码特征的场景文本识别方法研究

来源 :厦门大学厦门大学 | 被引量 : 0次 | 上传用户：wubin811030

【摘要】

：

场景文本识别主要研究的内容是识别出自然场景环境下拍摄的图像中所包含的文本。自然场景文本包括路牌、商业广告、杂货店店面和车牌号码等。随着计算机技术的发展，尤其是智能

【作者】

：

章冬

【机构】

：

厦门大学

【出处】

：

厦门大学厦门大学

【发表日期】

：

2015年期

【关键词】

：

场景文本识别稀疏编码特征目标函数精确度控制

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

场景文本识别主要研究的内容是识别出自然场景环境下拍摄的图像中所包含的文本。自然场景文本包括路牌、商业广告、杂货店店面和车牌号码等。随着计算机技术的发展，尤其是智能手机和数码相机的发展，先进的数码设备越来越在人民群众中普及，准确地识别图像中的文本也变得越来越有应用价值，这也促使了更多的研究人员投入到这项研究中来。　　本文主要描述了一种有效的基于稀疏编码特征的场景文本识别方法，即稀疏编码直方图特征(HSC)。整个识别方法分为单字识别以及单词识别两个阶段。在单字识别阶段，本文提出使用HSC特征代替梯度方向直方图(HOG)特征，HSC特征相比于HOG特征，能更详细表示图像的结构信息，在不增加时间复杂度的同时，又有效地提高了识别的精确度。在HSC特征的提取过程中，首先学习得到字典，该字典用来计算图像上每个像素的稀疏编码。字典的学习使用K-SVD分解方法，并按照类似HOG特征提取的方法聚集每个像素的稀疏编码形成局部直方图。在单词识别阶段，使用动态规划方法搜索最优匹配以得到识别结果。在动态规划的目标函数中集成了多种信息，包括候选字符区域的每个类的字符识别分数、候选字符区域之间的几何关系和单词包含的字符数。在搜索前，预先给定一定数量的单词，最终的识别结果是通过搜索所有给定单词中对应于目标函数最大值的路径得到。这个路径上的每一个点就是一个字符候选区域，最后顺序连接起来形成最终结果。目标函数中的参数通过最小分类错误(MCE)的训练方法学习得到。在ICDAR2003、ICDAR2011和SVT这三个国际通用数据库中的实验表明，基于稀疏编码直方图特征的场景文本识别方法明显优于基于梯度方向直方图的识别方法，并取得了较高的识别率。

其他文献

基于ARM9E的HE-AAC编解码器的优化研究

HE-AAC（HighEfficiencyAdvancedAudioCoding）作为MPEG（运动图像专家组织）提出的下一代音频压缩标准，是目前最先进的音频压缩技术之一，被称为是21世纪的音频压缩标准。以智能电话、

学位

音频压缩标准HE-AAC编解码器运算性能二叉树搜索

SIP电话的研究与设计

NGN（NextGenerationNetwork，下一代网络）是基于分组技术的网络，能提供多种电信级业务，满足人们对各种新业务的需求。其中，在NGN上提供实时语音和多媒体业务是当前的热点。　　与此

学位

下一代网络SIP电话通信协议TCP/UDP层IP分组

H.264解码器熵解码快速算法的研究

H.264/AVC视频压缩标准采用了几种变长码技术，例如指数哥伦布码和基于上下文自适应的变长编码。而在其参考软件中，这些变长码的解码算法对于理解标准的内容有很大的作用，但是在

学位

H.264解码器二叉树结构视频压缩标准熵解码快速算法

歌声中旋律自动调整算法设计与实现

语音处理技术有着广泛的应用领域，歌声旋律自动调整是语音处理技术的一个新的应用领域。对歌声旋律自动调整方法的研究在歌声评估、音乐教学、歌声纠正、娱乐等领域都有很大的

学位

语音处理技术自动调整算法声旋律帧能量同步

RoboCup中型组足球机器人决策系统的研究

足球机器人的研究在近几年得到了迅速发展，使得这个多学科交叉的项目受到越来越多的关注，作为一个新的研究领域，有很多内容值得去研究。本文的研究对象是中型组足球机器人，着重对

学位

足球机器人决策系统二分图估值函数角色有限自动机

一种融合细节点和汗孔的指纹识别算法

指纹识别是生物特征识别技术中被广泛关注的应用之一。一个典型的指纹识别系统包括四个主要部分：指纹图像获取、图像预处理、特征提取和特征匹配。由于基于细节点的指纹识别无

学位

细节点汗孔特征指纹识别算法图像预处理

基于BIBD的数据库压缩水印技术

随着数据库技术的不断发展及数据库管理系统的广泛应用,同多媒体数据一样,数据库也面临着版权保护的问题。当在Internet上允许指定用户远程查询和访问数据库时,数据提供者要

学位

数据库水印区组设计平衡不完全区组设计(BIBD)压缩水印水印信息与处理

生物异构网络的隐藏链接关系预测

生物系统是一种复杂系统，而生物网络是描述生物系统的一种有力工具。通过对生物网络研究，能够了解生物系统的运行过程，探索基因或其他分子化合物的功能作用。随着人类基因组计划

学位

生物异构网络链接预测算法致病基因致病非编码核糖核苷酸

SNMP在WCDMA基站中的应用

在WCDMA基站中，主控板和其他外围单板之间的交互显得非常繁琐，并且难以控制，一般的做法是采用大量的自定义的消息进行交互，即将需要交互的数据以厂家特定的形式封装在UDP或者TCP

学位

简单网络管理协议WCDMA基站嵌入式系统消息交互机制

RFID安全协议形式化分析研究及DRAP协议的建立与实现

随着计算机网络通信的迅猛发展,网络安全开始被人们所重视,其中安全协议分析验证已成为一个研究热点。对安全协议的分析验证的方法和手段有很多,其中形式化分析方法已被证明

学位

安全协议RFID系统串空间BAN逻辑形式化分析DRAP协议

基于稀疏编码特征的场景文本识别方法研究

与本文相关的学术论文