复杂图像文本提取关键技术与应用研究

被引量 : 22次 | 上传用户：HongJuZhang

【摘要】

：

近年来,随着便携式摄影设备的普及和互联网发展,数字图像和数字视频的数量正以惊人的速度增长。嵌入在图像和视频中的文字是图像语义的重要表达方式。如果能够利用计算机自动

【作者】

：

张健

【发表日期】

：

2014年01期

【关键词】

：

文本提取图像二值化连通体特征字符识别梯度直方图

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着便携式摄影设备的普及和互联网发展,数字图像和数字视频的数量正以惊人的速度增长。嵌入在图像和视频中的文字是图像语义的重要表达方式。如果能够利用计算机自动定位和识别这些文字,就可以让计算机自动理解图像的内容,进而借助已经成熟的文本检索技术来检索图像,从而为基于内容的图像和视频处理提供一种途径。国内外学者在复杂图像文本提取与识别方面做了大量研究,并取得阶段性成果,现有OCR软件处理文档图像取得了很好的效果。但是对背景较为复杂的场景图像和分辨率较低的原生数字图像中包含文本的提取研究还处于初级阶段。本文中,我们将复杂图像文本提取过程分为如下四个步骤：图像二值化处理；在二值化图像中提取所有连通体；通过条件随机场模型标记文本连通体；对文本连通体进行文字识别。针对提取过程的每一个步骤,本文进行了如下研究：首先,利用小波的优良去噪性,提出了基于小波变换的图像二值化方法。先将待处理复杂图像转化为灰度图像,然后利用小波分解、多层小波滤波、小波重构将图像中的前景文字作为噪音去除,从而得到图像的背景分布；将背景分布与灰度图像做差运算得到图像的前景分布；再计算局部阈值；最终得到二值化图像。通过与其他著名的八种二值化方法进行对比实验,表明基于小波变换的二值化方法优于其它方法。第二,采用深度遍历方法和形态学的膨胀操作对二值化图像进行连通体抽取,选取连通体关键特征,基于条件随机场模型进行文本分割。选取合理的实验参数,CRF模型能够很好地对连通体进行分类,达到文本分割的目的。第三,使用改进的HOG特征对文字进行识别。考虑在倾斜、光照不均、噪音干扰、边缘柔化等多种异态情况下的复杂图像的字符识别问题,提出基于稀疏编码与梯度方向直方图相结合的SC-HOG方法来进行字符识别研究。此方法先利用稀疏编码得到基向量和稀疏系数,通过重构图像滤除噪音、处理边缘柔化；然后利用梯度方向直方图抽取复原图像的字符边缘梯度特征,削弱倾斜和光照的影响；最后将获取的特征向量送入分类器,实现异态字符的识别。通过在设计字符集和现实字符集上进行字符识别实验表明,SC-HOG方法能够对上述复杂情况的图像中包含的文本进行有效的识别。第四,考虑字符图像尺度和平移影响文字识别率的问题,提出了具有尺度和平移鲁棒性的STRHOG方法来进行字符识别。通过剪裁梯度矩阵处理将字符图像的“边”去除,通过归一化梯度矩阵处理,将待识别的字符图像转换为相同大小,实验表明,利用STRHOG方法处理的图像,文字识别率得到了很大提高。最后,文中对复杂图像文本提取技术做了应用研究,指出了该技术广阔的应用前景。并且利用本文提出的关键技术,构建基于关键词的敏感网络图像过滤系统。

其他文献

口述史的硬伤和硬道理——有关台湾的几个口述史问题

“改古文为白话”唐德刚教授和胡适教授合作完成了《胡适口述自传》,合作推出了口述史的学术经典和学术规范。口述史不是采访人和报告人我问你答、你说我记的简单劳动成果。

期刊

台湾义勇队硬道理张士德学术规范三民主义青年团口述史李友邦

空间曲线在平面上的投影

介绍了空间曲线在平面上的投影曲线的方程的求解方法.通过实例展示了各种不同形式的方程确定的曲线在坐标平面或空间平面上的投影曲线的求解技巧.

期刊

空间曲线柱面投影曲线

新版UDC与我国三大分类法的通用复分体系比较研究

文章以UDC（85年英文版，89年中文版）为基础，就2006年11月更新后的网络版UDC以及《中图法》（第4版）、《人大法》（第6版）、《科图法》（第3版）4部分类法的通用复分表，在系统结构、使用规则、

期刊

新版UDC《中图法》《人大法》《科图法》复分表

面向智慧路灯系统的线性边缘计算算法

在我国智慧城市的建设中,智慧路灯系统是其中关键性的公共基础设施载体。然而规模逐渐扩大的智慧路灯系统越来越无法满足实时、安全处理任务的需求。本文将边缘计算引入智慧

期刊

边缘计算智慧路灯系统网络设备

中国宫内节育器的种类、质量与使用现状

宫内节育器(Intrauterine devices;以下简称IUD)是一种安全、有效、经济、简便、可逆、长效的节育方法。在我国,放置IUD避孕的人数居各项节育措施的第一位。以1991年底统计

期刊

金属单环IUD支撑力带器妊娠率宫内节育器续用率宫形节育器使用现状

深圳JTY典当公司风险管理研究

我国市场经济体制确立后,随着世界经济全球化和商品经济发展步伐的加快,对投资和融资的需求都不断增加,这使得在我国停滞了几十年的典当业务又重新复苏并起到了不可替代的作

学位

典当风险管理指标体系模糊积分评价

六味地黄丸对软脂酸诱导内皮细胞损伤保护机制的研究

目的：本研究从内皮细胞的胰岛素受体底物-2/磷脂酰肌醇3激酶/蛋白激酶B信号途径以及还原型尼克酰胺腺嘌呤二核苷酸磷酸氧化酶4-活性氧-不对称二甲基精氨酸系统两个通路入手，采

学位

胰岛素抵抗六味地黄丸人脐静脉内皮细胞胰岛素信号转导途径氧化应激

绿色贸易壁垒对中国农产品出口影响研究

作为一个农业大国,中国农产品出口贸易是促进农业发展的重要因素。日本一直是中国农产品出口第一大国,改革开放以来中国对日农产品出口额逐渐上升。但是近年来日本实行了越来

学位

农产品对外贸易绿色贸易壁垒农药残留限量标准数量

商业空间导视系统设计研究及其认知地图的构建

社会经济迅速发展与进步，传统的商业模式已经逐渐被综合性商业模式逐渐取代，传统的商业步行街、百货商店、超市以及餐饮、娱乐等商业活动场所，经过业态的整合，已经成为如今集购物

学位

商业空间导视系统认知地图意向元素造型元素

汽车天窗包边机构及工艺研究

天窗作为汽车车身覆盖件的一部分，其常见的包边方式有专机包边和机器人包边两种实现形式。文章首先通过对包边技术的介绍，总结了机器人滚边设备和包边专机设备的组成及设计的要

学位

天窗包边专机包边工艺机构设计质量缩放

复杂图像文本提取关键技术与应用研究

其他学术论文