彩色污损机票图像高精度多区域字符串定位

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:yuhong8109
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着航空事业的发展,票据部门成了一个巨大的档案馆,迫切需要一个通过计算机管理的自动化文档存储检索系统,通过网络对机票进行查询等处理.该机票自动处理系统对扫描图像作自动区域定位,连续OCR和数据库自动录入,以及提供网络检索技术,最后生成图像文档和索引.该文所描述的系统是机票自动处理系统的预处理部分.在该子系统中我们提出了一个检测和定位彩色机票图像中污损字符串技术.对该子系统的大致描述如下:对彩色机票图像进行图像处理,得到字符图像,再对字符图像应用自动目标识别(Automatic Target Recognition,ATR)技术进行多区域字符串定位.机票图像一般具有以下特点:不规则机票表格中的字符串是由计算机打印生成,对比度低且容易偏离表格,无法用常用的方法处理.因此,该文针对机票复杂背景首先提出一个进行字符分离的高准确率新算法.该方法采用一个基于主成分分析(Principal Components Analysis,PCA)和学习向量量化(Learning Vector Quantization,LVQ)混合神经网络作为高效的字符提取器,实际应用证明该字符提取算法准确率高,为准确的字符定位和OCR提供良好的输入.同时,我们推广了传统的灰度阈值分割二值化方法,在彩色空间应用决策树和局部阈值方法进行彩色图像二值化的研究与试验.然后,基于几何先验知识和字符提取结果,我们应用扩展最大平均相关高度(Extended Maximun Average Correlation Height,EMACH)相关滤波器,检测进而准确定位期望字符区域.试验结果表明该方法准确率高,可以为OCR提供良好的输入.文档图像分析是模式识别领域比较成熟的方面,但文档图像分析领域仍然没有一个通用的解决方法,因此该方面的研究仍处于初级阶段.飞机票系统就是该领域探索的一个典型的例子——我们将几种模式识别技术应用到文档图像分析领域,从而取得比较好的效果.因此,与已经出版的相关中英文文献比较,我们的尝试具有原创性和新颖性.
其他文献
人脸识别是一项极富挑战性的课题。传统方法需要极其繁多的前期工作和识别阶段的诸多限制,因而不论从理论上还是在实际应用中都极为困难。本文把遗传算法应用于人脸识别的分割
在软件开发过程中,开发人员通过复制粘贴既有代码向系统中引入大量的克隆代码。克隆代码会随着时间和软件系统更新而进行演化,使软件系统变得越来越臃肿、难以维护,从而影响了软
近年来,模糊神经网络以其广义的函数逼近能力,已经受到了广泛的关注。在模糊神经网络的研究中,参数学习问题具有很大的重要性。一般来说,对模糊神经网络的参数学习问题可以转化为
本文论述了MES的定义及其实质、MES的定位模型和其十一项功能,深入分析它与计划层和控制层的关系,并阐述了MES在行业应用中的特点。在分析济钢中厚板厂生产现状及其存在的问题
本系统主要是利用清分机、扫描仪等图像采集设备,使用OCR技术、验印技术、海量存储技术等规范票据处理流程,实现了银行票据的自动化处理,从而达到减员增效、加强会计核算管理
随着电子邮件、网络通讯、电子商务等网络行为日益走入人们的生活,接入宽带网络正成为嵌入式终端设备的一个基本要求。嵌入式终端的流行改善了人们的生活方式,提高了工作效率
随着信息自动化科技发展,各种硬、软自主机器人的应用领域正在不断扩大,从而对机器人的能力提出了越来越高的要求.一方面,自主机器人的应用环境正由传统的静态、确定环境向实
光纤布拉格光栅(FBG)是国际上新兴的一种在光纤通讯、光纤传感等光电子处理领域有着广泛应用前景的基础性光纤器件。当前FBG的制作与应用研究成为世界各国光纤技术研究的热点
随着互联网的迅速发展和数字信号处理技术的成熟,数字图像的应用越来越普遍和流行,比如数字电视、远程教育、新闻图片等。图像信息生动形象,它已经成为人们表达信息的重要手段之
在自然语言处理领域里,以大规模真实文本为基础的语料库研究和知识自动获取越来越受到重视,建设大规模高质量的语料库成为首要的任务。然而,对语料库加工质量检验方法的研究却很