文档扫描图像处理若干关键技术研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:hmgujie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
各类古今文献资料是人类智慧和文化的重要载体,文档数字化是一种运用现代信息科技来处理传统实体文档的技术。文档图像是文献数字化的最基本数字形式,通过对文档图像的处理分析,我们能从中获取大量可用于计算机解读、分析和利用的信息。在大数据信息技术高速发展的今天,传统实体文档中蕴含的海量信息将产生巨大的作用,创造重大文化和经济价值。在深入分析文档数字化中现有文档图像处理技术的基础上,本论文结合自适应滤波和概率图模型理论,针对现代打印扫描图像和古文献扫描图像两种不同的对象,分别就扫描图像去网纹、文档图像超分辨率、背面渗透去除和印章文字识别等四个方面的问题进行了深入研究,取得的主要创新性研究成果如下:  1.提出了基于冗余信息和自适应滤波的扫描图像去网纹方法。针对扫描图像出现中网纹瑕疵问题,首先深入分析了网纹出现的原因和机理,指出了扫描图像中的网纹瑕疵由半色调图案和随机噪声构成;在此基础上,一方面利用基于冗余信息的去噪方法去除随机噪声,另一方面,通过提取扫描图像中的半色调网纹频率信息和扫描图像局部梯度信息来生成自适应滤波核,最后通过自适应滤波和联合边缘保持滤波来从扫描图像中得到高质量的连续色调图像。在实际扫描图像上的实验证明我们提出的方法能够得到具有锐利边缘和干净平滑区域的全色调图像。  2.提出了基于快速抠像分解的文档图像超分辨率方法。针对大幅扫描图像快速超分辨率问题,以计算效率作为着重考虑因素,提出了基于联合边缘保持滤波的快速抠像分解算法,将低分辨率文档图像的颜色信息和边缘信息分离开来,然后通过分层超分辨率的策略,对扫描图像的边缘信息同时进行超分辨率和增强,最后将各组份重新合成为高分辨率文档图像。我们提出的文档图像超分辨率方法计算效率高,对实际扫描图像处理的结果不存在颜色失真问题,并且具有锐利的边缘。  3.提出了基于条件随机场的扫描图像背面渗透盲去除方法。针对古籍扫描图像中经常出现的背面渗透问题,采用条件概率模型来为图像中的前景、背面渗透和背景三部分进行建模,避免复杂的联合概率建模。利用初始分割来估计模型的参数,并采用置信度传播算法来求解扫描图像的条件随机场模型,得到扫描图像每个像素的标签,最后采用随机填充算法来修复背面渗透区域的像素,完成带背面渗透扫描图像的修复。在实际古籍手稿扫描图像上的实验证明我们提出的方法能很好的保护前景内容并有效修复背面渗透区域,取得了很好的修复效果。  4.提出了基于图模型匹配的古籍印章文字识别方法。针对古籍印章文字样本少和类内方差大的问题,提出利用图模型匹配算法来解决印章文字识别问题。首先,通过一系列图像骨架处理分析算法构建印章文字的图模型。我们采用马尔科夫随机场模型,根据局部特征相似度来为每个隐含节点选取候选匹配节点,利用连接一致性来约束隐含节点之间的相关性,然后采用置信度传播算法为各个节点选取最优的匹配节点,并依据这个最优匹配计算两个图模型之间的相似度,最后,通过逐一匹配和计算相似度,将相似度最大的参考文字作为待识别文字的识别结果。在实际印章文字图像上的实验结果验证了本文提出算法的有效性。
其他文献
小型无人直升机(Mini Unmanned Helicopter,简称MUH)具有特殊的飞行能力,比如垂直升降、侧飞、倒飞和悬停等机动灵活的飞行性能。而且它体积小、质量轻,在实际应用中具有良好
随着科学技术的进步,心电图诊断技术正向着远程化和智能化的方向发展。便携式心电监护系统应用先进的数字信息、无线通信以及模式识别等技术实现了对心脏疾病患者的实时跟踪
为了满足发电企业日益精细化的生产和经营需求,多数发电公司都已建立了适合自身电力生产、经营管理的现代化管理系统,耗差分析系统是其中对实现机组节能降耗、经济运行有重要意义的系统之一,对全面提升发电企业生产管理水平有着重要作用。然而,目前传统耗差分析系统仅提供耗差值,而影响耗差的因素对参数的影响过程不能直观体现,影响了系统的指导性。另外,当前传统的耗差分析系统与运行人员实时绩效考核、设备管理的结合不够深
焦炭生产过程是一个具有严重非线性、时变、多参数和不确定性等特性的复杂工业生产过程。焦炭是冶金、机械、化工行业的主要原料和燃料,它的质量直接关系到后续工业生产的稳
机动车牌照识别(LPR)是智能交通系统(ITS)的关键组成部分。LPR在旅行时间管理,停车场管理,收费站,超速监测执法,冲闯红灯监测执法和被盗车辆识别等交通运输系统应用中扮演了
学位
智能交通系统(ITS)是当今世界交通领域研究的热点,计算机视觉技术在ITS中的应用得到了国内外的广泛关注。交叉口是公路交通网的关键节点,交叉口处的车流参数检测和控制算法的性
学位
能源是人类社会生存与发展的重要物质基础,但由于受化石能源的不可再生特性和开发利用方式等因素制约,资源约束趋紧、环境污染严重、生态系统退化等问题日益突出。面对这种局
电力系统的可靠性和供电质量关系着国民经济的发展和人们日常生活水平的提高。当配电网发生故障尤其当保护和断路器发生误动或拒动以及通信装置故障造成信号改变或丢失时,会形成变异的故障模式,从而造成警报模式复杂化,给配电网故障诊断造成更多的困难。现有的研究方法在处理变异模式时难以保证故障定位的高容错性,会出现错判或漏判,其实用价值受到一定限制。因此如何在配电网系统发生事故时能尽快判定故障,为故障解列和恢复供
随着智能控制技术、信息和传感网络以及计算机技术的不断发展,智能移动机器人在人们的生产生活中的应用越来越广泛。目前,移动机器人已经能够应用到导游、军事侦查、未知区域
学位
压铸生产出的铸件广泛应用于汽车、航空航天和计算机等多个领域,随着经济的发展,人们对铸件质量的要求越来越高,以往的PLC开环控制系统不但分析和存储数据能力差,而且控制效