文档图像拼接技术研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:tiger5156
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像拼接技术在各领域都得到广泛关注和应用。在纸质文档数字化的过程中需要得到大幅面高分辨率的文档图像,如新闻报纸,而一般普通的摄像头虽然具有廉价、非接触、成像快速等特点,但无法通过一次拍摄获取这样的图像。通过拍摄多幅图像来覆盖文档的整个幅面,再利用图像拼接技术可以实现这一目标。由于文档图像因其自身的特点,使得在拼接中存在一些需要解决的问题,因此本文根据文档图像拼接的配准和融合两个过程中的难点问题做了相关的研究工作。针对文档图像中由于存在大量文字,而文字结构比较单一,并且可能多次出现相同或相似的字符,提取的特征点容易误匹配的问题,本文通过提取图像中具有尺度不变性特征的SIFT特征点,采用最近邻算法得到初步筛选的特征点对,再使用通过特征点对的约束关系改进的RANSAC算法提取精确匹配的特征点对,提高特征点匹配的效率和准确性。在此基础上得到稳定的单应性矩阵,并通过确定拼接图像间的配准关系和选取合适的参考图像实现文档图像的全局配准。针对文档图像中文字区域的文字和背景差异明显,对配准后的文档图像直接融合会导致重叠区域的文字模糊及错位的问题,本文提出了一种对文档图像的重叠区域的内容进行分块分类,再对各种类型的块分别融合的方法。该方法首先采用自适应阈值局部二值化的方法对重叠区域进行二值化后投影,再根据分析投影曲线的特征对重叠区域进行分块,并对块的类型采用基于Bayes网络分类器的分层块类型判定方法进行判定,然后根据不同的块类型采用本文提出的相应类型块的融合方法。实验表明该方法能很好的处理文档图像融合中的问题。最后,对本文所做研究工作进行了总结,提出了需要开展的后续工作的思路,对进一步的研究具有一定的指导意义。
其他文献
库存控制是供应链管理的一个关键因素,库存控制策略的优化可以极大地优化整个供应链的成本和利润水平。因此,研究库存控制的模型和优化算法对整体优化供应链系统具有重要的理论
随着多媒体会议、远程教学、分布式交互仿真等Internet应用的广泛使用,大规模可靠组播协议的研究成为了学术界的热点问题之一。组播与传统的单播、广播相比更适合一对多以及
近年来,将复杂网络技术用于研究分析软件系统已经成为热点。针对软件系统的复杂性,将复杂软件拓扑结构抽象映射为复杂软件网络模型,能够简单有效的挖掘复杂网络中重要节点,依
传感器节点由于体积和处理能力的限制,节能成为无线传感器网络技术研究的关键点。据研究发现,在网络工作过程中节点之间的信息的收发消耗了网络的大量能耗,而节点信息的处理
传统无公害农产品的认证方式,以人工处理为主,效率不高、工作琐碎、信息又无法回溯。随着电子政务技术的完善、网络的普及以及农业信息化平台的建设,较为落后的农产品认证方式也
稀疏移动自组网是一种不需要源节点与目标节点存在路径,利用节点的移动带来的相遇机会实现数据传输的自组织网络。由于节点对网络信息知之甚少,为了提高传输成功率,传统的路
随着计算机网络的发展,Web应用变得丰富多彩。相应地,越来越多的人们通过博客、空间及微博等网络文本“对话”的形式来进行个人情感的表达和生活需求、兴趣的交流。   情感
互联网的飞速发展极大方便了人们的学习、工作和生活,但同时也使我们面临着信息爆炸,却知识匮乏的窘迫。如何从海量信息中快速、准确的寻找所需要的信息,已经成为了人们的迫切需
随着计算机技术的快速发展,财政的信息化水平也飞速提高,财税各个业务系统数据日益累积,如何有效对财税数据进行整合与分析,有效提高数据的利用率,充分实现数据价值,是财税数
随着网络技术和信息技术的迅速发展,计算机网络在诸多领域内的应用日益普及,然而由于其运行环境具有开放性,使得计算机网络在给人们带来巨大便利的同时,也产生一系列的安全问