基于全卷积网络的低质量文档图像二值化方法研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:qweasd123qweqwe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
低质量文档图像二值化是文档分析与识别领域的研究热点。由于纸质文档在保存过程中受物理条件影响容易出现纸张破损、墨水污渍、背景渗透,或因人为破坏产生污迹,以及拍摄文档图像时出现光照不均匀等现象,导致文档图像产生较大程度退化,严重影响了文档分析与字符识别等算法处理的效果。因此,低质量文档图像二值化具有广泛的研究和应用价值,本文的主要研究内容及工作如下:(1)针对低质量文档图像存在文字笔画粗细不一和弱光照导致全局锐化处理后二值化效果不佳的问题,提出局部自适应锐化结合光照补偿的低质量文档图像预处理方法。实验中发现锐化程度对粗细不一的笔画影响不同,随着锐化程度的增加,二值化结果中,细笔画保留了更多信息,而粗笔画则逐渐出现了断裂情况。针对该问题,通过笔画宽度估计算法估计局部区域的笔画宽度,进行自适应锐化,在保留更多细笔画信息的同时解决粗笔画断裂的问题。此外,与弱光照文档图像相比,对强光照文档图像的锐化效果更突出,从而会产生更好的二值化结果。所以,本文通过对弱光照文档图像进行适当的光照补偿,作为图像锐化的有益补充。实验结果表明,采用提出的预处理方法对低质量文档图像进行处理后,二值化结果还原了更多细节信息,同时保留了粗笔画信息,二值化效果得到提升。(2)针对低质量文档图像二值化中数据集较小使得网络无法得到充分训练或容易产生过拟合且采用单一卷积网络存在泛化能力差,导致二值化性能不佳的问题,提出基于迁移学习与全卷积网络的低质量文档图像二值化方法。选取在较小数据集上表现更佳的全卷积网络模型U-Net,并引入迁移学习技术。选择VGGNet、ResNet和Inception三种常用迁移学习模型作为U-Net网络的预训练编码器;针对不同模型的特点,建立不同的解码器网络结构;与U-Net网络进行融合,其中,不同于采用池化层的输出这一常规处理,本文将卷积层的输出作为跳跃连接与上采样进行融合,使得上采样层更好地还原文档图像的细节信息。实验结果表明,引入迁移学习模型的U-Net网络加快了模型收敛速度,提升了模型泛化能力,从而提高了低质量文档图像二值化效果,其中融合VGG16和U-Net的低质量文档图像二值化方法(记为V16_U-Net二值化方法)的二值化性能更为突出。(3)运用提出的局部自适应锐化结合光照补偿的文档图像预处理方法(记为LASIC)和V16_U-Net二值化方法分别在DIBCO2016、2017和2018年的数据集,以及ICFHR2016年提供的Balinese Palm Leaf Manuscripts和ICFHR2018年提供的Southeast Asian Palm Leaf Manuscripts数据集上做综合实验。实验结果表明,提出的V16_U-Net二值化方法在多个数据集上均取得了很好的成绩,而结合了LASIC预处理方法和V16_U-Net二值化方法的最终二值化结果在各项评估指标上都得到了进一步提升,优于当年比赛中的最好成绩,表明其在低质量文档图像二值化上具有更好的性能。
其他文献
在体验经济与知识经济的双重驱动下,越来越多的旅游目的地借助外部的智力资本实现转型更新与价值跃迁。与此同时,以输出智力咨询服务为主营业务的旅游咨询企业也在全国遍地开花。组织的知识创新理论认为,推动企业知识创新与持续发展的根本力量来自于员工个体的创造力。但是,目前旅游企业情境下的员工创造力研究仍处于起步阶段,且研究对象集中于酒店、饭店、旅行社等服务型旅游企业的一线员工。无论是旅游领域还是组织行为学领域
研究目的通过临床研究,探讨微砭耳针对PCI术后伴焦虑抑郁状态患者的临床疗效,以期能丰富“双心医学”治疗模式的内容,并为中医疗法在PCI术后心脏康复的临床应用与推广提供实践依据。研究方法1.本研究选取74例符合纳入标准的PCI术后伴焦虑抑郁状态的患者,随机将他们分为耳针组和对照组;2.耳针组在常规冠心病二级预防用药的基础上联合微砭耳针治疗,对照组在冠心病二级预防用药的基础上联合简单心理疏导治疗,治疗
“记忆是知识的唯一管控人”,一切知识的来源都在于记忆。如何将繁多的字词“记得准”,减少错别字;如何将丰富的语文知识“记得牢”,运用得活;如何将浩如烟海的文学经典“记得多”,积累得多,都直接关系到语文教学的质量。然而,长期以来,在实际的中学语文教学过程中,教师较少注重记忆方法的传授,学生也没有掌握系统高效的记忆规律,只能死记硬背。语文学习“高耗低效”的问题一直困扰着广大一线教师和学生。因此将记忆方法
近年来随着信息技术的发展,虚拟社区正逐渐代替传统社区,成为学术界一个具有影响力的话题。越来越多的企业将虚拟社区作为品牌传播的新途径,通过虚拟社区中的品牌传播提升品
太平天国运动是中国近代史教学中必不可少的内容。针对“太平天国运动”一课,与《全日制义务教育历史课程标准(实验稿)》相比,《义务教育历史课程标准(2011年版)》提出了更具基础性和全面性的要求,符合初中学生的认知水平,也为初中历史教师明确了教学内容和教学程度。同时,相较于北师大版和岳麓版初中历史教科书而言,部编版教科书在课文系统和课文辅助系统上略胜一筹:其课文系统中容纳的知识点较为全面和系统,语言表
我国居民经济实力的提升和消费升级推动着新的产业持续发展,洗碗机作为降低厨房劳动强度,提升生活品质的重要设施,近几年得到迅速发展,成为厨电领域的新蓝海。我国洗碗机极低的普及率使得众多企业看好这一市场并加入竞争行列,B公司作为洗碗机行业的全球先行者和领导者品牌,在这一市场具有一定的先发优势,但也持续面临竞争压力,制定科学合理的竞争战略,是保持B公司持续竞争优势的重要途径。本文基于战略分析相关理论,对B
国家公园是保护国家自然资源和文化资源的重要形式,具有生态保护、历史文化传承、国民游憩、科研服务、生态文化教育的重要功能,建立国家公园体系能最大程度发挥自然资本的生态价值和经济价值,实现循环经济。党的十八届三中全会,我国正式提出建立国家公园体制,这一新发展模式对我国生态管理提出更高要求。在本土国家公园建设中,发展路径和管理模式仍然处于摸着石头过河的探索阶段,科研领域对于本土国家公园的研究也处于初级阶
相变存储器具有尺寸小、功耗低、工作速度快、抗疲劳性优异、抗干扰能力强等优点。随着相变存储器存储密度的不断提升,相变存储芯片的引脚数目越来越多,引脚也越来越密集。芯
对文档图像的自动处理能大大减轻人的劳动。文档图像的文本行分割是字符识别、关键词检索等文档分析和识别系统的重要部分,是提升字符识别效果的关键,对文档的数字化存储来说
本文采用基于密度泛函理论的第一原理计算,交换关联泛函选择局域密度近似(LDA),对Ti-V系的三种典型合金,D03型Ti3V合金,B2型TiV合金以及D03型TiV3合金的力学性质和电子结构进