形变文档图像校正技术研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:yadnlf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,数字化信息显得尤为重要。人们通常使用智能手机等设备对书籍等纸质文档拍摄进行数字化存储和应用。数字化的文档能够及时地为人们提供信息,快速地实现资源的共享。但是在使用智能设备拍摄书籍文档图像时,会发生不同程度的变形。在拍摄较厚的书籍页面图像时,会产生由于页面厚度导致的页面弯曲变形和拍摄角度不同导致的透视变形。变形的文档图像一方面会影响人们的视觉查看效果,另一方面对文档图像内容的识别、后期数字化文档的版面分析和格式处理等造成很大障碍。因此,对变形的文档图像校正十分必要。本文从两个方面进行了变形问题的研究。主要工作如下:(1)为了校正以文本行为主的变形文档图像,提出了变形文本行信息提取算法。该算法首先提取文档图像感兴趣区域ROI,接着从ROI中提取文本域,然后根据为此类文档图像设计的评分规则方法合并多个文本域为文本行。在提取合并得到的变形文本行信息后,进一步使用PCA提取有效的特征信息。校正时将变形文档图像页面视为广义圆柱面,使用最小二乘法对多项式曲线拟合,通过拟合的曲线实现曲面模型的重建。最后通过插值映射校正变形的图像。(2)为了校正文本行较少的变形文档图像,提出了基于网格校正变形图像的方法。该方法借助于我们设计的辅助网格和边缘形状匹配算法实现图像的校正。首先,针对不同的情况建立网格信息库。校正图像时,计算待校正图像与网格信息库中网格的匹配度,选择匹配度最高的网格用于变形信息的提取。在提取对应的变形网格信息后,用匹配度最高的网格图像信息作为待校正图像的基础信息。实现文本行信息较少或不含文本行信息的变形文档图像的校正。本文在公共数据集CBDAR2007上对变形文本行信息提取算法进行了实验,在人工数据集上对基于网格校正变形图像的方法进行了实验。基于文本行的校正方法在OCR准确率、多尺度结构相似性和匹配百分数上分别达到了96.8%、0.44和47%,均高于对比文献方法。基于网格的校正方法在投影误差和几何变形度量上,均低于校正前的变形图像。
其他文献
力致发光是指材料受摩擦、刮划、挤压、撞击、拉伸、压缩等机械刺激所表现出来的一种发光现象。由于力致发光直接建立了力学参数与发光信号之间的关联,其在可视化力学传感方面展现出了独特的优势,基于力致发光的可视化力学传感在结构健康监测、生物力学监测、人机交互等领域具有广阔的应用前景。然而,目前已报道的力致发光材料总体上存在着发光颜色单一、发光效率不足以及发光瞬态性等问题,因此,亟需发展新型、高性能力致发光材
饲料中的霉菌毒素污染不仅给畜牧业带来巨大的经济损失,而且由于食物链的累积作用,对人类健康造成严重威胁。赭曲霉毒素A(Ochratoxin A,OTA)是一种由真菌产生的真菌毒素,广泛存在于谷物中,OTA会对肾脏、肝脏、中枢神经和免疫系统造成有害影响。然而,OTA如何影响哺乳动物卵母细胞质量的机制仍不明确。在本研究中,通过向小鼠卵母细胞体外成熟液中添加7.5μM的OTA,暴露16小时,统计卵母细胞体
社区发现是一个基础性的且被广泛研究的问题。现有的社区发现算法多是聚焦于网络拓扑,然而随着真实世界网络中实体可用属性的多样性增加,捕获网络结构和属性的丰富交互关系来进行社区发现变得十分重要。通过对现有社区发现方法现状进行总结与分析,本文主要在融合结构和属性视图的可重叠社区发现和基于染色随机游走的可重叠社区发现两个方面展开了深入的研究,并取得了如下研究成果:1.提出了融合结构和属性视图的可重叠社区发现
猪细小病毒(Porcine parvovirus,PPV)是一种自主复制型单股负链DNA病毒,其复制完全依赖于宿主细胞的复制酶系统。PPV基因组主要包含两个开放性阅读框(Open reading frame,ORFs)ORF1和ORF2,ORF1编码非结构蛋白NS1、NS2和NS3,ORF2编码结构蛋白VP1和VP2。其中,VP2是病毒最重要的结构蛋白,占病毒衣壳组分的90%以上,是PPV最主要的
二炔(DA)单体在254 nm紫外光照射下或者γ射线和X射线下进行聚合可得到聚二炔(PDA),PDA具有独特的光学特性。即在外界环境的刺激下(热、溶剂、机械应力、p H、金属离子、微生物等),自身的颜色可由蓝色变为红色,相应蓝色对应的紫外可见吸收峰由原本的640 nm左右蓝移至540 nm左右。PDA具有的光学特性使其可作为传感器使用,但当撤销刺激后,它的颜色不能返回至原始的蓝色,如作为传感器不能
荧光传感方法具有灵敏度高、选择性好、操作简单、检测实时、可移植性好等优点,在生命科学、医学成像、生物传感分析等众多领域中得到了广泛的应用。其中,比率荧光传感通过同时测量不同波长的两个或两个以上的荧光信号,然后计算它们的强度比,实现对目标物的分析。与传统荧光方法相比,比率荧光传感通过内参比的建立极大地降低了探针浓度、温度、溶剂极性、激发波长、环境p H等众多难以控制因素对分析传感的干扰,使得检测结果
山羊精子液态保存具有操作简便、运输方便、无冷冻保存对精子的损伤等优点,但存在精子活力和寿命下降迅速的局限,极大限制了该技术的应用和推广。研究发现自噬可能是导致精子质量下降的关键因素之一,目前有关山羊精子自噬机理研究鲜有报道。为了探究4℃液态保存中奶山羊精子自噬的细胞分子机理,为液态保存稀释液配方的研制提供理论基础和思路。本研究对4℃液态保存中关中奶山羊精子质量与自噬水平的变化进行观察,进而筛选分析
随着云计算的进步与发展,云存储服务得到了人们广泛的关注。将数据存储在云服务器中,企业和个人能够以更低的成本获得很好的电子邮件服务。因此很多公司选择将电子邮件服务外包给云服务提供商。然而,云服务器中的电子邮件数据通常以明文形式存储,这就可能面临电子邮件中敏感数据的泄漏。一个简单的解决方案是将电子邮件在外包给云服务器之前对其进行加密,但是传统的加密方案会破坏原始数据的结构,从而阻碍用户查询存储在云服务
注意力流网络是复杂网络领域的重要分支,网络表征学习是将网络中的节点属性以及结构信息等进行合理表达的重要方式,注意力流网络的表征学习不仅能够将网络信息有效地表达,还具有广泛的应用场景。链路预测作为网络表征学习的重要应用场景,其主要是利用已知的节点以及网络结构等信息对节点间未来可能连边的情况进行预测,解决网络中缺失连边信息的问题。注意力流网络的链路预测研究不仅能够认知在线用户的行为偏好,而且能够针对用
本文基于中国互联网信息中心(CNNIC)提供的在线点击行为大数据,使用网络科学的建模方法构建注意力流网络,研究注意力流网络的异构性,分析站点之间的差异性。异构性研究能够很好的刻画注意力流网络的结构特征,在站点重要性排序分析、网站影响力分析、网站分类、社区发现等研究中发挥重要作用,进而,通过异构性研究为注意力流网络中社区发现研究提供理论指导,实现注意力流网络的有效社区结构划分,社区结构研究对人们的生