OCR文字识别技术在不动产数据整合中的应用

来源 :东华理工大学 | 被引量 : 7次 | 上传用户:yhmlivefor46
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字识别作为文字识别的重要组成部分,在前人近百年的摸索中,已经拥有了成熟的技术和蓬勃的发展。虽然各行业广泛应用这门技术,并且在数字识别发展的近百年时间里,涌现了大量优秀的算法和研究成果。但是对于测绘行业,文字识别技术的应用还尚在起步阶段,因此针对测绘行业的一些特定工作文字识别技术仍然有巨大的研究价值与空间。数字识别主要指通过使用硬件设施结合计算机软件编程手段实现自动识别阿拉伯数字的过程。在针对不动产数据整合这个项目中,通过数字识别可以大幅度减轻工作量与工作强度,具有非常重要的推广应用价值。本文主要研究如何解决在测区中纸质档案中含有界址点的扫描件如何直接生成数字化图的问题。本文的目的就是要解决识别纸质档案中的界址点,以及利用Arc Engine进行二次开发批量生成宗地图这两个技术难点。并最终形成一个能够自动识别界址点信息并且能自动生成数字化图的系统。全文主要工作包括如下:(1)数字识别图像预处理算法研究,包含图像的灰度化、图像的二值化、图像的降噪三个部分,研究三个部分的算法并将其实现应用在设计的系统中。(2)文字识别的算法选取,选择成熟的第三方库Tesseract文字识别引擎和百度OCR文字识别服务,对其进行对比分析,分析标准为识别后的正确率、错误率、拒识率以及识别所花费的时间,综上标准进行综合分析。最终做出最适合实验设计的选择。在应用选择好的识别方法时利用第一步掌握的图像预处理方法,尽可能的提高图像质量,提升识别正确率。(3)利用Arc Engine开发能够直接批量生成宗地图的软件。(4)结合前三步的工作,设计出一款能够通过计算机识别扫描件中界址点信息并最终能生成数字化宗地图的系统。(5)将该系统实际应用于清新区不动产数据整合项目中,验证是否满足实验精度需求。通过最终选定的文字识别方法,结合对扫描件图像的预处理工作,并将识别结果输出后提供给批量转换软件这一整套系统流程,最终满足实验设想,实现了高识别率的系统建设。
其他文献
摘 要:图片教学用在小学语文教学中,可以促使学生提升探究语文知识的动力,培养学生各种能力,因此,小学语文教师将此种方法广泛运用在教学中。语文教师利用多样的图片激发学生的语文学习兴趣,还能运用合适的图片帮助学生深度理解教材,并借助多彩的图片培养学生的想象力,从而促进小学生全面发展。  关键词:图片教学;小学语文;广泛运用  教师在教学中,将教学内容通过图片的形式展示,或者运用图片辅助教学,可以说成为
本文介绍双进双出钢球磨煤机的技术特点 ,同时分析双进双出钢球磨煤机存在问题和采取的措施。
目的探究"特殊需要学生"较为特殊的心理和行为特点。方法以人本主义的理论为指导,突破以往对于"特殊需要学生"基于数据的定量研究模式,采用质性研究结合定量分析的方法。结果
重建典型时段区域气候和植被空间格局变化,是评估未来增温背景下生态环境变化和响应过程的重要基础.文章基于AMS 14C定年技术和孢粉分析,获得了华北平原白洋淀等6个剖面末次
目的:比较三种方法在发现上颌磨牙MB2根管方面的有效性。方法:选取临床上因各种原因拔除的上颌磨牙194颗,要求牙齿无牙髓治疗史,牙根无龋,无牙根吸收,无髓底破坏。样品被固定
会议
采用一种较新的工艺研制出半透明的石蜡微乳液,讨论了如何获得该微乳液的一些规律。
高职学生“关键能力”培养符合我国当前高职教育改革与发展的研究和趋势,能够满足经济社会发展对高职人才培养的要求。对高职学生“关键能力”培养需要具有较高综合素质和能力
摘 要:在目前的小学教育体系中,数学属于其中极为关键的一门,学好数学对发展学生的学习能力、认知能力以及头脑灵活性的培养都有重要帮助。在新课程改革不断推进的教育背景下,小学数学的教学方式、目标均需不断提升,才能更好地满足学生的学习需求和发展需要。而在小学数学教学课堂上渗透进数学史知识,不仅可以让学生感悟到数学家的思维方式、理念,同时也可以加深学生对数学发展历史产生一个较为清晰的概念。本文简要分析小学