【摘 要】
:
传统OCR技术采用扫描仪或照相机等设备获取文档页面的图像,然后用计算机处理文档图像,以识别其上文字。传统OCR处理在识别算法之外还存在两个方面的主要问题,即文档页面变形和设备便携性差。前者会降低OCR技术的识别正确率;后者将大大减少其适用场合。本文提出基于智能手机的多视角文档图像几何校正技术的研究,拟利用智能手机近年来已大大提高的计算和拍照能力,实现在智能手机上的文档图像获取和几何校正,从而解决前
论文部分内容阅读
传统OCR技术采用扫描仪或照相机等设备获取文档页面的图像,然后用计算机处理文档图像,以识别其上文字。传统OCR处理在识别算法之外还存在两个方面的主要问题,即文档页面变形和设备便携性差。前者会降低OCR技术的识别正确率;后者将大大减少其适用场合。本文提出基于智能手机的多视角文档图像几何校正技术的研究,拟利用智能手机近年来已大大提高的计算和拍照能力,实现在智能手机上的文档图像获取和几何校正,从而解决前述问题。本文的工作主要是建立了智能手机上的多视角文档图像处理框架。该处理框架包括多视角文档图像获取、文档图像特征点匹配和误匹配剔除、基于SfM的文档页面三维重建、基于可展曲面模型的几何校正、文档图像文字识别。在该处理框架中,特征点匹配是关键环节,其正确率严重影响系统性能。基于其重要性,本文提出了一种基于ORB算法的误匹配点剔除算法。通过计算特征描述子之间的夹角余弦值得到特征点相似度,剔除相似度较小的匹配对,提高特征点匹配的准确率。框架的第二个重要环节是模型重建与校正。基于SfM的思想,利用匹配点对求解出三维点云坐标,鉴于可展曲面模型几乎涵盖了所有翘曲文档,提出一种曲线到曲面的拟合方式,重建出文档的可展曲面模型,并使用曲面函数校正扭曲文档图像。最后,根据以上研究成果,本文建立了多视角文档图像几何校正的手机app。本文通过实验验证了文档图像几何校正算法的有效性,在Android智能手机上实现的文档图像校正app也具备很强的实用性。
其他文献
【摘要】应用语言与文学语言有着各不相同的表述形式与语言特点,前者追求语言的准确、真实,而后者追求语言的多义性与想象性。本文主要从客观真实的构建与还原、语言风格以及语言中的贯穿性等方面阐述了文学语言与应用语言的差异。 【关键词】应用语言 文学语言 差异 修辞 【中图分类号】I045;H08 【文献标识码】A 【文章编号】2095-3089(2018)16-0058-02 文学语言与应用语言是两
病例女,70岁,因"呕吐4天,腹泻、咳嗽1天"入院。入院前4天,患者无明显诱因出现恶心、呕吐,呕吐物为胃内容物,无血液及咖啡样物质,约3~5次/天,与进食无关,无腹痛、腹泻,无发热、
上海市出租汽车蓝色联盟是由15个中型出租汽车企业联合组建的,共有车辆5900辆,员工12000名,联盟的特点是“集中管理,分灶吃饭”,这样一个不以资产为纽带的企业联合体,如何建设好,营
党中央、国务院领导十分重视内河航运发展及长江航运开发建设工作,交通部明确提出了加快长江黄金水道建设是“十一五”期间要着力办成的6件大事之一。规划到2020年,长江水运要
【摘要】伴随着我国教育水平的不断提高,高校学生群体的不断扩大,随之对应的一系列问题逐渐浮现出来。在这一系列问题当中,“高校资助育人”首当其冲,成为了每所高校重中之重的教育工作之一。在这项教育工作当中,需要考虑的是如何提升“资助”与“育人”这两个问题的高度融合,使其发挥应有的成效。本文以我校——银川能源学院为例,对提升高校资助育人成效的路径进行探析,为这项教育工作提出建设性的意见。 【关键词】高校
目前,油气资源的管道运输已经是我国资源调配体系中的重要一环,相比于传统的运输方法,管道运输具有经济适用,铺设简单的特点。但由于油气资源的易燃易挥发性,随着经济的发展,由施工等人类行为对管道产生的威胁也日益增加。因此,获取一个高精确度,高灵敏度,高时效性及高稳定性的新型预警设备对油气管道进行监控十分重要。为了解决上述问题,分布式光纤预警系应运而生。其具备的预警范围大,精准度高,抗电磁干扰,占地面积小
【摘要】院系级的学生党建工作是高校党建工作中的重点内容,在新时代背景下,抓好高校党建工作也面临着新的问题。在党的十九大报告中强调:“要引导广大党员发挥先锋模范作用,坚持“三会一课”制度,推进党的基层组织设置和活动方式创新,加强基层党组织带头人队伍建设,扩大基层党组织的覆盖面,着力解决一些基层党组织弱化、虚化、边缘化问题。”本文通过浅析院系级党员发展服务中心建设的做法,探讨了如何利用好学生党员队伍,