中文扭曲文本图像校正的研究与应用

被引量 : 2次 | 上传用户:yxzxyzxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字化信息时代的发展,OCR的诞生大大减轻了文字录入工作人员的负担,以其特有的将纸质文字转化为电子文档的功能受到各大图书馆和政府工作部门的青睐,但OCR也有其弊端,对于扭曲的图像其文字识别率低,而扭曲的图像往往是获取书籍页面图像得到的。为解决这一问题,本文介绍了国内外近几年对扭曲图像校正方法,分析了连通域标志方法和文本线提取方法校正扭曲文本图像的优劣,然后提出了基于文本行重构的扭曲文本图像校正方法。首先介绍了现阶段国内外对扭曲校正的研究现状,第二部分简述了研究和实验中用到的图像处理的基本理论知识,如灰度化,二值化,图像剪裁等,并说明了这些算法在系统中的具体作用,第三部分分析了扭曲图像的特征,连通域标志方法的优劣,进而进行了系统的总体方案设计,分析了其可行性,第四部分为基于多文本线行重构研究部分,详细的讲述了研究中的核心算法及作用,第五部分为实验中各个功能的实现,包括图像预处理,图像膨胀,文本线提取,图像重构和边界处理,其中后三个功能是系统的核心组成部分。图像预处理模块将图像处理为适合系统使用的图像,膨胀模块利用膨胀的方法模糊文字以及文字间的关系,文本线模块根据膨胀区域的特性进行细化得到每条文字行的曲线,再利用改进的模板搜索方法获取每条曲线的样值,通过最小二乘拟合得到近似的曲线,图像重构模块根据设定的规则进行图像的重构,为使扭曲图像的边缘文字更形象化,边界处理模块对边界文字进行了提取,在边界提取过程中,根据大量的扭曲图像文本线的统计分析得到了判断书籍左右页的规律,将提取的边界文字进行差值运算,使其与正文文字大小一致,最终拼接该边缘图像得到最终的校正图像。最终根据实现的系统以及测试标准,利用汉王OCR对校正前后图像的识别率对比作为最终评价标准,对比了利用连通域标志方法和单一文本线校正方法和本文方法的优劣。实验结果表明,本研究的设计方案有较好的实用价值。
其他文献
21世纪民营企业在我国经济发展中将发挥巨大作用,而其获得的金融支持远远不够。种种迹象表明,民营企业融资难制约着我国民营经济乃至整个国民经济的进一步发展,也制约着中国
改革开放伊始,中国开始摆脱长期以来的计划经济体制的束缚,大踏步迈进向市场经济体制的转型。与此同时,中国媒体报道的新闻话语也发生着悄然变化,伴随着市场经济的建立,国家
高校教师,是集文化素质、工作环境、社会地位于一体的理想职业,同时也肩负培养国家栋梁、引领学术风潮和道德风尚的传道授业解惑重任,是以德高任重。目前,随着社会的高速发展、高
运用锥度铣刀,利用三坐标数控机床解决了航空结构件小闭角零件加工的问题。锥度铣刀的结构特点有利于清除零件闭角残留,可实现飞机零件的减重。
在板材高速铣加工范围内,对航空结构件加工中出现的外形闭角残留进行了定义和分析,通过具体实例给出了外形闭角残留的几种去除方法,分别对各个方法的适用范围及存在的优缺点
情境化物理习题是新课改以来逐步被关注的一种题型,不同于模型化习题,它是指根据自然、社会生产和生活中客观存在的,能够反映物理概念、规律且未被加工过的典型物理现象和物理事
校园媒体对大学校园文化建设的主要功能是舆论引导功能和文化上的同构建设功能。深受世界范围内媒体环境变革的影响,校园媒体对校园文化建设的功能面临新挑战。为应对这一挑
合唱是以人声为乐器的具有多声思维和强大可塑性且关乎人性的艺术形式,是我国乃至全世界音乐教育的重要组成部分。合唱的发展对于我国国民音乐教育的普及具有深远影响,有利于国
俗话说:“一样话,百样说。”但是不同的说法往往会有不同的表达效果。人们要正确、有效地运用语言,把话说对、说好,把文章写对、写好,就必须讲究修辞。当代中学生是汉语运用的
破产重整制度是市场经济的一项基本制度,它是市场经济的退出机制,是以拯救经济困难的企业法人为目的的制度。我国破产重整制度具有对象相对特定、申请主体多元、重整措施灵活多