基于网络传真的版面分析技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lqgomqj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
OCR(Optical Character Recognition)系统的中文全称是光学字符识别系统,它包括脱机识别和联机识别两种.该文研究的基于网络传真图像的版面分析属于脱机字符识别的一部分,其主要功能是对整个版面进行分割处理,划分出图像区域,文字区域.版面分析是OCR系统中的一个难点,是后续的行切分,字切分及字符识别的基础.它的精确度对整个系统的识别结果有着重要的影响.该文的研究内容是整个网络传真智能监测系统的重要组成部分,文章首先给出该系统的整体结构流程,比较了现有的版面分析方法.然后在对分析的传真图像进行必要的预处理后,对图像进行倾角检测,如果图像倾斜则进行倾斜校正.最后分析图像版面,得出判定结果.该文的研究重点在传真图像的倾斜校正和版面分析两部分,针对倾斜图像,该文给出了两种倾角检测的方法,一种是旋转投影检测法,另一种是基于两条竖直直线的检测方法,两种方法都很实用,实验结果很理想.得到倾角后对图像进行旋转即获得校正后的图像.针对传真图像的版面分析,该文给出了一种基于投影-游程平滑的方法,它把自顶向下和自底向上分析的方法结合在一起,利用投影法初步切分版面,对其中未判定的区域经游程平滑处理后搜索连通基元,最后对文本行、列进行合并,实验结果表明,该方法对传真图像版面分析具有较理想的效果.
其他文献
在现实世界里,人们经常需要将自己的某些权力委托给可靠的代理人,让代理人代表本人去行使这些权力.在这些可以委托的权力中包括人们的签名权.委托签名权的传统方法是使用印章
数据挖掘,是从大量原始数据中提取知识的过程.由于其在现实生活中的广泛应用,数据挖掘领域在研究方面已有很大发展.然而,在一种新的数据环境中,即数据流环境中进行挖掘是一项
在社会用电量和用电规模剧增的今天,电力系统从发电厂、输供电线路、变电站、配电所直到电度表,大量各种各样、不同规范的电气设施分布在广阔的地域和空间.这对电力系统的生
技术和历史等各种原因造成了企业应用系统的分割,多个系统之间相互独立,无法共享数据,需要一种新的技术来解决这些问题.企业数据集成将企业的离散数据源联合起来,建立一个全
感知网由大量低成本、低能耗、体积小巧且具有一定计算能力和组网能力的感知设备组成,是一种以数据为核心的系统.在处理由大量感知节点产生的数据时面临一个重要的问题,即如
“知件”是本文作者所在研究团队于2005年提出的一个概念,它与硬件和软件相对应,用于刻画可独立成为IT领域可商品化的知识模块,其基本理念是封装可表示的知识,并通过统一规范的接
随着电子政务时代的到来,中国各地、各级部门的电子政务建设如火如荼的开展起来.由于Intemet的开放性,电子政务的安全问题日渐突出.电子政务安全的核心问题之一是电子公文的
从明暗恢复形状(SFS)考虑的是从单幅图象中的明暗渐变恢复出被成象物体表面的形状.已有的大多数SFS迭代算法缺乏对收敛性的分析和保证.该文提出了用于求解优化问题的阻尼振动
当前,网络已经成为社会和经济发展的强大动力,然而Internet的共享性和开放性也使之存在着严重的安全问题.随着对计算机系统弱点和入侵行为分析研究的深入,基于网络的入侵检测
人脸识别技术作为模式识别研究领域中的典型问题,在过去的三十年中一直是科研焦点.近些年,作为生物识别技术中的一个重要方向也得到了越来越多的重视,取得了巨大的进步并日臻