汉字细化算法的研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:mchz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的快速发展,汉字识别技术也逐渐成熟,被应用于许多领域,如信件的智能分拣、稿件校对、笔迹鉴定、文档图像处理等。而细化算法是汉字识别预处理中最重要的技术之一,也一直是脱机汉字识别的瓶颈,因此本文重点研究汉字的细化算法。本文在研究实现已有算法的基础上,重点提出了若干改进算法,论文主要工作如下。(1)研究了细化前对图像的预处理,重点研究了基于纵横向积分法和区域扩张法两种方法的字切分最小包围盒算法。在纵横向积分法中提出对积分曲线应用小波变换进行平滑处理,提高了列、字切分的准确度。实验表明采用两种方法较好地实现了字符切分。接着,研究了 Z-S细化算法,最大圆盘骨架提取算法、基于数学形态学的细化算法、基于索引表的细化算法以及A-W细化算法等,重点研究实现了这些算法并比较其优缺点。(2)虽然A-W细化算法优于上述其他方法的细化结果,但仍存在非单像素问题、分叉点处畸变和毛刺等缺陷。基于邻接矩阵的单像素化处理算法对于笔画撇、捺的处理效果不理想,而基于模板匹配的单像素化处理算法对笔画撇、捺处理效果好,对交叉点处处理效果不佳,提出将这两种方法结合起来的新方法CEADAR(Combination of template matching and adjacency matrix),消除了可能存在的两像素宽的骨架,达到了良好效果;接着,针对A-W细化算法的不足,提出基于笔画走向预测的A-W细化改进算法,对于满足A-W删除条件的点,判断其笔画走向并优先保留横、竖、撇、捺四个笔画走向上的点,实验结果表明此算法改善了交叉点处畸变的现象。(3)提出一种骨架畸变的矫正算法。检测骨架上的特征点,针对最大圆算法在笔画连接后骨架会出现不平滑的现象,采用改进的最大圆方法进行分叉点合并以及局部笔画的重新连接,提出结合汉字结构知识规则来优化局部笔画的连接,可获得更优的效果。实验结果表明以上改进算法得到的细化结果是单像素而且无毛刺和分叉点的,在书法字库和宋体、楷体、黑体、隶书等数据集上均取得了良好的细化结果。
其他文献
准确、高效和自动地识别人的身份是信息安全领域需要研究的重要问题,在此背景下衍生出如何准确的识别指纹信息与利用指纹信息对数据进行加密等问题,本文选择指纹识别中奇异点
随着软件系统复杂程度的增加,基于框架的分层式开发是目前企业级应用开发的主流。分层的实质是为了解决耦合问题,即降低对软件理解的复杂度问题。目前基于表示层、业务逻辑层
伴随着互联网的发展,网络技术也进行了一次革命,带来新的技术亮点包括:对等网络、分布式系统、网格、高密度存储等等。这些新的技术改变我们传统上网方式所提供的应用,其中视
使用电子计算机来处理自然语言,每一步都需要机器词典的协助。信息抽取、词义消歧、信息检索、机器翻译、智能问答系统、人机对话等所有的计算语言学自动处理技术解决问题的
随着网络技术以及数据分布式存储技术的发展,分布式Web数据挖掘技术应运而生且逐渐成为研究的热点。对于分布式Web数据挖掘问题,当站点数据非常庞大时,将会面临通讯开销大和
传统的客户端应用模式主要有两种:以C/S为代表的胖客户端和以B/S为代表的瘦客户端。前者一般用于局域网,易于开发和使用,但安装、部署和维护等工作较为烦琐;后者通常运行在In
无线mesh网络是一种具有大容量、覆盖范围广、高速率等优良特征的无线网状网络。其分层拓扑结构能够提供极为可靠的数据传输,并且可扩展性好,是无线宽带接入有线网络的一个非
现代数据库系统的负载主要来自于网络应用(Application),随着网络应用的快速发展,数据库系统的负载越来越多样化和复杂化,不同的负载(网络应用)有着不同的服务水平目标(Servi
随着计算机硬件及软件技术的迅速发展,使符合人际交流习惯的手势识别成为可能。由于基于视觉的手势识别技术涉及计算机视觉、图像处理、模式识别等领域,以及手势本身具有的多
无线传感器网络中节点的能量是有限的,任何路由协议,都必须要考虑到节点的能量消耗情况。一旦节点能量消耗完,那么节点就不能再继续收集和发送数据,从而影响整个网络的工作情