基于简易网格的汉字结构识别研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:soboy1759
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的中文信息处理系统都是采用字库作为底层核心技术,以汉字作为信息处理的最小单位。这种方式基本满足了到目前为止的信息化的要求。但是,这种方式也存在不利于汉字信息化标准建设、影响对文化的传承作用、不符合汉字认知规律而与汉字教学脱节、不能很好的满足整个社会的应用需求、信息熵高而效率低等不足。无字库智能造字就是为了解决汉字字库的上述弊端而提出来的。无字库智能造字以汉字结构和基元为基本信息造字,汉字结构和汉字基元为信息处理的基本要素。在中文处理相关的文字处理如输入、识别和自然语言理解等的处理方法都与基于字库的处理方法有所不同,汉字的识别应包括汉字结构识别和汉字基元识别两个方面。本文对简易网格的汉字结构识别进行了研究。主要内容包括:   ㈠从认知心理学出发,对汉字的认知过程进行了叙述,指出在汉字认知过程中汉字的结构起到了枢纽的作用,汉字的认知遵循从整体到局部的顺序,而汉字的识别即让计算机模仿人脑的活动去认知汉字,也应遵循从结构到基元的顺序。   ㈡介绍了简易网格并利用它对汉字各一级结构进行特征分析,在此基础上,提出汉字结构识别的方案:首先,特征的提取,结合传统的汉字识别方法中常用特征,并提出了结构的网格特征,对各个特征的提取方法进行详细描述;其次,该方案采用了并行和串行分类器结合的方法,每个分类器针对相应的特征进行匹配识别,采用的识别方法为结构匹配法;最后,按照方案,以GB2312-80收录的6763个汉字作为实验样本,在计算机上搭建实验平台进行实验,并对实验结果进行了分析,为汉字结构识别的进一步研究打下了基础。
其他文献
随着即时通讯系统的大众化,手机等移动设备硬件功能发展,以及通信世界3G时代的来临,移动即时通讯已经成为新时代通信的必然趋势,而作为NGN(下一代网络)核心的协议之一的SIP协议,体现
随着计算机技术、通信技术和网络技术的迅猛发展,人们现今主要通过网络发表自己对产品的价格、性能和售后等方面发表主观性看法、建议以及意见。这些主观性观点表达了消费者
随着开放式数控系统概念的提出,越来越多的国家投入到这个研究领域。开放式数控系统具有开放性、可移植性、可扩展性、互操作性强等要求与特性,从全新角度分析和实现系统的控制
近三十年来,电力电子技术、微处理器技术和电机控制理论取得了迅猛的发展,特别是矢量控制的提出,导致了电气传动技术的一场历史性革命,交流调速在工业场合的应用也越来越广泛。由
本文围绕带钢热连轧的工艺过程,建立传统的数学模型,根据传统模型对带刚热连轧四个关键参数进行传统预报;设计BP网络结构,将BP算法应用于带钢热连轧轧制力预报中;利用粒子群优化(PS
数控机床是现代制造系统的基础和核心,而先进的数控技术是解决机床制造业持续发展的关键,同时也是提高国家综合国力和国防现代化的重要战略性基础技术。世界各先进工业国家纷纷
随着微电子技术和电力电子技术的快速发展,运动控制系统正朝着通用化、智能化、微型化的方向发展。对于数控机床和加工中心数控系统来说,最重要的是控制各个进给轴的传动电机。
全自动金丝球压焊机是集精密机械、自动控制、图像识别、光学、超声波热压焊等领域于一体的现代化高技术微电子封装设备,主要用于集成电路制造后工序中芯片焊盘与外框架间引线