基于DHMM的印刷体文字识别研究

来源 :延边大学 | 被引量 : 0次 | 上传用户:w313296304
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文面向工程应用提出了一种新颖的基于退化隐马尔柯夫模型(Degraded Hidden Markov Model)的印刷体文字识别方法。 由于印刷体文字的字形相对固定,因此以往通常采用结构化的识别方法,并且取得了不错的识别率。在特征向量提取上,结构化方法中大多采用细化算法取得所需的笔段,而细化会带来笔段提取的错误,笔段的错误又会导致后面的文法推理错误,从而出现误识,针对这种错误以往采用的方法都比较繁琐。在HMM应用于文字识别方面,无论是联机文字识别还是脱机文字识别,一般都只采用左右型的模型结构,然而左右型的模型结构并不适合于本文所设计的特征向量。 通过对印刷体文字结构的分析,在本文提出了一种新的代表一个文字的特征向量——笔段序列向量,在本文中又称为观测序列向量,采用这种特征表达方式能够将二维平面文字信息转化为一维随机信号,并且保留了文字的几何信息。针对所设计的特征向量,在传统的隐马尔柯夫模型(HMM)基础上提出了一个新的处理一维随机序列的分类器——退化隐马尔柯夫模型。本文中的分类器采用了完全不同的状态转移方式,所形成的模型结构为遍历型的结构模型,该模型结构在保持字形结构完整的前提下,不受字号的影响。 实验结果表明本文所提方法受字号的影响比较小,并且在分辨率达到一定程度后对于识别率的影响度比较小,证明所设计的特征向量及其分类器能够很好地实现宋体印刷文字的识别。
其他文献
本文的目的研究RBAC标准所定义的模型在北京大学管理信息平台中的实现,并且构建统一的权限管理服务。在具体的实现过程采用了面向方面的编程(AOP)方法解决了权限系统开发过程
随着集成电路的迅猛发展,微处理器的设计技术对计算机产业、电子产业乃至整个信息产业的发展都有举足轻重的作用。其中RISC(Reduced Instruction Set Computer,精简指令集计
本文提出了一种新的面向变异测试的测试数据生成方法,它的主要特点是根据多个变异体的条件系统产生测试数据。它首先得到每个变异体的条件系统,然后将同一点产生的变异体的必要
  随着计算机技术的飞速发展,企事业单位对各类应用软件的需求越来越迫切,这对软件企业提出了更高的要求。因此,对框架的研究和实践越来越引起学术界和产业界的高度重视。框架
利用快速成形技术制造功能梯度材料零件是当前的一个热点问题。功能梯度材料零件建模和分层算法设计,是解决这一问题的关键环节。从CAD和CAM的角度来说,功能梯度材料零件模型
软件日趋复杂,大量软件高度可配置,给软件测试带来了极大的挑战。组合测试是一种高效的软件测试方法,能有效检查出由参数相互作用而导致的软件故障。但是在实际应用过程中,约
网络技术的迅速发展在给人们的生活带来巨大方便的同时,也带来了非常严峻的安全问题。在虚拟的网络世界里,利用木马窃取机密信息的黑客入侵行为日益增多,给用户和企业的利益、甚
本文将易于并行化的插值法用于Dixon结式的构造中,从而使两种方法有机结合起来,进一步提高了符号计算方法解决问题的规模和效率.主要工作和贡献有:①根据Dixon多项式的特点,
本文首先介绍标准移动IPv6(MIPv6,Moblie IPv6)的基本原理和切换过程,当移动节点在网络间越区切换时,由于IP层的切换容易产生时延和数据包的丢失,引起通信质量的下降或通信中
为了维护计算机系统的安全,一般通过设置用户口令进行身份鉴别,防止他人冒名顶替。口令鉴别的主要弱点在于一旦被窃,冒名顶替者就可以轻而易举地进行非法活动。击键特征的研