基于DHMM的印刷体文字识别研究

来源 :延边大学 | 被引量 : 0次 | 上传用户：w313296304

【摘要】

：

本文面向工程应用提出了一种新颖的基于退化隐马尔柯夫模型(Degraded Hidden Markov Model)的印刷体文字识别方法。由于印刷体文字的字形相对固定,因此以往通常采用结构

【作者】

：

金长龙

【机构】

：

延边大学

【出处】

：

延边大学

【发表日期】

：

2005年期

【关键词】

：

退化隐马尔柯夫模型文字识别细化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文面向工程应用提出了一种新颖的基于退化隐马尔柯夫模型(Degraded Hidden Markov Model)的印刷体文字识别方法。由于印刷体文字的字形相对固定,因此以往通常采用结构化的识别方法,并且取得了不错的识别率。在特征向量提取上,结构化方法中大多采用细化算法取得所需的笔段,而细化会带来笔段提取的错误,笔段的错误又会导致后面的文法推理错误,从而出现误识,针对这种错误以往采用的方法都比较繁琐。在HMM应用于文字识别方面,无论是联机文字识别还是脱机文字识别,一般都只采用左右型的模型结构,然而左右型的模型结构并不适合于本文所设计的特征向量。通过对印刷体文字结构的分析,在本文提出了一种新的代表一个文字的特征向量——笔段序列向量,在本文中又称为观测序列向量,采用这种特征表达方式能够将二维平面文字信息转化为一维随机信号,并且保留了文字的几何信息。针对所设计的特征向量,在传统的隐马尔柯夫模型(HMM)基础上提出了一个新的处理一维随机序列的分类器——退化隐马尔柯夫模型。本文中的分类器采用了完全不同的状态转移方式,所形成的模型结构为遍历型的结构模型,该模型结构在保持字形结构完整的前提下,不受字号的影响。实验结果表明本文所提方法受字号的影响比较小,并且在分辨率达到一定程度后对于识别率的影响度比较小,证明所设计的特征向量及其分类器能够很好地实现宋体印刷文字的识别。

其他文献

基于RISC的32位微处理器关键技术的研究与实现

随着集成电路的迅猛发展,微处理器的设计技术对计算机产业、电子产业乃至整个信息产业的发展都有举足轻重的作用。其中RISC(Reduced Instruction Set Computer,精简指令集计

学位

微处理器精简指令集计算机指令集IP核设计存储系统

功能梯度材料零件的CAD建模与分层研究

利用快速成形技术制造功能梯度材料零件是当前的一个热点问题。功能梯度材料零件建模和分层算法设计,是解决这一问题的关键环节。从CAD和CAM的角度来说,功能梯度材料零件模型

学位

功能梯度材料零件CAD模型分层算法数据结构

组合测试中的约束

软件日趋复杂,大量软件高度可配置,给软件测试带来了极大的挑战。组合测试是一种高效的软件测试方法,能有效检查出由参数相互作用而导致的软件故障。但是在实际应用过程中,约

学位

组合测试约束测试用例修正测试用例集后处理组合测试的应用

移动IPv6越区切换技术的研究

本文首先介绍标准移动IPv6(MIPv6,Moblie IPv6)的基本原理和切换过程,当移动节点在网络间越区切换时,由于IP层的切换容易产生时延和数据包的丢失,引起通信质量的下降或通信中

学位

移动IPv6越区切换切换管理模型层次化移动IPv6动态切换管理模型

基于模糊聚类分析的用户身份认证方法研究

为了维护计算机系统的安全,一般通过设置用户口令进行身份鉴别,防止他人冒名顶替。口令鉴别的主要弱点在于一旦被窃,冒名顶替者就可以轻而易举地进行非法活动。击键特征的研

学位

模糊c均值聚类身份认证击键特征

基于DHMM的印刷体文字识别研究

其他学术论文