印刷体数学表达式识别实现方法研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户：yiyucanqing

【摘要】

：

数学表达式是大多数科技工程文献的重要组成部分。随着网络技术和计算机技术的迅速发展,计算机已渗透到社会生活的各个领域,人类社会进入了一个信息化的时代,通过网络传播和

【作者】

：

李宁

【机构】

：

广西师范大学

【出处】

：

广西师范大学

【发表日期】

：

2005年期

【关键词】

：

数学表达式识别符号分割符号识别结构分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数学表达式是大多数科技工程文献的重要组成部分。随着网络技术和计算机技术的迅速发展,计算机已渗透到社会生活的各个领域,人类社会进入了一个信息化的时代,通过网络传播和交换信息已经成为一种重要的手段。实现科技工程文献的数字化对人们的学习和研究有着重要的意义,只有将现有的文献转换成相应的电子文档,我们已经拥有的大量信息才能够使用计算机处理并使之能够在互联网上传播。数学表达式的识别已经成为科技工程文献数字化过程中的难点和关键。本文针对科技文献中存在的大量数学表达式,首先介绍数学表达式识别的发展历程,分析它的结构特点,然后详细讨论了数学表达式的识别过程,将这个识别问题分为三个过程:表达式定位和符号分割、符号识别和结构分析。在数学表达式定位过程中,通过计算文本行内各符号的纵坐标的平均值和标准差来判断本行是否为独立的数学表达式,通过对一些特殊数学符号的识别来判断是否存在嵌入式数学表达式;符号分割采用的是递归的垂直水平轮廓投影分割方法做第一步处理,用种子填充法对其缺点进行补充,轮廓投影分割法的优点在于用它分割出来的符号具有结构信息;支持向量机作为统计学习理论的重要应用,我们使用它来进行符号识别,这是支持向量机方法的一种新应用,但它还是取得了比较好效果;在结构分析阶段中,树转换的方法被使用来分析数学表达式的结构,引入基线结构树的概念,将数学表达式中的操作符和操作数分到基线结构树的各个节点上,使用树结构能简单清晰的反映表达式的结构。本文在对数学表达式识别各阶段所使用的各种方法进行总结分析的同时,对使用到的方法编程实现,并给出了实验结果。最后,我们讨论了在数学表达式识别中所面临的问题以及其今后的发展趋势。

其他文献

BaO—Nd<,2>O<,3>—TiO<,2>系陶瓷结构和介电性能研究

本论文旨在制备出一种新型的高介电常数、低介质损耗、热稳定高频介质陶瓷。选取Ba_(6-3x)Nd_(8+2x)Ti_(18)O_(54) (x=2/3)系统作为研究对象。在这一系统中主要存在着两种化合物:BaNd_2Ti_5O_(14)和BaNd_2Ti_3O_(10)。在BaO-Nd_2O_3-5TiO_2附近可获得具有较好介电性能的材料。纯BaO―Nd_2O_3―TiO_2系材料不易烧结致密,

学位

Ba6-3xNd8+2xTi18O54系统高介电常数低介质损耗热稳定烧结温度预烧温度

多源图像融合的理论与方法

随着信息技术的发展，图像融合技术已成为非常热门的研究课题，在许多领域有着广泛的应用图像融合技术是一种对多源图像信息进行分析整合的技术通过将不同信道采集到图像信息经过

学位

图像融合图像配准视频融合背景差分

手持设备图像控制器的设计与研究

图像控制器广泛应用于各种图形显示设备中,近年来的热点是手持设备中的LCD图像控制器的设计实现和优化,同时考虑手持设备对物理尺寸、功耗和成本的要求。本文讨论应用于手持

学位

平板显示JPEG图形加速2D引擎BitBLT手持设备流水线

印刷体数学表达式识别实现方法研究

其他学术论文