中文印刷体文档数学公式识别系统

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:beilei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科技高度发展的现代,数学表达式是大多数科技文献的核心。但是,数学公式由于使用特殊符号繁多,排版格式复杂多变,因而在计算机上处理特别困难,这也制约了利用计算机和网络开展数学辅助教学的发展。因此对它的研究可以使数学表达式用于检索,提高文献的科技性;实现公式输入的自动化,以解决手动输入的低效率问题;改变数学表达式图片的存在形式,可以节省空间,提高网络的传输速度等。目前广泛应用的OCR系统对手写、印刷体文本都有很高的识别率,已经广泛应用于办公自动化等领域,克服了人工输入费时费力的缺点。但是它只能识别单个字符,还不能分析公式结构,这样就失去了公式所表达的数学含义。因此,本文提出一种对文档中的数学公式定位提取后利用基于特征字符的印刷体数学公式识别方法的设计思想,并给出了完整算法,将印刷体的数学公式(图像格式)转换成可编辑的电子格式。本文主要分为以下几个部分:首先是预处理。图像在生成的过程中容易引进噪声,为了使图像达到我们的要求,要对它进行二值化、平滑去噪、细化、大小归一化等处理。其次是公式定位。利用统计计算文档正文一行文本字符宽度2阶中心矩的修正值大小来判定这行文本中是否含有数学公式。在判定含有数学公式的文本行中,利用数学公式符号与汉字字符外部形态特征的不同把它们区分开,并定位数学公式。然后是公式字符识别。由于定位的是一个整体的公式,而我们需要知道公式包含的各个字符以及它们之间的位置关系,因此,就要分割公式所包含的字符并且识别它们。本文采用快速算法进行字符的分割,用模板匹配的方法进行字符识别。接下来研究结构分析。本文采用基于特征字符的方法进行结构分析,提出了特征字符和特征子块的概念。对输入的公式,按照特征字符的处理算法进行分割,并对不同的特征字符,采用不同的处理算法,找出各个特征子块。直到子块中无上下标,然后进行识别。最后就是结果输出。在这一部分给出了Word EQ域的使用方法。并把结构分析生成的语法树转换为可编辑的Word EQ格式。
其他文献
“去库存”现在是中国房地产的重要任务,二三四线城市更是如此,各方都在想办法。比如任志强还这样说:“政府也许会出台各种有助于消化库存的政策。但并非所有的库存都能靠政策被市场消化。当房子盖在了不合适的地方,(包括住宅、写字楼与商业)也许只能炸掉,推倒重来。”  机缘巧合的是,这两年,我正好在中部的三线城市做房地产相关工作,对于三线城市房地产库存营销状况还是了解的。大量的库存当然不可能像任志强所说的那样
随着科技的飞速发展,被控对象日益复杂化、大型化,传统的智能控制理论在控制系统的设计以及控制效果上都存在不足,而起源于分布式人工智能(DAI)的多智能体技术,为大规模复杂
随着移动设备和语音识别技术的发展,嵌入式平台下连续语音识别已成为当前语音识别应用研究的热点。在现今大词汇量连续语音识别距离实用化还存在不可忽视的沟壑下,某些特定领域
随着信息技术,特别是网络技术的发展,网络化协同制造将成为未来制造业的发展趋势。网络化协同制造越来越受到制造企业的高度重视。网络化协同制造有助于企业降低生产成本、快速
当今社会,很多大型仓库的安防一般需要在仓库各个角落安装许多摄像头。除光学信息外,热源信息也同时被需要。但市面上的大型远红外摄像头价格昂贵且不具实用性。本文根据对实际
具有网络功能及使用Linux操作系统作为软件平台是今后仪器设备的重点发展方向之一。本论文比较、分析和总结了当今嵌入式系统软件和硬件的发展趋势、工业色谱分析仪器发展现
现有的研究表明,精神疾病,先天智障及糖尿病等先天性遗传疾病患者的指纹特征具有一定的共性,并且与健康人士的指纹存在一定的差异,临床上也可以把指纹特征作为先天性疾病的辅助诊
视觉是人类最重要的感觉。视频信息具有信息量大、直观、具体、生动等诸多优点。据统计,人类从外界获取的信息中有70%来自视觉。因此,针埘各种视频技术的研究与应用一直吸引着国
由湖南省博物馆、谭国斌当代美术馆和湖南广电集团共同主办的第二届“艺术长沙”于2009年10月23日在湖南省博物馆开幕,2009“艺术长沙”依然延续上一届的做法,定为艺术家联展
中共成都市委宣传部按照中央和省、市委有关文件精神,对全市报刊进行了近一年的整顿,于去年12月25日批准了31家企业报纸出版,并发给了准印证。 The Propaganda Department