网络数学搜索中的数学查询语言与索引的研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户:chenlinwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,随着互联网的迅猛发展、Web信息的增加,用户要在信息海洋里查找信息,就像大海捞针一样,搜索引擎技术恰好解决了这一难题。然而传统文本检索系统在对数学公式和数学符号的搜索上具有很大的局限性,使得在科学、数学、工程及科技方面无法满足用户对数学公式搜索的需求。与此同时,随着数学内容计算机存储的深化以及浏览器对多种数学表示形式的支持使得基于公式的数学搜索引擎的研究具备了可行性条件。本文在对比研究了现有的一些数学搜索系统的实现方法和技术基础上,主要针对目前数学检索中的两大重点和难点问题展开深入讨论。即如何建立一种通用、有力的数学查询语言以及如何建立一种易于存储和查询的数学内容索引结构。在数学查询语言的建立方面,本文提出了一种基于XML的扩展机制,构建一种符合MathML语言规范的数学查询语言MQL(Math Query Language)。该查询语言通过在MathML语言规范的基础上定义一系列元数据标签来实现查询时的通配符查询表达和组合查询表达。这些标签各自具有相应的属性,这些属性可以细化查询描述,有效增强查询表达力度。在数学内容索引的建立方面,为了同时支持面向数学内容显示结构的查询和面向数学内容语义的查询,本文提出同时为数学内容建立Presentation索引和Content索引。其中,Content索引主要采用抽象树倒排索引结构,Presentation则采用N-grams线性倒排索引结构。此外,论文中还描述了索引建立时公式中各子公式的权值分配方法,以优化查询显示结果,提高搜索引擎查全率和相关度。
其他文献
随着网络和多媒体通信的发展,不同网络上各种视频信息的交流需求在不断增加。由于网络和终端设备的多样性,编码得到的视频流不一定是最优的。当在具有不同的信道特征的网络上
在当今互联网高速发展的时代,人们已经逐渐倾向于从网络上获取各种各样的信息。但是,随着用户和应用的日益增长,随之而来的流量剧增却使得网络变得更加拥塞,并直接导致了网络
在线社交网络中,异常账户是始终存在的。在现代社会,对于异常账户的检测通常使用的是信息本身的特征来设计,使用基于交互、基于排名、基于数据特征等方式来达到相应的检测目
视频目标跟踪是计算机视觉领域待解决的核心问题之一,它是一系列后续工作任务的基础。尽管视频目标跟踪已经经过了数十年的研究,且已经开发出许多高效的跟踪算法,但这些算法
近年来,随着3D显示技术的迅速发展,3D电视已成为我们日常生活中的一个重要电子产品。基于深度图像绘制(depth-image-based rendering,DIBR)是3D显示的关键技术。它能够合成一
人脸识别技术是一种利用计算机提取人脸图像中特殊表征信息并基于该信息实现对象匹配和分类的身份识别技术。在实际生活中,人脸图像的采集更方便和直接,因此人脸识别技术被广
计算机通信技术的飞速发展给数字产品的传播带来了极大的便利,与此同时数字产品也面临着日益严重的版权纠纷问题。如何对数字产品进行有效保护已经成为信息化时代一个迫切需
WEB文本挖掘是WEB数据挖掘的一个研究方向,WEB文本挖掘过程中最重要的是如何对文档内容进行有效分类,文本分类精度越高,WEB查询结果就越接近于理想的要求,在实际的应用中越能
入侵检测系统是继防火墙技术之后的新一代安全保护措施,它通过对计算机系统或网络关键节点信息的采集、分析,从中发现与正常模式不同的异常行为,及时发出警报并处理。传统的
无线传感器网络路由技术是传感器网络的关键技术之一,如何设计低能耗的传感器网络路由协议是一项艰巨的任务。针对这一问题,本文在贪婪周边无状态路由算法GPSR和低能耗路由协