【摘 要】
:
近年来,信息检索技术的出现,给人们获取信息带来了极大的方便,而XML在信息管理、电子商务、移动通信、网络教育、电子文档交换等诸多领域也有很广泛的应用。本文设计了一个基
论文部分内容阅读
近年来,信息检索技术的出现,给人们获取信息带来了极大的方便,而XML在信息管理、电子商务、移动通信、网络教育、电子文档交换等诸多领域也有很广泛的应用。本文设计了一个基于XML的移动信息检索系统,主要包括索引库的建立、关键词加权、检索、相似度计算几个部分。 尽管目前基于XML的信息检索模型研究与应用已经取得了很大进展,但在检索方面仍然存在一些问题,如何能使权重更加反映用户的需求,如何能够使检索的查全率与查准率获得提高,如何能够使XML文档结构和内容信息得到充分的挖掘。 针对上述问题,本文根据实际需求,在深入研究分析XML与向量空间模型的基础上,建立了基于内容和结构的倒排索引库,并将各种加权方法应用到XML信息检索领域中,提出了领域词典加权、结构位置、节点距离加权共同作用进行加权的方法。文中详细描述了基于模型的原型系统的总体设计、实现和相关的算法。 本论文的主要工作如下: 1、提出了原型系统的框架设计,并且介绍了此原型系统的设计思路、技术路线以及各个主要的模块的功能。 2、给出了索引库的建立方法、关键词加权的三种不同方法的结合公式、查询与文档之间的相似度计算、检索以及移动设备接口实现的主要算法。 3、实现了一个基于XML的移动信息检索系统,利用Java平台实现,并应用Servlet和JDBC实现移动客户端数据的传输以及对数据库的访问。 4、通过对召回率—精确率曲线的数据进行分析,分析原型系统对于召回率和精确率的提高。 本研究工作的开展,主要是为了解决现实问题,满足当前应用需求,同时积累系统开发研制的经验。基于XML的移动信息检索模型的研究与开发具有一定的应用价值和学术价值。
其他文献
在全世界,鲨鱼袭击游客的事件时有发生。2011年,全球有12人死于鲨鱼的袭击,这在历年中是很特别的,因为按照往年的情况,一般每年大约只有5人死于这种不幸事件。人们还发现,在最近的1
<正>《物权法》并没有规定添附规则,在此次编纂民法典的过程中则有必要再进行相关考虑。我认为,关于附合的物权法立法应重点关注三个问题。第一,附合的发生原因。这个问题直
根据目前生产线的实际情况,通过一种有效的工具——线平衡墙的运用,及时地发现浪费,平衡生产线的生产。线平衡的使用对生产线进行了优化和改善,实现了车间生产效率的提高。
现今,中国高校的翻译课程大多以传授翻译技巧为主,且非文学类翻译占主导。为了改善教学环境,提高教学质量,笔者在非英语专业研究生的翻译课程中设置了一次文学作品翻译实践,
提出一种基于深度置信网络(DBN)的电压暂降特征提取与暂降源辨识方法,利用DBN的特征提取能力对实测波形数据进行特征自提取,解决了人工提取特征过度依赖专家经验,受未知特征
《国语》是记载我国春秋时期诸国史实的一本重要史书,对它的校注研究,古往今来,可谓多矣。而其中集大成者,当属近人徐元诰之《国语集解》,它所使用的集注的方法和遵循的校注原则,其
违法侦查作为一种程序性违法行为,不仅可能侵犯犯罪嫌疑人合法权利,而且可能造成被害人权利的损害。不同违法侦查行为对被害人权利造成损害不同。为了更好地保护被害人权利,
基本篇章单元(Elementary Discourse Units,EDU)识别对篇章分析工作意义重大,是构建篇章结构的基础。从篇章衔接性视角看,每个EDU都由要表达信息的起始点--主位和要传达的新
唐釋慧苑的《新譯大方廣佛華嚴經音義》,簡稱《慧苑音義》,是一部重要的音譯之作。《慧苑音義》蘊含大量古文獻,蓋周秦兩漢古義之存者,可據以證其得失,其散佚不存者,可藉以窺
赵季平先生不仅创作了大量的影视音乐作品;而且还呈现出诸多器乐协奏曲、交响叙事诗、交响音画、舞剧与秧歌剧等等,在国内外享有声誉。其音乐作品的最大特征便是根植于民族音