基于Markov网络的信息检索模型

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:wukeda139
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和网络的出现和迅速发展,人们能接触到的信息越来越多。用户一方面可以迅速、方便地接触到丰富的信息,在另一方面,如何在如此繁杂的信息中找到所真正需要的信息却一直是一个难题。在这种背景下,信息检索技术在最近几十年得到了蓬勃的发展。 但是直到现在,信息检索仍旧不能很好地满足人们的需求。这是因为在信息检索的过程中,文档表示和用户查询都存在着大量的不确定性。用户的查询本身就是一个难以确定的概念,它受限于多种因素,包括用户的背景、环境等等。而用户感兴趣的程度也难以刻画。 通过学习机制,在检索过程中加入有利于检索的信息已经被证明可以有效的提高信息检索的效果。这些信息可以通过对文档集进行分析、学习得到,或是从用户的相关性反馈中获得,现有的一些模型采用这种方法已经取得了不错的效果。 图形模型可以很好的构造学习机制,其中贝叶斯网络模型的效果最好,但是由于贝叶斯网络的有向性使得它的构造是一个相当复杂且计算量庞大的过程。Markov网络是另一种较好的表示知识关联的图形表示方法,可以从实例数据来训练获得,并且它的无向性能更好地解释信息检索中知识之间的关系同时也更易于构造。在本文中,我们提出了基于Markov网络的信息检索模型。通过对文档集的学习,我们找到文档与文档、索引项与索引项之间的关系构造Markov网络,通过索引项之间的关系对查询进行扩展,利用文档之间的关系重新构造文档与查询的相似度。实验表明,我们的模型在很大程度上提高了检索效果。 本文的创新点在于: 1.首次提出了基于Markov网络的信息检索模型,这个模型能够较好的表示索引项之间的关系及文档之间的关系,且已有的经典模型均可看作此模型的特例。 2.通过实验验证和分析了基于Markov网络的信息检索模型的性能,并与一些常用的检索模型算法进行了比较。
其他文献
随着Internet的普及、网络性能的改善,越来越多的企事业单位和个人借助于网络进行信息的交流和发布。尤其是近年来出现的视频会议系统,能够使用户摆脱地域限制,进行实时的语音视
在异构数据源的集成中,解决语义异构一直是一个难题。本体能够明确表示一定领域的概念和概念之间的关系,利用这一特点,基于本体的数据集成能够解决这个问题。 在基于本体
软件配置管理是一套软件开发与维护的科学管理规范,是针对软件变更的一个关键的软件支持过程。随着软件系统的日益复杂化和软件版本更新的频繁化,软件配置管理已经成为当前软
随着软件技术日新月异的发展,传统的软件模式已经不能满足用户的个性化需求了,软件即服务(SaaS)模式的出现,使用户对软件产品的需求转变为对软件服务的需求,然而随着整体应用环境和
通用串行总线USB(Universal Serial Bus)的提出最初是为了解决PC上传统总线的不足,因其速度快、支持热插拔、占用主机资源少等优点广泛应用于PC外设和移动数据交换与存储。为
Internet的飞速发展和移动计算机日益广泛的应用,推动了对移动计算机无线接入的研究,同时广大Internet用户对随时在线的要求日益增强也极大地促进了对移动IP的研究。移动IP允许
线状要素综合作为制图综合领域中最重要的研究区域,经历了几十年的发展后,仍然是专家学者们研究的热点。这一方面是由线状要素在地图要素的图形表达上的重要性决定的;另一方
安全多方计算就是:拥有秘密输入的n方,希望用各自的秘密输入共同计算一个函数。计算结束,要求每方都能接收到正确的输出(正确性),并且每方只能了解他们自己的输出,而不能了解其他
数字图书馆和互联网等大规模信息资源库的飞速发展对视频数据的分析与检索技术提出了新的挑战。这些信息资源库具有数据容量大、数据类型丰富、非专业用户数量多等特点,这就
传感器技术是高科技发展的重要基础,数字化、智能化是当前传感器领域的主要发展方向。本文针对车辆性能测试中牵引力传感器的应用现状,设计了一种基于USB通讯的数字式智能化