论文部分内容阅读
随着计算机和网络的出现和迅速发展,人们能接触到的信息越来越多。用户一方面可以迅速、方便地接触到丰富的信息,在另一方面,如何在如此繁杂的信息中找到所真正需要的信息却一直是一个难题。在这种背景下,信息检索技术在最近几十年得到了蓬勃的发展。 但是直到现在,信息检索仍旧不能很好地满足人们的需求。这是因为在信息检索的过程中,文档表示和用户查询都存在着大量的不确定性。用户的查询本身就是一个难以确定的概念,它受限于多种因素,包括用户的背景、环境等等。而用户感兴趣的程度也难以刻画。 通过学习机制,在检索过程中加入有利于检索的信息已经被证明可以有效的提高信息检索的效果。这些信息可以通过对文档集进行分析、学习得到,或是从用户的相关性反馈中获得,现有的一些模型采用这种方法已经取得了不错的效果。 图形模型可以很好的构造学习机制,其中贝叶斯网络模型的效果最好,但是由于贝叶斯网络的有向性使得它的构造是一个相当复杂且计算量庞大的过程。Markov网络是另一种较好的表示知识关联的图形表示方法,可以从实例数据来训练获得,并且它的无向性能更好地解释信息检索中知识之间的关系同时也更易于构造。在本文中,我们提出了基于Markov网络的信息检索模型。通过对文档集的学习,我们找到文档与文档、索引项与索引项之间的关系构造Markov网络,通过索引项之间的关系对查询进行扩展,利用文档之间的关系重新构造文档与查询的相似度。实验表明,我们的模型在很大程度上提高了检索效果。 本文的创新点在于: 1.首次提出了基于Markov网络的信息检索模型,这个模型能够较好的表示索引项之间的关系及文档之间的关系,且已有的经典模型均可看作此模型的特例。 2.通过实验验证和分析了基于Markov网络的信息检索模型的性能,并与一些常用的检索模型算法进行了比较。