论文部分内容阅读
本文研究了P2P系统中信息检索的几个关键技术。首先从在P2P环境下进行信息检索的价值出发,阐明了在P2P系统中建立节点之间关系的重要性。然后,详细地讨论了所要解决的三个关键技术。对于节点描述,提出了一种称为WTL的描述方法,WTL从本质上来讲是一个关键字列表,每一个关键字都以其在文档集中的词频作为它的权重。通过大量的实验证实,这种描述方法不仅构建简单开销少,而且它还有非常不错的主题区分能力。对于节点选择,提出了两种在P2P系统中建立节点之间联系的方法,并在此基础上讨论了相应的节点选择机制。一种建立节点之间联系的方法是建立P2P社区,节点之间通过交互和WTL相似度的比较,兴趣相同(相似)的节点通过一种显式的关系联系起来,形成一个社区。与P2P社区的显式关系不同,另一种方法试图在P2P系统中建立起隐式联系,这种隐式联系分别把具有相似信息需求和具有相似信息提供能力的节点联系了起来,这种联系是为节点选择服务的。对于结果融合,提出了一种通过利用节点相似度以及权威度来对查询结果进行调整的方法。通过对P2P系统中信息检索的三个关键技术的研究和探索,作者形成了自己的解决这个问题的框架和方法。