P2P系统中信息检索关键技术的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:myqwe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了P2P系统中信息检索的几个关键技术。首先从在P2P环境下进行信息检索的价值出发,阐明了在P2P系统中建立节点之间关系的重要性。然后,详细地讨论了所要解决的三个关键技术。对于节点描述,提出了一种称为WTL的描述方法,WTL从本质上来讲是一个关键字列表,每一个关键字都以其在文档集中的词频作为它的权重。通过大量的实验证实,这种描述方法不仅构建简单开销少,而且它还有非常不错的主题区分能力。对于节点选择,提出了两种在P2P系统中建立节点之间联系的方法,并在此基础上讨论了相应的节点选择机制。一种建立节点之间联系的方法是建立P2P社区,节点之间通过交互和WTL相似度的比较,兴趣相同(相似)的节点通过一种显式的关系联系起来,形成一个社区。与P2P社区的显式关系不同,另一种方法试图在P2P系统中建立起隐式联系,这种隐式联系分别把具有相似信息需求和具有相似信息提供能力的节点联系了起来,这种联系是为节点选择服务的。对于结果融合,提出了一种通过利用节点相似度以及权威度来对查询结果进行调整的方法。通过对P2P系统中信息检索的三个关键技术的研究和探索,作者形成了自己的解决这个问题的框架和方法。
其他文献
随着车载系统、手机和笔记本电脑等通信产品的广泛应用,如何在移动ad hoc网中进行数据传输成为目前重要的研究课题,基于地理位置的GEOCAST数据传输协议是其中的一个重要分支
客户关系管理(CRM,customer Relationship Management)是适应现代管理思想发展起来的一种新型管理模式,可以分为协作型、操作型、分析型三种类型.分析型CRM将操作型CRM中有价
空间基础设施的建设对国民经济和国家安全起到的作用是至关重要的。因此,对以不同种类卫星组网为核心的空间基础设施建设的研究方兴未艾。卫星综合信息网作为空间基础设施的具
随着计算机的普及,计算机网络已成为许多行业必不可少的办公工具。而目前各行业仍利用邮电系统提供的程控交换网络进行电话通信,需支付大量的电话费,占用了各部门很大一部分
目前,负载均衡技术广泛应用于服务器集群当中,集群负载均衡技术主要分为三方面的研究内容:一、资源的重定向机制,包括:基于客户的重定向方法,基于DNS方法,基于分发器方法和基于服务
随着企业信息化进程的不断深入,把ERP引入生产管理已成为一种趋势。库存管理作为ERP的核心部分,对它的正确管理和科学决策能给企业的经营带来巨大的利润空间。 本文针对企业
Ad Hoc网络是一种无中心、自组织的、由移动节点组成的动态变化的多跳无线网络,每一个节点也兼备路由器功能。随着Ad Hoc网络的进一步发展,关于其网络中所使用的路由协议的性
随着计算机的应用领域不断扩大,数据的类型在不断地发生着变化,需要处理的数据量也与日俱增.从早期的单一数据,到以集合形式存在的文件和关系表数据,再到海量数据和无限数据
随着时间的推移,森林资源数据的规模越来越庞大,类型也越繁杂多样,对其信息的处理越来越困难,加上用户对数据处理作业的不同需求,传统的单一的计算模式已经无法适应海量的数
本文论述了XML及其相关技术的发展历程、技术要点及行业应用。由于信息表示的独立性,XML可用于数据交换;由于其层次结构特性,XML更多的用于表示复杂的数据结构和文档,因此在各行