基于语义相似的P2P搜索机制研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:slrjlc2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P网络中存在着丰富的信息资源,正确高效地搜索信息是P2P系统实现有效的资源共享和协同的关键。然而,由于现有P2P系统规模越来越大,并且具有较高的动态性和较强的异构性等特点,有效的P2P搜索技术一直是P2P系统研究中的重点问题和难点问题。 本文针对P2P网络的搜索技术进行了研究,分析了现有P2P搜索技术存在的不足,并提出一种基于语义相似的P2P搜索机制,通过积累历史搜索经验获得路由指引信息,帮助搜索结点快速发现与搜索内容最相关的结点,提高搜索效率和目标命中率。本文的研究内容主要包括以下三个方面: 第一,综述了P2P网络的基本搜索算法及其相关的改进,并分别对无结构P2P网络和结构化P2P网络分析了现有搜索算法存在的不足以及改进的难点。无结构P2P网络由于采用泛洪搜索机制,信息量随着网络规模的扩大而呈指数增加,导致网络拥塞,影响了网络性能,系统的可扩展性降低;此外,对于稀疏资源的搜索不能避免产生大量的查询信息,而且搜索结果不可知。结构化P2P网络由于采用分布式散列表技术(DHT),用户必须明确知道所搜索资源的唯一标识才能进行散列和找到该资源,而且DHT仅支持精确匹配查询,对于多关键词搜索却无法提供直接的支持,也无法支持内容、语义等复杂查询。 第二,提出了一种基于语义相似度的P2P搜索机制SRVN,该机制利用了P2P网络的拓扑特性,以及网络资源访问的局部性原理,各结点在查找过程中积累“有用的”搜索经验以更有效地指引路由,使得路由总是指向能提供更多信息的邻近结点。并且,用户提交查询请求后,通过该机制可以得到一组相关的信息(文件),从而扩大了搜索的范围。同时,在应答消息回路经过的各跳结点上,可以根据一定的策略存放文件副本信息,更新搜索经验,从而进一步提高全局搜索性能。 第三,研究了SRVN在P2P网络中的应用。主要以无结构P2P网络中典型系统Gnutella为例,通过仿真实验和性能分析,说明应用该算法能有效地减少由于采用类泛洪方式广播消息、定位对等点的方法造成的急剧增加的网络流量,提高了搜索效率和目标命中率。此外,也探讨了在结构化P2P系统上应用该算法的可行性,分析了应用基于语义相似度搜索机制的P2P信息检索系统的体系结构。该算法可以作为对基于DHT技术的结构化搜索算法的一种补充,改善搜索范围的限制,提供了对于多关键词搜索和模糊搜索的尝试。
其他文献
对于那些存在着服务提供方和服务使用方的信息系统,传统的服务提供方式在通讯安全、认证机制、访问控制机制、审计信息、服务收费、信任评估、系统监控、黑客入侵等方面存在着
在网络安全中,防火墙是建立网络边界、加强网络安全的重要设备。根据防火墙工作的层次和方式,防火墙上可以分成包过滤防火墙、代理防火墙。包过滤防火墙由于出色的性能而被广泛
本文对基于Windows的远程复制系统的开发进行了研究。文章针对当前的数据复制技术进行了研究和讨论,提出一个Windows平台下的远程复制系统(Remote Volume Replicator,简称RVR),
随着计算机软硬件技术的不断发展,多媒体技术的逐渐成熟,三维模型这种相对于二维图形、图像更加有表现力的媒体形式逐渐流行,并成为多媒体组成中的重要成员。虽然三维模型的创建
WebGIS——基于Internet的地理系统是将网络与地理信息系统相结合的产物,也是网络发展的必然趋势。将WebGIS应用于楼宇信息管理系统(BIS),采用B/S模式的体系结构,最终实现楼宇各
全球经济发展正在进入信息经济时代,知识经济初见端倪。但随着Internet、E-business的发展,信息系统安全问题越来越引起世界上各国、各行各业的人们的关注,它所涉及的范围非常广
服装类商品占据电子商务市场巨大份额,而针对的服装类商品属性实体识别的开放研究却较少。对服装类商品属性实体识别技术的研究,为电商信息检索、个性化商品推荐、广告系统、以
由于XML具有自描述、语法简单、可扩展性强等优点,广泛应用于电子商务、电子政务等应用系统中,并发展成为数据交换和数据表示领域事实上的标准。随着XML数据量剧增,研究人员提出
搜索引擎作为互联网上最主要的信息搜索工具之一,是广大网络用户用于查询信息的主要工具。然而,近年来,由于网络信息量迅猛增加和网络信息组织的无序性,用户很难从传统搜索引擎返
WWW的迅速增长使得其信息量已经远远超过了个人的信息阅读和理解能力,面对如此众多的信息,人们往往利用基于关键词的检索引擎帮助进行信息的检索,但它只能检索出很小部分的相关