论文部分内容阅读
对等网络(P2P)是一种采用分布式体系结构的网络,也是当今一个迅速发展的研究领域。现有的P2P系统网络规模大、动态性高、异构性强,有效的搜索技术一直是P2P系统研究中的核心问题,而P2P网络的有效搜索主要体现在提供稳定性定位与低查询开销等方面。集中式P2P搜索需要高性能的索引服务器,容易产生单点故障和瓶颈效应;基于洪泛的搜索具有一定的盲目性,而且对于带宽浪费较大。
由分布式散列表(Distributed Hash Table,DHT)建立的P2P系统在广域网支持巨量级的数据一致性分布,并提供可度量的低跳步路由算法来进行精确定位,同时具有高容错性。但分布式散列函数只适于精确的查找,而在P2P应用系统中,通常需要提供对关键词查询等非精确查找机制的支持。
本文深入分析结构化P2P网络本身的特点,结合搜索引擎核心技术中的分词索引技术,提出了支持多关键词搜索的资源发现模型KRDM(Keywords Resource Discovery Model),它通过将<关键词、资源信息>分发到P2P系统节点,然后建立资源簇的方法来提供多关键词查询。在此基础上,本文还利用LSH技术对关键词的映射机制进行改进,体现出相似关键词相邻存储的特性,从而能够搜索出与关键词相近的内容。这种方案使得相似关键词由相同节点维护的可能性大大增加,而且对于关键词输入错误具有一定的容错能力。
KRDM模型建立于全分布式结构化网络,具有良好的可扩展性,同时独立于overlay层所使用的协议,可重用性强。最后,本文还针对互联网资源的“热点”现象对Overlay协议提出了改进方案,旨在减轻关键词映射带来的负载不均衡问题,合理分配P2P系统中资源的分布。
通过仿真实验,KRDM能够在不增加路由复杂度的基础上,实现多关键词查询,同时支持相似关键词的搜索,并能达到较高的准确度。此外,利用捎带查找优化的节点分配方案也能够将“热点”节点的负载有效降低,使新加入节点向着“热点”汇聚。