结构化P2P关键词搜索模型的研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:x360791581
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对等网络(P2P)是一种采用分布式体系结构的网络,也是当今一个迅速发展的研究领域。现有的P2P系统网络规模大、动态性高、异构性强,有效的搜索技术一直是P2P系统研究中的核心问题,而P2P网络的有效搜索主要体现在提供稳定性定位与低查询开销等方面。集中式P2P搜索需要高性能的索引服务器,容易产生单点故障和瓶颈效应;基于洪泛的搜索具有一定的盲目性,而且对于带宽浪费较大。   由分布式散列表(Distributed Hash Table,DHT)建立的P2P系统在广域网支持巨量级的数据一致性分布,并提供可度量的低跳步路由算法来进行精确定位,同时具有高容错性。但分布式散列函数只适于精确的查找,而在P2P应用系统中,通常需要提供对关键词查询等非精确查找机制的支持。   本文深入分析结构化P2P网络本身的特点,结合搜索引擎核心技术中的分词索引技术,提出了支持多关键词搜索的资源发现模型KRDM(Keywords Resource Discovery Model),它通过将<关键词、资源信息>分发到P2P系统节点,然后建立资源簇的方法来提供多关键词查询。在此基础上,本文还利用LSH技术对关键词的映射机制进行改进,体现出相似关键词相邻存储的特性,从而能够搜索出与关键词相近的内容。这种方案使得相似关键词由相同节点维护的可能性大大增加,而且对于关键词输入错误具有一定的容错能力。   KRDM模型建立于全分布式结构化网络,具有良好的可扩展性,同时独立于overlay层所使用的协议,可重用性强。最后,本文还针对互联网资源的“热点”现象对Overlay协议提出了改进方案,旨在减轻关键词映射带来的负载不均衡问题,合理分配P2P系统中资源的分布。   通过仿真实验,KRDM能够在不增加路由复杂度的基础上,实现多关键词查询,同时支持相似关键词的搜索,并能达到较高的准确度。此外,利用捎带查找优化的节点分配方案也能够将“热点”节点的负载有效降低,使新加入节点向着“热点”汇聚。
其他文献
天气会商是天气预报制作过程的重要环节,对提高天气预报的准确率有着重要作用。传统的天气会商需要把所有的与会人员集中在一起,严重的浪费了人力、物力和时间资源。如果利用
抽象数据关系可视化主要是针对于数据结构的可视化,而图是应用最一般且最广泛的数据结构。图的可视化包括静态图可视化和动态图可视化,但动态图可以看成是由静态图组成的序列
随着电信网规模的不断增大,网络中的电信设备在复杂性和多样性方面都有很大的提高,如何对它们进行有效、高效的管理成为了一个很重要的问题。本文设计并实现的集中操作维护平台
学位
近年来,垃圾邮件的传播形式和内容已经出现了新的变化,其危害日益严重,而现有的垃圾邮件过滤技术却不能很好地应对这种形势。为了进一步提高互联网抵御垃圾邮件风险的能力,更
近年来,P2P网络发展迅速,在很多领域得到广泛应用,成为业界研究与关注的一个焦点。对等网络是实现下一代互联网的重要组成部分,P2P搜索技术是P2P研究中的一个重要领域。随着
连续函数的总体极值在自然科学、人文科学和工程设计等各种学科中都有着很广泛的应用。目前对于求解函数局部极值有很多好的成熟实用算法,而对于求解函数总体极值尚不多见,因此
分布式约束优化是解决分布式推理任务的一个基本框架,是目前多Agent领域的研究热点。近几年来提出了许多优秀的分布式约束优化算法,这些算法大体上分为完备算法和非完备算法
随着数码设备的普及,互联网的兴起,每天将产生大量数字图像。为了有效的存储、管理图像数据库,需要对图像库进行索引,按特定的需求检索图像。怎么根据数字图像的视觉内容有效
随着信息技术与互联网技术的发展,大量的数据在各行各业中积累着,为了综合利用这些数据信息,达到充分的资源利用,需要针对现有的数据进行科学的研究和分析,进行大量的数据沉淀和数
学位
分类技术是数据挖掘领域一项重要的任务。如何根据训练集建立分类器,并使用该分类器准确预测待测试实例的类别是衡量分类器好坏的标准。单级分类器通常只对训练集学习一次,在