d-Left CBF技术在P2P中的研究

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户：bbs_lijun

【摘要】

：

本文分析了布隆滤波器技术在时下流行的分布式系统——P2P系统中的应用,着重介绍基于d-left算法的的计数型布隆滤波器技术,d-left CBF利用d-left hashing的方法存储fingerpri

【作者】

：

王键

【机构】

：

江南大学信息技术与工程学院

【出处】

：

计算机工程与设计

【发表日期】

：

2009年期

【关键词】

：

P2P 分布式哈希表 d-Left计数型布隆滤波器

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文分析了布隆滤波器技术在时下流行的分布式系统——P2P系统中的应用,着重介绍基于d-left算法的的计数型布隆滤波器技术,d-left CBF利用d-left hashing的方法存储fingerprint。将hash value分为两部分,分别用于存储随机地址和fingerprint,从而提高工作效率,并支持节点动态删除操作,应用于节点异常活跃的P2P系统中。在当前各种P2P技术中,搜索技术是最有价值、最亟待解决的问题,其中分布式哈希表(hashing)将是对等网搜索的重要方向。Hashing通过使用哈希表来实现存储和查询,对于P2P搜索而言,其优点是快速准确,缺点是浪费存储空间。本文提出的d-left方法,是基于Bloom Filter技术,利用d-left Hashing的方法存储fingerprint,从而实现空间利用效率的提高。d-left中的d是多个的意思。为了更加简单的说明这个“d”,本文以d=2,既2-left算法应用到哈希表的实现方法为例,分析其结构和性能。2-left Hashing指的是将一个哈希表分成长度相等的两半,分别叫做T1和T2,给T1和T2分别配备一个哈希函数,h1和h2。在存储一个新的key时,同时用两个哈希函数进行计算,得出两个地址h1[key]和h2[key]。如果两边一样多,如两个位置都为空或者都存储了一个key,就把新key存储在左边的T1子表中,2-left也由此而来。在查找一个key时,必须进行两次Hash,同时查找两个位置。了解了2-left Hashing,d-left Hashing就很好理解,它只是对前者的扩展。2-leftHashing固定了子表的个数是2,d-left Hashing更加灵活,子表的个数是一个变量d,同时也意味着哈希函数的个数是d。在d-left Hashing中,整个哈希表被分成d个从左到右依次相邻的子表,每个子表对应一个相互独立的哈希函数。在加入新key时,这个key被d个哈希函数同时计算,产生d个相互独立的位置,然后将key加入到负载最轻的位置(bucket)中。如果负载最轻的位置有多个,就把key加入到最左边的负载最轻的子表中。同样地,如果要查找一个key,需要同时查找d个位置。d-Left计数型布隆滤波器与标准的布隆滤波器比较,若false positive概率相同,假设标准CBF使用9个4位的counter(每个元素36位),6个独立的哈希函数,得到的false positive概率为0.01327。d-left CBF使用11位的fingerprint(每个元素52/3位),得到的false positive概率为0.01172。计算可得,52/3÷36=0.48,即d-left CBF只使用了CBF不到一半的空间,就得到了比CBF更低的错误率。因此在保证false positive概率接近的同时,由于d-left CBF负载均衡,可比负载不均衡的CBF节省至少一倍的存储空间。较之布隆滤波器的其它变种,d-left计数型布隆滤波器有其特殊性。虽然d-left计数型布隆滤波器没有标准布隆滤波器快捷,也没有标准计数型布隆滤波器高效,但d-left结合了两者的优点,综合性能较强。既弥补了标准布隆滤波器的只能对静态网络进行快捷管理,查找和插入,不能删除操作的先天缺陷;也避免了标准计数型布隆滤波器过度占用空间的臃肿。能够较好的解决负载均衡、减少网络浏览等热点问题。当然d-left计数型布隆滤波器不是没有缺点,无法与标准布隆滤波器或标准计数型布隆滤波器结合使用和结构过于复杂等,这些都有待更深入的研究。同样,本文提出的基于d-left计数型布隆滤波器技术在P2P中的研究,只是P2P技术的很小一部份,但基于d-left计数型布隆滤波器的构建思路独辟蹊径,却的确值得期待,希望今后有更多的观察研究。

其他文献

基于频繁词集聚类的海量短文分类方法

信息技术的飞速发展造成了大量的文本数据累积，其中很大一部分是短文本数据。文本分类技术对于从这些海量短文中自动获取知识具有重要意义。但是对于关键词出现次数少的短文，现

期刊

文本挖掘分类海量短文频繁词集text mining classification massive short document frequen

基于改进Inver-over算子的并行TSP演化算法

设计了基于近邻点初始化和改进Inver-over（反序杂交）算子求解旅行商问题的并行演化算法。该算法执行时,主进程每当收集到各个种群的最好个体并形成精英种群时,就对该种群执行一

期刊

旅行商问题反序杂交并行主从式近邻精英种群TSP inver-over parallel master-slave nearest neigh

黑龙江省高粱优质高产种植技术要点

近年来黑龙江省中部、北部地区高粱生产面积进一步增加,优质高产品种更新换代速度加快,由原来的高秆稀植品种向现在的矮秆耐密品种转换,大幅度提高了单产水平。为了有效规范

期刊

种子包衣高产品种黑龙江省

SAN在数字图书馆的应用研究

网络存储技术被称为继个人计算机(PC)、互连网络(Internet)之后第三次IT浪潮的引导者.随着科技的发展,技术的进步,一种更先进、更新颖的网络存储技术--SAN正逐步被人们所接受

期刊

网络存储存储区域网络数字图书馆FCSANnetwork storagestorage area networkdigital libraryFC

会计教学的新方法：“诊所式”教学法

【摘要】诊所式教学法是把课堂看作“诊所”、把教师与学生关系视为“医师”与“患者”关系的一种有效的教学方法。它的特点是:一可以变学生被动为主动,使学生自愿学习;二可以变教师权威性、单向性演讲为师生平等、双向交流,使学生轻松愉快地学习;三可以变满堂灌为对症下药和有的放矢,使学生有效学习。这样,学生既学到了知识,教师也提高了教学技能,符合孔子主张的因人而异、因材施教、教学相长的教育思想,也使教育达到了

期刊

会计教学诊所式教学法应用

基于混合算法的均衡路程MTSP研究

给出了MTSP的整数线性规划模型、分类，提出了均衡各旅行商访问路程和均衡各旅行商访问人数的多目标MTSP问题。针对均衡各旅行商访问路程的MTSP设计了相应的求解算法，求解算法为

期刊

多路旅行商问题均衡多路旅行商目标函数虚拟点设置混合算法MTSP balanced MTSP objective function virtual

Vague的等价聚类分析

聚类分析在现实生活中有着重要的应用。参考模糊集中有关等价聚类分析的方法，在Vague集的等价关系基础上，提出了vague集的等价聚类分析中如等价矩阵，at,af截矩阵等一些基本理论，

期刊

VAGUE集等价关系聚类分析传递闭包ataf截矩阵Vague sets equal relation clustering analyze t

关于加强行政事业单位国有资产管理的思考

【摘要】加强行政事业单位国有资产管理是适应经济发展的必然要求。建立系统、完整的行政事业单位国有资产管理制度是加强有效管理的必然选择，而推进行政事业单位国有资产信息网络化，实施动态管理是加强资产管理的必由之路。　　【关键词】行政事业单位；国有资产；管理　　　　改革开放以来，随着我国经济的发展，行政事业单位国有资产的数量和规模不断上升，质量不断提高。截至2005年底，全国国有净资产约为13.

期刊

行政事业单位国有资产管理

d-Left CBF技术在P2P中的研究

其他学术论文