论文部分内容阅读
P2P存储系统具有潜在的自治性、容错性和可扩展性等优势,其是近年来学术界研究的热点。然而,P2P系统中节点的高动态和不可信特性使得P2P存储系统面临数据可用性和安全性两大难题。虽有不少研究工作讨论这些问题,但很多关键问题仍未很好的解决,这严重阻碍了P2P存储系统的进一步发展。数据可用性方面,本文首先开展系统动态性测量工作,然后分两个阶段达到用最少的网络带宽确保数据可用性的目标:(a)利用精确的分析模型和分发方案(存储节点选择方案),使得可以用最少的数据冗余度屏蔽节点暂时离开造成的数据不可用;(b)更精确的判断节点永久离开的个数,用最少的带宽修复丢失的冗余数据。数据安全性方面,本文提出并分析了P2P存储环境中全新的安全问题,给出了解决该问题的新型数据加密算法。本文的主要贡献包括以下几个方面:(1) P2P环境实际动态性测量。本文全面测量和比较了多个不同类型P2P运行环境的动态性特征,为本文和相关研究提供必须的数据。本文首次发现其它基于爬虫的测量工作的天生缺陷,首次为单个节点在线时间分布等特征建模,首次得到新加入系统的节点有极高动态性等结论。(2)细粒度的可用性定义和分析模型,基于节点动态性的分发方案。本文首次实验验证经典的随机分发方案不能确保数据的目标可用性。本文提出了更符合实际情况的时间相关可用性概念及其分析模型,并据此提出了基于节点动态性的分发方案。分析和实验均表明,本文的分发方案可以用更少的数据冗余度确保数据的目标可用性。(3)基于误判和漏判抵消的节点永久离开判别器PROTECTOR。目前广泛使用时间阈值判别器判断节点是否永久离开系统,其难于同时降低误判率和漏判率,同时存在阈值选择的难题。PROTECTOR用基于概率的独特思路抵消了误判与漏判,从而精确判断了永久离开的节点数,实验表明其节约了大量修复带宽。额外副本法被广泛用来避免暂时错误引发数据修复,本文首次从原理上指出这种方法不能真正节约带宽。(4)适合P2P存储环境的安全纠删码方案SEC。本文提出了P2P存储环境中的敌手模型和数据安全模型,分析发现经典分组加密算法存在较多的安全隐患,而本文的SEC方案则可以很好的解决这些问题。(5)开放的P2P存储服务平台UPStore。本文设计的UPStore系统通过使用上述研究成果,可以提供高可用和高安全的P2P存储服务。