论文部分内容阅读
目前,在一些需要科学计算的领域,比如全球气候变化和高性能物理中,往往需要处理大量的数据,这一领域的研究人员需要访问并分析这些数据,同时这些研究人员以及他们研究时所依赖的计算与存储资源通常是在地理上分布的,这种分布导致了现有数据管理的基础设施无法满足复杂的,严格的性能要求。数据网格能够对数据传输和计算能力合理调度,能够准确的进行性能估计,可以指导数据拷贝的选择。
结构化的P2P(Peer-to-Peer)作为一个分布式计算模型,它避免了单点失败,同时具有很好的可扩展性。P2P结构通过对等连接可以均衡数据的分布,通过分散查询来实现数据访问的低延时,采用随机性来实现良好的负载平衡。然而,在实际应用中,对于数据的访问不平衡性往往是不容易控制的,数据访问的不平衡性可能引发节点访问量过载,导致系统整体性能下降。
本文,首先对已有P2P结构和算法进行了深入的研究和分析,然后对副本管理的概念和技术进行深入的讨论,最后提出了多根节点、多点维护的副本策略。这种副本策略改变了一些结构化P2P中一个资源只有一个根节点的方法,而采用多个根节点共同存储资源的索引,保证了索引的可用性,这很大程度上提升了系统的健壮性。同时,每一个根节点的部分邻居节点中也会存储同一个资源的索引,从而形成了多个点维护同一个索引,这也提高了系统的访问效率。
在此基础上,本文设计了一个副本管理模型,通过对副本的创建、更新、删除等一系列操作,有效地管理系统中的副本,如自动控制系统中副本的数量、确定系统中副本的有效性以及保证同一资源副本的一致性。
本文通过大量的实验模拟验证所设计的副本管理器,提出了适合实际应用的最佳解决方案,通过测得的实验数据有效地支持了本文的设计方案,不但让本系统能够高速、高效的运行,也为今后的研究铺平了道路。