论文部分内容阅读
数据分布是研究数据如何分布到多个资源节点的NP-Complete问题,是云计算、普适计算、网格计算、分布式计算、P2P网络等多节点分布式系统中的关键技术之一,对系统性能、可靠可信性、资源配置等方面有着重要影响。随着云计算的发展,云数据分布已成为云计算中不可或缺的部分,并在负载均衡、节约能源、系统安全等众多领域发挥着重要作用现有数据分布策略在总时域负载均衡中已经取得了不错的结果,在地域分布式系统中的也有很好的表现。但是,由于现有云基础架构大多为大规模集群,相对于以往的地域分布式系统,其带宽已有极大的改善,故数据分布策略需要弱化以往以带宽为主的评价指标。此外,总时域均衡的数据分布策略短时域数据访问并不一定均衡,而短时域的不均衡极有可能引发系统瓶颈。
本文在调研多种数据分布策略的基础上,依据云数据的松散特质、短时域的访问规律和云系统的基础架构,提出云数据分布过程的数学模型,提出并实现了云中的数据分布系统,设计并实现了基于时序片段评价的集中式和分布式数据分布策略。策略将总时域切分为时间片段,将多目标优化问题转化为单目标问题,采用反馈评价的方式调整各个资源节点中的数据。该策略均衡了系统各个节点在各个短时域中的负载。经多次随机模拟实验和云环境实验表明,基于时序片段评价的数据分布策略相对于常见的数据分布策略而言在系统总时段均衡、每时段的系统均衡、系统时段最大波峰这三个指标上取得了较好结果。在数据迁移量指标上,分布式策略比集中式策略有显著改进。