论文部分内容阅读
信息技术的不断发展带来对信息存储高容量,高性能的要求,云存储应运而生。在云存储服务过程中,对于性能和可靠性的要求尤为看重。云存储通常以分布式文件系统体现,这就需要提高分布式文件系统的性能和可靠性。如同像RAID技术引入分布式文件系统中,副本技术的引入可以很好地提高系统的性能和可靠性。副本技术在带来高性能和高可靠性的同时,也带来了副本一致性的问题。如何建立恰当的副本管理机制,减少副本一致性维护所带来的性能的损耗,已成为分布式文件系统的一个研究热点。在Google提出的GFS,Amazon使用的Dynamo等中针对副本一致性问题都提出了一些解决方案,但它们都只关注问题的某一方面。在副本一致性技术维护过程中,课题根据分布式文件系统中副本和负载平衡的发展需求,充分利用负载信息以及存储节点中文件访问的热度信息,提出了基于热度和数据大小的副本一致性维护算法。算法定期从存储端获取热度队列,与更新队列进行比较,若两者无交集,则可以放缓更新,反之,则选取热度大且更新数据量小的文件先更新,热度小且更新数据量大的后更新。通常在一致性维护过程中,会加重元数据服务器处理的负载。当更新负载影响到正常的元数据处理功能的时候,将更新维护切换到客户端来完成,可以减小元数据端的负载。实验表明,基于热度和数据大小的一致性维护策略和动态一致性切换维护策略,在保证数据可靠性的同时,实现了副本一致性的有效维护,大大降低了系统一致性维护的开销。在更新请求占所有访问请求的20%及以上以及副本数量较多的情况下,系统在响应时间上,副本动态一致性较传统的副本一致性策略有较明显的提高。