论文部分内容阅读
随着信息化的发展和大数据时代的到来,传统的数据存储方式已不能满足现代数据存储的需求,而云存储和海量数据存储被视为是下一代数据存储的良好解决方案。所谓的云存储,是指通过各种集群技术、网格技术和分布式文件系统等技术及系统的应用,将网络中大量的各种存储设备通过软件系统集合起来协同工作,共同对外提供数据存储和业务访问等功能的一个系统。本文所研究的是一个基于分布式系统MooseFS的海量数据存储系统,因为本系统在实现时参考并使用了云存储的系统架构,因此本系统又可说是一个云存储系统。MooseFS是一个开源的分布式网络文件系统,是Google File System的一个C语言实现。该系统有着高可用的系统架构,非常便利的应用程序接口,以及非常高的可扩展性(支持在线扩展)和数据读写性能,且系统安装部署简单,使用方便。本文首先对云存储的相关理论及技术等进行简单的介绍,分析研究其系统架构,并在此基础上设计本系统的整体框架。然后利用Struts2框架设计并实现一个Web应用作为客户端,用Java语言设计并实现一个用于文件存储的API,再利用Libevent事件库设计并实现一个高性能的数据存储服务器,最后利用分布式系统MooseFS作为基础存储层,从而实现一个简单的、类似于网盘的云存储系统,从而验证MooseFS在云存储或者海量数据存储系统中的可用性。此外,本系统在实现时还将对云存储系统的安全策略进行一定的研究与实现,主要包括部分虚拟化存储技术和数据加密技术等。最后将通过对系统的部分功能和性能的测试来验证系统的设计和解决方案的可行性。本文所做的研究主要是为分布式系统MooseFS在企业海量数据存储中的应用做一个前瞻性验证,具有一定的参考价值和重要的实践意义。但是,对于一个安全、可靠、高效的云存储系统来说,本系统所作的研究还是远远不够的,云存储系统的数据监控管理、数据压缩、重复数据删除、网络带宽限制等,将是后续研究亟待解决的问题。