HBase数据可用性和持久性研究与实现

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:sdwhliyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网产业的迅猛发展,大数据的存储和处理问题受到越来越多的关注。云计算、云存储也就成了网络新时代的一个重要概念。非关系型数据库便是云存储的解决方案。HBase是Apache Hadoop下的一款非关系型数据库,是一个基于列存储的开源数据存储系统。由于在大数据存储方面展现出的良好性能,以及与Hadoop的良好结合,基于HBase的开发、应用、研究也就越来越流行。   由于HBase是基于内存和磁盘的存储系统,它会在内存中暂存数据并在后续处理过程中把数据写入文件系统,所以内存缓存的大小成了影响系统性能的一个重要因素。在深入研究非关系型数据库实现理论和持久化方案,认真分析了HBase的实现和可用性、持久性方案之后,本文重点提出并实现远程日志过程和空闲写策略两种新解决方案,改进HBase数据处理流程:   (1)远程日志过程以日志备份为基础确保数据可用性和持久性,通过推迟写操作过程中的写磁盘进程来提高系统写操作时间性能。   (2)以远程日志过程为基础详细给出了数据恢复过程保证数据可用性。   (3)空闲写策略的核心是当系统处于空闲状态时主动把内存中的数据写入磁盘,减少远程日志写操作过程中的被动写磁盘频率,提高系统时间性能。   通过实验证明,两种方案在HBase数据库上都切实可行:在确保数据可用性和持久性的前提下,当缓存不超过默认大小时,远程日志过程和空闲写策略都能够明显的提升写操作的时间性能,并且在不同的缓存大小时写操作都能获得稳定的性能。
其他文献
在一幅图像中,文字相对图像中其他内容来说含有更多的信息,如果能够从图像中正确识别这些文字,那么将对图像检索、图像分析和图像理解等工作起着重要的辅助作用,因此自然场景
能源短缺和环境污染是当前一个世界性的难题,节能是关乎到整个社会的事情。当前工业生产中,风机、水泵、压缩机等负载大量被使用,开发高压多电平变频节能装置并推广使用,对降低我
随着信息化和数字化社会的发展,互联网领域信息的安全问题日益突出,不仅危害了国家信息安全,影响社会安定,也危及人民的财产安全,密码应用的信息化和标准化的需求日益显著。  
中国传统医学拥有悠久的历史,是我国优秀文化的瑰宝和科学发展的结晶。方剂学在中医药理论中占有重要的地位,方剂是中医药理论中理、法、方、药的一个重要组成部分,是中医治疗中
网格是一个将空间分布的资源,通信服务和计算资源集成而形成的大型的计算机系统,以实现资源共享和协调工作。由于网格环境中的资源具有动态性、异构性、自治性等特点,而任务
随着Internet的快速发展及商业化进程的加速,组播以其节约网络带宽和减轻服务器负荷的优势获得了越来越多的应用。而无线Mesh网络(Wireless Mesh Networks,WMNs)作为“最后一公里
由于道路交通事故,每年有数百万世界各地的人们死亡和受伤。执行的安全标准,如车速限制和道路条件的申请,但仍然有很多工作要做。这需要使用Vehicular Ad Hoc Networks(VANET),这
Web服务是近年来发展迅速的一种分布式计算技术,能够实现跨平台、跨技术地互操作。许多大型的企业越来越多的将自己的应用封装为Web服务发布,但随着跨企业应用的日益复杂,单
  随着通信技术与互联网的快速发展,越来越多的用户、企业通过Internet进行通信与交流、合作,与此同时伴随着网络中的各种信息的安全和保密越来越引起重视和关注。为保护个人
在通信系统中,流密码是保证通信安全最重要的一种手段,大量应用于军事、政治和电子商务中。其安全性得到研究学者的大量关注,特别是衡量密钥流安全性强度的度量。   线性复杂