HBase分布式缓存策略的研究与设计

来源 :北京交通大学 | 被引量 : 7次 | 上传用户:winddss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,大数据的价值也得到了越来越多的重视。作为大数据研究与应用的基础设施,大数据存储系统显得尤为重要,HBase便是其中一款典型的非关系型数据库。当前HBase仍然存在分区不均衡和缓存替换策略单一等问题,对集群读写性能造成了制约。论文针对这些问题进行研究,致力于优化HBase的读写性能。论文的研究工作得到了国家自然科学基金项目(No.61172072、61271308)、北京市自然科学基金项目(No.4112045)和高等学校博士学科点专项科研基金(No.20100009110002)的支持。论文的主要工作如下:(1)写缓存方面:在不分区的情况下,现有HBase很难发挥出分布式系统的优点。即使采用了预分区技术,也没有一套对任何数据表存储均适用的预分区方法以及一套能够自适应调整系统负载的方案。为了解决上述问题,本文设计了一种两阶段分区方法。预分区阶段,利用MD5的散列效果对RowKey重新进行设计。自适应分区阶段,本文设计了一种RegionServer性能评价策略,依据该策略实现自适应分区。该评价策略将层次分析和TOPSIS相结合,利用并改进了一致性哈希算法,而且设计了一种新的数据结构来实现改进后的一致性哈希算法。(2)读缓存方面:现有BlockCache的LRU缓存替换策略十分粗糙。它虽然将缓存分成多层,但是所有层均使用同一种缓存策略,即只根据数据最后一次更新时间的先后进行缓存替换。本文将对每一层的缓存替换策略进行进一步的设计:在Single层添加了对数据热点的考虑,在Multi层添加了对Block大小的权衡,同时对Single层进入Multi层的门限参数重新进行规定,降低FULL GC发生的概率。另一方面,针对连续数据等紧密关系数据查询速度降低的问题,使用社区发现的思想设计了一个二级缓存来对其弥补。(3)本论文准备了连续型数据、随机型数据和集中型数据来模拟不同的实验情景,将本文设计的HBase系统应用于同构、异构集群中,进行读写性能的测试,并与原HBase的测试结果进行对比和分析。通过实验表明,本论文所给出的方案对原有HBase的读写性能具有一定程度的提高,而且改进后的HBase适用于绝大多数类型的数据表,具有较好的适用性和稳定性。
其他文献
随着新课程教学改革的深入,高中数学教学正在向纵深方向发展.作为重要的理工学科,高中数学在整个教学体系中发挥着基础性作用,是构建学生抽象概括思维体系的重要载体和平台.
传统的双向中继信道描述了一对用户通过中继互发信息时的网络结构。但在实际应用中,会出现多个用户需要交互信息的情形,此时对应的网络结构称为多向中继信道,MIMO-Y信道是其中一
Mesh作为一种新型的网络拓扑结构,受到了广泛的关注。它是改善无线通信系统性能,提高服务质量的一条重要途径。随着通信产业日益增加的资源消耗和对通信效率关注度的提高,需要对
表面等离子体激元(SPPs)是一种具有良好场约束力的特殊表面波。在微波频段,金属表现出理想电导体的特性,导致在电磁波传输过程中,SPPs对场的约束能力较差,于是可以解决这一问题的
无线多跳网络将中继站(Relay Station,RS)加入到网络建设中,不仅能够在较低成本条件下扩大基站覆盖区域,还能改善小区边缘用户通信质量,提高通信系统传输容量。另一方面,正交频分
随着HSUPA技术的发展,信息的业务类型和数据业务量大量增加,移动用户对传输速率需求也在不断增长,导致Node B侧Iub接口的带宽成为上行速率的瓶颈。在Iub接口带宽有限的情况下,如
随着医学图像处理技术的快速发展,为医学诊断性能的提高提供了坚实的技术支撑,并有效促进其推广应用。医学图像处理是计算机辅助医疗中重要的一个环节,而医学图像分割作为医学图
随着教育信息化的普及,导师制研究生培养系统在研究生教育中崭露头角。导师制研究生培养系统以提供丰富的学习资源和便捷的交互方式成为研究生提高科研能力的重要途径之一。
随着现代科技的发展,图像处理技术已经被广泛地运用到航空业、信息通信、生物技术、医学和农业以及机器视觉等众多领域。图像去噪作为图像处理的重要分支之一,也成为众多学者
鼻形识别是一种新兴的生物识别方法,近年来受到了越来越多国内外研究者的关注。和现有的生物特征识别方法相比,鼻子最重要的特征是不易改变性,稳定性,难以隐藏性等,并且能够采取非