基于存算分离的分布式RocksDB的研究与应用

被引量 : 0次 | 上传用户:ttjjww1129
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,大部分开源的分布式数据库采用了计算和存储耦合的架构模式,存在计算和存储不均衡、CPU和内存配比更新困难、扩展需要迁移大量数据等缺点。在数据并发量和使用量高速增长的互联网时代,数据库的CPU和内存配比、存储容量需要不断更新,计算和存储耦合的缺陷越来越明显。随着网络延迟降低,计算与存储分离的架构模式成为了新的发展方向。本文以RocksDB为例,研究了计算与存储分离的键值数据库的改造方法,设计与实现了分布式RocksDB数据库。RocksDB采用了Write Append Log(WAL)和Compact内存机制,没有更新数据文件的操作。因此,其数据文件(如SST,WAL,MANIFEST等文件)比较适合使用Append Only模式的高性能分布式文件系统(High Performance Distributed File System,HPDFS)作为底层文件持久化存储系统。本文基于计算与存储分离的架构模式改造RocksDB数据库,并利用异构存储、RDMA(Remote Direct Memory Access)与SPDK(Storage Performance Development Kit)等技术加快存取速度,消除数据库端远程存储对性能的影响。论文主要完成以下几项工作:(1)改造RocksDB为分布式数据库,采用一主多从的模式,在Zookeeper组件上注册选主。同时,在HPDFS上设计分布式文件锁,利用分布式文件锁确认主服务器的唯一性,确保RocksDB不会双写。主服务节点提供读写能力,从服务节点提供写的能力。主服务节点故障后,从服务节点可以推选为新的主服务节点提供服务,实现高可用。(2)改造了RocksDB底层文件存储的接口,通过HPDFS提供的SDK访问远程的分布式文件系统,将数据灾备、副本恢复、冗余压缩等特性集成到分布式文件系统中。同时,不同RocksDB实例的数据存在到HPDFS的不同文件目录中,实现数据隔离。(3)针对RocksDB写WAL、MANIFEST两种文件速度影响RocksDB整体写性能的特性。研究中创新性的提出了对RocksDB的数据进行异构介质存储,综合性能和成本的需求,系统能够同时使用持久化内存(Persistent Memory,PM)、固态硬盘(Solid State Disk,SSD)两种存储介质。使用PM存储数据量较少的WAL、MANIFEST文件,使用SSD等相对廉价设备来存储SST文件。此外,本文针对读取频繁且对读性能较高的业务,提出在计算节点端利用PM缓存访问读取频繁的、数据量相对较少的索引文件。(4)RocksDB的写操作瓶颈主要在于WAL日志的追加写,所有写请求都会堵塞等待WAL日志持久化完成。针对RocksDB原生的批量写存在锁等待、堵塞的缺陷。本研究通过队列及异步化写的模式,写线程将请求封装成Context放在Pending队列中,再由轮询线程从队列中批量取出数据组装发送到远程分布式文件系统,通过异步的模式提升系统的吞吐能力。针对远程存储网络延迟的问题,本研究采用RDMA技术的数据旁路、用户空间和操作系统内核空间的复制等特性降低网络延迟,采用SPDK技术提升SSD磁盘的读取速度。RDMA和SPDK两种技术能够有效帮助降低延迟的影响。(5)论文通过实验,对比批量写、PM、RDMA&SPDK等技术优化前后的效果。并通过机器故障、磁盘故障、网络故障、增加计算节点、增加存储节点等实验验证了分布式RocksDB系统的可靠性、可扩展性、负载均衡性。通过实验表明,本研究设计与实现的计算与存储分离的分布式RocksDB数据库具有较强的可靠性和扩展性。综合IO优化效果能够让分布式RocksDB存储性能接近RocksDB在本地SSD文件系统的存储性能。目前,分布式RocksDB存储系统被试运行应用到对象存储系统的元数据灾备存储中,并通过Grafana监控工具对线上的实例进行监控,系统整体运行稳定。
其他文献
随着现代经济发展、人口增长以及社会f分工,促生了一系列企业管理方面的问题,其中就包括了企业聘请更专业的人才以及职业经理人帮助企业所有权人来经营管理公司,以获取更高的企业经营效率和企业经营的规模。但是与此同时企业所有者和企业经营者之间的利益之间就容易出现冲突,这就催生了企业的代理问题,而本文所研究的股权激励就是化解这一问题的工具,其基本原理是通过给予经营者公司股份使其身份不单单是经营者,同时是企业的
现阶段,随着我国教育水平不断提升,国家对学生综合素质提出了更高层次要求。新课改之后,我国课程教学目标已经从素质教育转化为“立德树人”,课程思政是实现“立德树人”教学目标的主要途径。课程思政指的是以全员、全程、全课程育人格局为教学形式,发挥协同效应作用,在提高学生专业素质水平的基础上提高学生思想素质的一种课程理念,将这一理念运用在计算机专业课中,是新课标的客观要求,也是提高学生综合素质的必然要求。将
目的 探讨启发式临床医学教学模式(PCMC)联合以团队为基础的学习(TBL)教学模式在骨科护理教学中的应用效果。方法 选择2021年1月至2022年2月在骨科实习的80名护生作为调查对象,对照组采用传统教学模式,观察组采用PCMC联合TBL教学模式,比较两组护生考核成绩、对带教教师的评分等。结果 观察组考核成绩、对带教教师的评分、对教学方法的评分、教学满意度均高于对照组(P<0.05)。结论 骨科
<正>2013年9月22日,中俄人文合作委员会卫生合作分委会第十三次会议在京举行。分委会中方主席、国家卫生和计划生育委员会副主任马晓伟与俄方主席、俄联邦卫生部副部长卡格拉曼扬共同主持此次会议。双方回顾了一年来中俄卫生领域开展双边、多边合作的成果和进展,并就传染病防控、灾害应急医学、传统医药、药品监管、医疗机构和青年学者之间的交流等议题展开了讨论。
期刊
本文的主要工作是构建一款应对不同需求场景的程序创建与管理系统,该系统应支持多数据类型。基于上述目标设计的系统,具备构建业务程序的能力,并且可以根据不同的业务需求,调度完成相应业务。该系统源于“模拟对抗演习”的项目,在需求迭代的过程中,制定了具体实现方案。该方案的重点工作放在设计、实现标准化的程序构建模式上。在这一模式下,程序设计员负责设计、实现业务依赖的程序任务。此外,系统自身通过规范化的管理,维
在新课标下,怎样才能更好地提高初中物理的教学质量,使其在新课标下更好地发挥初中物理教学的作用。针对初中物理教学的特点,提出了一种可行并且有效的方法,以达到新课程改革的目的。
为解决Inconel 617合金的高温加工问题,对锻造Inconel 617合金的高温热变形行为进行了研究。利用Gleeble-3500热模拟试验机研究了Inconel 617合金在900~1200℃、应变速率为0.001~10 s-1范围内的热塑性行为。推导了该温度和应变速率下的本构方程,得到了该温度范围内的热加工图。用电子背散射衍射研究了合金压缩后的动态再结晶。确定了失稳区的位置,并表明在热变
毛泽东新民主主义经济理论是整个经济理论学说史上一种崭新的经济理论,是独具中国特色的经济理论。它植根于中国特定的历史条件,吸收了人类文明的思想成果,立足于筚路蓝缕的艰辛实践。它是在长期的新民主主义革命和建设的实践中形成、发展和完善起来的,并不断地经受着实践的检验。它具有丰富多彩的内容:重视发展生产力但又不搞唯生产力论,强调多种经济成分协调发展但又重视国有经济的主导作用,运用资本的力量推动经济社会进步
高校课程思政是思政课程的延伸与升华,思政元素的挖掘与专业知识的融合是开展思政课程的基础,是把思想价值引领贯穿教育教学全过程和各环节的落实。工科专业课教学侧重于理论知识和动手能力,轻德育教育,因此探索思政元素的挖掘和融入对课程思政教育十分必要。农田水利学课程是农业水利专业的核心课程,文章以农田水利学课程内容为基础,从农田水利史、农田水利建设现状、专业知识点和工程实例中发掘思政元素,并通过课堂教学、实