内存计算框架性能优化关键技术研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:sust_alex
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,充分利用内存的低延迟特性改进系统性能成为并行计算新的研究方向。以Berkley研究成果Spark为代表的内存计算框架,有效缓解了频繁磁盘I/O性能瓶颈,解放了多核CPU配合大容量内存硬件架构的潜在高性能,成为工业界一致认可的高性能并行计算系统。虽然内存计算框架的性能表现相对于传统的并行计算系统提高了数十倍,但与大数据时代的即时应用需求相比,还存在不小的差距。因此,从计算模型的角度研究内存计算框架的性能优化方法具有一定的现实意义。本文对内存计算框架性能优化问题展开一系列的研究,旨在通过提高内存计算集群资源利用率与计算效率,进而达到优化内存计算框架整体性能的目的。本文主要研究工作包括以下几点:(1)系统归纳了内存计算技术和应用系统的研究现状。首先,根据内存计算技术的发展历程,对内存数据管理技术、内存计算框架和典型的性能优化方法进行分类讨论,并将性能优化方法分为基于资源配置、任务调度及故障恢复三类进行综合比较。(2)提出了内存计算框架自适应缓存策略。针对内存计算框架Spark缺乏有效缓存选择机制的问题,提出自适应的缓存管理策略,分析任务的DAG(Directed Acyclic Graph)结构,自动识别重用RDD数据加载到缓存区;综合计算代价、处理数据量和使用频率等因素计算RDD权重,作为缓存替换的主要依据;通过异步清理无价值的RDD,降低作业的内存需求;从而在整体上优化缓存空间利用率。(3)提出内存计算框架局部数据优先拉取策略。针对异构环境下Stage同步导致的作业延时和计算资源浪费问题,提出局部数据优先拉取策略,通过高效节点优先调度,提高流水线与宽依赖任务的时间重合度,减少宽依赖Shuffle过程的同步延时,优化集群资源利用率;通过适度倾斜的任务分配,在保障慢节点计算连续性的前提下,提高分配任务量与节点计算能力的适应度,优化作业执行效率。(4)提出了内存计算框架并行度推断算法。针对内存计算框架任务并行度参数化设定可能导致的性能下降问题,提出内存计算框架并行度推断算法,通过分析任务并行度与作业执行效率的关系,提出并行度推断算法的问题定义;综合输入数据量、计算资源和附加开销等多个参数,计算出具有最大化资源利用率和最优状态同步的任务并行度,对作业的各个Stage进行优化调度,加速作业执行并提高计算能效。(5)提出基于分配适应度的渐进填充分区映射算法。针对异构环境下Shuffle过程数据分配与节点计算能力严重不符的问题,提出Shuffle过程的渐进填充分区映射算法;建立Shuffle过程模型,分析分配数据量与原始数据分布的联系;通过扩展式分区和多轮渐进填充映射,建立适应节点计算能力的数据分配方案,有效缩减Shuffle过程的同步延时,提高集群计算效率。(6)提出了基于回归检测的内存重复数据删除算法。为提高内存计算框架堆外存储区的利用率,提出一种基于滑动块回归检测的内存重复数据删除算法,通过未匹配数据进行回归检测,对比未匹配块的结构变化确定删冗操作类型,根据不同的操作类型选择执行折半匹配算法或二次滑动窗口检测算法,达到删除未匹配块内重复数据的目的,提高内存资源的使用效率。
其他文献
随着电子技术的快速进步,电算化的应用在会计行业中显得越发重要,而财务软件在企业信息系统中处于主导位置,本文以具有代表意义的用友U8财务软件为例,通过对用友U8财务软件与
通过数理统计和气候分析的方法,得出百色单站24h最高最低气温突升突降的分布特征,进行区间划分和分型。利用概念模型预报方法进行研究,得出最高最低气温突升突降的概念模型预报
介绍气象局中心机房UPS供电方案,并在UPS电源种类、容量的确定、后备电池配置、冗余方式的选择等方面提出自己的观点.
目的初步探讨心理干预在减轻门诊保健儿童家长焦虑情绪中的作用。方法随机选择该院100例门诊保健儿童家长,随机分为两组,观察组50例应用心理干预,对照组50例采用常规护理。在
增长与分配是经济学领域中传统而又重要的问题,现代经济增长理论为收入分配对经济增长的影响做了基奠,本文也试图从收入分配的角度探寻经济增长的路径。从理论上论证了这两个
目的析慢性肝炎肝静脉彩超频谱改变和肝纤维化分期这两者之间的关系,供临床借鉴。方法 300例本院近3年中接收且于超声引导下肝组织活检病理学确诊的慢性肝炎患者。借助彩超仪
“女强人”“铁娘子”是很多人对女性高管的刻板印象,也是人们概念中管理者必须具备“刚性”特质的映射。但多元化时代和环境使得企业更加透明、相互依存,它要求领导者更加灵
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的探讨建立QQ群在规范管理1型糖尿病患儿、提高患儿自我管理依从性中的作用。方法通过建立QQ群,专人管理QQ群,对患儿及家长实施糖尿病教育及沟通,同时通过定期开展夏令营活