分布式技术在发酵房可视化系统中的应用

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:ymhd_hhxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要工作是研究多种开源分布式技术组成并行框架,应用于发酵房可视化系统的监测系统中,以此来处理由项目规模扩张以及实时在线测量硬件系统带来的海量数据,并满足发酵房可视化系统对实时计算、机器学习大规模迭代计算的性能要求。通过研究目前最前沿的分布式理论、开源项目的运行原理,并在此基础上进行优化、拓展,设计出了并行化、实时化、具有一致性保证的分布式系统解决方案。具体内容如下:(1)对传统粮油行业发酵房可视化系统进行分析,阐明在实现过程中遇到的重点以及软件系统设计需要解决的几个关键技术难点,即:能应对海量数据压力、能稳定快速地大规模迭代计算、能进行实时计算、能处理数据倾斜问题。围绕这几个要求对传统分布式技术MapReduce进行分析,得出了传统分布式技术不能满足设计要求的结论,并总结原因。(2)针对发酵房可视化系统的设计要求以及传统分布式技术的缺陷,提出一种并行化分布式框架解决方案,包括了资源调度并行化、计算并行化、存储并行化,资源调度并行化通过应用基于DRF算法的Yarn资源调度器,让分布式框架得以容纳更多种类的开源技术,使得引入外部框架解决系统内部缺陷成为可能;计算并行化通过应用Spark的RDD技术解决了传统分布式技术难以进行大规模迭代的问题;存储与计算两方面同时进行并行优化,有效缓解了数据倾斜的风险。(3)在并行化分布式框架中应用Storm流式计算技术,从而满足发酵房可视化系统连续工艺环节的实时快速计算要求,以此为基础,完成了OffLine、NearLine、Online三者结合的并行分布式框架总体设计。并针对并行化分布式框架自身可能存在的一致性风险,应用Zookeeper作为分布式集群协调系统对集群进行管理。(4)基于并行化的分布式框架以及神经网络原理,从实时计算与离线计算两个角度对人工神经网络算法进行实现并测试对比,以此作为对分布式机器学习MLlib库的补充,使其更加完整,可以面对发酵房可视化的各种算法需求。(5)对整个并行化分布式框架进行搭建和调试,并从离线计算与实时计算两个方面对系统进行性能测试,证明该并行化分布式系统在内存使用情况与数据处理速度方面可以达到应用于发酵房可视化系统的设计要求。
其他文献
目的分析消化道早癌编码错误原因,提高消化道早癌编码正确率。方法通过病案检索系统以手术操作"EMR"和"ESD"为检索条件,筛选出某三甲医院2014年至2016年消化内科诊治的主要诊
摘 要:随着我院教学改革的不断深入,综合实习在大专班专业教学课程体系中占据地位越来越重要,在培养学生岗位任职能力和综合素质方面发挥特殊的作用。本文从教学内容、教学流程、成绩评价三个方面对本专业大专班综合实习课程教学进行了初步探索。  关键词:大专班;综合实习;教学内容;教学流程;成绩评价  为加深学生对理论知识的理解,锤炼专业技能,提高岗位任职能力,“综合实习”在专业教学中发挥作用越来越重要。本文
小学英语趣味教学模式是提升学生英语学习兴趣的有效措施。本文主要从小学英语趣味教学模式应用的必要性入手,对小学英语趣味教学模式在小学英语教学中的地位进行探究。
菊花病虫害的防治菊花,别名秋菊、家菊、白菊花、黄菊花.菊花有较高的药用与食用价值.但在栽种过程中,易发生多种病虫害,直接影响菊花的产量和质量。因此,对菊花病虫害的防治,是一项
我国进入世界贸易组织之后,国内企业在各种条件的推动下开始审视自己的问题。中国处于发展中国家,企业的中层阶级对于一个企业的发展在这个阶段尤为重要,重视企业中层人才发
摘 要:化学是一门理论与实际相结合的学科,理论对于化学来说固然是重要的,但是实验也是不可缺少的一部分。化学实验对于学生的创新思维和能力有着重要的影响。针对目前高校化学实验室存在的一些问题,本文提出了如何建设现代化的高校化学实验室以及加强师资队伍建设提高相关人员素质等措施,促进高校实验教学的发展。  关键词:化学实验;高校;改革  0引言  高校化学的理论教学和化学实验教学两者是相辅相成的关系,化学
以《梦溪笔谈》为基础,探讨中国古代科学技术发展的最基础原因,最直接的推动力——古代耕种农业生产方式。古代中国的科学技术发展有自身的优缺点,在当代,重新认识古代科学技