基于云平台的集群故障监控的研究与实现

被引量 : 6次 | 上传用户:fantasy2204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术普及和信息化技术的不断提高,社会上各个领域对信息化的要求越来越高,处理的数据也不断增加。云计算已从概念落实到实际应用中,发展已臻成熟,已发展为可个性化定制、伸缩可扩展、面向服务的公有云或私有云。云平台的服务质量对于云平台有着重要的意义,监控是云计算平台的重要组成部分,它是云计算平台中很多诸如网络分析、系统管理、作业调度、负载均衡、事件预测、故障检测以及恢复操作的前提,可以帮助云计算平台动态量化资源使用、检测服务缺陷、发现用户使用模式、辅助资源调度模块决策,可以提高云计算平台的服务质量。BC-PDM (Big Cloud of Parallel Data Mining)是全球最大的电信运营企业的商务智能应用需求背景,旨在针对海量数据提供高效、准确、便捷的数据分析服务。本系统是基于Hadoop集群开发的,本论文主要介绍了Hadoop集群的故障监控的研究与实现过程。本文首先介绍了研究背景和研究现状,然后针对项目本身的需求,给出总体功能设计和各模块设计。本文使用Ganglia和Nagios这两个开源监控工具,通过对工具的深入调研,总结了其工作原理及优势、缺点等,将Ganglia和Nagios优势结合,同时优化Ganglia的容错机制,实现故障监控和资源监控的功能。Ganglia和Nagios的监控数据在存储方面都存在一些问题,系统通过持久化存储工具将监控数据转存到Mysql数据库中,进行监控数据统一管理和分析,优化监控数据存储问题。本系统利用开源监控工具Ganglia和Nagios,通过系统需求分析、系统关键点研究,最后完成了资源监控和故障监控功能。实现了对云平台中的物理资源、虚拟资源、服务资源等的全面监控和资源利用率的分析,并根据分析实现邮件、短信等多种方式的故障监控,以达到资源监控和故障监控的目的,保证云平台的正常运行。最后应用以上的研究实现了一个云平台监控系统,其运行效果表明本文的策略是有效可行的。
其他文献
目的 比较即刻种植后用GBR术和植入PRF对种植体周骨缺损区的成骨能力。方法 选取前牙区缺牙患者52例,随机分为两组,观察组26例,即刻种植后跳跃间隙单纯植入PRF,对照组26例,即
通过不断实践摸索,我们找到防治柞蚕场害虫的有效药剂,并提出了具体的施用方法,可以解决杀虫与保蚕的矛盾。柞蚕场内害虫通常分为三类:第一是食柞叶类,如天幕毛虫、舞毒
中澳铁矿石领域相互依赖的关系是经双方多年努力而建立起来的,目前,双方在铁矿石贸易中都对对方具有很高的敏感依赖性,这个关系的受阻或切断,将使双方付出惨重的代价,使我国
<正>配网是连接输电网和用户,就地或逐级向各类用户供给和配送电能的重要环节。通过对抢修作业的安全风险成因和涉法风险的分析,推行标准化配网抢修,实现抢修流程、现场作业
针对目前游离磨料线锯切割效率低、切缝损失大的缺点,提出了一种亚固结线锯切割的新方法,即在线锯表面增加凹槽,在线锯切割时让磨粒嵌入凹槽实现瞬间固结,从而达到提高效率和
亚运城规划设计不仅要满足赛时需求,还应充分考虑赛后使用问题,具有很强的特殊性。亚运城的低碳生态规划设计不仅能体现和践行"绿色亚运"的理念,更是一个向国际社会展示我国
<正>护理安全是指在实施护理过程中,患者不发生法律和法定的规章制度允许范围以外的心理、结构和功能上的损害、障碍、缺陷和死亡[1]。护理安全是护理管理的重点,涉及到参与
在美国革命和建国思想渊源问题研究中,希伯来传统所起到的重要影响逐渐受到学界的重视。而作为美国革命的推动者,潘恩作品中所散发出的浓烈希伯来共和主义倾向,强烈的昭示了这位
目的:观察长托宁联合血液灌流救治重度有机磷农药中毒的疗效。方法:回顾性分析阿托品加氯解磷定抢救54例与长托宁联合血液灌流抢救55例重度有机磷中毒患者的效果进行评价。结