面向大规模基础设施的告警分析及实时响应

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:seasonlao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算和大数据的发展,云数据中心的基础实施承载了大量的应用,云基础设施在运行过程中会产生大量的告警。由于云数据中心的基础设施规模庞大,导致云数据中心的告警产生规模效应,给云数据中心稳定的服务交付带来巨大隐患。云数据中心告警存在海量性、实时性、冗余性和强时间关联性的特点,如果能够及时预测出云数据中心将要产生的告警,并做好相应的告警预案,将极大地减少因为告警处理不及时导致的宕机、服务不可用等损失。因此,为了提高云数据中心告警处理的效率,提升云数据中心服务的稳定性,研究云数据中心告警实时响应方法具有重要的意义。  为了解决上述问题,本文提出了一种基于有向概率图的告警预测方法,该方法使用有向图表示云数据中心告警关系,其中,用有向图的顶点表示告警类型,顶点之间的有向边表示告警之间发生的先后关系,边的权值表示有向边连接的两个顶点的之间的偏序关系的强弱。使用该有向概率图进行预测时,根据云数据中心当前产生的告警,在图中寻找该告警所代表的节点,并在该告警节点找出其概率最大的边所对应的节点作为预测告警。为了提高算法的准确率和性能,论文对算法进行了大量的优化改进。  为了验证该告警预测方法的可行性,论文使用真实的云数据中心告警数据进行测试和验证,实验结果表明,算法的预测的准确率保持在90%左右,且算法的预测性能保持在微秒级别。实验结果表明,本论文提出的面向大规模基础设施的告警分析及实时响应方法为告警预案和运维自动化夯实了基础。
其他文献
随着通信、网络及信号处理技术的不断发展,新兴的宽带多媒体业务在无线网络中日益普及。无线多播是一种带宽有效的传输方式,通过单次传输可以同时为多个用户提供多播数据,尤
本文着重研究如何使用基于GPU的并行化技术,尤其是基于OpenCL的并行化技术,对分组密码算法中的AES以及KLEIN两个算法进行并行化优化。与以往的并行化实现方式相比,基于GPU的并行
域名系统的安全运行对整个互联网的安全和稳定至关重要,其主要作用是完成域名到IP地址的映射,域名系统包括存储域名数据的权威服务器和代理互联网应用域名查询请求的递归服务器
航天嵌入式系统工作在恶劣的太空环境下,容易产生瞬时或间歇性故障,因此,可靠性评价成为系统性能检测的重要环节。故障注入方法是评测容错计算机系统可靠性的有效方法之一,它通过
学位
基于OFDM-MIMO技术的宽带无线通信系统的快速发展使用户随时随地接收移动电视、视频点播、在线游戏等高带宽的多媒体业务成为了可能。为了高效传输可以同时被多个用户接收的
由于我国的空间技术的迅速发展,航天嵌入式系统的复杂性急剧增加,导致星载嵌入式软件呈现多任务化的趋势。使用主循环加中断的方式开发星载多任务软件,存在以下几个问题:一、开发
非线性系统的分歧问题一直以来都是动力系统研究中的一个热门问题。它不仅在理论上有着重要的研究意义,而且还可以与自然现象密切相关,如对称磁场中的平面单摆运动、生物种群和
随着我国载人航天工程和地面互联网技术的快速发展,特别是建设载人空间站目标的确定,航天任务逐渐呈现多样性、长期性及国际合作的迫切性,这使得建设天地一体化互联网成为必然趋
网络虚拟化技术在未来互联网的研究中具有重要的意义,斯坦福大学提出的OpenFlow[1]技术由于其高度的开放性而受到了业界和学术界的欢迎,并且逐渐成为了网络虚拟化的主流技术。