论文部分内容阅读
在通信网管理中,故障管理是一个重要且难度很大的任务,而故障管理的关键和难点是故障诊断,它依赖于故障诊断的相关知识,尤其是告警信息与故障的关联知识。这些知识可来源于对网络产生的大量告警信息的分析,因而故障诊断是告警信息分析的目的,而对告警进行分析是实现故障诊断的必经途径。目前在电信故障管理中对告警流的处理主要是采用告警关联系统,它是用于分析告警数据的专家系统。然而通信网本身的复杂性以及动态变化的特点导致获取必要的知识来为某个特定网络构建一个告警关联系统是十分困难的。本文以国家自然科学基金项目《基于数据挖掘的通信网告警相关性分析》为背景,重点研究了网络告警加权关联规则挖掘,包括告警预处理、关联规则增量挖掘、频繁告警序列的加权处理、规则的搜索算法以及网络告警关联规则挖掘系统的仿真验证。本文提出了告警预处理系统包括告警信息的整理与提取、告警时间同步处理和告警清洗的功能。告警信息的整理与提取将告警中有用的、能够反映故障特征的告警属性字段提取出来并整理成形式简单、利于进行数据挖掘的告警事务项。引入了时间窗口和滑动步长的概念来进行告警时间同步处理,一个时间窗口内的告警看作是告警事务数据库中的一个告警事务。通过告警压缩的方法可以清除同一告警事务内的冗余告警信息。最后提出了告警数据的清洗对挖掘过程产生的积极意义。告警关联规则挖掘以及增量更新是该系统的核心。本文在现有的关联规则挖掘算法的基础上,针对网络告警具有告警信息量大、告警具有时间流动的动态特性等特点提出了一种基于枚举树的告警关联规则挖掘算法,提高了数据增量更新的挖掘效率,为网络故障的及时处理提供了一条有效的解决途径。更重要的是,该算法采取逐一枚举频繁项的思想为接下来的各种加权提取算法提供了发挥的空间。告警频繁项的加权处理是要将数据挖掘中的频繁项概念结合到网络告警相关性分析的具体实践中。文章重点阐述了拓扑加权算法,该算法结合网络告警设备的拓扑特征,使得加权的告警序列更具可读性。最后提到如何将加权算法集成到枚举树算法中。在规则后处理算法的讨论中,文章创新性的提出了一种基于规则前件的搜索算法,递归的使用树形结构查找出以固定的加权频繁告警项作为前件的所有告警关联规则,为全面分析告警关联提供有力工具。本文在实现了网络告警关联规则挖掘系统后,通过模拟产生网络告警数据对系统进行了仿真验证并对结果对比分析。仿真结果充分证明了该系统对于告警关联分析的实用性。