论文部分内容阅读
电力远动传输异常检测为电网稳定运行提供有力的支持和保障,可以减少甚至避免电网异常所造成的损失。如何从大量电力远动传输数据中提取有用信息,实现快速实时准确的异常检测分析,是电力远动传输异常检测的主要挑战。本文主要围绕基于数据挖掘的实时电力远动传输异常检测方法展开系统研究,为异常检测系统实现提供可行思路。本文首先介绍基于数据挖掘的实时电力远动传输异常检测的研究目的和意义。同时,从异常检测和数据挖掘两个角度对国内外的研究现状进行总结介绍。针对电力远动传输系统的特点,对电力远动传输系统通信数据进行数据预处理。同时,利用小波变换对通信流量信号进行频域分析,建立基于IF-THEN规则的专家系统,对通信信号进行初步异常检测;另外,将通信信号小波变换的统计分析数据加入对应厂站的特征属性集,进行特征子集选择,得到最优特征子集。然后,提出基于马氏距离的双层聚类算法(MClu Stream算法)和基于网格密度的双层聚类算法(DBClu Stream算法)对远动传输数据进行算法分析。MClu Stream算法主要对K-means聚类算法和CURE聚类算法进行改进融合,并加入马氏距离进行相似度计算,提高算法对非球面分布数据的分析能力。DBClu Stream算法则引入密度网格方法对K-means算法进行改进,提高在线分析阶段的稳定性;离线部分,采用DENCLUE改进密度聚类算法实现对任意形状分布数据的分析。最后,分别对提出算法进行仿真分析,验证算法的有效性和稳定性。在得到小波变换分析和双层聚类分析的结果后,本文利用改进贝叶斯算法对分析结果进行综合判断,最大限度地提高系统准确性,并且通过实际电力远动传输数据仿真对改进贝叶斯算法的有效性进行验证。同时,利用实时计算框架Storm实现基于贝叶斯算法的实时电力远动传输异常检测系统,并通过分布式计算框架Hadoop对系统中部分计算进行优化,提高系统并发率,降低计算时延。