论文部分内容阅读
我国电力行业自动化、信息化进程高速发展,电站积累了海量的历史运行数据,其中必然蕴含了大量未知的宝贵知识,为应用数据挖掘指导电站优化运行提供了基础保障。但同时我们也面临着“信息富足,知识匮乏”的问题,其中电站历史数据中缺失值的存在增加了数据挖掘的难度,缺失数据的错误处理甚至会导致数据挖掘的失败。因此,对电站数据缺失值进行高效准确的处理是一项紧迫的任务。模糊聚类算法体现了“物以类聚”及“模糊划分”的思想。电站运行机理复杂各参数相互耦合、在不同工况下运行数据具有差异性、在相近工况下运行数据又具有相似性是模糊聚类算法能够应用于电站数据分析处理的理论基础。本文利用改进的模糊聚类算法对电站数据多属性缺失值进行填补,为进一步的数据挖掘做好了数据准备。同时利用模糊聚类算法离散化电站数据,进行关联规则数据挖掘,得到了能够指导电站优化运行的规则。本文主要研究内容包括:1.提出了SVR-OCSFCM算法,应用于电站数据多属性缺失值的填补。为提高缺失值填补效率,根据电站数据的缺失值分布特点,提出了SVR-OCSFCM填补与线性填补相结合的电站缺失数据处理策略。2.采用改进的模糊聚类算法对电站数据进行离散化。应用决策表中的相容性作为评判标准,动态调节聚类参数,能够达到优化电站数据的离散效果。3.设计了数据预处理及数据挖掘软件框架及可视化界面,并利用Microsoft Visual Studio开发环境实现了各算法及功能模块。4.以低供电煤耗为目标,对电站数据进行缺失值填补并离散化后进行关联规则数据挖掘,得到了各工况下的氧量最优值,能够对电站的优化运行提供指导。