论文部分内容阅读
当前,我国的电力行业信息化建设正在大力推进,并以共享与开发利用信息资源为重点。数据仓库是信息管理和分析型应用的有效平台,可以更有效地为分析决策支持系统服务,提高其系统的分析效率并增强处理复杂查询能力。数据挖掘技术是从大量数据中提取及挖掘隐藏、潜在和有用的知识和信息的方法,为决策分析提供知识和规律。数据仓库与数据挖掘技术的应用是目前实现电力企业各类信息资源共享与综合利用开发的重要途径。
为此,本文针对电力系统数据仓库构建及数据挖掘方法进行了科学性地探索,主要研究工作及成果如下:
1.在分析电力系统数据仓库需求、结构及特点的基础上,提出了一种增强型的电力系统数据仓库平台体系结构,该平台主要由信息一体化节点、实时数据处理中心、主动数据仓库和系统管理工具等组成,实现了从三个方面对数据仓库的增强:以自开发的通用ETL工具作为信息一体化节点,增强了数据抽取和转换能力;建立实时数据处理中心实现实时数据的缓冲与交换,增强了数据仓库的实时性能;采用基于事件触发的主动数据仓库技术增强了对突发事件捕获的能力,使电力系统数据仓库不仅支持长时间的战略决策,还支持短时间的战术决策,满足决策人员的不同需要。该数据仓库平台的性能在已投入海丰实际电网运行的自开发SCIiT2008电网调度自动化系统中得到了测试。增强型数据仓库平台有效地提高了信息资源的实时共享能力以及信息特征的挖掘与综合利用开发能力,实现了更好地支持分析决策系统。
2.分析介绍了电力系统数据仓库设计步骤及主题确定。提出了一种通用的基于CIM的电力系统数据仓库维度建模方法,以及设计评估的5个基本标准,并以故障分析为实例介绍了模型及评估过程。提出了电力系统数据仓库变粒度存储策略,实现了在时间维上对数据集的滚动压缩,防止了数据随时间推移呈线性增长。电力负荷预测多维数据模型建立的实验表明:该策略节省了存储空间,提高了分析查询的响应速度。
3.分析介绍了对电力系统数据仓库安全的基本概念及安全控制模型。基于系统安全工程能力成熟度模型(SSE-CMM),提出了电力系统数据仓库安全评估的模糊综合评估模型及方法,其权重系统的确定采用了层次分析法(AHP),并以算例进行了演算。分析了数据仓库质量的定义及数据错误的来源,提出了数据仓库数据质量评价指标体系。同样基于模糊综合评估方法,提出了实现电力系统数据仓库数据质量评估的模型和方法,也用算例进行了演算。
4.提出了增强型分类数据挖掘方法--基于Adaboost方法的支持向量机分类算法。该方法引入了Adaboost,将弱分类器支持向量机提升为强分类性能的增强型支持向量机,大大提高了分类效果以及增强了分类的智能性和容错性。电网故障诊断的应用仿真研究表明:模型的分类能力大大提高,并具有很强的泛化能力。
5.基于独立成份分析(ICA)与支持向量回归(SVR)提出了数据挖掘与预测整合方法。该方法利用了独立成份分析具有从未知来源的混合信号中分离出原始信号的能力,以挖掘隐藏在预测变量内的干扰;使用了支持向量回归构建预测模型;并采用了粒子群优化算法(PSO)对模型参数进行优化。在负荷预测中的应用研究表明:该方法的预测精度和速度优于直接使用SVR的预测方法。
6.提出了一种粒子群优化算法(PSO)与模糊C均值算法(FCM)有机结合的粒子群优化模糊聚类算法。该算法用PSO优化过程代替FCM中基于梯度下降的迭代过程,充分利用PSO具有全局寻优、快速收敛的特点,使算法具有很强的全局搜索能力,有效地避免了FCM易陷入局部极小的缺陷;同时也降低了FCM对初始值的敏感度。还通过核方法,将低维特征空间的样本通过核函数映射到高维特征空间,增强了特征的优化,使特征在高维空间更易聚类。电力系统负荷样本聚类的应用仿真研究表明:与单纯FCM法相比,该算法聚类更准确,效果更佳。