论文部分内容阅读
电力工业是国民经济的重要基础产业,也是世界各国发展的战略重点,更是衡量一个国家经济发展程度的重要指标。然而,电能是一种难以大量存储的能源。在实际生活中其生产、分配、消费的过程几乎同时进行,这就要求电力系统要尽可能地平衡供需。因此掌握先进的负荷预测方法和提高负荷预测技术水平,对保证电力系统安全稳定运行,提高社会效益和经济效益具有重要意义。本文通过电力负荷特性分析,挖掘出历史负荷数据本身、日期类型、气象因素和异常或特殊事件四个因素,对负荷预测工作有重要的研究意义。为了能够使观测数据更加具有可靠性,分别从纵向比较前后两个时刻的负荷值,和横向比较前后一周内同一时刻负荷值两个角度,设定阈值构造数据分布区间来识别和处理异常值。并对所有原始数据进行归一化处理,消除不同单位量纲之间的影响。针对冗余特征会降低模型预测精度和运算效率的问题,本文提出了一种基于MIC-GPR的特征选择方法。这种方法能够将最大信息系数方法和高斯过程回归算法的优良特性充分结合起来,剔除无关特征,筛选出对电力负荷预测工作贡献度较大的特征作为模型输入,极大地降低了模型训练的复杂程度。针对单项电力负荷预测模型存在预测精度低和实用性差的问题,本文采用集成学习方法,构建了多模型融合Stacking集成式的电力负荷预测模型。首先通过比较基于SVR、LSTM、随机森林、GBDT、XGBoost和Light GBM单项算法的电力负荷预测模型的性能优劣,同时为了保证能够从多角度描述数据结构和特点,选择SVR模型、LSTM模型、随机森林模型和Light GBM模型作为Stacking框架中的基学习器进行训练和预测。接下来通过实验比较不同Stacking框架搭建方式下的模型预测效果,得到最佳电力负荷预测模型为以LSTM模型、随机森林模型和Light GBM模型作为第一层中的初级学习器,SVR模型作为第二层中的元学习器所构建的Stacking集成式预测模型。经过实验验证分析,结果表明与传统单项预测模型相比,多模型融合Stacking集成式的电力负荷预测模型显著提高了预测精度和模型的鲁棒性。