论文部分内容阅读
随着智能电网的飞速发展和电能计量技术的不断进步,电网用户侧数据呈现出高复杂度、高冗余度的态势,这也为智能电网某些用户进行窃电行为提供了可乘之机。电网用户窃电行为造成的损失不仅降低电网企业经济效益,甚至阻碍国民经济平稳发展。用户窃电手段呈现多样化趋势,传统的窃电检测方案无法实现多样化数据下用户用电特征的分析处理和高效窃电检测需求。为了辅助电网公司提高用电稽查效率,管理用户规范化用电,本文提出了结合用户窃电行为特征分析,研究了基于K均值聚类(K-means Clustering Algorithm,K-means)与合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE)结合的过采样方法,K-SMOTE。和基于粒子群优化算法(Particle Swarm Optimization,PSO)与随机森林方法(Random FOREST,RF)结合的用户侧窃电行为检测方法,P-RF算法。首先,对某配电网区域进行用户的窃电行为分析,对用户电压、电流和功率因数等相关电气参数时序特征进行分析总结,通过提取窃电用户用电特征确定窃电行为的特征,为下文窃电检测方案提供检测指标和特征基础。其次,考虑到电网不平衡数据对机器学习方法检测精度的影响,提出一种K-SMOTE过采样方法,即采用K-means方法将用户数据集进行聚类操作,找出不平衡数据聚类质心,再将质心与SMOTE过采样方法相结合,进行人工线性插值,构造平衡化的用户侧用电数据样本,为后文的窃电行为检测达到期望精度提供数据基础。通过仿真对比试验,进行用户用电数据的可视化验证和算法效能的定性定量分析,证明了K-SMOTE过采样的有效性。最后,使用平衡化的数据集训练随机森林分类器,针对现有算法对随机森林中决策树数量设定的局限性,提出一种基于粒子群改进随机森林方法,P-RF。通过粒子群优化算法求解随机森林中最优决策树的数量。通过仿真和纵向横向对比实验,并与多个检测模型进行比较,从不同角度验证了本文提出的电网用户窃电行为检测模型具有较好的精确性与有效性,从而为电力企业进行用户窃电检测提供更多信息,降低了电网风险成本。