论文部分内容阅读
随着智能配用电系统的建设和发展,电力企业中积累了海量的电力数据,为基于配用电大数据的业务应用奠定了基础。利用配用电大数据不但可以提高配电系统规划设计和运行管理水平,而且对于发掘系统内在规律和提供更丰富的电力服务,具有潜在的价值。为此,本文利用上海电力公司提供的浦东地区实际配用电数据,研究基于配用电大数据的配电馈线拓扑解析方法和配电馈线统计线损估计方法。为实现从配用电系统海量的拓扑数据中提取出单一馈线拓扑,提出一种基于CIM/XML拓扑文件的配电馈线拓扑解析方法。首先,利用正则表达式从拓扑文件的海量数据中匹配拓扑解析所需的有效信息。在此基础上,从拓扑文件中提取设备与结点的连接信息,并构建设备与结点的关联关系表,接着将其转化为结点信息表和线型设备信息表,并通过广度优先搜索算法解析单一馈线的拓扑信息。最后以陆家嘴地块的拓扑文件为例,验证了所提方法的有效性。针对智能配用电系统中配电馈线统计线损存在大量缺失值和异常值的问题,提出一种基于聚类和XGBOOST(eXtreme Gradient Boosting)的配电馈线统计线损估计方法。首先,研究了考虑配电馈线统计线损影响因素相关性和有效性的馈线聚类指标选取方法,并提出了带权重距离的PAM(Partitioning Around Medoids)算法,实现对配电馈线样本数据的聚类。其次,构建了基于XGBOOST的配电馈线统计线损估计模型,利用每类馈线的样本数据分别对其进行训练,挖掘各类馈线的统计线损率与馈线特征参数及其理论线损率的内在关系。最后,以上海市浦东地区的1172条配电馈线为例,验证了所提方法的有效性。结果表明,与传统的线性回归、决策树和神经网络算法相比,基于XGBOOST的配电馈线统计线损估计方法准确性更高。