基于数据挖掘技术的低压台区线损检测研究

来源 :计算技术与自动化 | 被引量 : 0次 | 上传用户:zhusimeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  关键词:线路损耗;数据挖掘;层次分析;加权LOF算法;异常值检测
  低压台区作为配电网的末端,通常是指以380V或220V低压变压器供电的区域,其可为广大居民用户和小微企业用户供电。低压台区变压器端采集的电力数据量庞大、用电信息维度高导致分析困难,并且原始数据很难为电力用户用电研究提供数据依据。线路损耗会影响到配电网的输出效果,进而对变压器性能造成直接影响。线路损耗按结构可分为统计线损、技术线损和管理线损。它不仅是指以热能形式存在的能量损耗,而且还是指窃电行为引起的管理线路损耗。
  针对低压台区内窃电行为引起的线损研究,文献提出了一种基于局部离群点检测的低压台区用户窃电识别方法。搭建了一套包含低压台区电网异常分析、用户窃电预警以及采集缺陷判断等数据诊断功能的云平台。利用卷积神经网络Le Net5模型对日用电量数据进行建模分析,为精确捕获窃电奠定了基础。电力系统线损计算和系统的精准管理,对降低节能降耗、促进线损管理具有重要的指导意义。
  为了降低低压台区内线损问题,结合数据挖掘中的离群点分析方法,对异常用电行为进行了研究。此外,针对传统异常功率检测方法的局限性,提出了一种基于层次分析法(AHP)的加权LOF算法的电力线异常功率检测方法。
  1基于数据挖掘的异常电量检测
  数据挖掘作为一种新兴的数据处理方法,能够有效地处理海量且复杂情况的数据分析。因此,为了有效地应对低压台区内大规模用户功耗数据中检测异常用户数据的问题,引入了数据挖掘技术,基于数据挖掘的异常用电量检测模型主要分为三个部分:用户用电数据采集与处理、异常用电模型的构建、检测用户结果分析与验证。基于数据挖掘的异常用电量检测模型,如图1所示。
  2基于用电特征分析的异常检测原理
  2.1电能利用特征提取
  窃电线损行为引起的异常用电数据信息提取往往不是孤立的,并且一个窃电场景可能引发多个异常现象。如果测试是基于单个指标,则很可能会出现遗漏或误判。因此,必须从各种异常用电现象中以及在由各种异常用电行为引起的可量化特征量中提取综合特征来进行有效的防窃电工作。
  以单相用户为例,整合现有文献对功耗评估指标如下:日平均电压、日平均功率因数、日平均电流不平衡率、前7天平均日冻结功率、功率不平衡率。
  2.2基于离群点检测的窃电线损判定原理
  离群点检测又称异常检测,其目的是发现样本组中具有不同行为特征的目标。常用的检测方法主要分为五类:基于分布的检测、基于深度的检测、基于距离的检测、基于密度的检测和基于偏移量的检测。
  考虑到电力用户环境,基于密度的检测算法能够更好地适应内部结构复杂的电力数据集。因此,选择了密度检测算法中最具代表性的LOF算法,并将其应用到异常功率检测中。为了更好帅理解算法,引入以下概念,
  由公式(4)可以看出,数据目标的密度越小,k距离邻域中目标的密度越大,LOF值越大,则异常程度越大。根据离散点检测原理,利用LOF算法得到用户异常度,并且表达用户窃电导致的线损嫌疑程度,进而根据嫌疑程度完成低压台区内异常用户检测。
  3加权LOF算法及其在窃电线损检测中的应用
  由于低压台区内用户较多,且不同用户的用电特性差异较大,这使得电力数据集内部呈现出复杂的分布特性。LOF算法能有效地避免数据分布不均匀对检测结果的影响,并且对密度不平衡的电力数据集具有良好的检测效果。由于不同的电能指标具有不同的含义,如果用传统的LOF算法直接得到异常值来表示用户窃电线损嫌疑程度,当多个电能指标对可疑的窃电线损具有不同的重要性时,导致判断结果并不合理。如果不同指标数据具有相同程度的异常值,并不意味着两个用户具有相同的窃电线损嫌疑。
  考虑到选定的电能指标对涉嫌窃电用户具有不同的重要性,因此,有必要分析可以代表窃电线损可能性的每个电能指标数据异常程度。本文使用层次分析法(AHP)对每个检测指标分配合理权重,并结合加权LOF算法对用户的窃电线损嫌疑进行综合量化,利用得到的综合异常值来表征用户对窃电线损的嫌疑程度,提高了对用户窃电线损的检测效率。最后,通过实验验证了该检测方法的有效性。
  3.1指标权重的确定
  传统的LOF算法无法区分不同指标数据的含义,且传统的LOF算法得到的异常值只能代表用户用电特性的异常程度,不能解释用户对窃电线损行为的嫌疑程度。因此,有必要对传统LOF算法的不同維度数据分配相应的权重。电能指标异常程度越大代表窃电线损行为的概率越大,在整个涉嫌窃电线损行为分析中应发挥的作用越大,则权重越大,反之亦然。因此,引入AHP作为权重量化的数学工具。
  AHP的基本思想是根据优势关系分解复杂问题,并形成层次结构。同时,根据一定的比例尺度,通过两两比较对判断过程进行量化,计算相对判断矩阵,进而确定层次结构要素的相对重要性。具体步骤如下:
  (1)构建窃电线损行为评价指标体系:以用户窃电线损嫌疑程度为评价目标,并使用由窃电线损现象引起的各种可量化的电能特性参数作为评估指标集,从而构建了窃电线损嫌疑评价体系,如图2所示。
  (2)电能参数:根据与涉嫌窃电线损相关的重要程度,形成判断矩阵P。指标的相对权重使用9/9到9/1的比例进行比较。具体比例尺度,如表1所示。
  参照专家经验,根据电能指标数据异常能够代表窃电线损的概率所建立指标判断矩阵P:
  综合分析了用户异常用电量中各电能参数的特点,得出当前涉嫌窃电线损的重要性高于其他指标的结论。测量电压、功率因数和功率不平衡率对试验结果影响很大。然而,由于功率因数不仅取决于电网,还取决于用户的负载性质,因此,低压台区变压器存在一些正常的波动。功率不平衡率受通信系统中的通信容量和电流采集频率的限制,所得到的数据不可避免地会随着实际功耗而呈现较小的波动。因此,功率因数和功率不平衡率对试验结果影响略低于测量电压对试验结果影响。   (3)判断矩阵P
  得到了对应于矩阵最大特征值的特征向量,归一化特征向量。为异常功耗指标的权重。同时,对判断矩阵进行一致性检验。根据以上步骤,涉嫌窃电线损的评价指标权重如表2所示。
  3.2基于加权LOF算法的低压台区窃电线损分析
  简要讨论距离度量对结果的影响。目前,使用较多的距离度量是欧氏距离,因此是用n个数值属性描述的两个目标。目标i和目标J之间的欧氏距离定义为:
  在对涉嫌窃电线损的分析中,由于电能指标的含义不同,并且不同指标对涉嫌窃电线损的影响有所不同。因此,在异常检测中,针对不同的电能指标设置相应的权重。改进的欧氏距离表达式为:
  在计算综合异常值时,利用加权欧氏距离对任意用户之间的综合距离进行加权,从而得到能够表示每个用户对窃电线损行为涉嫌程度的综合异常值。异常值越大,窃电线损的可能性越大。基于加权LOF算法的低压台区窃电线损检测系统的总体结构,如图3所示。
  4实验结果与分析
  比较分析了传统LOF算法和所提的基于AHP的加权LOF算法对低压台区窃电线损检测的效果,所使用的数据集来自浙江省海宁市某低压台区的反窃电检查装置,该低压台区变压器端采集的数据集覆盖1143户家庭。
  4.1结果评价标准
  采用多种分类器评价工具对算法的检测效果进行度量,根据真实类别和分类模型两个准则,将数据集中的记录以混淆矩阵的形式进行汇总。如下表3所示,表中的每一列表示一个预测类别,每一行表示数据的真实属性类别。基于混淆矩阵可以得到多个评价标准:
  在实际应用中,低压台区内的正常用户和异常用户在类别分布上存在不平衡。为了更直观地表达最终的检测结果,引入了受试者工作特征(R()C)曲线和ROC曲线下与坐标轴围成的面积(AUC)的概念。其中,ROC曲线描述了混淆矩阵中FPR和TPR增长率之间的相对关系;ROC曲线下的面积AUC表示分类器的性能,AUC越大,性能越好。
  4.2算法检测结果
  两种检测算法的召回率随检测率的变化,如图4所示。从图4可以看出,整个低压台区窃电线损检测大致可以分为两部分:当检测率较低时,曲线增长较快。当检测率超过20%时,上升趋势减慢并最终趋于稳定,即通过20%的检测率就可以发现约80%的潜在窃电用户。为了节省成本,异常功耗检测可以将重点放在用户具有较大怀疑系数的检测算法输出上,从而提高了异常功耗检测的效率。
  两种检测算法的ROC曲线,如图5所示。根据电能参数的含义,综合量化了不同电能指标对配电网电能分析的重要性。改进的加权LOF算法的检测结果更合理地解释了用户对窃电线损的怀疑,因此改进的加权LOF算法的ROC曲线下的面积AUC明显高于传统LOF算法,这说明了窃电用户的整体检测效果优于传统LOF算法。
  5结论
  通过对低压台区电压器端用电信息采集系统获取的用户用电量数据进行深入分析,可以有效揭示数据背后隐藏的用电行为信息,完成对各种异常用电行为的有效检测。基于数据离群点分析理论,提出了一种基于AHP的加权LOF算法異常值分析方法,该方法综合了多个电能指标来评价用户的全面性能。该方法通过监测电压台区内用户窃电线损行为引起的多个可量化电能参数,完成对多种线损检测。同时,只需要对输出可疑系数高的用户进行异常值分析,即可完成对台区内大部分窃电用户所导致的线损检测。
其他文献
关键词:NLP技术;智能分析;用电网络;高维度电力数据分析;电网停电数据  在互联网技术蓬勃发展的环境下,电力设备能否正常运行给智能电网、电力用户、工作等造成重要影响,给电力企业用户造成无法衡量的损失。伴随着电网信息技术的发展,产生了大量的电网信息数,尤其是造成停电原因的数据,如果电网用户能够恰当地寻找停电数据信息,将在一定程度上挽回企业损失。停电的因素有很多,诸如无法抗拒的自然界外力因素,电力设
关键词:机器人;Web技术;远程控制;V-REP仿真;虚拟仿真平台  近年来,机器人技术已逐步应用于工业制造、医疗服务、物流分拣等多个领域,不仅节省了人力大大提高了工作效率,同时也给人们的生活带来了极大的便利。对于一些环境复杂、条件恶劣或者存在一定危险的作业场所,通常需要通过远程控制的方式来操作机器人完成相应的任务。Internet和网络通讯技术的快速发展有力促进了Web技术在机器人控制领域的应用
关键词:SVR;过拟合;欠拟合;组合核函数;PSO;回歸预测模型
关键词:船用柴油机;拉普拉斯分值(LS);改进鲸鱼算法(IWOA);支持向量机(SVM);故障诊断  船用柴油机因其特殊性和复杂性,一直是相关行业讨论的重中之重。在喷射方面,船用柴油机的输出扭矩会比其他柴油机更高;在点火方面,船用柴油机通过压缩自燃点火;在用油方面,船用油的碱性较高,对润滑油的要求有足够的碱保持性、良好的抗乳化性和分水性。由此可知,展开对船用柴油机的故障诊断是具有很大实用性。  基
关键词:混合H及被動性能;随机网络攻击;分散事件触发;时延
關键词:神经网络;LSTM;时间序列;异常检测;贝叶斯优化;桥梁传感器;异常数据
关键词:电力巡检无人机;四维垂直定位;计算机视觉;四维速度矢量控制;自适应抗干扰  无人机巡检对于提高输电系统巡检效率,降低人力成本和人员安全风险等方面发挥着重要的作用。在巡检无人机整个工作过程中,降落定位是一项非常重要但存在较大干扰的技术难点。传统的无人机降落技术主要包括惯性导航、卫星导航、多普勒导航、地形辅助导航等方法。惯性导航方法不受外界任何信息影响,稳定性好,但定位误差随时间不断积累,因而
关键词:超声聚能器;阻抗匹配;貝塞尔函数;ACTRAN声场辐射
暗通道先验(DCP)近几年已被证实是一种合适的除雾模型,然而其过程将引起图像的Halo效应和颜色失真。基于此,提出了结合亮通道原理和天空区域分割的新算法。使用亮通道和暗通道的结合来精准估计大气光值和透射率,天空区域自适应分割解决恢复无雾图像时天空区域的色彩失真问题。将从主观及客观两方面将本文去雾算法与现有算法进行对比,结果表明,本算法能够有效消除Halo效应,获得高对比度、高色彩饱和度以及丰富细节
针对基本MFO算法存在后期收敛速度较慢、收敛精度低等缺点,提出了一种基于差分进化的改进飞蛾优化算法(DEMFO)。该算法首先将差分进化算法融合到MFO算法中,使得飞蛾种群个体之间具有变异、交叉、选择机制,DEMFO算法拥有更强的全局和局部搜索能力;运用柯西变异算子对飞蛾最优位置进行变异更新产生新解,保持飞蛾种群的多样性,帮助算法跳出局部最优;再引入动态自适应权重因子,使飞蛾的更新方式更具灵活性,引导算法朝着正确的搜索方向进行,从而有效地提高了算法的收敛性和精度;对该算法用8个测试函数进行仿真实验,从实验结