论文部分内容阅读
随着全国经济水平的提升,基础设施建设的加快,我国用电量的提升以及电网的快速发展,繁多复杂的电网数据越来越多。电网企业中产生海量底层电网数据,人们对海量电网数据的把控显得尤为重要,尤其是电网公司对海量异常数据的根因定位和排查,挖掘隐藏在底层明细数据中的关系,并进行诊断研究。
本文通过研究关联数据挖掘技术和方法,结合并收集实际电网中的数据及指标管理,通过对方法的不断试验研究,利用数据关联方法计算出电网运营数据间的关联性,同时将数据关联技术应用到物资寿命精细化管理方面,分析配电网设备提前报废的因素,并提前防护准备,对电网企业辅助决策,利用关联数据挖掘技术的结果对问题归因处理,从而达到辅助决策。主要工作内容如下:
1、结合实际某电网公司海量的电网数据,对数据进行形态、维度的分类处理,根据不同的数据类别,研究其关联变量的生成方法并生成可计算的关联变量,同时将需要的数据进行关联性识别和计算,利用关联性计算找出各项指标数据间存在的隐形关系,便于对数据更好地分析。
2、根据电网底层数据和指标通过上述关联关系识别和计算方法,对某电网部分底层数据的关联性进行分析,售电收入、输配电成本、可控费用、售电量、购电量等指标的关联性均超过了0.9,是高度相互关联性。电网中存在大量关联性非常高的运营指标,一个指标发生变化,通过高关联指标分析哪些指标将受到影响,从而对电网运营指标进行精准化管理。
3、结合前面的电网企业数据,得出关键指标和隐藏指标的关联性后,要想对关联关系进行评估,研究出我们需要构建关联关系表和核心指标群,将关联关系从大到小排列,根据关联性高低判断出设备提前淘汰的因素,提前淘汰的设备是哪个厂家生产的居多,投运日期和资本化日期处于2010年到2014年期间,主要位于交流10KV上的柱上变,从而辅助公司做出决策,节省成本。
4、为了对关键指标进行分析,需要明确核心指标的范围,我们建立了符合监测要求的核心指标群,通过对指标异动逻辑回溯技术的研究,通过构建关联链路,构建关联关系表来探寻指标异动的潜在因素变量,通过关联排序,从而实现对异动问题的根因排查方法和指标的趋势研判。
本文通过研究关联数据挖掘技术和方法,结合并收集实际电网中的数据及指标管理,通过对方法的不断试验研究,利用数据关联方法计算出电网运营数据间的关联性,同时将数据关联技术应用到物资寿命精细化管理方面,分析配电网设备提前报废的因素,并提前防护准备,对电网企业辅助决策,利用关联数据挖掘技术的结果对问题归因处理,从而达到辅助决策。主要工作内容如下:
1、结合实际某电网公司海量的电网数据,对数据进行形态、维度的分类处理,根据不同的数据类别,研究其关联变量的生成方法并生成可计算的关联变量,同时将需要的数据进行关联性识别和计算,利用关联性计算找出各项指标数据间存在的隐形关系,便于对数据更好地分析。
2、根据电网底层数据和指标通过上述关联关系识别和计算方法,对某电网部分底层数据的关联性进行分析,售电收入、输配电成本、可控费用、售电量、购电量等指标的关联性均超过了0.9,是高度相互关联性。电网中存在大量关联性非常高的运营指标,一个指标发生变化,通过高关联指标分析哪些指标将受到影响,从而对电网运营指标进行精准化管理。
3、结合前面的电网企业数据,得出关键指标和隐藏指标的关联性后,要想对关联关系进行评估,研究出我们需要构建关联关系表和核心指标群,将关联关系从大到小排列,根据关联性高低判断出设备提前淘汰的因素,提前淘汰的设备是哪个厂家生产的居多,投运日期和资本化日期处于2010年到2014年期间,主要位于交流10KV上的柱上变,从而辅助公司做出决策,节省成本。
4、为了对关键指标进行分析,需要明确核心指标的范围,我们建立了符合监测要求的核心指标群,通过对指标异动逻辑回溯技术的研究,通过构建关联链路,构建关联关系表来探寻指标异动的潜在因素变量,通过关联排序,从而实现对异动问题的根因排查方法和指标的趋势研判。