基于GA-iForest与ARIMA-LSTM的WAMS异常数据清洗研究

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:qq445057927
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据清洗是将电力数据应用于电网运行与维护中的一个关键步骤,有助于提高数据质量和数据利用率。数据清洗通过填充缺失值、平滑噪声数据和识别离群点来提高数据质量,但是在实际应用中,广域量测系统(Wide Area Measurement System,WAMS)大数据、高响应的特征导致很难获取足够的带标签训练集,“数据海量,信息匮乏”仍是电网运行规划面临的重要问题。与有监督学习相比,无监督学习更加适用于难以获取足够带标签数据集的情况,通过无标签数据进行模型训练就可以获得不错的检测分类结果。在获取了异常点后通过对异常点进行预测,然后将预测值填充到异常点位置就可以实现数据清洗的目的。然而电力数据是一种线性与非线性混合的时序数据,现有的单一模型很难对这种混合型数据进行准确描述。与传统单一模型相比,混合模型在电力数据预测领域具有更好的适用性。本文在异常数据分类与时序数据预测方面进行研究。本文在无监督学习领域进行了分类算法的探讨,分析了一些现有算法的优缺点,并在现有的算法上进行改进,提出了新的算法模型,同时对时序预测进行了混合模型的应用研究,对比了单一模型与混合模型的预测效果。文本的主要工作体现如下:(1)基于隔离森林(Isolation Forest)算法对WAMS数据集进行异常检测。针对隔离森林准确性与稳定性不足的问题引入遗传算法(Geneticalgorithm)构造了一个新的异常检测模型GA-iForest。具体来说,利用遗传算法对决策树进行筛选,淘汰检测性能低的决策树保留性能高的决策树,以此来优化隔离森林的结构。该方法在保持了传统隔离森林执行效率高的同时提高了检测精度与稳定性,同时对局部异常检测与高维异常检测也实现了检测性能的提升。(2)基于移动平均自回归(Autoregressive Integrated Moving Average mode,ARIMA)与长短期记忆神经网络(Long Short-Term Memory,LSTM)对WAMS时序数据进行预测。针对WAMS数据混合化以及单一模型性能不足的问题,提出基于移动平均过滤器和混合模型(ARIMA-LSTM)的耦合预测模型。模型采用移动平均过滤器对WAMS数据进行线性与非线性的划分,然后使用ARIMA对划分后的线性数据进行预测,LSTM对非线性数据进行预测,最终的预测结果为两种模型的叠加。该耦合模型在WAMS数据预测方面比单一模型表现出更好的预测精度。为了进行实验,本文采用了某省WAMS的实际采集数据进行对比,实验结果表明,本文提出的模型具有更好的预测精度。
其他文献
服务业在全球制造业的发展中已扮演着愈来愈重要的角色,投入服务化成为制造业转型发展的重要趋势。我国也出台一系列政策文件明确提出,将生产性服务投入制造业与制造业企业提升绩效具有密切关系。在服务化背景下,加成率已成为衡量企业绩效的重要标准,其高低反映了企业的盈利能力和真实的市场竞争力。而现阶段中国制造业服务化程度较低,且生产性服务业发展也相对滞后,对制造业的支撑和渗透作用还很有限,导致企业加成率较低,在
技术融合是提升研发机构竞争力的重要途径,及时准确地洞察技术融合机会有助于把握技术先发优势、减少创新决策中的不确定性,加速企业技术创新发展;知识基因理论是认识知识进化过程、揭示科学发展规律的有效手段,运用知识基因理论,在以功能需求为导向广泛获取多领域解决方案的基础上实现面向未来的技术融合机会研究,将改善传统外推方法预测结果局限性、数据时滞导致的结果失准等问题。将技术作为知识基因,称之为“技术基因”,
以往研究结果表明,在NiTi形状记忆合金(SMA)与纳米线组成的复合材料中,NiTi基体在发生马氏体的相变切变过程中,纳米线能够展现出其本征的大弹性应变,从而提高复合材料的强度
近年来,在以电力为中心的新一轮能源革命背景下,风能、太阳能等清洁能源发电形式在缓解化石能源枯竭、减轻环境污染等方面发挥着重要作用。而新能源的接入对传统配电网的线路潮流、网络损耗、节点电压和可靠性等方面带来一定影响,并且不同类型的新能源接入具有不同的出力特性,如何确定新能源对配电网的影响范围及深度成为亟待解决的问题。本文通过新能源出力特性与配电网运行特性的充分分析,揭示新能源对配电网的影响范围及深度
随着我国油气勘探开发力度的不断加大,“三高油气井”(高温、高压、高含硫)的数量日益增多。酸性腐蚀介质是海相碳酸盐气藏的重要特点之一,H2S是天然气伴生物,井下的H2S会对
我国经济伴随着“一带一路”倡议的确立及快速实施和发展,迎来了新的发展机遇,但同时又面临着前所未有的巨大挑战,这对于农业经济的影响尤为重要。探究“一带一路”沿线各个国家对花木产品的需求,可为我国花木出口产区的花木种类区域布局、花木国际化标准提供有效的参考信息,进而能提升花木出口产品的市场认可度和满意度,抢占更多市场份额,进一步获得更优的贸易利益,提高我国对外开放的水平。温江区作为全国重要花木主产区之
萜类化合物是广泛于存在自然界的一种天然产物,在植物的生长发育和对环境的适应性方面起着重要的作用。萜类化合物在植物中主要通过两种途径合成,细胞质中的MVA途径和质体中
近些年来,我国的经济发展日益剧增、企业的规模不断扩大,企业的成长性研究逐渐成为人们关注的焦点。成长性的良好代表着企业在研发能力、偿债能力、营运能力以及发展能力等方面较强,有利于企业价值的提升,也有利于投资者对企业信任程度的增强。通过对企业成长性的研究分析,能够为利益相关者对企业未来的生存和发展能力的评价提供参考,促使评判结果更加客观,进而推动企业发展,为加快建设新时代经济强省、美丽河北提供有力支撑
石化行业换热器占设备总量的40%,其中99%的换热器都存在结垢问题,据统计,因污垢造成的损失占国民生产总值的0.3%。因此提高管壳式换热器的传热性能已成为研究的热点。本文以北京燕山化工一厂的管壳式换热器中油溶性污垢为研究对象,主要研究了换热器污垢的沉积对管壳式换热器传热性能的影响。针对管壳式换热器油溶性污垢进行了污垢特性分析,研究了油溶性污垢的形成过程与主要影响因素;构建了污垢导热系数实验测试平台
本文针对渤海油田目前应用的调驱技术效果差异大的问题,以SZ36-1油田为对象,采用室内实验的方法,以调驱剂的流变性、注入性、运移性、封堵性和驱油效果为指标,对AP-P4溶液、A