基于深度强化学习的电网运行方式辅助计算方法

来源 :中国电力科学研究院 | 被引量 : 0次 | 上传用户:atianjun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电力系统运行方式计算是辅助调度人员实现电网安全稳定运行的重要理论依据。电网年度运行方式计算通常需要先根据下一年度的电网规划和负荷预测结果,参考历史运行经验初步制定电网典型运行方式,然后利用各类稳定计算得出电网的安全运行边界。目前,实际生产中的运行方式计算工作,仍主要由电网各级调控中心借助电力系统仿真软件(如PSASP、PSD-BPA),依靠大量人力协调完成。随着2017年国家电网新一代特高压交直流仿真平台投运,运行方式计算工作迈上新台阶,整体仿真能力和工作效率显著提升。但近年来,随着国家电网规模不断扩大、交直流混联格局逐步形成以及高比例可再生能源的大规模接入,电网运行形态日趋复杂多变。就单运行方式调整工作而言,一定程度上仍然依赖专家经验。为进一步提高计算程序的自动客观分析处理能力和运行方式计算工作效率,亟需提高运行方式计算工作的自动化程度。潮流收敛调整和关键输电断面功率调整是运行方式计算中任务量最大、重复度最高的内容,自动化完成这两部分工作对提高运行方式计算的自动化程度具有重要意义。本论文首先深入分析并模拟实际工程中的人工调整过程,对潮流收敛调整和关键输电断面功率调整过程进行数学建模,然后提出改进深度强化学习算法并进行调整训练,最后依据训练后的神经网络实现电网潮流的自动收敛调整和关键输电断面功率的快速灵活调整。本论文具体研究内容如下:(1)建立电网潮流自动收敛调整的马尔科夫决策模型。分析实际工程中潮流的收敛调整过程,提出一种考虑网损率的映射策略,将潮流收敛调整过程抽象为一个便于计算机求解和推理的马尔科夫决策过程。(2)提出改进深度Q学习算法,求解内容(1)构造的马尔科夫决策模型,实现潮流自动收敛调整。实际工程中的潮流收敛调整,针对发电机部分通常只调整其起停机状态,即调整变量为离散变量,所以本论文提出基于值函数的改进深度Q学习算法求解内容(1)构造的马尔科夫决策模型,并在IEEE-118节点系统和实际电网系统中得到验证。(3)建立电网关键输电断面功率调整的马尔科夫决策模型。分析实际工程中运行方式计算人员调整电网关键输电断面功率的方法,提出一种融合专家经验的改进映射策略,将输电断面功率调整过程抽象为一个马尔科夫决策过程。(4)提出基于Actor-Critic框架的改进深度强化学习算法,求解内容(3)构造的马尔科夫决策模型,实现关键输电断面功率的快速灵活调整。由于断面传输功率是连续变量,所以本论文提出适用于连续变量调整的改进深度强化学习算法。(5)内容(4)所提算法容易因关键输电断面数量过多或者单个输电断面可调节功率范围过大而导致训练失败。主要原因是训练目标过于复杂,超过神经网络拟合上限。为避免重新设计更复杂的神经网络,本论文进一步提出“分阶段训练”和“优先目标回放”两项改进措施,且分别在IEEE-39节点系统和实际电网系统中得到验证,最后讨论了相关参数的设置对训练效率的影响。
其他文献
随着越来越多大科学装置的建设和重大科学实验的开展,科学研究进入到一个前所未有的大数据时代,大数据时代产生的空间大数据集对海量矢量数据的高效存储与计算提出了诸多挑战。传统的解决方案是采用关系型数据库与Arc SDE协同管理的模式,该模式将数据存储在单台机器上,这在很大程度上限制了数据的存储能力和计算能力。云计算环境下提供的分布式存储与高性能并行计算技术是一种有效的解决方案。基于云计算的这种特性,论文
氟元素对地下水的污染是受全世界广为关注的环境问题。在我国,广大地区的地下水深受氟污染的威胁,尤其以西北、东北和华北等广大北方地区人民为首,面临着由于长期饮用高氟水带来的地方性氟中毒的潜在威胁。因此,对于高氟地下水的有效防治变得尤为迫切。铁氧化物因其来源广泛、对氟离子亲和力强等,是地下水除氟重点研究的吸附材料。本课题选用铁氧化物中吸附性能优异的四氧化三铁,采用共沉淀法制备了纳米级四氧化三铁,并对纳米
社会医疗保险保障制度是国家心系民生的重要福利制度,社会医疗保险制度的推行,一定程度上改善了就医难、看病贵的医疗困境。随着医疗保险覆盖率的不断提高,医保基金的资金不断充盈。由此,医保诈骗行为愈演愈烈,且欺诈手段不断升级,在实务中存在惩治困难的境地。如此,我国学者不断呼吁将医保诈骗行为纳入刑法规制,但理论界就如何定罪量刑存在争议。2014年4月24日,全国人大常委会出台立法解释将骗取医疗保险等社会保险
Fe/C-Fenton工艺在化工有机废水处理中的应用一直是水处理领域的热点。本研究针对一种难降解的典型新型有机污染物苯并三唑(BTA),通过控制p H条件与反应时间,研究Fe/C微电解反应中铁的溶出规律,在后续Fenton氧化反应中匹配相应的过氧化氢量,探究Fenton氧化反应的最佳条件,通过对Fe/C-Fenton氧化反应过程中Fe元素的形态转化研究与动态小试实验,对基于p H控制的Fe/C-F
工业革命过后,资本主义社会生产对自然资源的掠夺和对环境的破坏,使所积累的生态危机越来越明显和深刻。目前,全球环境污染问题主要表现在土地污染严重、可用淡水资源不断被污染消耗、森林覆盖面积逐年减少、全球极端气候现象频发、空气质量不断下降、物种灭绝速度快速增加等等问题。良好的生态环境质量才能彰显出人民美好生活的质量,因此建设当代生态文明就显得极其重要。当代生态文明的建设是在习近平生态思想的理论指导下进行
近年来,随着移动设备的不断普及,移动应用的数量也呈现爆炸式的增长。安卓(Android)系统是其中使用量最多的移动操作系统,给人们带来了生活方式的改变。但是由于安卓系统本身的开源性和安卓应用的普遍性,不法分子将安卓应用作为目标,采取一系列手段来获取违法利益。在这些手段中,安卓应用重打包(Repackaging)已经成为最主要的方式之一。安卓重打包指的是解压安卓应用程序包并在可能的修改后重新打包并且
近些年不断发生的食品安全事件是对职能部门执政管理能力的严峻考验,而其中有一些食品安全问题是由不规范使用食品添加剂引起的。食品安全的很多问题固然与我国食品工业尚处于快速发展时期,许多方面仍不完善有关,但政府的监管没有完全落到实处也是一个重要的原因。论文详细阐述了我国食品添加剂的发展历程、食品添加剂管理的法规与标准,简述了美国、日本、欧盟有关食品添加剂及其管理的相关法规。以云南省2016年食品安全国抽
甲壳素来源于丰富的海洋资源,但其在水和有机溶剂中难以溶解,存在加工难等问题,直接限制了对甲壳素的应用研究。天然甲壳素可通过各种机械作用或化学反应转化为甲壳素纳米晶(Ch NCs)。Ch NCs具有独特的针状形貌、高的长径比、高的力学模量、稳定良好的水分散液、比表面积大、生物相容性良好等优良性质,是一种易于功能化、可生物降解的新型天然纳米材料。基于这些特性,开发Ch NCs更多应用领域极具研究价值,
近年来广东省空气质量取得积极进展,截至2019年,广东省环境空气质量已连续5年实现整体达标,PM2.5的年均浓度从2013年的47μg·m-3降至2019年的27μg·m-3,在全国处于领先水平。珠三角地区O3浓度不降反升,自2005年以来呈现震荡上升趋势,O3污染逐渐成为影响珠三角地区空气质量达标的首要污染物,特别是在秋季O3污染问题最为严重。PM2.5和O3污染是彼此关联的大气二次污染问题,V
近几年来,随着互联网地图的出现,POI数据得到了迅速的发展,百度、腾讯、高德等互联网地图公司也相继建立了自己的POI数据库。POI,全称为“Point of Interest”,即兴趣点,可以泛指所有能够抽象为实体的点,每个POI都包含了名称、类别、地址、坐标四个方面的信息。POI数据具有结构简单、数据量大、现势性强等优势,被众多学者广泛用于城市规划、商业分析等方面的研究,另辟蹊径地成为了新兴研究