基于博弈论和强化学习的无人机电力巡检卸载策略

来源 :电网技术 | 被引量 : 0次 | 上传用户:Melissachen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人机组在执行应急故障巡检时由于受到设备本身计算能力和能源资源的限制,无法较好地执行密集型计算任务。针对这一问题,该文提出一种基于博弈论(game theory,GT),与强化学习的卸载策略,该策略在无人机之间建立非合作博弈将最小化成本函数定义为能量开销和延迟组合,同时证明了至少一个纳什均衡(Nashequilibrium,NE)的存在性,提出了一种分布式算法求解博弈双方的NE解,在此基础上,通过基于随机学习自动机(stochastic learning automata,SLA)理论的强化学习方法
其他文献
从电网侧储能出发,提出了一种储能参与现货市场联合竞价的双层Stackelberg博弈模型.首先,基于共享的概念将电网侧建设位置不限且分散、投资主体多样的储能电站组成联盟,实现资源统一调度,并以市场价格信号激励电网侧储能联盟参与日前电能量市场、调频辅助服务市场以及日内平衡市场竞价.其次,基于Stackelberg主从博弈,建立了以储能为竞价主体,兼顾收益与风险的现货市场联合竞价策略双层模型.上层以储能收益最大为目标进行策略性报价;下层以购电成本最小为目标进行日前多市场联合出清,以系统平衡成本最小为目标进行日
随着我国电力市场化改革的推进,计划与市场“双轨制”下的交易结算产生了大量不平衡资金.不平衡资金分配机制直接影响市场主体的收益和市场效率,合理的不平衡资金分配机制对推进我国电力市场化改革,保证市场公平高效运行具有重要的指导意义.为此,立足于我国电力市场特点,利用基于主体的建模方式(agent-based model,ABM)对不平衡资金分配机制展开研究.在分析不平衡资金产生机理的基础上,结合我国现行的几类代表性不平衡资金分配方法,建立了考虑不平衡资金分配的ABM模型.然后通过算例验证了所提模型能够有效模拟不
分布式光纤传感(distributed optical fiber sensing,DOFS)技术融合传输媒介和传感单元一体化实现了空间的连续监测,且可以直接利用光纤复合架空地线内光纤资源,其独特优势使得DOFS技术在输电线路在线监测中越来越多地被应用.首先对DOFS中的瑞利散射、拉曼散射和布里渊散射的基本原理进行简要介绍,给出了DOFS系统可以监测的基本物理量和各类DOFS技术的特点;然后围绕雷击、覆冰、舞动等工况监测对DOFS技术在输电线路在线监测领域的研究现状进行综述.随后分析了现有DOFS技术在传