【摘 要】
:
无人作战飞机(Unmanned Combat Air Vehicle,UCAV)由于其具有较好隐身性、较强的机动性能等优点,在未来认知电子战领域将会占据越来越重要的位置,它能够快速实现敌方目标打击,对己方战术推进具有重要作用。进行路径规划以实现敌方目标打击是UCAV自主飞行的主要任务,但是现有的路径规划算法由于花费时间长、UCAV飞行动作不连续、很少考虑飞行物理约束等缺陷,很难适应不断变化的战场环
论文部分内容阅读
无人作战飞机(Unmanned Combat Air Vehicle,UCAV)由于其具有较好隐身性、较强的机动性能等优点,在未来认知电子战领域将会占据越来越重要的位置,它能够快速实现敌方目标打击,对己方战术推进具有重要作用。进行路径规划以实现敌方目标打击是UCAV自主飞行的主要任务,但是现有的路径规划算法由于花费时间长、UCAV飞行动作不连续、很少考虑飞行物理约束等缺陷,很难适应不断变化的战场环境,为在认知电子战中取得胜利带来极大的困难。论文针对动态未知环境下UCAV路径规划问题,采用深度强化学习的相关理论知识,通过建立从状态到动作的映射从而得到最优的路径,提高了UCAV的任务完成率。论文的主要工作如下:首先,对UCAV路径规划问题做了一个总体的阐述,明确了UCAV路径规划的整体流程。根据UCAV在飞行过程当中的受力情况,设定了UCAV需要满足的物理约束条件。针对UCAV飞行环境进行了建模,给出真实战场上常见的雷达、导弹、高炮、以及电子干扰四种威胁模型,分析了不同的威胁对UCAV的杀伤概率。其次,针对现有的UCAV路径规划算法不能够适应动态未知环境的情况,将深度强化学习的相关理论知识引入到路径规划中。采用神经网络逼近状态空间,解决了UCAV状态空间较大时,表格形式对状态的存储变得十分困难的问题。设计了UCAV的状态、动作以及奖励函数,采用深度强化学习算法中的DQN(Deep Q-learning network,DQN)和PG(Policy Gradient,PG)算法进行训练。从平均积累奖励、规划步数和成功率三个方面对算法进行了对比,验证了深度强化学习在UCAV路径规划领域的适用性。再次,针对DQN算法输出动作不连续,PG算法收敛速度慢等缺陷,将结合了DQN和PG算法的AC(Actor-Critic,AC)框架下的DDPG(Deep Deterministic Policy Gradient,DDPG)和SAC(Soft Actor-Critic,SAC)算法引入到连续动作空间的UCAV训练过程当中。给出了UCAV的状态和存在物理约束条件下的飞行动作,设计了和不同威胁下的UCAV获得的奖励。根据四种不同的性能指标,比较了两个算法在三个不同任务上的表现。通过分析仿真结果,基于AC框架的深度强化学习算法能够明显提高连续动作空间下UCAV的任务完成率。最后,介绍了连续动作空间下UCAV路径规划软件的整体架构,给出了模块化的设计过程。
其他文献
近年来越来越多的企业采用BIM技术,它不仅仅只是应用于建筑工程,还扩张到了公路工程、轨道交通工程、机场工程等等。在大数据时代它还与云技术、物联网、RFID无线射频辨识别等新技术结合,拓宽了BIM技术的应用范围。学界和业界在关注BIM应用领域的同时也开始关注BIM实施期间及实施后的用户的满意度。分析清楚是什么原因影响了BIM用户的满意度,以及这些原因之间是如何相互影响的,直接关系着BIM技术信息系统
机场是陆地交通运输和空中交通运输的重要枢纽,目前由于人民生活水平逐渐改善,航空运输成为了很多出行乘客的首选,也就导致机场旅客吞吐量大、行人换乘量大等特点。对于旅客而言,仅仅拥有良好的航班服务是远远不够的,舒适便捷的机场陆侧交通服务近年来也成为了旅客越来越重视的考虑因素。本文从理论分析、模型建立以及实例分析等角度,采用理论和实例相结合、定性分析和定量分析相结合的方法对机场陆侧交通进行评价研究。相关研
地理国情是指与地理相关的人文要素和自然要素,从地理空间角度反映一个区域人文、经济、自然状况。从地理的角度,利用空间化的方法,针对国情相关要素进行不间断的观测,同时对监测结果进行采集、处理、统计分析的过程就是地理国情监测[1]。自2016年以来,由于测绘地理信息事业转型发展的自身需要,各省按照国务院关于地理国情监测工作的总体部署和安排,开展每年度的常态化监测。在地理国情普查的基础之上,内容体系保持与
定向遗忘是被试在学习阶段按照记住和忘记指示符对指定材料进行遗忘而产生的记忆成绩下降的现象,是实验室中研究记忆和遗忘的重要范式。本研究采用项目法定向遗忘范式,以词语和图片作为实验材料,探讨特质焦虑水平对情绪记忆定向遗忘的影响。本研究共由两部分组成:研究一以词语为实验材料,采用2(组别:高特质焦虑组、低特质焦虑组)×3(词语类型:正性、中性、负性)×2(指示符:记住、遗忘)的混合实验设计,探讨了特质焦
随着全球信息化社会的不断发展,移动通信系统的规模与使用方式正在发生翻天覆地的变化。下一代无线网络将接入各种类型的设备,包括智能手机、无人机以及车辆等,这将对未来蜂窝网络的性能提出更高的要求。为解决日益增长的吞吐量需求,学者们提出异构蜂窝网(Heterogeneous Cellular Network,HCN)技术。HCN能够有效地改善宏小区边缘用户的服务质量,提高频谱效率和系统容量,实现无缝接入覆
针对本文,首先提出财务诊断的含义以及现实和理论意义,国内外当前的发展现状和最新的研究成果,接着以农业行业作为这次分析的大范围,从中选择了T公司,一家在新疆具有典型意义
攀西地区位于四川省西南部,是四川省开发潜力巨大的经济区域。“十三五”期间,在国家推动“一带一路”和长江经济带建设,深入实施西部大开发战略,加快建设攀西国家级战略资源创新开发试验区的各种政策实施下,攀西地区发展迎来难得的历史机遇。但攀西地区是长江上游生态屏障的重要承载区,也是国家级水土保持重点防控区,生态地位极其重要;且自20世纪70年代以来,随着经济发展,攀西地区工业化与城镇化的速度加快,开发力度
生物地理学优化算法(BBO)是一种模拟生态系统中物种地理分布和迁移的新型启发式算法,具有实现简单、鲁棒性强、搜索机制独特等特点,与其它智能算法相比,BBO算法具有良好的收敛性和稳定性,受到越来越多专家和学者的关注。作为一种新的智能优化算法,尽管现在对于BBO算法理论的完善、算法的改进以及工程问题的实际应用等方面已经有了大量的研究,但是仍然还有一些不足。因此本文将在现有的这些研究内容上,为进一步提高
随着时代的发展,智能建筑已经成为一种趋势,使日常生活变得高效而便捷,智能建筑供配电系统日益庞大,不可避免会出现故障,所以对智能建筑的安全保障是必要的。一旦智能建筑供配电系统出了故障,势必会增加电网调控工作人员的工作量,影响到居民的正常生活,严重则会使整个建筑遭到损害和不必要的经济损失,而且对电能质量的影响巨大,甚至会造成人身伤亡事故,因此智能建筑中供配电系统的故障诊断技术尤为重要,对故障诊断的研究
室内弹道试验是轻武器研制和生产中不可缺少的外弹道参数测量试验。试验数据作为靶场弹道参数测量的重要组成部分,在武器装备研制、生产中起着重要作用。目前,我国室内弹道参数测量试验大部分仍然是以单靶道单站点多参数测量为主,测量的参数不能反映出弹丸全弹道飞行状态,试验数据缺乏规范性和统一性。鉴于此,本论文针对室内全弹道弹丸飞行参数的测量,设计了一种基于网络通讯的多测试站试验数据管理系统,通过一次试验即可获取