增强学习在共面双机空战格斗中的应用

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:xinwang01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微分对策作为解决追逃动态对策问题主要工具已经经历了近50年的发展,就其本身而言已经发展的相当成熟,但距实际应用还有一段距离。这主要是由于微分对策理论来源于最优控制理论,因此它需要精确的数学模型,以及在求解时会遇到非线性两点边值问题和奇异面问题。 近年来,随着人工智能的兴起,国内外许多学者致力于将智能控制理论引入微分对策理论的研究中。而要达到智能化制导就不可避免地涉及知识的自动提取和利用问题。作为机器学习的一种方法,增强学习恰可使知识的获取过程自动化,并扩展所能得到的知识资源范围。 本文研究了共面双机空战格斗的动态对策问题,采用增强学习与微分对策相结合的方法,避免了传统的控制理论根据被控对象的精确数学模型和性能指标来求解最优解析解的方法带来的困难。并依据人的模糊思维建立空战对策准则,实现状态空间的离散化以减小动作空间范围,提高网络学习效率。 本文针对传统增强学习中出现的“维数灾难”问题以及学习问题中的“Structure Credit-Assignment”问题采用BP神经网络近似Q-学习的评价函数的解决方法。 在仿真试验中考虑诸多实际因素,并采用了实际空气动力学参数,仿真结果验证本文所采用的方法的有效性,表明将增强学习与微分对策理论相结合,并应用于空战格斗问题中是—种有前途的发展方向。 本文首先分析双机格斗的重要性及其研究方法的发展,并给出设计方案的依据及总体框架。在第二章介绍了增强学习的特点、发展历史和各种算法。在第三章设计了基于Q-学习智能空战制导控制,并给出空战对策准则。在第四章对水平面双机空战格斗常、变速数学模型进行了仿真试验,对仿真结果作了分析。
其他文献
期刊
由我国自主研发、自主装配、全程实现机械化操作的健康板材连续生产线全部改造完成,近日正式投产,这也是全球第一个实现连续化作业的健康板生产线。该生产线全面运行填补了我国
《中共中央国务院关于进一步深化电力体制改革的若干意见》(中发〔2015〕9号)拉开了新一轮电力体制改革的序幕,增量配电业务改革是此轮改革的重点任务之一。目前,第一批106个增量
报纸
技术入股是一种重要的技术转移机制,在促进成果转化方面具有不可替代的作用。我国技术入股面临着国有资产管理、治理结构、股权奖励以及税收等方面的障碍。应当从国家层面采
瑞典劳工部负责有关劳动力市场、就业条件(包括工作环境问题)、移民和公民权政策等方面的事务。该部还负责关于男女平等、瑞典与国际劳工组织的合作以及就本部职责范围内事务进
日前,国内首个家饰行业组织--全国工商联家具装饰业商会家居饰品专业委员会在京举行了一系列活动.不仅举办了"影响力·首届中国家居饰品行业优秀企业表彰大会",还举办了"
期刊
随着《招标投标法》和《建筑工程工程量清单计价规范》的陆续实施,造价工程师的工作内容也发生了相应变化,文章阐述了在工程量清单招投标实施阶段,造价工程师应对的几点措施。
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
随着国家对新能源的重视,含分布式电源的微电网配电系统将会是未来配电网发展的趋势。但是分布式电源接入配电网,会给配电网的结构,配电网中故障电流大小及方向都会产生一定的影
间充质干细胞(mesenchymal stem cells MSCs)是中胚层来源的干细胞,可取自于骨髓、脐带血、脑、肝脏、肾脏、肺等组织。其具有自我更新和多向分化的潜能的特点,在适当条件下不仅