强化学习在多阶段装备组合规划问题中的应用

来源 :国防科技大学学报 | 被引量 : 0次 | 上传用户:lhbneil
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多阶段武器装备组合规划中的选择难、规划难问题,提出基于多目标优化算法以及强化学习技术的混合优化方法。在各个阶段以装备组合效能最大和成本最小为准则,构建单阶段多目标优化模型,并设计基于非支配排序遗传算法的求解算法以生成各阶段的Pareto解,在此基础上建立多阶段的组合优化模型。通过强化学习的Q-Learning方法,在各阶段的Pareto解中采用探索或者利用两种模式,生成各阶段的装备组合,并指导下一阶段的装备选型,从而生成整个周期内的规划方案。通过对比实验分析,验证了所提模型和算法的有效性,能够为多阶段
其他文献
为了评估爆震弹封装壳体破片致死、致伤半径,并削弱其平均比动能,基于蒙特卡洛剖分投影法建立破片平均比动能计算模型。通过LS-DYNA及自编程联合仿真方法对爆震弹自然破片、半预制破片比动能计算模型进行仿真求解,获得了全破片全时域的质量分布、初始速度、垂直靶分布、平均比动能阈值及安全半径等指标。结果表明:在相同装药参数下,半预制破片相比于自然破片,质量分布、初始速度阈值更低且更集中;在小于等于2.5 m范围内半预制破片平均比动能阈值比自然破片更低,大于2.5 m后半预制破片平均比动能阈值比自然破片更高。相比于自
为研究气液针栓式火箭发动机的声学振荡特性并为其优化设计提供指导,加工了具有矩形燃烧室的LOX/GCH4针栓式发动机,采用Euler-Lagrange方法仿真横向速度扰动产生的声学响应,以期在热试前了解声学激励频率对非稳态喷雾燃烧过程的影响。仿真结果表明,采用的横向速度扰动能在燃烧室内产生同频率的一阶横向声学振荡响应。喷雾燃烧对声学激励的响应强弱受扰动频率与燃烧室一阶横向振荡模态固有频率的相对大小影响较大。当扰动频率与该固有频率相等时,压力和燃烧释热随速度扰动出现同相振荡,压力振荡幅值
为了实现SpaceFibre总线节点的高效数据传输,针对网络协议中关键问题和技术提出了一种基于现场可编程门阵列(Field Programmable Gate Array,FPGA)的SpaceFibre总线节点系统设计方案。其中,采用了轮询仲裁算法,解决了多路虚拟通道中流量控制字的申请冲突;设计了基于服务质量机制的高效处理状态机,实现了多路虚拟通道的服务质量调度;提出了一种并行的分区存储架构和重发控制算法,实现了基于错误检测隔离恢复机制的错误恢复;采用了不同的数据并行处理方案,实现了多种数据格式的循环冗
在建立卫星导航系统星座自主守时时间基准时,必须消除星载原子钟钟差数据中包含的周期性波动,以免将其引入系统时间。针对这一问题,基于国际卫星导航服务组织(International GNSS Service,IGS)提供的北斗系统星载原子钟钟差产品,提出了一种基于频谱分析的星载原子钟周期性波动校正方法。通过比较校正前后钟差数据的频率稳定度性能差异,确认该方法能够消除由环境因素引起的钟差数据周期性波动。北斗系统各类卫星星载原子钟的性能在校正后都得到了提升。地球同步轨道卫星星载原子钟的万秒频率稳定度提升50%左右
为了研究弹性应力和弹塑性应变对921A船体钢在模拟海水中腐蚀行为的影响,采用自制的载荷-电化学实验装置对921A钢在载荷与腐蚀介质协同作用时的开路电位、动电位极化曲线和电化学阻抗谱等电化学性能进行了测试,并由电化学阻抗谱拟合得到的电荷传递电阻定义载荷下的腐蚀速率修正因子,将实验得到的腐蚀速率修正因子与理论值进行了对比。结果表明:弹性拉应力与弹性压应力对力学化学效应的影响具有对称性。力学化学效应随着弹性应力的增大而增大,随着弹塑性应变的增大先增大后减小。弹塑性应变对力学化学效应的影响远远大于弹性应力的影响。
为验证不同掩星数据反演湿温廓线的精度,需量化分析其误差特性。采用分段线性插值法,以时间窗1 h、水平距离100 km为匹配准则,对0.2~30 km各插值高度层温度的平均偏差和标准差进行统计分析,旨在探究不同掩星数据偏差特性。通过采用2018—2019年期间的全球探空站背景场资料完整数据,评估中国区域不同掩星数据偏差。结果表明:与全球探空站背景场资料相比,各类掩星数据绝对负偏差小于0.4 K,整体
复合固体推进剂属于高填充比颗粒类复合材料,氧化剂和金属颗粒在基体中的随机分布使其在细观尺度具有非均质的特点。从细观尺度研究固体推进剂燃烧及力学性能时,必须考虑颗粒级配、空间分布和种类等因素的影响。采用分子动力学方法,以硝酸酯增塑聚醚高能复合固体推进剂为研究对象,将固体颗粒模型化为球形,生成其在基体内随机分布的颗粒填充模型。利用Monte-Carlo算法模拟计算颗粒填充模型细观结构的两点概率函数,并研究了颗粒填充体积分数、尺寸与级配等参数对其的影响规律。从统计意义上给出具有各态历经性、统计均匀性和各向同性特
为了降低"相似性漂移"问题的影响,提出一种基于"邻域传播"的匹配策略,将待查询项的模态内近邻映射到目标空间中,并将它们在目标空间中的最近邻作为查询项的跨模态近邻。基于邻域传播的匹配策略在不改变跨模态映射函数的条件下,可以有效地降低"相似性漂移"带来的误匹配现象。理论和实验分析证明,跨模态映射函数的"相似性漂移"问题广泛存在,而基于"邻域传播"的匹配策略可以有效降低其影响,提高匹配的准确率。
为得到不同温度下石英杂化酚醛材料的渗透率,自主搭建了材料气体渗透率测试平台,提出基于Darcy定律的复合材料气体渗透率的测试方法。对不同温度下石英杂化材料进行研究,测量渗透过程中试验件上下表面气体压力变化和流过试验件的气体流量,进而得到复合材料的渗透率。结果表明:该实验平台可以用来测量复杂孔隙复合材料的渗透率。石英杂化酚醛材料渗透率与热解温度呈正相关,热解温度越高,复合材料的渗透率越大,材料渗透率和热解温度满足关系式K=9.5×10-15T-6.32×10-12
为研究液压水锤效应引起的液体喷溅特性及其影响因素,进行了高速破片撞击充液容器的试验,测试了液体内的空腔振荡特性、压力分布特性和容器外的液体喷溅特性。试验结果表明:液压水锤效应引起的液体喷溅有两个不同的阶段。第一个阶段发生在空腔生长到最大体积后的400~700μs内,喷溅液体的头部呈箭状;在第二个阶段出现多次形状相似的脉动喷溅,且单次脉动均发生在每次空腔溃灭之后,喷溅液体具有伞状头部与线状尾部。液体内的压力和侵彻孔的形态共同影响液体的喷溅速度,相对喷溅速度与破片的撞击速度成反比。喷溅液体在运动过程中存在速度