应用深度强化学习的压边力优化控制

来源 :哈尔滨工业大学学报 | 被引量 : 0次 | 上传用户:guo20
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为改善板料拉深制造的成品质量,采用深度强化学习的方法进行拉深过程的压边力优化控制.提出一种基于深度强化学习与有限元仿真集成的压边力控制模型,结合深度神经网络的感知能力与强化学习的决策能力,进行压边力控制策略的学习优化.基于深度强化学习的压边力优化算法,利用深度神经网络处理巨大的状态空间,避免了系统动力学的拟合,并且使用一种新的网络结构来构建策略网络,将压边力策略划分为全局与局部两部分,提高了压边力策略的控制效果.将压边力的理论知识用于初始化回放经验池,提高了深度强化学习算法在压边力控制任务中的学习效率.实
其他文献
本文讨论了用时域有限差分法计算在平面电磁波照射下人体对电磁能量的吸收问题。计算了各种入射方向和极化条件下非均匀块状人体模型中的局部比吸收率(SAR)分布。计算结果表明,人体并不总是在正面入射时吸收能量最多;同时还表明,局部比吸收率比平均比吸收率更值得重视,因为局部吸收率的最大值往往比全身平均值大几倍到十几倍。本文的计算结果丰富了人们在人体电磁剂量学方面的知识。
在鱼类池塘养殖过程中,为什么会突然出现鱼不喜吃食或停食现象,对此通过看水色,查水质,镜检浮游生物组成,检查鱼体病情和肠道食物情况,其原因与投饵、用药、水等有着密切的关
本文应用Volterra级数和谐波平衡技术分析了一个互感耦合非线性振荡电路在外电动势作用下的频率占据现象。导出了占据带宽表达式。这种方法在建立好系统模型后只需进行代数运
采用生态影响评价的工作方法,以中山陵园风景区外缘景区为例,在分析外缘景区生态现状的基础上,从土地利用与水土流失状况、森林群落状况、生物多样性、生态系统等方面对规划产生
国土资源部内网门户内容管理与发布系统是内网门户网站的技术支撑系统,基于部机关业务需求和特点开发和设计,支撑了网站内容与应用的管理、开发和运维。本文从系统架构、技术
随着国内外交通运输行业、建筑市场逐渐走向成熟,建筑业、房地产业、项目投资方、建设监管单位等在工程建设活动和日常经营管理中所涉及的合同风险及法律事务越来越多;而且对
本文对TiO_2陶瓷晶界层电容器进行了较为系统的研究。用液相喷雾干燥法制备含Nb~(5+),Ba~(2+)微量杂质的TiO_2超细原料粉末,研究了TiO_2陶瓷的电性能与烧结温度和测试条件的
为解决传统解耦算法在非线性m输入m输出(MIMO)系统中参数整定工作量非常大、整体控制性能不佳的问题,提出非线性MIMO系统的自解耦(self-decoupling control,SDC)法.SDC法利用
<正> 在临床上,有大约50%的冠状动脉粥样硬化形成与血浆中胆固醇浓度升高,血管壁大量脂质沉积有关。然而,虽然人们采取了积极的预防性干预措施,心血管病仍是人类死亡的主要原
本文从严格的场匹配方法出发,对电磁波在矩形截面光栅上的反射和衍射进行了理论研究。对这种光栅作为频率扫描天线的计算显示出,不论满足或不满足布喇格条件,在较宽的角度范