强化学习和仿真相结合的车间作业排序系统

来源 :控制与决策 | 被引量 : 0次 | 上传用户:dafeizz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
设计了一个强化学习和仿真相结合的动态实时车间作业排序系统.首先引入多个随机变量,将车间作业排序问题转换成序贯决策问题;然后通过仿真手段构建车间作业排序问题的模型环境,求取系统性能指标并保证解的可行性;接着设计了一个多智能体Q学习算法和仿真集成解决作业排序问题;最后通过仿真优化实验验证了该系统的有效性.
其他文献
H∞滤波通常应用于系统模型和噪声特性不确定的环境,存在滤波精度不高的缺点.通过对H∞滤波引入闭环修正,在不影响滤波鲁棒性的前提下,有效地提高了系统精度.无源北斗/SINS组
对一类具干扰的捕食一食饵模型进行了研究,讨论了该系统的平衡点的性态,证明了该系统的全局稳定性和闭轨存在性.
20世纪以来,现代西方哲学渐渐形成了解释学和分析哲学两大阵营,实用主义与分析哲学走向融合,实用主义从皮尔士发展到罗蒂、普特南等新实用主义者。分析考察伽达默尔与罗蒂在“对
针对一种典型的动态迟滞模型。提出一种基于动态滑模原理的跟踪控制器.通过构造辅助的滑模变量来实现动态滑模控制的两阶段收敛.在保证系统状态有限时间收敛的前提下.求取了滑模
提出一种混合粒子群优化算法,即在改进粒子群优化算法全局搜索模型参数的基础上,利用梯度下降法进一步确定径向基神经网络模型参数,以提高网络的收敛精度和网络性能.采用基于
对于一类状态不可测非线性互联时滞系统,给出一种基于观测器的模糊分散输出反馈控制方法.首先采用模糊T-S模型对非线性互联时滞系统进行模糊建模,在此基础上给出了模糊分散观
建立新的实验中心运行模式与机制,可更好地为教学、科研和社会服务.在教学、社会服务、管理等方面采用实践法对实验中心进行开放模式的改革,以充分发挥实验中心在人才培养方面的