论文部分内容阅读
在生产制造业中,存在一类带有不相容工件簇的批处理机调度问题;其中,不相容工件簇是指属于不同簇的工件不能被安排在同一批中加工。本文研究了不相容工件簇在单台批处理机上的随机调度问题,其中工件具有随机的到达时间和加工时间。本文首先根据不相容工件簇在单台批处理机上的分批加工特点,以缓冲库的库存量为实时状态,以最小化系统长期平均代价为优化目标,建立了半马尔可夫决策过程模型。然后,在此模型的基础上,通过策略迭代算法求解其最优控制策略,并分析了不同缓冲库容量对系统工件流失率的影响。最后,针对工件簇总数增大时引起的“维数灾”问题,给出了基于模拟退火的Q学习算法;并分析比较了工件簇总数为二和三时,两种算法的优化效果以及工件到达率和处理率对系统性能的影响。在现代化先进生产环境中,为了减少库存成本和生产浪费,单纯以追求生产效率为目标的传统生产模式已逐渐被及时生产(just in time,JIT)方式所替代。JIT生产方式是指在需要的时候,按需要的量生产所需的产品,因此本文研究了需求驱动下不相容工件簇的单机随机调度问题。首先,以缓冲库和成品库的库存量为联合状态,以最小化系统长期平均代价为优化目标,建立了半马尔可夫决策过程模型。由于需求驱动系统模型具有较大的状态空间,为了避免理论求解的“维数灾”问题,通过基于模拟退火的Q学习算法分析了不同需求类型对系统性能的影响。最后,通过仿真结果分析说明了所建模型的合理性以及优化算法的有效性。