MMDP相关论文
强化学习为多Agent之间的协作提供了鲁棒的学习方法.本文首先介绍了强化学习的原理和组成要素,其次描述了多Agent马尔可夫决策过程......
根据某种GPRS通信中信道分配的要求,分析了动态信道的变化规律为一马尔柯夫调制定长过程(MMDP);建立了D/MMDP/1/K排队模型;导出了......