状态行为空间相关硕士博士期刊学术论文 - 搜论网

状态行为空间相关论文

一种共享经验元组的多agent协同强化学习算法

Q学习算法是一种最受欢迎的模型无关强化学习算法。本文通过对Q学习算法进行合适的扩充,提出了一种适合于多agent协作团队的共享经......

期刊

多agent学习强化学习 Q学习状态行为空间协作团队

多agent协同强化学习算法SE—MACOL及其应用

针对多agent团队中各成员之间是协作关系且自主决策的学习模型，在此对Q学习算法进行了适当扩充，提出了适合于多agent团队的一种共享......

期刊

多AGENT学习强化学习 Q学习状态行为空间协作团队 multi-agent learning reinforcement learning Q-

看过本文同时还关注