基于强化学习算法的多机器人系统的冲突消解策略

来源 :控制与决策 | 被引量 : 0次 | 上传用户:greenbrowser
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多机器人系统中,随着机器人数目的增加.系统中的冲突呈指数级增加.甚至出现死锁.本文提出了基于过程奖赏和优先扫除的强化学习算法作为多机器人系统的冲突消解策略.针对典型的多机器人可识别群体觅食任务.以计算机仿真为手段,以收集的目标物数量为系统性能指标,以算法收敛时学习次数为学习速度指标,进行仿真研究,并与基于全局奖赏和Q学习算法等其他9种算法进行比较.结果表明所提出的基于过程奖赏和优先扫除的强化学习算法能显著减少冲突.避免死锁.提高系统整体性能.
其他文献
近年来,在大学英语教学中,混合式小组学习模式得到了更为广泛的应用。该模式打破了传统大学英语教育的僵硬化局面,强调了学习中的合作精神,实现了学生的个性表达。本文主要针
针对基于Kalman滤波的跟踪方法需要对噪声特性和车辆的运动规律进行假设的不足,提出一种基于灰色预测模型GM(1,1)的运动车辆跟踪方法.该方法通过不断更新的灰色预测模型GM(1,1),挖掘出车辆的当前运动规律,从而对车辆的运动位置进行快速准确的预测;然后根据预测结果搜索出运动车辆,实现运动车辆的跟踪.试验结果表明,该方法在不需要假设的条件下,能够较快较好地实现车辆跟踪.
提出一种求解多目标函数优化的元胞蚂蚁算法.该方法将元胞自动机演化规则引入蚂蚁算法,给出了在连续空间多目标函数优化的算法描述,定义了与蚂蚁信息素释放有关的元胞演化规则及
在陕南山区,常见危害核桃较重的虫害主要有核桃小吉丁虫、豹纹木蠹蛾、银杏大蚕蛾、芳香木蠹蛾、核桃举枝蛾、黄须球小蠹和云斑天牛等,通过对发生情况的调查和防治试验等情况
目的补肾活血汤在多囊卵巢综合征促排卵方案中的疗效。方法将120例多囊卵巢综合征不孕患者随机分为西药组和中药组各60例,西药组给予枸橼酸氯米芬促排卵治疗,中药组在西药组
为了削弱变结构控制系统的抖振,提出一个新的滑动模态到达条件.分析了该到达条件参数对系统动态性能的影响,讨论了参数的物理实现,并给出了到达时间的简化计算公式.仿真结果
CFG桩复合地基在多层、高层、超高层以及工业厂房等工程的地基处理中被广泛应用,并已取得了非常好的工程成效和经济效益,但其相关的理论及设计方法还有待进一步完善。所以,开展C
目的探讨复方氟米松联合复方乳酸乳膏治疗掌跖部角化性湿疹的临床疗效和安全性。方法选择浠水县人民医院2012年1月至6月皮肤科门诊接诊的掌跖角化性湿疹患者90例,上述所患者