论文部分内容阅读
机器人动态操作任务是指在对运动目标进行识别、判断、分析或预测的基础上,进行相关操作的动态规划、学习、模拟和控制等。它是智能机器人研究领域中的一个前沿应用课题,在航天、工业、体育娱乐等领域有着极其广阔的应用前景。
相对静态操作任务而言,机器人实现动态操作任务所遇到的最大挑战在于其作业环境,即作业目标的运动不确定性。因此,如何面对运动目标而保持或提高机器人各项操作活动的成功概率显得至关重要,其关键就是如何进行运动规划。传统运动规划方法的计算量较大以及机器人和运动目标的精确模型难以获得等问题,给运动规划提出了新的课题和挑战。
本文提出以学习控制为解决途径,利用已有规划结果进行学习以及通过与环境的交互过程进行自主规划。在传统的运动规划方法基础上,通过模仿人类的记忆学习和试探性学习模式,采用案例学习和增强学习实现自主运动规划和控制,以提高系统的学习能力。
本文主要完成以下几方面的工作:1.动态操作任务的多智能体运动规划框架以打击任务为例,建立单机器人的多智能体运动规划体系结构,将传统和智能规划方法结合起来实现一种具有强智能的运动规划。这种体系结构可产生一般分层递阶式或包容式结构难以达到的灵活性和智能性。本文建立的多智能体运动规划结构由若干个称为功能模块的智能体和一个中心黑板组成。每个智能体代表运动规划的一个子任务,它由接口和知识源组成。接口接受由黑板模型激活的任务,然后该智能体利用自身的知识源进行子任务求解,结果放在黑板中供黑板推理和激活其他智能体。
2.基于目标预测的运动规划旨在为后续研究基于案例学习的运动规划提供学习案例。通过模糊规则确定动作目标的位置约束,仿真表明该方法确定的动作目标可以更小的速度达到相同的打击效果,这无疑对控制是有利的。由于运动目标存在随机性,期望机器人的动作具有较大的可操作性和基于任务的操作灵活性。本文以机器人可操作度和路径长度的加权作为优化目标进行路径规划,再以任务方向的可操作度进行轨迹规划。仿真结果表明本文轨迹规划方法可使机器人的任务操作灵活性得到提高。
3.运动规划案例学习及其实现针对传统运动规划方法需要系统精确模型等问题,本文提出案例学习的规划方法。首先对机器人的运动能力进行判别,然后对运动目标与机器人的交互过程进行分析,得到确定机器人动作目标的三个映射关系。对于案例数量有限问题,提出采用支持向量机作为案例学习的实现方法。由于实际应用中不同的案例具有不同的重要程度,采用加权支持向量机实现案例学习。仿真分别采用神经网络、支持向量机和加权支持向量机,结果表明,基于支持向量机的案例学习实现方法在精度、泛化能力和对样本数据依赖程度优于以神经网络为代表的传统方法,更适于案例学习;而加权支持向量机比标准支持向量机精度更高。
4.自主运动规划增强学习是一种不需要系统精确模型的学习方法,且不需要样本数据,它在与环境的不断交互中学习,可以实现自主的运动规划,避免复杂的运动学逆解。本文对动态操作任务的运动规划问题进行分析:将机器人的关节角和运动目标的状态作为输入变量,关节角变化作为输出变量;采用目标分解的方式,将动态操作任务的位置、姿态和速度匹配程度的加权作为强化函数;为适应连续的动作输出,采用自适应启发评价算法进行学习。针对影响增强学习应用的学习速度问题,将案例学习融入增强学习中,用于辅助值函数学习和动作生成。以位置匹配为例进行仿真,结果表明基于案例的强化学习可以明显提高学习速度。
本文有关机器人动态操作任务运动规划和学习控制的相关研究,将提高机器人动态操作的智能水平,拓展机器人的应用领域,在理论和应用上都具有一定的借鉴作用和参考价值。