基于强化学习的车辆路径规划问题研究

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户：fdc1027267648

【摘要】

：

从机器学习的角度理解,车辆路径规划问题(VRP)可转化为单代理有限状态空间的强化学习问题进行研究。针对小规模VRP问题,提出时间差分模型,使用Sarsa和Q-learning算法进行优化。针对大规模VRP问题,构建环境模型,通过蒙特卡洛法优化代理策略和值函数。在公开数据集上的实验结果表明,强化学习能有效求解小规模VRP问题,并在大规模VRP问题上超过一般的启发式算法。

【作者】

：

刘虹庆王世民

【机构】

：

北京工商大学计算机与信息工程学院

【出处】

：

计算机应用与软件

【发表日期】

：

2021年08期

【关键词】

：

车辆路径规划强化学习时间差分法蒙特卡洛法启发式算法

【基金项目】

：

北京市科委科技计划项目(Z19110000861907)。

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

一种基于Spark的改进随机森林算法

提出一种改进随机森林算法(SP-RF)。通过建立数据抽样索引表和随机特征索引表来实现随机森林算法在Spark上的并行化;通过计算随机森林算法中每个决策树的AUC值来给分类能力不同的决策树分配权重;提高随机森林算法在投票环节的分类精度。实验结果表明改进后的随机森林算法分类精度平均提高5%,运行时间平均减少25%以上。

期刊

随机森林SPARKAUC并行化大数据

混沌精英哈里斯鹰优化算法

针对哈里斯鹰优化(HHO)算法存在的收敛精度低、收敛速度慢、易于陷入局部最优的不足,提出了一种混沌精英哈里斯鹰优化(CEHHO)算法。首先,引入精英等级制度策略,以充分利用优势种群来增强种群多样性以及提升算法收敛速度和精度;其次,利用Tent混沌映射调整算法关键参数;然后,使用一种非线性能量因子调节策略来平衡算法的开发与探索;最后,使用高斯随机游走策略对最优个体施加扰动,并在算法停滞时,利用随机游

期刊

哈里斯鹰优化算法混沌算子等级制度随机游走非线性权重基准测试函数

基于遗传蚁群算法的雾计算任务调度研究

雾计算是部署在网络边缘的分布式系统,任务调度是雾计算中最重要的研究问题之一。针对雾计算环境下任务请求的合理调度问题,提出基于雾计算的遗传蚁群算法。算法前期利用遗传算法快速搜索能力避免蚁群算法前期搜索能力不足的问题,后期利用蚁群算法正反馈的特性进行解空间的搜索。仿真实验结果表明,该算法在CPU执行时间和分配内存方面优于传统的遗传算法和蚁群算法。

期刊

遗传蚁群算法雾计算式任务调度

基于强化学习的车辆路径规划问题研究

其他学术论文