基于强化学习的车辆路径规划问题研究

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:fdc1027267648
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从机器学习的角度理解,车辆路径规划问题(VRP)可转化为单代理有限状态空间的强化学习问题进行研究。针对小规模VRP问题,提出时间差分模型,使用Sarsa和Q-learning算法进行优化。针对大规模VRP问题,构建环境模型,通过蒙特卡洛法优化代理策略和值函数。在公开数据集上的实验结果表明,强化学习能有效求解小规模VRP问题,并在大规模VRP问题上超过一般的启发式算法。
其他文献
建立与垃圾种类相匹配的垃圾分类收运体系是确保垃圾分类制度有效实施的重要一步。生活垃圾分类收运问题属于车辆路径问题范畴。在垃圾分类收运模式下,考虑垃圾种类-车辆类型匹配关键因素,研究多种类垃圾多车型车辆路径优化问题。以车辆启动成本、运输成本之和最小化为目标,建立混合整数规划模型,利用遗传算法予以求解。通过算例仿真验证了模型及算法的有效性,在践行垃圾分类制度上具有实际应用价值。
作文自动评分(AES)技术能够自动地对作文进行分析和评分,其已成为自然语言处理技术在教育领域应用的热点研究问题之一。针对目前AES方法割裂了深层和浅层语义特征,忽视了多层次语义融合对作文评分影响的问题,提出了一种基于多层次语义特征的神经网络(MLSF)模型进行AES。首先,采用卷积神经网络(CNN)捕获局部语义特征,并采用混合神经网络捕获全局语义特征,以从深层次获取作文的语义特征;其次,利用篇章级
针对车联网冷链物流中转与配送目标可被关联的问题,提出一种可有效泛化这种关联,进而保护配送目标的隐私保护算法。基于属性基加密技术,利用车联网中车辆可相互通信这一特点,通过同属性车辆解密建立匿名车辆组;利用匿名车辆组实现关联和配送目标泛化,进而保护配送目标的隐私安全。通过性能分析从理论上证明了安全性和算法效率,利用模拟对比实验,进一步验证了该算法的优越性。
随着市场经济的不断发展,人力资源也逐渐受到社会各界的关注。在IT行业中,由于技术的快速发展与更新换代,企业内对高新技术人才的需求日益加大,企业间对稀缺人才的争夺呈现白热化状态。现有的管理学评估方法难以满足企业需求,为更高效地发掘GitHub中的软件开发人才,基于GitHub软件开发者编程能力、项目管理能力、学习能力、团队合作能力、技术影响力、敬业度建立软件开发者人力资源价值评估体系。使用CNN-L
提出一种改进随机森林算法(SP-RF)。通过建立数据抽样索引表和随机特征索引表来实现随机森林算法在Spark上的并行化;通过计算随机森林算法中每个决策树的AUC值来给分类能力不同的决策树分配权重;提高随机森林算法在投票环节的分类精度。实验结果表明改进后的随机森林算法分类精度平均提高5%,运行时间平均减少25%以上。
误差在系统中是普遍存在的。在安全关键系统中,对误差的定量分析是必要的,而以往的推理验证方法较少考虑误差。误差通常用区间数来刻画,从而推广了线性断言,并给出了线性误差断言的概念。此外,结合凸集的性质,提出了求解线性误差断言顶点的具体方法,并验证了该方法的正确性。通过分析相关概念及定理,将判断线性误差断言之间的蕴含关系的问题转化为前驱断言的顶点是否被包含在后驱断言的零点集的判断问题,从而给出了判断线性
针对哈里斯鹰优化(HHO)算法存在的收敛精度低、收敛速度慢、易于陷入局部最优的不足,提出了一种混沌精英哈里斯鹰优化(CEHHO)算法。首先,引入精英等级制度策略,以充分利用优势种群来增强种群多样性以及提升算法收敛速度和精度;其次,利用Tent混沌映射调整算法关键参数;然后,使用一种非线性能量因子调节策略来平衡算法的开发与探索;最后,使用高斯随机游走策略对最优个体施加扰动,并在算法停滞时,利用随机游
针对蝙蝠算法存在易陷入局部最优、后期收敛速度慢及收敛精度低等问题,提出一种改进的并行蝙蝠算法(IPBA)。设计一种基于免疫浓度的混沌初始化,选择出适应度高、浓度低的个体组成更高质量的初始群体;引入并行策略,将种群分为探索与开发两个子群体,采用不同的惯性权重和停滞变异策略分别进化,可有效防止早熟,并加快算法收敛速度。此外,子群体间定期进行个体迁移和信息交换,充分发挥并行优势,提高算法的整体性能。通过
雾计算是部署在网络边缘的分布式系统,任务调度是雾计算中最重要的研究问题之一。针对雾计算环境下任务请求的合理调度问题,提出基于雾计算的遗传蚁群算法。算法前期利用遗传算法快速搜索能力避免蚁群算法前期搜索能力不足的问题,后期利用蚁群算法正反馈的特性进行解空间的搜索。仿真实验结果表明,该算法在CPU执行时间和分配内存方面优于传统的遗传算法和蚁群算法。
针对传统环境下运行的推荐算法预测精度不高的问题,提出一种基于矩阵分解和随机森林算法的推荐模型。提出的基于数据分割策略和新的学习过程的分布式推荐模型是在Apache Spark上设计的。通过数据分区、模型训练和偏好预测三个步骤处理大规模数据,提高预测质量,解决数据稀疏问题。为了提高模型在大数据环境下的性能,采用基于矩阵分解(Matrix Factorization, MF)和随机森林(Random