【摘 要】
:
随着智能网联车辆(Connected and autonomous vehicle CAV)技术的发展,城市道路和高速公路中的交通控制方法得到了智能化地发展。针对现有高速公路施工区局部单点交通控制方法的局限性,本文提出了基于多智能体强化学习的高速公路施工区协同多点交通控制方法,并搭建在线仿真平台对该控制方法和控制效果进行可视化分析与验证。本文针对多智能体强化学习算法于高速公路施工区智能网联车辆运行
论文部分内容阅读
随着智能网联车辆(Connected and autonomous vehicle CAV)技术的发展,城市道路和高速公路中的交通控制方法得到了智能化地发展。针对现有高速公路施工区局部单点交通控制方法的局限性,本文提出了基于多智能体强化学习的高速公路施工区协同多点交通控制方法,并搭建在线仿真平台对该控制方法和控制效果进行可视化分析与验证。本文针对多智能体强化学习算法于高速公路施工区智能网联车辆运行控制展开相关研究,主要工作涉及以下几方面:首先,借鉴并分析主动交通管理中可变限速控制方法的优劣性,在高速公路施工区处,提出了车辆汇入控制,通过实时调整施工处多车辆之间的车头时距,以此改变施工区多车辆之间的跟驰状态;接着分析施工区上游交通量分布不均匀问题,通过换道间隙识别并结合车辆汇入控制机制,提出多车辆提前换道控制,达到施工区上游交通流提前分配的目的;其次,应用强化学习中的分布式多Agent在线SARSA算法,将汇入控制和提前换道控制进行联立,实现车辆在施工区前多控制区域之间的协同控制;另外,建立多Agent中的协同汇入和换道动作,以车道占有率和交通量为状态监测,车辆停车次数和所构建的密度函数为联合奖赏,并借助协作图法将多Agent中的相邻Agent纳入一个多维Q矩阵,确保每个Agent在更新本体Q值时能够考虑到相邻Agent的交互作用下寻找全局最优结果,克服了集中式多Agent强化学习中随着Agent数量的增长使得Q值矩阵呈指数增长的问题。最后,结合MATLAB和VISSIM COM搭建了在线交互仿真平台,并对所提出的控制进行仿真评价;记录学习过程中奖赏值和Q值的更新迭代过程,验证算法结果的敛散性;提出了四个方案进行对比分析,并可视化四种方案下的全局车辆运行轨迹;选用多个指标验证控制的优化效果。在对比结果中表明,所提出的控制方法性能优于现有的局部可变限速理论,车辆的行驶轨迹较其他方案下更加平顺。此外,在所选指标下,优化效果显著。上述研究结果表明,本文提出的基于多智能体强化学习的高速公路智能车辆运行控制研究,能够显著提升高速公路施工区路段的运行效率,可以克服现有瓶颈路段中局部单点控制的缺点,可为智能网联车辆运行控制和技术发展提供科学的方法。
其他文献
伴随着汽车保有量的增加,我国交通运输业在工业和建筑业之后成为第三大温室气体排放源,被认为是交通减排最难实现的一环。同时城市化和机动化的快速发展,使得城市交通系统更加复杂,居民出行越来越受到建成环境的制约,给城市可持续发展带来严峻挑战,注重城市建成环境对交通减排的主动式干预已经成为城市管理的重点之一。城市建成环境涉及的要素种类众多,在空间区域上存在较大差异,因此在交通排放与建成环境影响关系的研究上不
随着我国科学技术和经济的发展,越来越多的大坝、港口、大桥和高层建筑物等基础性设施被建设完成,这些设施的建设过程难度很大,且对安全性要求也很高,往往在施工以及后续运行管理时都需要进行形变监测,因此,对于工程结构的稳定性以及变形进行监测变得至关重要。另外,人类的生产生活活动的不断加剧对自然环境也造成一定程度的破坏,再加上降雨、洪水和地质构造的运动造成自然灾害频繁发生,这些灾害的发生主要有以下特点:发生
城市的快速发展给城市道路交通运行带来巨大压力,交通作为城市的重要功能之一,与人们的日常生活紧密相关,然而日益严重的交通拥堵问题制约了城市的发展建设和交通运行效率,给人们的日常生活带来极大的不便和困扰。以往对于交通拥堵的研究主要是通过流量参数进行分析评价,而对于拥堵持续时间的研究较少。而在实际出行时,出行者不仅关心交通状态是否处于拥堵,也会关注拥堵状态什么时候结束,拥堵会持续多长时间,拥堵持续时间的
换道是最常见的微观驾驶行为之一,在复杂的动态环境中,智能车辆能否做出正确的换道决策且实现安全、舒适的换道是自动驾驶技术的一个难点。本文针对智能车辆换道决策和轨迹规划等方面展开了详细的研究,旨在避免不当的智能车辆换道行为,实现智能车辆安全、舒适的动态换道,同时在缓解交通压力、减少交通事故的方面也具有重要的意义。首先,本文将智能车辆换道过程分为常见的两个阶段-换道决策阶段和换道实施阶段。在换道决策阶段
西汉水流域上游地处青藏高原和黄土高原的交汇地带,构造活动强烈,生态环境脆弱,泥石流灾害严重。因此开展泥石流危险性评价,对当地防灾减灾有着重要的意义。本文以陇南市西汉水上游流域为对象,在野外地质调查的基础上,结合区域自然环境背景,总结了泥石流的发育分布特征与类型,分析了该区泥石流灾害的形成条件、影响因素及典型泥石流的成因机制。在此基础之上,采用确定性系数法,从流域单元出发,对西汉水流域上游泥石流灾害
地裂缝是一种区域性的城市地质灾害,广泛分布于世界各地。西安地区由于大量抽取地下水已陆续出现14条地裂缝,工程建设及土地规划受到了严重的危害。以往对于地裂缝的研究往往侧重于地裂缝对工程建筑的破坏机理与防灾举措,对于开采地下水导致的地裂缝活动机理并不十分明晰。同时,近年来地下水开采被加以限制,地裂缝活动速率随之减小。而地裂缝场地建筑仍按抽水活动高峰期所规定的安全距离进行避让,造成土地资源的浪费。因此,
大跨径桥梁作为交通网的关键节点,其重要性不言而喻,长周期地震动作用下大跨径桥梁等长周期结构的地震响应显著。随着抗震设计理论的不断完善,基于能量的抗震分析方法研究也越来越深入。本文在已有研究的基础上,建立了长周期地震动输入能设计谱,提出了长周期地震下超高桥塔地震输入能的估算方法,为大跨径桥梁基于能量反应谱的抗震设计和性能评估提供有益参考。主要内容包括:(1)比较长周期地震动和普通地震动的差异,确立长
黄河源区是我国重要的生态屏障,也是中华水塔之一。在全球气候变暖和人类活动日益加剧的时代背景下,近50年黄河源区的气象和水文条件发生了显著变化,出现了径流减少、极端气候发生频率越来越高等问题。潜在蒸散量(Potential evapotranspiration,Ep)是衡量地表水量损失的重要参量,也是指示极端气象事件的重要指标之一。研究多尺度下潜在蒸散发特征及其变化趋势,对黄河流域的水资源管理及应对
如何快速获取范围大、现势性强的路网数据,实现道路网络的自动更新一直是智慧交通和智能城市建设亟待解决的问题。以车载或手持GPS运动轨迹为代表的众源轨迹数据具有体量大、信息内容丰富、获取成本低、现势性高等优势,为路网数据的自动化采集提供了一种新的手段和方式,通过GPS轨迹数据可以快速直观地提取出道路的几何位置、网络拓扑、和交通状态等信息,是近年来测绘遥感和智能交通行业研究的热点。低精度GPS轨迹数据现
我国高速公路隧道建设快速发展,随之而产生的隧道照明能耗问题也逐渐增加。据统计,当前高速公路隧道运营的所有费用中,有90%的费用是用于支付隧道照明用电。因此,在保证隧道照明安全的前提下,减少隧道照明的能耗是当前研究的方向和重点。开展对隧道照明节能控制技术的研究并建立与之匹配的隧道照明绿色评价体系,用以提升隧道照明节能控制水平及促进节能控制技术的应用,对隧道照明的和谐发展具有重要意义。本文以某高速公路