基于多智能体强化学习的城市自适应交通信号控制方法研究

来源 :长安大学 | 被引量 : 6次 | 上传用户:gegengwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
城市社会经济发展到一定程度时,城市道路往往会出现不同程度的拥堵现象,为了克服现有城市道路信号控制方法存在的各种局限性,本文提出基于马尔可夫决策过程的最优搜索型强化学习的城市道路自适应信号控制方法,并搭建仿真平台对所提出的自适应信控方法的有效性进行验证。本文针对智能体技术应用于城市道路自适应信号控制方法展开相关研究,主要工作涉及以下几个方面:首先,对现有信控方法的局限性进行充分调查并提出基于强化学习的自适应信控方法,考虑邻域交叉口的交通压力对Agent所处环境的状态和动作选择策略进行定义,以停车次数的变化值作为Agent状态动作对之间转换获得的奖励值;接着,结合VISSIM交通仿真软件的仿真建模能力、VB系统的图形用户界面和快速应用程序开发能力以及MATLAB系统强大的矩阵运算能力和绘图能力,利用COM组件的生成和调用搭建基于VISSIM-VB-MATLAB的交互仿真平台,对本文提出的自适应信号控制方法的有效性进行仿真验证;另外,抽取部分迭代学习过程作为观察对象,分别记录学习过程中的各交叉口信控方案即各Agent选取的动作,以及对各Agent的Q表进行可视化处理;最后,以交叉口总停车次数以及总行程延误作为交通运行效率评价指标,以定周期信控模式下交叉口停车次数和行程延误检测数据为控制组,以自适应信控模式下交叉口停车次数和行程时间检测器数据为实验组,利用SPSS统计分析软件进行配对样本t检验。实验数据表明,自适应信号控制模式下的交叉口运行效率显著高于定周期信号控制模式下的交叉口运行效率,相较于定周期信号控制模式,本文提出的自适应信号控制方法可以降低交叉口11.3%-51.8%的停车次数以及13.1%-48.7%的行程延误。上述研究结果表明,本文提出的基于多智能体强化学习的城市自适应交通信号控制方法是一种有效的信控方法,可以显著提升区域内各交叉口的运行效率,且可以弥补定周期信号控制模式无法适应动态交通需求的不足,可替代目前广泛采用的定周期信控方法对城市道路交叉口交通流进行有效控制。
其他文献
北京农学院园林专业是北京市品种建设专业和特色专业,生态文明建设战略和京津冀协同发展战略的实施给园林专业建设提出了更高的要求,着力培养具备社会责任感、团队合作精神、
王珪(1019-1085),字禹玉,祖籍華陽(今四川成都),生於舒州(今安徽潛山),北宋相臣,工於文章、書法,事跡主要見於李清臣《王文恭公珪神道碑》,以及《宋史》《續資治通鑒長編》和宋人筆記等。世人對其評價与史实多有龃龉。時人謂之“三旨宰相”,四库館臣亦言其“人品事业,皆无可取”。勾稽史料,可知王珪於貢舉變革、政權更迭等方面頗有政績。文学方面,其造詣亦稱頌於世,宋人輯其詩文爲《華陽集》,後散佚,清
低温是影响农作物产量的主要限制因子之一。本实验室以拟南芥32个核心生态型为试材,在研究拟南芥CBF3基因的单核苷酸多态性(SNP)过程中,发现抗寒生态型203AV的CBF3等位基因的单
一个民族在文化内容、形式、精神等方面形成可传承且统一的独特性,即艺术民族性。黄宾虹言:“画有民族性,而无时代性;虽有时代改变外貌,而精神不移”,中国绘画艺术在民族特有的审美精神下是可以穿越时空的,与过去未来者对话的。除了如齐白石所论造化与艺术的关系妙在似与不似之间,中国画的继承与创新相对前人作品而言也在“似与不似之间”。似者民族审美之精神也;异者个人风格之体貌也,即“源与流”的关系。一个民族的真正
AP1000压水堆核电站主蒸汽管台是主蒸汽管道上重要的组成部分之一,承受较大热冲击和热瞬态,疲劳强度大,对焊接质量要求非常高,不同于国内外其他核电,AP1000核电采用带有裙座
巨大的餐饮市场对于人才的需求不断加大,而在我国餐饮业中,员工的过高流动率已是众多餐饮企业所面临的一个重要问题。以动态的目光着眼于吸引、发现和发挥人才的作用。注重员
土地利用变化对区域生态环境会造成一定的影响,从景观生态学角度对区域生态安全进行评价具有重要的研究意义。为揭示典型喀斯特高原湿地区域景观生态安全状况对土地利用变化
化学课堂是培养学生核心素养的载体。以"溴碘的提取"为例,探讨证据推理、实验探究、变化观念等化学核心素养要素的功能,总结培养与提升学生化学学科核心素养的策略,并对案例
目的利用CBCT和三维影像重建技术分析上颌阻生尖牙及其导致的邻近牙齿牙根吸收的基本情况,并且探讨上述基本情况与年龄的关系。方法严格按照实验纳入标准,选取大连市口腔医院
有限元法是一种为求解偏微分方程边值问题近似解的数值技术,分为三个阶段:有限元模型的建立、有限元计算、结果处理。当采用有限元法对高速爆炸、流体力学、高速碰撞等几何非