基于改进深度强化学习方法的单交叉口信号控制

来源 :计算机科学 | 被引量 : 0次 | 上传用户:caiql
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用深度强化学习技术实现路口信号控制是智能交通领域的研究热点。现有研究大多利用强化学习来全面刻画交通状态以及设计有效强化学习算法以解决信号配时问题,但这些研究往往忽略了信号灯状态对动作选择的影响以及经验池中的数据采样效率,导致训练过程不稳定、迭代收敛较慢等问题。为此,文中在智能体模型设计方面,将信号灯状态纳入状态设计,并引入动作奖惩系数来调节智能体动作选择,以满足相位最小绿灯时间和最大绿灯时间的约束。同时,结合短期内交通流存在的时序相关性,文中采用优先级序列经验回放(Priority Sequence E
其他文献
随着养殖水平不断提高以及居民对猪肉制品消费和需求的不断增加,我国生猪养殖规模的不断扩大,目前生猪存栏量、出栏量均较前期有所提高。我国养猪业在不断发展的同时,也在面
随着多体系统动力学理论和计算机技术的发展,矫形器的计算机辅助设计和制造(CAD,CAM)技术已经日趋成熟,利用这项新技术可建立人体和矫形器的数学力学模型,通过模拟计算来确定矫形器
9月百城新建住宅均价同比保持上涨态势,但涨幅不大。短期来看,房价大涨的概率不大。在因城施策环境下,部分房价、地价存较强上涨预期的城市仍会进一步升级楼市政策,以稳定预期。  9月房价小幅上涨  9月房价持续上涨,不过涨幅依旧维持在合理范围之内。  根据中国房地产指数系统对100个城市的新建住宅样本调查数据,2020年9月,百城新建住宅均价15643元/平方米,同比上涨3.26%,涨幅较上月收窄0.0
针对传统分布式日志系统存在的问题,提出了一种高性能低时延的分布式日志系统方案。通过多项关键技术,有效提升了设备和日志服务器之间通信的吞吐量,降低了传输时延,减轻了对
目的研究Notch基因在小鼠牙髓干细胞样细胞表达.方法采用酶消化培养法获得小鼠的单个牙髓细胞悬液,调整细胞密度为1×10 4个/孔细胞,干细胞培养液培养14 d,挑选细胞克隆
[目的]了解全国31个省(自治区、直辖市)中医药健康产业的竞争力水平。[方法]采用因子分析、层次聚类分析等统计分析方法评价我国31个省(自治区、直辖市)中医药健康产业的区域