基于深度强化学习的车辆自主避撞决策控制模型

来源 :汽车安全与节能学报 | 被引量 : 0次 | 上传用户:crazyapple123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高车辆对行驶环境的自我学习和决策能力,提出了一种基于深度确定性策略梯度(DDPG)的车辆自主避撞决策控制模型。基于Markov决策过程的强化学习理论和车辆纵向运动学特性,设计了决策所需目标对象及自车信息的状态空间和自车减速度的动作空间,以安全性、舒适性和效率因素为多目标奖励函数的端到端的车辆自主避撞决策模型。利用Matlab/Simulink构建的DDPG算法与交通环境的交互模型,通过了前车静止(CCRs)和前车制动(CCRb)场景测试。结果表明:本决策算法具有很好的收敛性,引入加速度和冲击度的极限值
其他文献
研究了粉煤灰-钢渣-水泥复合胶凝材料的水固比、原料配比、养护时间、CO2压力等因素对固碳率和抗压强度的影响。实验结果表明,采用50%钢渣与10%粉煤灰掺比的试件,在剩余水固比w/s=0.25时达到了最高的固碳率和抗压强度。当CO2养护压力由0.2 MPa上升到2 MPa时,固碳率提高了45%。XRD分析表明与自然养护对比,经矿化养护后样品生成了大量碳酸钙;SEM分析观察到矿化养护后矿化产物CaCO3相互交织,填充了孔隙,使微观结构更加致密,
为给无人驾驶车辆精确制定城市路口通行轨迹提供先验信息,提出了在边缘计算平台中基于驾驶员意图分类和Bezier曲线相结合的轨迹预测算法。分析2个路口230辆车的真实通行数据,提出了基于支持向量机的驾驶员意图识别算法,预测路口车辆直行、左转及右转的概率;用基于Bezier曲线和代价函数相结合的通行轨迹预测方法,预测其路口通行轨迹。结果表明:经过与采集的120辆车的实际数据对比,驾驶员意图分类算法准确度在92.5%以上,车辆预测轨迹与真实轨迹间最大偏差范围在22.3~57.9 cm之间,所有车辆预测轨迹与真实轨