基于深度强化学习的自动泊车控制策略研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:sjzshiyijshan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前汽车行业的发展重心正逐步由传统车辆向智能车辆转移,随之带来的是智能驾驶技术的迅速发展。自动泊车系统是智能驾驶技术的研究方向之一,通过在泊车过程中给予驾驶引导或者完全代替驾驶员进行泊车操作,有效地提升了泊车成功率,降低了交通事故发生几率。同时,由于停车位狭小、停车不规范,驾驶员常常面临泊车困难的局面。因此,自动泊车系统成为了当下各大车企与高校的研究热点。首先,本文对自动泊车系统的研究现状进行分析与总结,选择自动泊车系统中的泊车控制策略作为本文的研究重点,总结了现有的自动泊车控制策略以及存在的问题。基于高斯坐标系以及传统的车辆坐标系构建泊车坐标系。以车辆的运动学原理为基础,对汽车参数与停车位参数进行简化。基于阿克曼转向原理建立汽车的运动学模型,以平行、垂直泊车为泊车场景,对运动学模型进行运动分析。以车辆的极限转弯特性为切入点,研究了汽车进行泊车所需的最小停车位尺寸。其次,对人工智能领域的深度强化学习算法进行了研究。DDPG(Deep Deterministic Policy Gradient)算法是深度强化学习算法之一,具有一定学习能力与泛化性能,本文将其应用于自动泊车控制策略,实现端对端的车辆泊车控制。以Tensorflow为框架来构建DDPG算法模型,以车辆状态为状态信息,车辆控制指令为动作信息,通过车辆的状态信息来输出动作信息,控制车辆完成泊车。以采样策略与奖励函数为研究重点,基于经验回放方法与数据结构提出了一种高效的采样策略,并且基于预瞄模型与库仑定律设计了一种基于轨迹学习的奖励函数,从而完成DDPG算法的改进,提升了DDPG算法的训练效率与训练效果。最后,本文使用CarSim车辆动力学仿真软件来搭建仿真和算法训练平台,通过与Python联合仿真的方式来实现车辆动力学模型与DDPG算法模型进行模型训练,从而验证了基于DDPG算法的控制策略的有效性。设计多组泊车泛化性试验,在试验中调整泊车起始位置与停车位尺寸,从而进行泊车试验,验证和分析算法的泛化性。将CarSim中的车辆接口硬件化,硬件在环平台采用Lab VIEW编写转向程序,通过CAN通讯来完成对执行机构的控制,以此来控制Python与CarSim的数据交换,通过硬件在环平台进行试验。试验结果表明,车辆均可完成泊车,方向盘转动平稳,验证了本文所设计的自动泊车控制策略的功能性和有效性。
其他文献
目前,旅游产业已经成为了我国国民经济的战略性支柱产业。我国正加快旅游产业的转型升级,全面推进旅游目的地建设,通过发展全域旅游带动区域经济发展,实现国民经济的整体提升
毁兵葬现象多见于周人墓葬中,在其他族群墓中也有所见,其中尤以楚墓中的毁兵葬现象最为典型。楚墓中出现的毁兵葬俗有两种,分别涉及高等级芈姓公族与普通低级贵族两类人群。
中国已成为全球独角兽企业最重要的发源地,但不少中国独角兽企业因对公司控制权有较高的诉求采用双层股权结构无法于A股上市而纷纷奔赴海外,形成的“国内赚钱、境外分红”的
种子活力检测是农业发展中最重要的生产环节之一。种子活力的高低是反映种子发芽势、发芽率、田间出苗率等因素的重要指标。种子活力检测方法可分为有损检测和无损检测两类。
对负载下碳纤维(CFRP)与钢板复合加固钢筋混凝土梁的抗弯性能进行了试验研究和破坏模式分析,提出了复合加固梁的抗弯承载力公式。通过试验和理论分析可知,复合加固大大提高了
当前,随着农民工代际结构和需求结构的变化,丰富新生代农民工的精神文化生活,被置于社会融入、文化强国和和谐社会建设的时代背景之中。我认为,保障文化权益是积极推进新生代农民
目的:研究五子衍宗汤对环磷酰胺致免疫低下小鼠的免疫调节作用。方法:将实验用Balb/C小鼠32只,雌雄各半,随机分为空白组、模型组、五子衍宗汤低、高剂量组,每组8只。空白组ip
提出了一种制导武器的命中精度评定方法:由大样本仿真试验仿真模型解出的均值和方差的置信区间可以用于小样本试验验收的标准,并通过实际试验数据验证了其正确性;针对不同的
文中对小波分析理论在毫米波雷达数据处理中的应用进行了研究,分析了小波分析在毫米波脉冲多普勒雷达信号消噪中的应用及小波分析在毫米波频率步进雷达目标长度估计中的应用,
目的:观察云芝菌胶囊联合双嘧达莫片治疗儿童慢性乙肝的疗效.方法:160例病人随机分为治疗组与对照组,每组80例。治疗组口服云芝菌胶囊+双嘧达莫片;对照组单用双嘧达莫片.两组