基于深度强化学习算法的主动悬架控制策略研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:bestdzik
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度强化学习(Deep Reinforcement Learning,DRL)可以在模型完全未知且无训练集的基础上,进行端对端的、状态到动作的复杂高维映射关系的自学习。目前,在游戏、机器人控制、芯片设计以及智能驾驶等领域都得到了成功的应用。然而,目前基于DRL在汽车主动悬架控制领域的研究甚少,特别是在主动悬架的减振和侧倾集成控制问题上仍未被涉及。因此,本文针对汽车主动悬架系统的平顺性和侧倾稳定性等关键问题,基于深度强化学习算法理论,提出五种主动悬架强化学习控制策略。主要研究工作如下:针对实际主动悬架系统动力学模型难以获取以及神经网络控制方法需要大量带标签的样本数据的问题,分别提出基于深度Q网络算法(DQN)和深度确定性策略梯度算法(DDPG)的主动悬架无模型控制策略。DQN策略通过对作动力进行离散化,并利用神经网络对Q值进行估计,实现系统状态到作动力的端对端映射控制。DDPG策略使用神经网络逼近值函数和确定性策略,并输出动作的概率分布,解决了连续作动力控制问题。采用1/4悬架模型进行上述策略的仿真验证,结果表明两种强化学习控制策略均可以有效抑制车身振动,且DDPG策略具有更好的控制性能。针对强化学习训练初期效率低以及随机探索可能违反实际系统安全约束等问题,通过改进DDPG算法,提出一种基于安全深度确定性策略梯度算法(S-DDPG)的主动悬架控制策略。建立具有动挠度和轮胎动载荷安全约束的非线性主动悬架半车模型,并进行马尔可夫建模;通过引入经验样本并进行预训练,来提升算法训练的探索效率和质量,同时,使用Dropout机制以提高泛化与容错能力。在此基础上,考虑直行工况下的车辆平顺性,从时域和频域两个角度进行对比仿真。结果表明,所提出的算法可以在提高训练过程安全性的同时有效提升悬架系统的平顺性和操纵稳定性。针对高速转向工况下的侧倾稳定性需求,通过直接控制侧倾力矩,并以跟踪目标侧倾角为主要目的,设计了基于双延迟深度确定性策略梯度算法(TD3)的主动悬架侧倾控制策略。具体而言,建立了6自由度侧倾-转向模型,并基于逆向侧倾控制机理设计目标侧倾角。然后设计了具有梯度型奖惩函数的TD3策略框架。最后设计滑模控制策略用于对比。仿真结果证实了所提出的策略能快速有效地跟踪不同比例的期望侧倾角,降低横向载荷转移率,提高侧倾稳定性及侧翻极限。针对直行-转向混合工况下平顺性与侧倾稳定性的综合优化需求,结合模糊控制和强化学习算法,提出了融合平顺性控制模式(RCM)和侧倾稳定性控制模式(RSCM)的双模式模糊切换强化学习控制策略(Fuzzy-TD3)。定义了包含两种模式的集成奖惩函数,并设计具有延迟机制的双模式模糊切换控制策略用于决策TD3算法的奖惩函数形式。然后通过训练获得一种具有平顺性和侧倾稳定性综合优化性能的集成控制策略。最后,进行对扭路面激励下的数值仿真,表明所提出的策略可以综合提升车辆的平顺性和侧倾稳定性等性能。
其他文献
为提高桥梁工程施工阶段风险管理的水平和效率,增强风险管理理论的适用性和实用性,本文建立了系统化的桥梁工程施工期风险识别模型与风险评估模型,选取BIM软件Navisworks为开发对象,使用C#语言开发了桥梁工程施工期动态风险评估系统,实现风险评估计算过程的自动化,将风险评估与施工进度相关联,实现桥梁工程施工期风险动态可视化的管理。论文的主要研究内容和成果如下:(1)建立基于WBS-RBS法的桥梁施
如今互联网的影响渗入各行各业,互联网与产业的结合已经成为当代不可忽视的热门话题。互联网的兴起、国人意识的改变、空间经济的转换与国家政策的加持下,国内兴起了一股民宿热。经过近十年的发展,“民宿”一词早已脱离最初的定义,“民宿”与“酒店”的界限正在消解,演化出“现代民宿式酒店”这一新兴住宿类型。互联网在本文更多是作为一种媒介平台来研究,在互联网媒介作用下,许多“网红”现代民宿式酒店破空而来,其巨大的商
城市边角空间的质量是反映一个城市品质的最直观体现,传统模式下的城市发展,城市各种资源浪费严重,城市管理存在着很多人为因素和漏洞,城市边缘空间、建筑角落、城市街道闲置空间等被废弃和遗忘,使得城市活力与城市品质不高,存在城市空间形态不完善等一些列问题。针对传统模式下的城市建设发展过程中存在的问题,有必要进行更深一步的研究分析,将城市中的边角空间形态构成及设计手法进行阐述与实践,从而得出并总结相关的城市
地铁乘客的旅行时间是衡量地铁服务水平的重要指标之一。准确的旅行时间预测不仅能为乘客制定更好的出行规划和路径选择、提高乘客满意度,还能为地铁运营部门制定合理运营计划,提高运营效率。因此,对地铁乘客的旅行时间预测研究具有重要意义。本文基于福州地铁一号线乘客进出站刷卡数据构建相应旅行时间的数据集并用机器学习算法对旅行时间进行预测研究。本文主要研究工作分为以下三个方面:(1)地铁乘客异常出行数据处理。首先
我国处于两大地震带之间,地震活动时常发生。桥梁结构作为国家重要的基础设施和交通运输枢纽,在地震作用下容易发生破坏,对交通运输产生极大的影响。因此,对桥梁结构进行地震风险评估显得更加重要。地震易损性分析作为地震风险评估的重要一环,虽然国内外对其进行了大量研究,但仍存在一些不足。Copula理论作为一种新兴的分析工具,不仅简化了联合分布函数的建构过程,而且考虑变量间的非线性相关关系,为桥梁易损性模型提
本文首先基于验证后的整体式组合梁有限元模型探讨了其在循环荷载下的力学性能和破坏过程;然后,探讨了循环荷载作用下整体式组合梁与传统端板连接组合梁在力学性能方面的差异,并以钢梁下翼缘有无设置加劲肋、板面钢筋直径和钢梁下翼缘宽度为变化参数,分别对7个整体式组合梁模型开展了参数化分析,探讨影响整体式组合梁受力性能的关键因素;最后,对采用整体式组合梁的整体式组合钢框架、传统端板节点连接钢框架和传统梁柱刚性连
智能交通系统集成了各种先进的技术和智能化应用服务于城市交通管理,以提升道路的使用效率,优化城市交通的状况,从而改善城市的交通质量,为城市居民带来出行便利。然而,交通数据缺失的问题一直困扰着智能交通系统的研究人员,缺失的交通数据降低了自身的研究价值,阻碍了智能交通系统的进一步应用和研究。因此针对缺失的交通数据,如何进行高效的数据恢复和有效的缺失数据利用成为智能交通系统的重要研究课题。针对缺失数据带来
在车辆辅助驾驶系统中,应用计算机视觉和图像处理技术能有效地提高车辆行驶途中的安全性能,而针对车辆的距离估计技术是车辆辅助驾驶系统的核心。以雷达等硬件设备为基础的测距存在费用高、受外界影响大等问题,而基于传统的计算机视觉单目测距算法,需要对相机的内外部参数进行精确的标定,相机的微小抖动都会引起测距结果的偏差,因此不适用于实时移动场景中的车辆测距。在福建省重点科技项目(2017H6009,2018H0
湖南省地形地貌千差万别,素有“八山一水,一分田”之所。境内湖泊水系发达,河网密布。湖南地区众多传统村落以其保存完好的特色建筑和文人辈出的历史而名扬四方。尤其是以湘西,湘南传统村落的水系以及周围环境共同衍生出来的的滨水美景,更具有独特的艺术魅力。近年来,传统村落发展以其迅猛之势,正在改变着人们的生活。村落文化旅游的兴起,外来人口的涌入,传统村落开始展示其面貌。与此同时,不少地区为扩大旅游,增加当地居
古诗词是培养高中生审美能力的重要资源,可以让学生领略古代经典文学的无穷魅力,形成高雅的审美情趣。从审美教育的视角出发,探讨开展高中语文古诗词教学的方法,提出教师应对有关古诗词文体的知识展开教学。在文本解读方面,教师可运用画面联想法和意象解析法,让学生感受意境美;可从意义和声音层面引导学生感受作品的语言美;同时应重视对作者人格美的探究。教师还可基于同类古诗词组织专题学习活动,培养学生独立阅读古诗词的