当前位置: 首页> 学位论文 >详情
原文传递 数据驱动下的Homotopic强化学习在汽车半主动悬架控制研究
论文题名: 数据驱动下的Homotopic强化学习在汽车半主动悬架控制研究
关键词: 半主动悬架;T-S模糊模型;强化学习;Homotopic策略迭代
摘要: 随着经济和科技的发展,人们对乘车平稳性提出了更高的要求。汽车悬架系统对于乘车的稳定性和安全性来说,起着至关重要的作用。无法调节弹簧刚度和阻尼的被动悬架已经无法满足人们对于汽车动力学性能的要求,而主动悬架的出现则改变了这些弊端。主动悬架靠外界输入的能量来调节作用于车身的控制力,根据不同的道路状况改变悬架系统的阻尼和刚度,从而减缓车身振动,提高行驶的平稳性。半主动悬架作为主动悬架的一种,由于成本优势,应用广泛,受到越来越多学者的关注。主动悬架在不同的控制算法下产生的效果不一样,如何设计出更先进、更智能的控制算法一直是相关学者们的研究重点。对半主动悬架系统控制算法的研究具有重要的理论价值和经济效益,也是本文研究的主题。
  针对连续时间非线性半主动悬架系统,本文首先建立了二自由度的四分之一汽车悬架模型,确定了控制系统的性能评价指标。针对半主动悬架系统具有非线性的特点,建立了该悬架系统的T-S模糊模型,将原始的非线性系统模型用模糊算法分解成多个线性子系统逼近来表示。接着针对半主动悬架的最优控制问题,提出了一种基于数据驱动,无需模型的homotopic强化学习算法,不需要给定初始稳定控制策略。在指定的模糊规则下测量各子系统的状态和控制输入数据,利用测量数据计算各子系统的最优控制增益,根据并行分布补偿法,得到整个非线性系统的最优控制策略。最后使用Matlab软件对提出的控制策略进行了仿真分析。
  研究表明,所提出的控制策略通过对采样数据进行分析和处理,可以在未知系统模型信息的情况下,将闭环系统的不稳定极点移动到稳定区域,在给定初始值的情况下系统输出和控制输入都快速收敛到零,比较算法得出的控制增益和最优控制增益,证明了该算法得出的控制策略是最优控制策略,在控制无模型的连续时间非线性系统上取得了理想的控制效果,可以有效改善汽车的驾驶平顺性。
作者: 庞淞文
专业: 应用统计
导师: 唐胜达
授予学位: 硕士
授予学位单位: 广西师范大学
学位年度: 2023
检索历史
应用推荐