当前位置: 首页> 学位论文 >详情
原文传递 离线学习到在线优化的混合动力汽车能量管理策略研究
论文题名: 离线学习到在线优化的混合动力汽车能量管理策略研究
关键词: 混合动力汽车;能量管理策;离线学习;在线优化
摘要: 混合动力汽车(HybridElectricVehicle,HEV)作为目前最有发展前途的节能汽车之一,其具有污染小、低油耗、续航里程长等优点,是目前纯燃油车到纯电动汽车的过渡型产品,得到人们的青睐。由于混合动力汽车系统的结构复杂和驾驶工况的不确定性,制定高效的混合动力汽车能量管理策略(EnergyManagementStrategy,EMS)成了目前HEV研发项目的重点。本文以P2型并联混合动力汽车为研究对象,针对目前的能量管理策略无法适应复杂变化工况的问题,提出了一种基于强化学习的混合动力汽车能量管理策略离线学习在线优化的自适应方法,主要研究工作如下:
  (1)阐述了混合动力汽车能量管理策略的研究现状,介绍各类策略的优劣。介绍并联式混合动力汽车的构型,并且以P2并联混合动力汽车作为参考对象,利用Simulink/Matlab搭建车辆模型包括:车辆动力学模型、发动机模型、驱动电机模型、电池模型等关键部件模型。介绍了动态规划算法,并将动态规划算法应用于混合动力汽车能量管理策略,并且对基于动态规划算法的EMS仿真结果进行分析。
  (2)目前大多数基于RL的EMS研究只是离线训练和在线执行的范式,对于不同的工况自适应性差,针对上述问题,提出一种了离线训练在线优化的方案。首先,对强化学习理论进行了详细介绍,特别是本文采取的离线强化学习以及在线强化学习;其次,介绍了本文用于离线训练的离线强化学习算法原理,并将此与HEV的EMS相结合,作为策略离线出训练方案。最后,搭建了基于MATLAB/Simulik和Python的联合仿真平台,用于验证离线初始策略和后续的在线策略优化。
  (3)针对目前在线优化过程中由于分布转移问题导致策略在线优化过程不稳健的问题,提出一种稳健的在线优化方案并介绍了其基本原理,其次将提出来的在线稳健优化方案与HEV的EMS相结合,保证了离线初始策略的稳健优化,并对仿真结果进行分析。同时,在此基础上进行了硬件在环试验,验证了策略实时性和有效性。
  经过仿真结果表明:离线训练在线优化的融合算法在离线阶段能够很好的从离线数据中学习较好的策略,融合算法在线优化后的策略相比于优化前油耗下降6.25%,在优化后的策略接近DP策略98.49%的性能,并且所提的离线训练在线优化的方案使得策略在不同的工况下能够达到自适应。
作者: 刘博程
专业: 工程(车辆工程)
导师: 胡博
授予学位: 硕士
授予学位单位: 重庆理工大学
学位年度: 2023
检索历史
应用推荐