当前位置: 首页> 学位论文 >详情
原文传递 基于离线强化学习的混合动力汽车能量管理策略研究
论文题名: 基于离线强化学习的混合动力汽车能量管理策略研究
关键词: 混合动力汽车;燃油经济性;能量管理策略;离线强化学习
摘要: 由于环境污染和能源短缺问题日益加剧,研究汽车燃油经济性成为汽车行业的一个焦点,混合动力汽车兼具传统燃油车和纯电动汽车的优势,其燃油经济性自然也受到重大关注。为了确保混合动力汽车在各种行驶环境下均能最大化节能减排,研究一种自适应性强的控制策略势在必行。强化学习是比较前沿的一种智能优化算法,由于其良好的决策性能,将其用在混合动力汽车的能量管理策略研究将是一种新的尝试。本文以P2并联式混合动力汽车作为研究对象,利用强化学习算法进行决策控制,将控制策略应用到混合动力汽车上实现HEV能量管理。本文主要研究内容如下:
  1.分析混合动力汽车能量管理策略
  分析混合动力汽车能量管理策略的控制变量和能量管理问题的建模,将强化学习策略与基于规则和基于优化的策略作比较,选择等效燃油消耗量和电量维持作为评判标准,验证算法的可行性。
  2.建立混合动力汽车模型和联合仿真平台
  建立了P2并联式混合动力汽车的动力总成模型,包括发动机模型、电池模型、电机模型、动力学模型,分析了能量管理问题。在算法撰写和混合动力汽车模型搭建完成后,利用Matlab/Simulink仿真软件搭建通信接口,将策略应用到模型上实现能量管理并进行分析。
  3.设计和分析基于强化学习的HEV能量管理策略
  由于基于规则的策略对工况适应性差,且控制效果有待提升;基于优化的控制策略实时性不佳,所以本文引进了强化学习控制策略。首先,对强化学习进行了详细介绍,特别是本文使用到的在线强化学习和离线强化学习策略;其次,对两种算法的控制效果进行了比较;最后介绍了本文的离线强化学习算法能够工作的原因,并分析了离线强化学习适用场景,相比于其他算法的优劣性。
  结果表明,在线强化学习可以在较长的时间内学习到良好的控制策略,而离线强化学习在数据的驱动下很快就能学到良好的控制策略。在WLTP工况下验证了算法的鲁棒性和适应性,说明了离线强化学习在燃油经济性和工况适应性方面均表现良好。
作者: 张鹏飞
专业: 工程(车辆工程)
导师: 胡博;杨靖
授予学位: 硕士
授予学位单位: 重庆理工大学
学位年度: 2022
检索历史
应用推荐