论文题名: | 基于离线强化学习的混合动力汽车能量管理策略研究 |
关键词: | 混合动力汽车;燃油经济性;能量管理策略;离线强化学习 |
摘要: | 由于环境污染和能源短缺问题日益加剧,研究汽车燃油经济性成为汽车行业的一个焦点,混合动力汽车兼具传统燃油车和纯电动汽车的优势,其燃油经济性自然也受到重大关注。为了确保混合动力汽车在各种行驶环境下均能最大化节能减排,研究一种自适应性强的控制策略势在必行。强化学习是比较前沿的一种智能优化算法,由于其良好的决策性能,将其用在混合动力汽车的能量管理策略研究将是一种新的尝试。本文以P2并联式混合动力汽车作为研究对象,利用强化学习算法进行决策控制,将控制策略应用到混合动力汽车上实现HEV能量管理。本文主要研究内容如下: 1.分析混合动力汽车能量管理策略 分析混合动力汽车能量管理策略的控制变量和能量管理问题的建模,将强化学习策略与基于规则和基于优化的策略作比较,选择等效燃油消耗量和电量维持作为评判标准,验证算法的可行性。 2.建立混合动力汽车模型和联合仿真平台 建立了P2并联式混合动力汽车的动力总成模型,包括发动机模型、电池模型、电机模型、动力学模型,分析了能量管理问题。在算法撰写和混合动力汽车模型搭建完成后,利用Matlab/Simulink仿真软件搭建通信接口,将策略应用到模型上实现能量管理并进行分析。 3.设计和分析基于强化学习的HEV能量管理策略 由于基于规则的策略对工况适应性差,且控制效果有待提升;基于优化的控制策略实时性不佳,所以本文引进了强化学习控制策略。首先,对强化学习进行了详细介绍,特别是本文使用到的在线强化学习和离线强化学习策略;其次,对两种算法的控制效果进行了比较;最后介绍了本文的离线强化学习算法能够工作的原因,并分析了离线强化学习适用场景,相比于其他算法的优劣性。 结果表明,在线强化学习可以在较长的时间内学习到良好的控制策略,而离线强化学习在数据的驱动下很快就能学到良好的控制策略。在WLTP工况下验证了算法的鲁棒性和适应性,说明了离线强化学习在燃油经济性和工况适应性方面均表现良好。 |
作者: | 张鹏飞 |
专业: | 工程(车辆工程) |
导师: | 胡博;杨靖 |
授予学位: | 硕士 |
授予学位单位: | 重庆理工大学 |
学位年度: | 2022 |