详情

当前位置：首页> 学位论文 >详情

原文传递基于离线强化学习的混合动力汽车能量管理策略研究

论文题名：	基于离线强化学习的混合动力汽车能量管理策略研究
关键词：	混合动力汽车;燃油经济性;能量管理策略;离线强化学习
摘要：	由于环境污染和能源短缺问题日益加剧，研究汽车燃油经济性成为汽车行业的一个焦点，混合动力汽车兼具传统燃油车和纯电动汽车的优势，其燃油经济性自然也受到重大关注。为了确保混合动力汽车在各种行驶环境下均能最大化节能减排，研究一种自适应性强的控制策略势在必行。强化学习是比较前沿的一种智能优化算法，由于其良好的决策性能，将其用在混合动力汽车的能量管理策略研究将是一种新的尝试。本文以P2并联式混合动力汽车作为研究对象，利用强化学习算法进行决策控制，将控制策略应用到混合动力汽车上实现HEV能量管理。本文主要研究内容如下：　　1.分析混合动力汽车能量管理策略　　分析混合动力汽车能量管理策略的控制变量和能量管理问题的建模，将强化学习策略与基于规则和基于优化的策略作比较，选择等效燃油消耗量和电量维持作为评判标准，验证算法的可行性。　　2.建立混合动力汽车模型和联合仿真平台　　建立了P2并联式混合动力汽车的动力总成模型，包括发动机模型、电池模型、电机模型、动力学模型，分析了能量管理问题。在算法撰写和混合动力汽车模型搭建完成后，利用Matlab/Simulink仿真软件搭建通信接口，将策略应用到模型上实现能量管理并进行分析。　　3.设计和分析基于强化学习的HEV能量管理策略　　由于基于规则的策略对工况适应性差，且控制效果有待提升；基于优化的控制策略实时性不佳，所以本文引进了强化学习控制策略。首先，对强化学习进行了详细介绍，特别是本文使用到的在线强化学习和离线强化学习策略；其次，对两种算法的控制效果进行了比较；最后介绍了本文的离线强化学习算法能够工作的原因，并分析了离线强化学习适用场景，相比于其他算法的优劣性。　　结果表明，在线强化学习可以在较长的时间内学习到良好的控制策略，而离线强化学习在数据的驱动下很快就能学到良好的控制策略。在WLTP工况下验证了算法的鲁棒性和适应性，说明了离线强化学习在燃油经济性和工况适应性方面均表现良好。
作者：	张鹏飞
专业：	工程(车辆工程)
导师：	胡博;杨靖
授予学位：	硕士
授予学位单位：	重庆理工大学
学位年度：	2022

相关文献

检索历史

应用推荐