主权项: |
1.一种混合动力汽车增强学习能量管理控制方法,其特征在于,包括如下步骤: 步骤S1、采集车辆状态和电池状态数据; 步骤S2、建立混合动力汽车ICE模型、EM模型和传动系统模型,以及电池内阻和衰退模型; 步骤S3、将等效燃油消耗最小策略和增强学习算法模型相结合,建立混合动力汽车能量管理策略,求解多目标优化问题,并按照求解结果生成控制信号,分配发动机功率和电机功率。 2.根据权利要求1所述的一种混合动力汽车增强学习能量管理控制方法,其特征在于,步骤S1中,所述车辆状态数据包括:车辆速度、需求功率、发动机转速和电机转速,所述电池状态数据包括:电池电流、电压、温度和SOC。 3.根据权利要求1所述的一种混合动力汽车增强学习能量管理控制方法,其特征在于,步骤S2中,所述电池衰退模型的构建方法如下: 定义电池由SOClow经充电至SOChigh随后再由SOChigh放电至SOClow为一个充/放电循环;一个充/放电循环内电池容量衰退量取决于平均SOC值SOCavg和SOC变化范围差值SOCswing; 考虑SOCswing的电池容量衰退百分比,即电池容量相对于电池额定容量的衰退百分比为: 其中,KCO和Kex为与电池有关的常数,SOCswing=SOChigh-SOClow,Tref为参考电池温度,T为电池温度,τ为此循环的时长,τlife为电池的静置寿命; 考虑SOCavg的电池容量衰退百分比为: 其中,KSOC为与电池有关的常数,SOCavg=(SOChigh+SOClow)/2,为初始电池容量衰退百分比; 一个充/放电循环后的电池容量衰退百分比计算如下: 其中,KT为与电池有关的常数; 因此在一个时间步长ΔT内的电池容量衰退百分比为: 其中,Qlosscycle(i)为步长ΔT内第i个循环的电池容量衰退百分比,Nc为步长ΔT内的循环次数。 4.根据权利要求1所述的一种混合动力汽车增强学习能量管理控制方法,其特征在于,步骤S3中,所述多目标优化问题是在满足动力性要求的前提下,通过能量管理策略,在优化混合动力汽车燃油经济性的同时,减缓电池容量衰退的速度,以获得整车最佳经济性能。 5.根据权利要求1所述的一种混合动力汽车增强学习能量管理控制方法,其特征在于,步骤S3中,所述等效燃油消耗最小策略的目的是获取所建立模型在典型工况数据下,使得等效燃油消耗最小工作点时的最优等效系数Sopt,以此建立最优等效系数与动力电池功率和SOC关系的离线MAP。 6.根据权利要求5所述的一种混合动力汽车增强学习能量管理控制方法,其特征在于,等效燃油消耗最小策略中等效系数的优化定义为: 其中,为整车的瞬时等效燃油消耗率,为ICE的瞬时燃油消耗率,表示电能的等效燃油消耗率,s(t)为等效系数,Pbatt为电池输出功率,QIhv为燃油低热值。 7.根据权利要求1所述的一种混合动力汽车增强学习能量管理控制方法,其特征在于,步骤S3中,所述增强学习算法模型是在通过等效燃油消耗最小策略获得最优等效系数MAP的基础上,获取等效系数初始值s(0),并以电池衰退最小和整车等效燃油消耗最小为多目标优化对象,在线更新等效系数s(t)。 8.根据权利要求7所述的一种混合动力汽车增强学习能量管理控制方法,其特征在于,所述增强学习算法模型,包括: (1)状态st∈S={Pdem(t),v(t),SOC(t)} 其中,S为包含所有状态的状态集,Pdem(t)为驱动混合动力汽车行驶的需求功率,v(t)为车速,SOC(t)为电池的荷电状态; (2)动作at∈A={s(t)} 其中,增强学习算法Agent根据状态st选择动作at=[s(t)],A为包含所有可能行动的行动集,即所有等效系数; 为保证SOC在一定范围内波动,定义等效系数s(t)为: 其中,s(0)为初始等效系数,通过MAP插值获得,即α为调节系数,SOCswing为SOC变化范围差值,SOCref为参考SOC值; 由此可以建立SOCswing与等效系数s(t)、与SOC(t)的函数关系: SOCswing=g(s(t),SOC(t)) 当已知t时刻的s(t)和SOC(t),便可根据此函数关系求出SOCswing,用于后面电池衰退容量的计算; (3)回报函数定义为一时间步长ΔT内电池衰退量与等效燃油消耗量之和的负数,表示为: 其中,R为回报函数集,ΔQloss为一个时间步长ΔT内的电池容量衰退百分比;根据所建立的电池衰退模型,ΔQloss由下式获得: ΔQloss=f(SOCswing,SOCavg,T)=f(g(s(t),SOC(t)),SOCavg,T)。 |