当前位置: 首页> 交通专利数据库 >详情
原文传递 考虑空调系统的燃料电池汽车学习型协同能量管理方法
专利名称: 考虑空调系统的燃料电池汽车学习型协同能量管理方法
摘要: 本发明涉及一种考虑空调系统的燃料电池汽车学习型协同能量管理方法,属于新能源汽车领域。该方法包括:S1:获取燃料电池汽车的车辆状态参数信息、燃料电池参数信息、动力电池参数信息以及空调系统参数信息;S2:建立燃料电池汽车协同能量管理模型;S3:建立考虑空调系统的燃料电池汽车协同能量管理优化控制策略,并结合SAC算法求解包含燃氢经济性和舱室温度舒适性的多目标优化问题,在进行能量流优化控制的同时,控制空调制冷/制热容量的变化以维持舱室温度处于舒适区间。本发明能有效解决氢能消耗和舱室温度舒适性之间的折中问题,优化燃料电池汽车的燃氢经济性以及舱室温度舒适性。
专利类型: 发明专利
国家地区组织代码: 重庆;50
申请人: 重庆大学
发明人: 唐小林;邓磊;甘炯鹏;朱和龙;胡晓松;李佳承
专利状态: 有效
申请日期: 2022-11-07T00:00:00+0800
发布日期: 2022-12-23T00:00:00+0800
申请号: CN202211385462.0
公开号: CN115503559A
代理机构: 北京同恒源知识产权代理有限公司
代理人: 方钟苑
分类号: B60L58/30;B60L58/12;B60H1/00;B60H1/32;B;B60;B60L;B60H;B60L58;B60H1;B60L58/30;B60L58/12;B60H1/00;B60H1/32
申请人地址: 400044 重庆市沙坪坝区沙坪坝正街174号
主权项: 1.一种考虑空调系统的燃料电池汽车学习型协同能量管理方法,其特征在于,该方法具体包括以下步骤: S1:获取燃料电池汽车的车辆状态参数信息、燃料电池参数信息、动力电池参数信息以及空调系统参数信息; S2:建立燃料电池汽车协同能量管理模型,包括:整车纵向动力学模型、燃料电池模型、动力电池模型、电机模型、空调系统模型和车舱热负荷模型; S3:建立考虑空调系统的燃料电池汽车协同能量管理优化控制策略,并结合SAC算法求解包含燃氢经济性和舱室温度舒适性的多目标优化问题,在进行能量流优化控制的同时,控制空调制冷/制热容量的变化以维持舱室温度处于舒适区间;所述SAC算法是软约束演员评论家算法。 2.根据权利要求1所述的燃料电池汽车学习型协同能量管理方法,其特征在于,步骤S1中,所述车辆状态参数信息包括:车速、车舱热负荷参数、电机运行效率以及传动系统特性参数;所述燃料电池参数信息包括:燃料电池的功率、效率以及氢能消耗量;所述动力电池参数信息包括:动力电池的荷电状态、内阻以及开路电压;所述空调系统参数信息包括:空调系统冷却容量/制热容量以及相应的功率。 3.根据权利要求1所述的燃料电池汽车学习型协同能量管理方法,其特征在于,步骤S2中,建立的整车纵向动力学模型为: Pdrive=(Fair+Ff+Fi+m0a)·v Pdem=Pb+Pfc·ηDC/DC 其中,m0表示整车质量;v表示为整车车速;a表示车辆加速度;Fair表示为空气阻力;Ff表示为滚动阻力;Fi表示为加速阻力;ηm、ηDC/AC、ηDC/DC以及ηmotor分别表示传动效率、DC/AC转换器效率、DC/DC转换器效率以及电机效率;Pdrive、Pdem、Pb以及Pfc分别表示车辆车轮处驱动功率、需求功率以及电池输出功率、燃料电池输出功率。 4.根据权利要求3所述的燃料电池汽车学习型协同能量管理方法,其特征在于,步骤S2中,建立的燃料电池模型为: ηfc=fη(Pfc) 其中,fη(·)和分别表示为效率和氢能消耗量的拟合函数,通过插值法计算效率与氢耗。 5.根据权利要求3所述的燃料电池汽车学习型协同能量管理方法,其特征在于,步骤S2中,建立的动力电池模型为: 其中,IL表示为动力电池电流;Voc表示为动力电池开路电压;Rin表示为动力电池等效内阻;SOC0表示为初始SOC;Qt表示为动力电池最大容量;t0表示为初始时刻;tf表示为最终时刻。 6.根据权利要求3所述的燃料电池汽车学习型协同能量管理方法,其特征在于,步骤S2中,建立的电机模型为: ηm=fm(ωm,Tm) 其中,ωm和Tm分别表示电机转速和转矩;Pm表示为电机输出功率,fm(·)表示电机工作效率的拟合函数,通过插值法得到电机的工作效率。 7.根据权利要求1所述的燃料电池汽车学习型协同能量管理方法,其特征在于,步骤S2中,建立的空调系统模型为: 其中,Qac表示为空调系统的制冷容量或制热容量;Pac表示为空调系统相应功耗;ηcop表示为空调系统性能系数。 8.根据权利要求1所述的燃料电池汽车学习型协同能量管理方法,其特征在于,步骤S2中,建立的车舱热负荷模型为: Qc=∑KF(Tout-Tin) Qh=145+116n Qn=meξCpair(Tout-Tin) 其中,Qc、Qr、Qh以及Qn分别表示热传导负荷、辐射热负荷、车内人员产生热量以及通风系统热负荷;K表示为传热系数;F表示为相应外壳的传热面积;Tout表示为环境温度;Tin表示为舱内空气温度;η表示为渗透率;I表示为太阳光光强大小;Ai表示为挡风玻璃、左右侧窗以及后窗面积;θi表示为太阳光入射角;β表示为阴影因子;n表示为车内乘客人数;me表示为通过蒸发器的空气质量;ξ表示为空气再循环系数;Cpair表示为室内空气热容;ρair和Vair分别表示为车舱内空气密度和车舱体积。 9.根据权利要求1所述的燃料电池汽车学习型协同能量管理方法,其特征在于,步骤S3中,建立考虑空调系统的燃料电池汽车协同能量管理优化控制策略,具体包括以下步骤: S301:确定状态空间:将动力电池SOC、燃料电池输出功率Pfc、车辆速度v、空调系统的制冷/制热容量Qac设置为状态变量,构建状态空间S,表示为: S={SOC,Pfc,v,Qac} S302:确定动作空间:将燃料电池输出功率变化量和空调系统制冷/制热容量变化量设置为动作变量,构建动作空间A,表示为: S303:建立奖励函数:将奖励函数R设置为氢能消耗量、SOC变化和舱室温度变化三个指标的加权求和,表示为: R=-(ζ·fuel(t)+ψ·(SOC(t)-0.7)2+γ·(Tin-24)2) 其中,ζ、Ψ、γ为各优化项权重因子,通过调节权重因子来解决氢能消耗和舱室温度舒适性之间的折中问题,从而求解多目标优化问题;fuel(t)表示当前时刻下的氢能消耗量;SOC(t)表示当前时刻下的动力电池荷电状态。 10.根据权利要求9所述的燃料电池汽车学习型协同能量管理方法,其特征在于,步骤S3中,结合SAC算法求解包含燃氢经济性和舱室温度舒适性的多目标优化问题,具体包括以下步骤: S311:结合SAC算法求解能量管理中多目标优化问题,在SAC算法中引入了动作熵值使得动作输出更加分散,进而提升算法的探索能力、学习新任务能力以及稳定性,熵值表示为: H(π(·|st))=-logπ(·|st) 其中,H为策略π(·|st)的熵; S312:求解过程中,智能体中演员网络以状态st作为输入,输出动作高斯分布的均值和方差,利用重参数化技术生成动作at: 其中,τt表示从标准正态分布中采样的噪声信号;表示函数输出均值和方差;和分别表示高斯分布的均值和方差; S313:执行动作at后,车辆环境向智能体反馈奖励rt,并转移到下一状态st+1,即生成环境与智能体的交互数据{st,at,rt,st+1},并储存于经验池中; S314:随机从经验池中抽取小批量经验样本,引入参数为θ1,θ2的评估评论家网络以及参数为θ′1,θ′2的目标评论家网络,选择目标评论家网络输出较小的动作状态函数值作为目标值;针对特定状态st和动作at,SAC算法中软约束动作值函数Qsoft(st,at)更新公式如下: 其中,r表示车辆获得的奖励;γ表示折扣因子;α表示温度系数; S315:更新策略网络时,通过最小化损失函数L(θi)更新评估评论家网络,损失函数定义为与之间的均方误差,表示为: 其中,表示评估评论家网络参数为θi时的评价函数,表示目标评论家网络参数为θ′i时的评价函数; S316:演员网络参数更新是通过最小化KL散度实现;演员网络的目标函数定义为: 其中,DKL表示KL散度计算表达式;Z(st)是配分函数,用于归一化分布;表示当前时刻下车辆状态st、执行动作at时的数学期望函数;表示当前状态为st时的策略函数,表示为策略函数的参数; S317:按照梯度下降法更新演员网络参数,表示为: 其中,表示为关于策略函数参数的下降梯度,表示为关于当前时刻t下执行动作at的下降梯度; S318:通过对优化问题中目标函数求解最小值,即能更新得到每步最佳温度系数,目标函数表示为: 其中,H0表示预先定义的最小策略熵的阈值,表示为依据策略函数πt执行动作at时的数学期望函数,πt(at|st)表示为策略函数,st表示为当前时刻t下燃料电池汽车所处的状态,at则表示为当前时刻t时依据策略函数执行的动作。
检索历史
应用推荐