当前位置: 首页> 交通专利数据库 >详情
原文传递 基于自适应动态规划的并联混合动力汽车能量管理方法
专利名称: 基于自适应动态规划的并联混合动力汽车能量管理方法
摘要: 本发明公开了一种基于自适应动态规划的并联混合动力汽车能量管理方法,旨在对PHEV几种工作模式中的混合驱动模式进行能量管理优化,包括:根据驾驶员的命令以及车速获得车辆总的需求转矩,由车辆当前状态获得这一时刻电池SOC以及发动机转矩;综合获得的车辆信息,建立基于ADP的并联混合动力汽车能量管理模型;ADP中的执行网络用来近似最优控制策略,评价网络用来近似最优性能指标函数,这两个网络的结合相当于一个智能体能够智能学习并在线响应系统的动态变化,使其对网络结构中的参数进行自动调整,对建立的能量管理模型进行求解,得到最优的分配转矩给电机。本发明方法能够实时地将需求转矩合理地、最优地分配给发动机和电机。
专利类型: 发明专利
国家地区组织代码: 安徽;34
申请人: 合肥工业大学
发明人: 张冰战;倪尧尧;吴俊成;邱明明
专利状态: 有效
申请日期: 2019-08-05T00:00:00+0800
发布日期: 2019-11-05T00:00:00+0800
申请号: CN201910717298.0
公开号: CN110406526A
代理机构: 北京青松知识产权代理事务所(特殊普通合伙)
代理人: 郑青松
分类号: B60W10/06(2006.01);B;B60;B60W;B60W10
申请人地址: 230000 安徽省合肥市包河区屯溪路193号
主权项: 1.基于自适应动态规划的并联混合动力汽车能量管理方法,其特征在于包括如下步骤: 步骤1、根据驾驶员的命令如加速踏板或制动踏板的行程以及车速获得车辆总的需求转矩T,由车辆当前状态获得这一时刻电池荷电状态SOC以及发动机转矩Te; 步骤2、基于自适应动态规划方法,以维持电池SOC的平稳变化和高效区域工作的同时提升PHEV的燃油经济性为目标建立并联混合动力汽车的能量管理模型; 步骤3、通过自适应动态规划方法中执行网络和评价网络的智能在线学习来对能量管理模型进行求解,得到分配给电机的最优需求转矩,然后再根据总的需求转矩得到分配给发动机的最优需求转矩;具体过程如下: 步骤3.1、初始化评价网络和执行网络的权值; 步骤3.2、将每个采样时刻采集的电池组SOC、整车需求转矩T和发动机当前时刻转矩Te输入执行网络,执行网络输出为电机需求转矩Tm_req; 步骤3.3、将每个采样时刻采集的电池组SOC、整车需求转矩T、发动机当前时刻转矩Te和执行网络输出的电机需求转矩Tm_req作为评价网络的输入,得到代价函数J的近似值 步骤3.4、根据评价网络的权值更新方式,更新评价网络的权值,使其输出的与代价函数J的误差Ec不断逼近0; 步骤3.5、根据执行网络的权值更新方式,更新执行网络的权值; 步骤3.6、更新并记录上述执行网络和评价网络的权值; 循环步骤3.1~3.6,直到近似等于代价函数J,完成最优控制输出Tm_req。 2.根据权利要求1所述的基于自适应动态规划的并联混合动力汽车能量管理方法,其特征在于:步骤3中,所述代价函数J就是用于找到最优解的目的函数,是自适应动态规划方法运行的关键,定义为: 式中,γ是折扣因子,且0<γ≤1;U为效用函数;自适应动态规划的目的就是选择一个控制序列u(i),i=k,k+1,…使得定义的代价函数J最小化; 其中,结合SOC定义的二次型效用函数U如下: U(k)=x(k)Ax(k)T+ε(SOC-τ)2; 式中,A为符合此公式矩阵运算的单位矩阵;x是系统输入的状态变量;ε是折扣因子;τ是根据车型选取的SOC波动下限。 3.根据权利要求2所述的基于自适应动态规划的并联混合动力汽车能量管理方法,其特征在于:所述评价网络的优化目标函数为: 其中,ec(k)表示评价网络的预测误差; 评价网络的输出值可以通过随着时间最小化以下的误差来实现: 当对于所有的k都有Ec(k)=0时,上式意味着 显然有,因此,最小化所定义的误差函数,将获得一个训练好的神经网络,该评价网络的输出值是定义的代价函数J的一个估计。 4.根据权利要求3所述的基于自适应动态规划的并联混合动力汽车能量管理方法,其特点在于,所述评价网络的权值更新是采用梯度下降法进行的,使: Wc(k+1)=Wc(k)+ΔWc(k), 其中, 式中,k表示采样周期,Wc代表评价网络的权值,Ec(k)表示评价网络的优化目标函数,lc(k)表示评价网络的学习率。 5.根据权利要求4所述的基于自适应动态规划的并联混合动力汽车能量管理方法,其特点在于,所述执行网络的权值更新方式是通过使用控制信号u(k),以最小化为目标;具体步骤为: 将每个采样时刻采集的电池组SOC、整车需求转矩T和发动机当前时刻转矩Te输入执行网络,执行网络输出为电机需求转矩Tm_req,并且执行网络的权值更新模型为: Wa(k+1)=Wa(k)+ΔWa(k), 其中, 式中,Wa表示执行网络的权值,u(k)表示控制变量,la(k)表示执行网络的学习率。 6.根据权利要求5所述的基于自适应动态规划的并联混合动力汽车能量管理方法,其特点在于:所述执行网络和评价网络均采用BP神经网络也是三层前馈神经网络,网络的训练由正向的计算和反向的误差传播过程组成。
所属类别: 发明专利
检索历史
应用推荐