主权项: |
1.基于自适应动态规划的并联混合动力汽车能量管理方法,其特征在于包括如下步骤: 步骤1、根据驾驶员的命令如加速踏板或制动踏板的行程以及车速获得车辆总的需求转矩T,由车辆当前状态获得这一时刻电池荷电状态SOC以及发动机转矩Te; 步骤2、基于自适应动态规划方法,以维持电池SOC的平稳变化和高效区域工作的同时提升PHEV的燃油经济性为目标建立并联混合动力汽车的能量管理模型; 步骤3、通过自适应动态规划方法中执行网络和评价网络的智能在线学习来对能量管理模型进行求解,得到分配给电机的最优需求转矩,然后再根据总的需求转矩得到分配给发动机的最优需求转矩;具体过程如下: 步骤3.1、初始化评价网络和执行网络的权值; 步骤3.2、将每个采样时刻采集的电池组SOC、整车需求转矩T和发动机当前时刻转矩Te输入执行网络,执行网络输出为电机需求转矩Tm_req; 步骤3.3、将每个采样时刻采集的电池组SOC、整车需求转矩T、发动机当前时刻转矩Te和执行网络输出的电机需求转矩Tm_req作为评价网络的输入,得到代价函数J的近似值 步骤3.4、根据评价网络的权值更新方式,更新评价网络的权值,使其输出的与代价函数J的误差Ec不断逼近0; 步骤3.5、根据执行网络的权值更新方式,更新执行网络的权值; 步骤3.6、更新并记录上述执行网络和评价网络的权值; 循环步骤3.1~3.6,直到近似等于代价函数J,完成最优控制输出Tm_req。 2.根据权利要求1所述的基于自适应动态规划的并联混合动力汽车能量管理方法,其特征在于:步骤3中,所述代价函数J就是用于找到最优解的目的函数,是自适应动态规划方法运行的关键,定义为: 式中,γ是折扣因子,且0<γ≤1;U为效用函数;自适应动态规划的目的就是选择一个控制序列u(i),i=k,k+1,…使得定义的代价函数J最小化; 其中,结合SOC定义的二次型效用函数U如下: U(k)=x(k)Ax(k)T+ε(SOC-τ)2; 式中,A为符合此公式矩阵运算的单位矩阵;x是系统输入的状态变量;ε是折扣因子;τ是根据车型选取的SOC波动下限。 3.根据权利要求2所述的基于自适应动态规划的并联混合动力汽车能量管理方法,其特征在于:所述评价网络的优化目标函数为: 其中,ec(k)表示评价网络的预测误差; 评价网络的输出值可以通过随着时间最小化以下的误差来实现: 当对于所有的k都有Ec(k)=0时,上式意味着 显然有,因此,最小化所定义的误差函数,将获得一个训练好的神经网络,该评价网络的输出值是定义的代价函数J的一个估计。 4.根据权利要求3所述的基于自适应动态规划的并联混合动力汽车能量管理方法,其特点在于,所述评价网络的权值更新是采用梯度下降法进行的,使: Wc(k+1)=Wc(k)+ΔWc(k), 其中, 式中,k表示采样周期,Wc代表评价网络的权值,Ec(k)表示评价网络的优化目标函数,lc(k)表示评价网络的学习率。 5.根据权利要求4所述的基于自适应动态规划的并联混合动力汽车能量管理方法,其特点在于,所述执行网络的权值更新方式是通过使用控制信号u(k),以最小化为目标;具体步骤为: 将每个采样时刻采集的电池组SOC、整车需求转矩T和发动机当前时刻转矩Te输入执行网络,执行网络输出为电机需求转矩Tm_req,并且执行网络的权值更新模型为: Wa(k+1)=Wa(k)+ΔWa(k), 其中, 式中,Wa表示执行网络的权值,u(k)表示控制变量,la(k)表示执行网络的学习率。 6.根据权利要求5所述的基于自适应动态规划的并联混合动力汽车能量管理方法,其特点在于:所述执行网络和评价网络均采用BP神经网络也是三层前馈神经网络,网络的训练由正向的计算和反向的误差传播过程组成。 |