主权项: |
1.一种插电式混合动力车辆最优能耗的确定方法,其特征在于,包括以下步骤: 1)基于马尔科夫决策过程的五个要素,建立电动车能耗的状态-行动值函数; 2)基于马尔科夫决策过程的五个要素,在实际场景对电动车进行采样,生成电动车的若干周期; 3)根据生成的周期,求解电动车能耗的状态-行动值函数,得到电动车能耗的最优策略。 2.如权利要求1所述的一种插电式混合动力车辆最优能耗的确定方法,其特征在于,所述马尔科夫决策过程的五个要素包括: 状态集S,即t阶段起始时电动车的电量水平st; 动作集A,即t阶段充电或放电at,其中,充电时为at=-1,放电时at=+1; 回报函数R,即t阶段电动车的电耗价格其中,Ct表示t阶段电动车的电耗花费,C表示新电池组价格,N表示电池充放电的循环总次数,表示每次充电或放电时电池的损耗价值,pt表示电价格,ηt表示t阶段的充电量或放电量; 转移概率P,即转移概率Pr{St=s′,Rt=r|St-1=s,At-1=a},其中,s′表示下一步的电量水平值,s表示当前的电量水平值,r表示电动车的电耗花费; 折扣因子γ。 3.如权利要求2所述的一种插电式混合动力车辆最优能耗的确定方法,其特征在于,所述折扣因子γ=0.9。 4.如权利要求2所述的一种插电式混合动力车辆最优能耗的确定方法,其特征在于,所述电动车能耗的状态-行动值函数为: 其中,Eπ表示关于策略π的数学期望,k表示整个周期的第k步,Gt为一个标号,代指 5.如权利要求1所述的一种插电式混合动力车辆最优能耗的确定方法,其特征在于,所述步骤2)的具体过程为: 在实际场景中采集运动的电动车的马尔科夫决策过程的五个要素值,得到一条周期,采集n次要素值即得到n条周期。 6.如权利要求2所述的一种插电式混合动力车辆最优能耗的确定方法,其特征在于,所述步骤3)的具体过程为: 3.1)设置步长α以及在选取行动时采用随机方法的百分比ε; 3.2)初始化电动车能耗的状态-行动值函数; 3.3)对于某条周期,初始化状态集S; 3.4)对于状态-行动值函数,采用ε-贪婪策略,在状态集S下选出某一动作集A,该动作集A对应一回报函数R和状态集S′; 3.5)将状态集S′作为更新后的状态集S,进入步骤3.4),直至完成该周期所有步长下状态集S的更新,得到该周期对应的最优状态集S和动作集A,即得到: Q(S,A)=Q(S,A)+α[R+γQ(S′,A′)-Q(S,A)] 其中,A′为在状态集S′下选出的某一动作集,状态集S′作为更新后的状态集S后,A′为更新后的动作集A; 3.6)重复步骤3.3)~3.5),直至完成每一周期所有步长下状态集S更新,得到每一周期对应的最优状态集S和动作集A,进而得到电动车能耗的最优策略。 7.如权利要求6所述的一种插电式混合动力车辆最优能耗的确定方法,其特征在于,所述电动车能耗的最优策略包括每一周期对应的最优状态集S和动作集A,以及每一最优状态集S和动作集A对应的转移概率P、折扣因子γ和回报函数R。 8.如权利要求6所述的一种插电式混合动力车辆最优能耗的确定方法,其特征在于,所述步长α=0.5,所述在选取行动时采用随机方法的百分比ε=0.01。 |