当前位置: 首页> 交通专利数据库 >详情
原文传递 一种智能车辆滚动优化非合作博弈决策方法
专利名称: 一种智能车辆滚动优化非合作博弈决策方法
摘要: 本发明提供了一种智能车辆非合作滚动优化博弈决策均衡点求解方法,首先建立了本车的决策模型以及周车的驾驶员模型,将本车的决策模型和周车的驾驶员模型集成为一个系统,建立车辆的博弈模型;接着,建立行车环境模型,提出了滚动优化博弈的决策方法,对非合作博弈决策的优化问题进行数学描述;根据本车和周车各自的目标,分别构建了本车和周车的目标函数和约束条件;最后设计了非合作博弈决策优化问题的纳什均衡求解方法,实现智能车辆在非合作博弈下的决策;本方法通过博弈的形式,提高了预测周围车辆动态的精度,提高了决策的效果和效率。
专利类型: 发明专利
国家地区组织代码: 吉林;22
申请人: 吉林大学
发明人: 戴启坤;郭洪艳;孙义;陈虹;刘俊;郭景征
专利状态: 有效
申请日期: 2023-07-04T00:00:00+0800
发布日期: 2023-11-07T00:00:00+0800
申请号: CN202310809374.7
公开号: CN117002520A
代理机构: 长春吉大专利代理有限责任公司
代理人: 刘驰宇
分类号: B60W50/00;G06F30/20;G06F30/15;G06F17/15;G06Q10/0637;G06Q50/30;G06F111/04;G06F119/14;G06F111/10;B;G;B60;G06;B60W;G06F;G06Q;B60W50;G06F30;G06F17;G06Q10;G06Q50;G06F111;G06F119;B60W50/00;G06F30/20;G06F30/15;G06F17/15;G06Q10/0637;G06Q50/30;G06F111/04;G06F119/14;G06F111/10
申请人地址: 130012 吉林省长春市长春高新技术产业开发区前进大街2699号
主权项: 1.一种智能车辆滚动优化非合作博弈决策方法,加装和运行在本车上,通过本车上加装的现有技术中的惯性导航系统、激光雷达、摄像头、感知算法,感知周围全部车辆的位置,并且本车将周围全部车辆中与智能车辆距离最近的车辆作为周车;针对本车与周车可能因行驶目标相近而导致本车与周车对行驶空间进行博弈的问题,首先建立车辆博弈模型以同时预测本车和周车的未来状态,然后建立非合作博弈决策优化问题的数学描述以表示本车的行驶目标和周车的行驶目标,最后通过非合作博弈求解得到本车和周车的最优控制量序列,实现智能车辆在非合作博弈下的决策,其特征在于,本方法的具体步骤如下: 步骤一、建立车辆博弈模型 本发明采用模型预测控制的方法实现智能车辆非合作博弈决策,因此需要建立模型预测控制方法的预测模型,在建立车辆博弈模型之前,首先分别建立本车的决策模型以及周车的驾驶员模型; 为了更好的实现智能车辆非合作博弈决策,本方法考虑了车辆动力学,并使得所建的车辆模型较为简单,采用了只考虑车体的平面运动,忽略垂直运动和空气动力学效应的自行车模型对本车的车辆动力学模型进行建立; 假设本车通过前轮进行转向,前轮转角的值较小,则自行车模型的运动学方程如下所示: 其中,表示本车的轮胎总纵向力,/>分别表示本车前轮的总侧向力和本车后轮的总侧向力,mA表示本车的质量,/>表示本车的纵向速度,/>表示本车的横向速度,/>表示本车的横摆角,rA表示本车的横摆角速度,/>表示本车的纵向加速度,/>表示本车绕Z轴的转动惯量,XA表示本车在大地坐标下的纵向位置,YA表示本车在大地坐标下的横向位置,a1表示本车的前轴到质心的距离,b1表示本车的后轴到质心的距离; 由于本车的前轮转角较小,所以本车的侧向轮胎力采用以下的线性轮胎模型进行表示: 其中,表示本车的前轮侧偏角,/>表示本车的后轮侧偏角,/>表示本车的前轮侧偏刚度,/>表示本车的后轮侧偏刚度; 采用本车的横向速度、纵向速度、质心侧偏角计算轮胎侧偏角,具体公式如下所示: 其中,δA表示本车的前轮转角,βA表示本车的质心侧偏角; 将公式(3)带入公式(2)中计算可得: 由公式(1)可知: 所以: 将公式(4)代入公式(6)可得 因此,通过上述的公式推导,最终采用公式(8)的非线性模型表示本车的决策模型: 对于本车的决策模型,本方法将作为本车系统的状态量,将作为本车系统的控制量,上标T表示向量的转置; 对于周车驾驶员模型,当本车决策,周车驾驶员途中遇到障碍物或者与本车目标冲突,行驶存在竞争关系时,周车和本车一样也能够通过纵向加速度与前轮转角来改变自身的行驶状态;周车驾驶员模型与本车的决策相比,周车驾驶员模型需要考虑驾驶员神经肌肉反应延迟的问题,本步骤将延迟转化为周车驾驶员的能力、风格,通过优化目标的权重来体现;此外,周车驾驶员模型的参数与本车的决策模型也不同,具体的周车驾驶员模型如下: 其中,mB表示周车的质量,表示周车的纵向速度,/>表示周车的横向速度,/>表示周车的横摆角,rB表示周车的横摆角速度,/>表示周车绕Z轴的转动惯量,XB表示周车在大地坐标下的纵向位置,YB表示周车在大地坐标下的横向位置,a2表示周车的前轴距离,b2表示周车的后轴距离,/>表示周车的纵向加速度,δB表示周车的前轮转角,/>表示周车前轮的侧偏刚度,/>表示周车的后轮侧偏刚度,将/>作为周车系统的状态量,将/>作为周车系统的控制量,上标T表示向量的转置; 本方法将本车的决策模型和周车的驾驶员模型集成为一个完整的系统,结合式(8)和式(9)可得到如下的车辆博弈模型: 其中,x表示车辆博弈模型的状态向量,具体被描述为: 本车和周车的控制量由两辆车的纵向加速度与前轮转角组成,具体控制量被描述为: 为了通过预测模型预测出本车和周车在未来一个时域内的动态,需要对式(10)进行离散化处理,设k为步长,xk表示第k步的状态量,表示第k步的控制量,上标j=A表示本车,上标j=B表示周车,假设采样时间较小,可将车辆博弈模型离散化为: 其中, C表示12×12的单位阵;Ts表示采样时间; 步骤二、非合作博弈决策优化问题的数学描述 在对非合作博弈决策优化问题进行数学描述之前,首先建立行车环境模型,本方法采用人工势场法建立行车环境模型,将车道线和障碍车作为道路上影响智能车辆行驶的因素; 建立智能车辆决策坐标系,坐标系X轴方向为从智能车辆质心向智能车辆车头的方向,坐标系Y轴方向为从智能车辆质心向智能驾驶车辆左侧的与坐标系X轴垂直的方向,坐标系原点为智能车辆质心位置,坐标系X轴方向为车辆纵向,坐标系Y轴方向为车辆侧向; 对于车道线势力场,车道线由车道的分道线和车道的边界线构成,分道线势场是为了保证车辆尽量在当前的车道上行驶,避免不必要变道,依据分道线势场建立的目的,势场在分道线处取最大值,并向分道线两侧逐渐变小;除此之外,分道线势场应尽可能小,确保智能车辆在需要避障变道时能成功跨越车道行驶,本方法采用如下的类似高斯函数进行分道线势场建模: 其中,Alane表示分道线的势场系数,ylane表示分道线在坐标系Y轴方向上的位置,σlane表示分道线势场收敛系数; 车道边界线是为了防止智能车辆驶出车道,将道路边缘的势力场设为无穷大,以防止车辆离开道路,车道边界线的势力场随着车辆与车道边界距离的减小而增大,在车道边界线处势力场值达到最大,势力场远大于分道线势力场,本方法采用如下函数形式来表示道路边界线的势力场: 其中,η表示车道边界线的比例因子,yroad,a表示第a条车道边界线的位置,a∈{1,2}分别设yroad,1=1.5m,yroad,2=4.5m; 因此车道势力场的值为车道边界线势力场值与分道线势力场值之和; Uk=Ulane+Uroad (17) 建立障碍车坐标系,坐标系X轴方向为从障碍车质心向障碍车车头的方向,坐标系Y轴方向为从障碍车质心向障碍车左侧的与坐标系X轴垂直的方向,坐标系原点为障碍车质心位置,坐标系X轴方向为车辆纵向,坐标系Y轴方向为车辆侧向; 对于障碍车智能车辆的行驶产生影响,本方法通过在障碍车的周围建立沿道路方向的虚拟动态斥力场引导智能车辆完成决策,随着智能车辆与障碍车的距离缩小,障碍车动态矩形虚拟斥力场的势能增大,到障碍车位置时趋于无穷大,障碍车动态矩形虚拟斥力场的势场函数如式(18)所示: 其中,ηp1、ηp2和ηp3表示调节因子,ηp1决定障碍车动态矩形虚拟斥力场势能变化的紧急程度、ηp2决定势能变化与相对速度的相关程度,ηp3决定势能变化与相对位置的相关程度,O表示障碍车,vOb表示障碍车的速度,xOb表示障碍车在坐标系X轴的纵向位置,yOb表示障碍车在坐标系Y轴的侧向位置,x0表示智能车辆在坐标系X轴的纵向位置,y0表示智能车辆在坐标系Y轴的侧向位置; 本步骤依据步骤一建立的车辆博弈模型以及本步骤建立的行车环境模型,采用模型预测控制方法对非合作博弈决策优化问题进行数学描述,实现智能车辆的横纵向决策,非合作博弈决策方法应满足如下要求:第一,本车和周车在行驶中,都应尽可能保持在当前车道行驶;第二,需控制本车与周车避免与障碍车发生碰撞;第三,应尽可能保持本车和周车按期望车速行驶;第四,保证本车和周车在博弈路径规划过程中的控制增量都尽量较小;第五,在两车博弈决策时,车辆需在观测周车位置同时预测周车的控制量,并尽可能使得周车的控制增量较小; 根据以上智能车辆非合作博弈决策所需满足的要求,分别建立本车与周车非合作博弈决策的目标函数和约束条件; 假设智能车辆非合作博弈决策的控制时域为Nc,预测时域为Np,且Nc≤Np,控制量在控制时域之外的部分保持恒定不变,即: 通过当前获取的本车状态和周车状态,基于式(13)采用模型预测控制中的状态递推的方式迭代,预测出下一个时域的本车状态信息和周车状态信息; 为防止本车和周车与障碍车相撞,当两车在障碍车斥力场范围内的时候,靠近障碍车时,所受到的势能较高,通过障碍车斥力场的势能构建本车和周车的最小化目标函数,本车的具体目标函数和周车的具体目标函数/>如下: 对于道路边界线势力场,车辆行驶在道路边界两端的斥力场很大,往道路内逐渐变小;此外,道路分道线也具有较小的势力场,防止本车和周车经常进行换道;通过车道线的总势能构建本车和周车的最小化目标函数,本车的具体目标函数和周车的具体目标函数/>如下: 为了保证本车和周车在行驶过程中尽可能保持各自期望的速度行驶,分别构建如下本车期望速度最小化目标函数与周车期望速度最小化目标函数/> 其中,表示本车期望速度;/>表示周车期望速度; 为了保证本车和周车的平稳运行,应该使得本车和周车的控制增量尽可能小,分别构建如下本车控制增量最小化目标函数与周车控制增量最小化目标函数/> 其中,ΔuA(k+i)表示本车的控制增量;表示本车的纵向加速度变化率;ΔδA(k+i)表示本车的前轮转角变化率;ΔuB(k+i)表示周车的控制增量/>表示周车的纵向加速度变化率;ΔδB(k+i)表示周车前轮转角变化率; 为了在两车进行博弈决策时,本车和周车可以平稳行驶,两车在行驶的时候需要在观测周围车辆位置的同时也预测周围车辆的纵向加速度和前轮转角,并尽可能使得周围车辆的控制增量较小,分别构建如下本车和周车的最小化目标函数 由于本方法考虑非合作博弈决策中需要优化的目标较多,优化目标之间存在互相制约的问题,因此通过引入权重因子平衡本车和周车的多个优化目标,分别构建本车的总目标函数和周车的总目标函数,本车的总目标函数与周车的总目标函数如下: 其中,表示本车子目标函数/>的权重因子,/>表示本车子目标函数/>的权重因子,/>表示本车子目标函数/>的权重因子,/>表示本车子目标函数/>的权重因子,/>表示本车子目标函数/>的权重因子;/>表示周车子目标函数/>的权重因子,/>表示周车子目标函数/>的权重因子,/>表示周车子目标函数/>的权重因子,/>表示周车子目标函数的权重因子,/>表示周车子目标函数/>的权重因子; 为了更好地实现智能车辆非合作博弈决策,对本车和周车的约束条件也进行构建,为了保证本车和周车可以平稳行驶,分别对本车与周车的控制量进行约束,本车与周车的约束条件可以表示为: 其中,表示本车纵向加速度的最小值;/>表示本车纵向加速度的最大值;/>表示周车纵向加速度的最小值;/>表示周车纵向加速度的最大值;/>表示本车前轮转角的最小值;/>表示本车前轮转角的最大值;/>表示周车前轮转角的最小值;/>表示周车前轮转角的最大值; 因此,本车与周车的非合作博弈决策优化问题可以进行如下的数学描述: 步骤三、非合作博弈求解 由于本车与周车完成非合作博弈决策的过程是一种非线性纳什均衡博弈求最优解的过程,非线性具体体现在非线性规划模型与非线性目标函数,因此对于非合作博弈决策的优化问题采用纳什均衡方法求解,即任何参与人都不能通过改变自己的最优解来降低自己的目标函数; 本车和周车在进行横纵向决策时形成的博弈是非合作博弈关系,则本车与周车之间的策略组合构成了纳什均衡策略,根据纳什均衡原理,当本车与周车进行非合作博弈决策达到平衡的条件如下: 其中,JA表示本车的总目标函数;UA表示本车的控制量序列;JB表示周车的总目标函数;UB表示本车的控制量序列; 将以上的纳什均衡条件进行转化,要想本车与周车进行非合作博弈决策达到平衡,需要在周车的最优控制量序列UB*下求解出本车目标函数JA(UA,UB*)的局部极小值,在本车的最优控制量序列UA*下求解出周车目标函数JB(UA*,UB)的局部极小值; 根据局部极小值的定义,纳什均衡的条件可以进一步转化为如果存在本车与周车的最优控制量序列(UA*,UB*)使得: 根据式(29)中本车与周车进行非合作博弈决策达到平衡条件,接下来进行具体的求解,要想求出在周车的最优控制量序列UB*下本车目标函数JA(UA,UB*)的局部极小值,在UA*下周车目标函数JB(UA*,UB)的局部极小值,首先对本车目标函数的极值和周车目标函数的极值进行求解,通过求本车和周车目标函数导数平方的最小值,分别求出两个目标函数的极值,具体公式如下: MultiStart是当运行时试图通过从不同的点开始为一个问题找到多个局部解决方案的求解器; 由于式(30)不止一组解,因此这里使用MultiStart对式(30)进行求解; 如果一组解满足(31),那么该组解就是一个局部极小值解: 在求解出的极小值解中选出最小的解作为本车和周车的最优控制量序列: U*(k)=[u*(k),u*(k+1),...,u*(k+Nc-1)]T (32) 其中,u(k)=[uA(k),uB(k)]T; 选取最优控制量序列中的第一个元素作为后续横纵向决策系统的输入,作用于本车和周车上,通过求解得到的两车纵向加速度与前轮转角控制本车与周车的非合作博弈决策, 间隔决策周期Td的时间,智能车辆滚动优化非合作博弈决策方法重新获取车辆滚动优化决策系统状态,建立车辆博弈模型、建立行车环境模型、对非合作博弈决策优化问题进行数学描述、通过纳什均衡方法求解非合作博弈决策优化问题,实现智能车辆的横纵向决策,提高预测周围车辆动态的精度。
所属类别: 发明专利
检索历史
应用推荐