专利名称: |
一种多车运动状态的汽车轨迹网联交互式预测方法 |
摘要: |
本发明涉及一种多车运动状态的汽车轨迹网联交互式预测方法,属于智能网联汽车环境感知技术领域。本发明方法包括确定网联多车的相对位置关系,提取各自行驶状态的特征,将多车的行驶状态特征分别输入到长短时记忆单元中,并将相邻车辆的隐藏状态通过辐射形网络连接共享,从而构建结构化长短时记忆单元,实现对多车间交互关系的建模,然后利用结构化长短时记忆单元建立多层编码‑解码器网络进行多车的未来行驶轨迹的预测,之后将网络所得的预测状态发送给决策模块进行自主决策与路径规划。本方法采用结构化长短时记忆单元将网联多车之间的行驶状态进行隐藏状态层的共享,实现交互关系的建模,本方法可以实现在复杂交通环境下,针对多车进行同步的长时间跨度预测,达到较高的预测准确度。 |
专利类型: |
发明专利 |
国家地区组织代码: |
北京;11 |
申请人: |
清华大学 |
发明人: |
李升波;成波;侯廉;忻隆;王文军;孙琪;李克强 |
专利状态: |
有效 |
申请日期: |
2019-02-25T00:00:00+0800 |
发布日期: |
2019-06-21T00:00:00+0800 |
申请号: |
CN201910135633.6 |
公开号: |
CN109910909A |
代理机构: |
北京清亦华知识产权代理事务所(普通合伙) |
代理人: |
罗文群 |
分类号: |
B60W50/00(2006.01);B;B60;B60W;B60W50 |
申请人地址: |
100085 北京市海淀区清华园1号 |
主权项: |
1.一种多车运动状态的汽车轨迹网联交互式预测方法,其特征在于该预测方法包括以下步骤: (1)设定被预测的目标车辆与环境车辆,分布在三条相邻车道中,目标车辆处于中间车道中,当目标车辆越过中间车道线时,目标车辆与环境车辆的位置关系替换为新的三条相邻车道,仍使目标车辆处于中间车道中间车道: (2)根据步骤(1)设定的被预测的目标车辆与环境车辆空间位置关系,通过车辆传感器分别采集目标车辆与环境车辆的行驶状态参数,记为xt,其中t为采样时刻,xt包括:车辆与车辆所在当前车道的左车道线之间的距离、车辆与车辆所在当前车道的右车道线之间的距离、车辆的车头时距、车辆的车头间距、车辆的横向速度、车辆的纵向速度、车辆的横向加速度、车辆的纵向加速度、车辆的车宽和车辆的车长; (3)建立一个描述目标车辆与环境车辆的交互式关系的结构化长短时记忆网络单元,该单元由多个长短时记忆网络单元组成,根据步骤(1)的车辆空间位置关系,建立相邻长短时记忆网络单元之间的辐射形连接,具体过程如下: (3-1)建立与各目标车辆与环境车辆相对应的长短时记忆网络单元如下: ct=ft⊙ct-1+it⊙gt ht=ot⊙f(ct) 其中,σ(·)为sigmoid函数,即σ(x)=1/1+e-x),f(·)为长短时记忆网络单元的任意激活函数,it、ft、ot和gt分别为长短时记忆网络单元的输入门向量、遗忘门向量、输出门向量和更新门向量,和分别为长短时记忆网络单元的可训练权重,为长短时记忆网络单元训练后的待定量,其中,上标i、f、o和g分别表示该权重计算后得到输入门向量、遗忘门向量、输出门向量和更新门向量,下标x和h分别表示该权重对应单元输入和隐藏状态,bi、bf、bo和bg为长短时记忆网络单元的偏置,为长短时记忆网络单元训练后的待定量,其中,下标i、f、o和g分别表示该权重计算后得到输入门向量、遗忘门向量、输出门向量和更新门向量,⊙为矩阵元素的对应相乘,xt为步骤(2)的在采样时刻t分别采集的目标车辆与环境车辆的行驶状态参数,xt作为长短时记忆网络单元的输入,隐藏状态ht及单元状态ct为长短时记忆网络单元的输出; 重复本步骤,遍历所有目标车辆和环境车辆,得到所有车辆的长短时记忆网络单元; (3-2)根据步骤(1)的车辆空间位置关系,将步骤(3-1)建立的所有长短时记忆网络单元中,与相邻车辆相对应的相邻单元分别进行连接,共享各自的隐藏状态,形成一个结构化长短时记忆网络单元: 其中,LSTM(·)表示步骤(3-1)中的长短时记忆网络单元,W为所有可训练权重,为结构化长短时记忆网络单元训练后的待定量,隐藏状态ht及单元状态ct为结构化长短时记忆网络单元的输出,下标t为采样时刻,上标o、f、lf、lr、rf和rr分别表示步骤(1)中的目标车辆、前方车辆、左前车辆、左后车辆、右前车辆和右后车辆,[·,·]表示将两个短向量相连得到一个长向量; (4)利用步骤(3)构建的结构化长短时记忆网络单元,建立一个车辆轨迹网联交互式预测网络,具体过程如下: (4-1)建立一个历史行驶状态处理器,包括一个线性变换层与多个步骤(3)的结构化长短时记忆网络单元层,用于理解车辆的历史行驶状态参数,历史行驶状态处理器的结构如下: 其中,为线性变换后的中间量,SLSTM(·)表示步骤(3-2)中结构化长短时记忆网络单元层,V和W分别为线性变换层的可训练权重和结构化长短时记忆网络单元层的可训练权重,为历史行驶状态处理器训练后的待定量,N为结构化长短时记忆网络单元的层数,根据交通环境设定,例如,当交通环境较为简单时设定为1或2,当交通环境较为复杂时设定为3或以上,xt为步骤(2)采集的车辆的行驶状态参数,隐藏状态ht及单元状态ct为历史行驶状态处理器的输出; 将与最后输入的车辆行驶状态参数xt相对应的历史行驶状态处理器输出的隐藏状态ht及单元状态ct作为中间处理量; (4-2)建立一个未来行驶状态处理器,包括一个输入线性变换层、多个步骤(3)的结构化长短时记忆网络单元层和一个输出线性变换层,用于预测车辆的未来行驶状态参数,未来行驶状态处理器的结构如下: 其中,为线性变换后的中间量,SLSTM(·)表示步骤(3-2)中结构化长短时记忆网络单元层,V′、W′和U′分别为输入线性变换层的可训练权重、多个步骤(3)的结构化长短时记忆网络单元层的可训练权重和输出线性变换层的可训练权重,为未来行驶状态处理器训练后的待定量; 将步骤(4-1)中的中间处理量作为未来行驶状态处理器的隐藏状态ht及单元状态ct的初始值,将yt作为未来行驶状态处理器的输出,即通过中间处理量连接历史行驶状态处理器与未来行驶状态处理器,得到车辆轨迹网联交互式预测网络; (5)对步骤(4)建立的车辆轨迹网联交互式预测网络进行训练,将车辆传感器采集目标车辆与环境车辆的连续驶状态参数xt序列切分为两段,其中第一段作为车辆轨迹网联交互式预测网络训练输入,记为历史行驶状态第二段作为训练标签,记为未来行驶状态真实值将历史行驶状态输入当前权重V、W、V′、W′和U′下的车辆轨迹网联交互式预测网络中,得到未来行驶状态预测值yt,计算未来行驶状态预测值yt与真实值之间的均方根误差J: 其中T为预测时长,取值为5秒至10秒; 将均方根误差J作为车辆轨迹网联交互式预测网络的损失函数值,利用反向传播算法将网络权重V、W、V′、W′和U′向负梯度方向更新,以降低损失函数值,重复上述步骤,直到相邻两次的损失函数值下降率小于0.1%,以最后步骤中的V、W、V′、W′和U′作为车辆轨迹网联交互式预测网络中的网络权重,完成车辆轨迹网联交互式预测网络的训练; (6)以步骤(5)中训练完成的车辆轨迹网联交互式预测网络作为多车运动状态的汽车轨迹网联交互式预测模型,实时向该多车运动状态的汽车轨迹网联交互式预测模型输入车辆传感器当前采集的目标车辆与环境车辆的行驶状态参数,实时输出未来的目标车辆与环境车辆的行驶状态预测值,实现多车运动状态的汽车轨迹网联交互式预测。 |
所属类别: |
发明专利 |