当前位置: 首页> 交通专利数据库 >详情
原文传递 车辆的交互决策方法、装置、电子设备和存储介质
专利名称: 车辆的交互决策方法、装置、电子设备和存储介质
摘要: 本公开实施例公开了一种车辆的交互决策方法、装置、电子设备和存储介质,该方法通过在当前车辆的预决策轨迹中确定多个横向行为语义,从首个横向行为语义开始,依次确定每个横向行为语义下的各预测状态信息,最终根据所有横向行为语义下的各预测状态信息的状态收益,得到当前车辆在预决策轨迹中的第一纵向加速度序列、以及各障碍物的决策轨迹和对应的第二纵向加速度序列,实现了当前车辆的纵向行为决策,以及障碍物的横纵向行为决策,该方法在一个状态交互求解出纵向行为的基础上依次预测下一个状态,使得各状态中障碍物意图预测更加准确,解决了由于不同状态下自车行为改变及障碍物意图变化所导致的决策准确性低的问题,提高了决策可靠性。
专利类型: 发明专利
国家地区组织代码: 北京;11
申请人: 驭势科技(北京)有限公司
发明人: 慕博文;李凯伦;张志晨
专利状态: 有效
申请日期: 2023-09-18T00:00:00+0800
发布日期: 2023-11-07T00:00:00+0800
申请号: CN202311201666.9
公开号: CN117002536A
代理机构: 北京驰明知识产权代理有限公司
代理人: 武玉维
分类号: B60W60/00;B;B60;B60W;B60W60;B60W60/00
申请人地址: 102403 北京市房山区弘安路85号1号楼101室
主权项: 1.一种车辆的交互决策方法,其特征在于,所述方法包括: 在当前车辆的预决策轨迹中确定多个横向行为语义,并获取与所述当前车辆对应的障碍物的预测轨迹,横向行为语义用于描述所述当前车辆的横向行为; 根据初始状态信息确定首个横向行为语义下的多个目标纵向行为解,基于各目标纵向行为解确定首个横向行为语义下的各预测状态信息,并基于各预测状态信息确定下一个横向行为语义下的多个目标纵向行为解,直至得到最后一个横向行为语义下的各预测状态信息,所述目标纵向行为解包括所述当前车辆的纵向加速度以及所述障碍物的纵向加速度; 根据所有横向行为语义下的各预测状态信息的状态收益,确定所述当前车辆在所述预决策轨迹中的第一纵向加速度序列、以及所述障碍物的决策轨迹和对应的第二纵向加速度序列; 其中,状态信息用于描述所述当前车辆、所述障碍物的速度和位置,所述初始状态信息为当前时刻的状态信息,所述预测状态信息为对应横向行为语义中结束时刻的状态信息。 2.根据权利要求1所述的方法,其特征在于,所述根据初始状态信息确定首个横向行为语义下的多个目标纵向行为解,包括: 根据初始状态信息以及每个障碍物分别对应的交互模型,确定每个障碍物分别对应的局部最优行为解集; 对所有局部最优行为解集进行融合,得到首个横向行为语义下的多个目标纵向行为解。 3.根据权利要求2所述的方法,其特征在于,所述根据初始状态信息以及每个障碍物分别对应的交互模型,确定每个障碍物分别对应的局部最优行为解集,包括: 针对每一个所述障碍物,根据所述初始状态信息,调用所述障碍物对应的交互模型,计算所述当前车辆的各第一采样加速度以及所述障碍物的各第二采样加速度之间的收益矩阵; 基于所述收益矩阵确定所述障碍物对应的局部最优行为解集。 4.根据权利要求2所述的方法,其特征在于,所述对所有局部最优行为解集进行融合,得到首个横向行为语义下的多个目标纵向行为解,包括: 针对每一个所述障碍物对应的局部最优行为解集,在其中确定与其它局部最优行为解集具备相同第一采样加速度的行为解,得到解交集; 根据所有解交集中的行为解确定多个目标纵向行为解,并根据各解交集中行为解的单个收益,确定各目标纵向行为解的累计收益,其中,所述单个收益为所述当前车辆与单个障碍物交互的收益,所述累计收益为所述当前车辆与所有障碍物交互的收益; 相应的,所述基于各目标纵向行为解确定首个横向行为语义下的各预测状态信息,包括: 针对每一个所述目标纵向行为解,基于所述目标纵向行为解以及所述初始状态信息确定对应的预测状态信息,并根据所述目标纵向行为解的累计收益确定所述预测状态信息的状态收益。 5.根据权利要求1所述的方法,其特征在于,所述获取与所述当前车辆对应的障碍物的预测轨迹,包括: 在所述当前车辆的当前所在车道中,将距离所述当前车辆最近的前方障碍物和后方障碍物作为关键障碍物; 若所述预决策轨迹包括跟车轨迹段,则将距离所述当前车辆最近的左侧障碍物和右侧障碍物作为关键障碍物,若所述预决策轨迹包括换道轨迹段,则将所述换道轨迹段对应的目标车道中与所述当前车辆最近的前方障碍物和后方障碍物作为关键障碍物; 针对每一个所述关键障碍物,按照预测概率从大到小的顺序,对所述关键障碍物对应的各预测轨迹进行排序,从排序结果中选取前M个预测轨迹; 将除各所述关键障碍物之外的其它障碍物确定为非关键障碍物,针对每一个所述非关键障碍物,对所述非关键障碍物的所有预测轨迹进行碰撞检测,获取其中发生碰撞的部分预测轨迹或全部预测轨迹。 6.根据权利要求5所述的方法,其特征在于,所述获取其中发生碰撞的部分预测轨迹或全部预测轨迹,包括: 获取其中发生碰撞的全部预测轨迹;或者, 基于发生碰撞的所有预测轨迹的预测概率,获取发生碰撞的部分预测轨迹,或者,基于发生碰撞的所有预测轨迹的碰撞位置,获取发生碰撞的部分预测轨迹。 7.根据权利要求1所述的方法,其特征在于,在所述基于各目标纵向行为解确定首个横向行为语义下的各预测状态信息之前,还包括: 针对每一个目标纵向行为解,基于所述目标纵向行为解对所述预决策轨迹进行仿真,并判断所述预决策轨迹的仿真结果中是否存在碰撞情况; 若是,则在所述当前车辆以及各所述障碍物中确定碰撞责任对象,并更新所述目标纵向行为解中所述碰撞责任对象的纵向加速度。 8.一种车辆的交互决策装置,其特征在于,包括: 获取模块,用于在当前车辆的预决策轨迹中确定多个横向行为语义,并获取与所述当前车辆对应的障碍物的预测轨迹,横向行为语义用于描述所述当前车辆的横向行为; 状态确定模块,用于根据初始状态信息确定首个横向行为语义下的多个目标纵向行为解,基于各目标纵向行为解确定首个横向行为语义下的各预测状态信息,并基于各预测状态信息确定下一个横向行为语义下的多个目标纵向行为解,直至得到最后一个横向行为语义下的各预测状态信息,所述目标纵向行为解包括所述当前车辆的纵向加速度以及所述障碍物的纵向加速度; 决策模块,用于根据所有横向行为语义下的各预测状态信息的状态收益,确定所述当前车辆在所述预决策轨迹中的第一纵向加速度序列、以及所述障碍物的决策轨迹和对应的第二纵向加速度序列; 其中,状态信息用于描述所述当前车辆、所述障碍物的速度和位置,所述初始状态信息为当前时刻的状态信息,所述预测状态信息为对应横向行为语义中结束时刻的状态信息。 9.一种电子设备,其特征在于,所述电子设备包括: 一个或多个处理器; 存储装置,用于存储一个或多个程序; 当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的方法。 10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
检索历史
应用推荐