专利名称: |
驾驶场景的表示方法、装置、系统和存储介质 |
摘要: |
本发明实施例提出一种驾驶场景的表示方法、装置、系统和存储介质,其中的方法包括预处理原始场景序列,得到训练场景序列,其中,所述原始场景序列中的每帧原始数据均包括场景感知数据和驾驶行为数据,所述训练场景序列中的每帧训练数据均包括场景感知向量和驾驶行为向量;基于所述训练场景序列训练场景嵌入模型;将目标场景的感知数据输入训练好的场景嵌入模型,得到所述目标场景的表示向量。上述方法可以自动化训练场景嵌入模型,有效且低成本地实现将海量高维场景向量降维到可解释语义层面的效果。 |
专利类型: |
发明专利 |
国家地区组织代码: |
北京;11 |
申请人: |
北京百度网讯科技有限公司 |
发明人: |
马晓波 |
专利状态: |
有效 |
申请日期: |
2019-05-24T00:00:00+0800 |
发布日期: |
2019-08-16T00:00:00+0800 |
申请号: |
CN201910443619.2 |
公开号: |
CN110126846A |
代理机构: |
北京市铸成律师事务所 |
代理人: |
包莉莉;武晨燕 |
分类号: |
B60W50/00(2006.01);B;B60;B60W;B60W50 |
申请人地址: |
100085 北京市海淀区上地十街10号百度大厦2层 |
主权项: |
1.一种驾驶场景的表示方法,其特征在于,包括: 预处理原始场景序列,得到训练场景序列,其中,所述原始场景序列中的每帧原始数据均包括场景感知数据和驾驶行为数据,所述训练场景序列中的每帧训练数据均包括场景感知向量和驾驶行为向量; 基于所述训练场景序列训练场景嵌入模型; 将目标场景的感知数据输入训练好的场景嵌入模型,得到所述目标场景的表示向量。 2.根据权利要求1所述的方法,其特征在于,预处理原始场景序列,得到训练场景序列,包括: 根据横向分辨率和纵向分辨率,将所述场景感知数据的物理感知范围划分为多个物理感知单元格; 根据所述场景感知数据中的障碍物信息,设置每个所述物理感知单元格中的参数信息; 用多个包含所述参数信息的物理感知单元格表示所述场景感知向量。 3.根据权利要求1所述的方法,其特征在于,预处理原始场景序列,得到训练场景序列,包括: 将所述驾驶行为数据映射到离散语义类别,得到所述驾驶行为向量。 4.根据权利要求1所述的方法,其特征在于,基于所述训练场景序列训练场景嵌入模型,包括: 从当前窗口的所述训练场景序列中,采样当前帧训练数据和正样本训练数据集,其中,所述正样本训练数据集包括所述当前帧训练数据的前N帧训练数据和后N帧训练数据,N为正整数; 从所述当前窗口之外的所述训练场景序列中,采样负样本训练数据集,其中,所述负样本训练数据集包括随机采样的2N帧训练数据; 基于所述当前帧训练数据、所述正样本训练数据集和所述负样本训练数据集训练所述场景嵌入模型。 5.根据权利要求4所述的方法,其特征在于,所述当前帧训练数据包括当前帧场景感知向量和当前帧驾驶行为向量,所述正样本训练数据集包括2N帧正样本场景感知向量和2N帧正样本驾驶行为向量,所述负样本训练数据集包括2N帧负样本场景感知向量和2N帧负样本驾驶行为向量,基于所述当前帧训练数据、所述正样本训练数据集和所述负样本训练数据集训练所述场景嵌入模型,包括: 将所述当前帧场景感知向量、2N帧所述正样本场景感知向量和2N帧所述负样本场景感知向量输入所述场景嵌入模型,分别得到当前帧嵌入向量、2N帧正样本嵌入向量和2N帧负样本嵌入向量; 根据每帧所述正样本嵌入向量与所述当前帧嵌入向量之间的相似度和第一行为权重,确定正样本相似度,所述第一行为权重根据所述正样本嵌入向量对应的驾驶行为向量与所述当前帧嵌入向量对应的驾驶行为向量之间的相似度确定; 根据每帧所述负样本嵌入向量与所述当前帧嵌入向量之间的相似度和第二行为权重,确定负样本相似度,所述第二行为权重根据所述负样本嵌入向量对应的驾驶行为向量与所述当前帧嵌入向量对应的驾驶行为向量之间的相似度确定; 根据所述正样本相似度和所述负样本相似度,调整所述场景嵌入模型的模型参数。 6.根据权利要求5所述的方法,其特征在于,根据所述正样本相似度和所述负样本相似度,调整所述场景嵌入模型的参数,包括: 以最大化所述正样本相似度和最小化所述负样本相似度为收敛目标,调整所述场景嵌入模型的模型参数。 7.根据权利要求1至6任一项所述的方法,其特征在于,将目标场景的感知数据输入训练好的场景嵌入模型,得到所述目标场景的表示向量,包括: 将所述目标场景的两帧感知数据输入所述训练好的场景嵌入模型,分别得到第一表示向量和第二表示向量; 根据所述第一表示向量和所述第二表示向量之间的相似度,判断所述目标场景的变化度。 8.根据权利要求1至6任一项所述的方法,其特征在于,所述目标场景包括第一目标场景和第二目标场景,将目标场景的感知数据输入训练好的场景嵌入模型,得到所述目标场景的表示向量,包括: 将所述第一目标场景的感知数据输入所述训练好的场景嵌入模型,得到第一场景嵌入向量; 将所述第二目标场景的感知数据输入所述训练好的场景嵌入模型,得到第二场景嵌入向量; 根据所述第一场景嵌入向量和所述第二场景嵌入向量之间的相似度,判断所述第一目标场景与所述第二目标场景是否属于同一类场景。 9.一种模型训练装置,其特征在于,包括: 预处理模块,用于预处理原始场景序列,得到训练场景序列,其中,所述原始场景序列中的每帧原始数据均包括场景感知数据和驾驶行为数据,所述训练场景序列中的每帧训练数据均包括场景感知向量和驾驶行为向量; 训练模块,用于基于所述训练场景序列训练场景嵌入模型,所述场景嵌入模型用于对输入所述场景嵌入模型的目标场景的感知数据进行处理,得到所述目标场景的表示向量。 10.根据权利要求9所述的装置,其特征在于,所述训练模块包括: 第一采样子模块,用于从当前窗口的所述训练场景序列中,采样当前帧训练数据和正样本训练数据集,其中,所述正样本训练数据集包括所述当前帧训练数据的前N帧训练数据和后N帧训练数据,N为正整数; 第二采样子模块,用于从所述当前窗口之外的所述训练场景序列中,采样负样本训练数据集,其中,所述负样本训练数据集包括随机采样的2N帧训练数据; 训练子模块,用于基于所述当前帧训练数据、所述正样本训练数据集和所述负样本训练数据集训练所述场景嵌入模型。 11.根据权利要求10所述的装置,其特征在于,所述当前帧训练数据包括当前帧场景感知向量和当前帧驾驶行为向量,所述正样本训练数据集包括2N帧正样本场景感知向量和2N帧正样本驾驶行为向量,所述负样本训练数据集包括2N帧负样本场景感知向量和2N帧负样本驾驶行为向量,所述训练子模块包括: 输入单元,用于将所述当前帧场景感知向量、2N帧所述正样本场景感知向量和2N帧所述负样本场景感知向量输入所述场景嵌入模型,分别得到当前帧嵌入向量、2N帧正样本嵌入向量和2N帧负样本嵌入向量; 正样本相似度确定单元,用于根据每帧所述正样本嵌入向量与所述当前帧嵌入向量之间的相似度和第一行为权重,确定正样本相似度,所述第一行为权重根据所述正样本嵌入向量对应的驾驶行为向量与所述当前帧嵌入向量对应的驾驶行为向量之间的相似度确定; 负样本相似度确定单元,用于根据每帧所述负样本嵌入向量与所述当前帧嵌入向量之间的相似度和第二行为权重,确定负样本相似度,所述第二行为权重根据所述负样本嵌入向量对应的驾驶行为向量与所述当前帧嵌入向量对应的驾驶行为向量之间的相似度确定; 调整单元,用于根据所述正样本相似度和所述负样本相似度,调整所述场景嵌入模型的模型参数。 12.一种驾驶场景的表示装置,其特征在于,包括: 应用模块,用于将目标场景的感知数据输入场景嵌入模型,得到所述目标场景的表示向量,所述场景嵌入模型为基于训练场景序列而训练得到,所述训练场景序列中的每帧训练数据均包括场景感知向量和驾驶行为向量。 13.根据权利要求12所述的装置,其特征在于,所述应用模块包括: 输入子模块,用于将所述目标场景的两帧感知数据输入所述训练好的场景嵌入模型,分别得到第一表示向量和第二表示向量; 判断子模块,用于根据所述第一表示向量和所述第二表示向量之间的相似度,判断所述目标场景的变化度。 14.根据权利要求12所述的装置,其特征在于,所述目标场景包括第一目标场景和第二目标场景,所述应用模块包括: 第一输入子模块,用于将所述第一目标场景的感知数据输入所述训练好的场景嵌入模型,得到第一场景嵌入向量; 第二输入子模块,用于将所述第二目标场景的感知数据输入所述训练好的场景嵌入模型,得到第二场景嵌入向量; 判断子模块,用于根据所述第一场景嵌入向量和所述第二场景嵌入向量之间的相似度,判断所述第一目标场景与所述第二目标场景是否属于同一类场景。 15.一种驾驶场景的表示系统,其特征在于,包括权利要求9至11任一项所述的模型训练装置以及权利要求12至14任一项所述的驾驶场景的表示装置。 16.一种驾驶场景的表示系统,其特征在于,包括模型训练设备和应用设备, 所述模型训练设备包括: 一个或多个第一处理器; 第一存储器,用于存储一个或多个第一程序; 当所述一个或多个第一程序被所述一个或多个第一处理器执行时,使得所述一个或多个第一处理器实现以下方法:预处理原始场景序列,得到训练场景序列,其中,所述原始场景序列中的每帧原始数据均包括场景感知数据和驾驶行为数据,所述训练场景序列中的每帧训练数据均包括场景感知向量和驾驶行为向量;基于所述训练场景序列训练场景嵌入模型; 所述应用设备包括: 一个或多个第二处理器; 第二存储器,用于存储一个或多个第二程序; 当所述一个或多个第二程序被所述一个或多个第二处理器执行时,使得所述一个或多个第二处理器实现以下方法:将目标场景的感知数据输入训练好的场景嵌入模型,得到所述目标场景的表示向量。 17.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至8中任一项所述的方法。 |
所属类别: |
发明专利 |