详情

原文传递无人驾驶车辆自动控制信号生成方法和装置

专利名称：	无人驾驶车辆自动控制信号生成方法和装置
摘要：	本公开是关于无人驾驶车辆自动控制信号生成方法，包括：根据多个时刻下车辆的驾驶员实际输出的控制信号与多个时刻确定第一拟合函数，根据多个时刻下训练过程模型基于车辆的环境信息输出的控制信号与多个时刻确定第二拟合函数；根据第一拟合函数和第二拟合函数中相同类型的函数项的系数的差值确定损失函数；根据损失函数训练训练过程模型以得到训练完成模型；根据训练完成模型和车辆的环境信息生成用于自动控制车辆的信号。根据本公开的实施例，可以使得训练得到的模型基于环境信息输出的控制信号，可以与驾驶员基于环境信息输出的控制信号稳定性相近，有利于保证模型输出控制信号的稳定性。
专利类型：	发明专利
国家地区组织代码：	北京;11
申请人：	北京三快在线科技有限公司
发明人：	钱德恒;任冬淳;朱炎亮;付圣;丁曙光;王志超
专利状态：	有效
申请日期：	2019-08-06T00:00:00+0800
发布日期：	2019-11-22T00:00:00+0800
申请号：	CN201910720811.1
公开号：	CN110481561A
代理机构：	北京曼威知识产权代理有限公司
代理人：	方志炜
分类号：	B60W50/00(2006.01);B;B60;B60W;B60W50
申请人地址：	100080 北京市海淀区北四环西路9号2106-030
主权项：	1.一种无人驾驶车辆自动控制信号生成方法，其特征在于，包括：根据多个时刻下车辆的驾驶员实际输出的控制信号与所述多个时刻确定第一拟合函数，根据所述多个时刻下训练过程模型基于车辆的环境信息输出的控制信号与所述多个时刻确定第二拟合函数，其中，所述第一拟合函数与所述第二拟合函数的类型相同，且包含函数项的数目相同；根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数；根据所述损失函数训练所述训练过程模型以得到训练完成模型；根据所述训练完成模型和所述车辆的环境信息生成用于自动控制所述车辆的信号。 2.根据权利要求1所述的方法，其特征在于，所述对每种类型的函数项的系数的差值的绝对值求和以确定所述损失函数包括：对每种类型的函数项的系数的差值的平方进行加权求和以确定所述损失函数。 3.根据权利要求1所述的方法，其特征在于，所述第一拟合函数和所述第二拟合函数中的函数项包括以下类型至少之一：多项式函数，指数函数，对数函数。 4.根据权利要求1至3中任一项所述的方法，其特征在于，所述训练过程模型为神经网络，所述神经网络包括m层，在根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数之前，所述方法还包括：确定驾驶员在第一时刻的环境信息下输出的第一控制信号，在第二时刻输出的第二控制信号和在第三时刻输出的第三控制信号，其中，第一控制信号大于第二控制信号，第二控制信号大于第三控制信号，且第一控制信号与第二控制信号的差值，小于第二控制信号与第三控制信号的差值；确定所述第一时刻的环境信息在所述神经网络中第j层激发的第一特征值，所述第二时刻的环境信息在所述神经网络中第j层激发的第二特征值，所述第三时刻的环境信息在所述神经网络中第j层激发的第三特征值；计算第一控制信号和第二控制信号的差值，与第二控制信号和第三控制信号的差值的控制信号比值，第一特征值和第二特征值的差值，与第二特征值和第三特征值的差值的第j差值比；计算所述控制信号比值与所述第j差值比的第j差值的绝对值；其中，所述根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数包括：根据所述第一拟合函数中函数项的系数和所述第二拟合函数中函数项的系数的差值的绝对值，以及所述第j差值的绝对值确定损失函数，j≤m。 5.根据权利要求4所述的方法，其特征在于，在根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数之前，所述方法还包括：对第一差值的绝对值到第m差值的绝对值进行加权求和；其中，所述根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数包括：根据所述第一拟合函数中函数项的系数和所述第二拟合函数中函数项的系数的差值的绝对值，以及对第一差值的绝对值到第m差值的绝对值进行加权求和的值确定损失函数。 6.根据权利要求1至3中任一项所述的方法，其特征在于，所述训练过程模型为神经网络，所述神经网络包括m层，在根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数之前，所述方法还包括：确定驾驶员在第一时刻的环境信息下输出的第一控制信号，在第二时刻输出的第二控制信号和在第三时刻输出的第三控制信号，其中，第一控制信号大于第二控制信号，第二控制信号大于第三控制信号，且第一控制信号与第二控制信号的差值，小于第二控制信号与第三控制信号的差值；确定所述第一时刻的环境信息在所述神经网络中第j层激发的第一特征值，所述第二时刻的环境信息在所述神经网络中第j层激发的第二特征值，所述第三时刻的环境信息在所述神经网络中第j层激发的第三特征值；计算第一控制信号和第二控制信号的第一实际相关度，以及计算第二控制信号和第三控制信号的第二实际相关度，第一特征值和第二特征值的第一模型相关度，以及第二特征值和第三特征值的第二模型相关度；计算所述第一实际相关度和所述第一模型相关度的差值的绝对值，与所述第二实际相关度和所述第二模型相关度的差值的绝对值的第j绝对值和；其中，所述根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数包括：根据所述第一拟合函数中函数项的系数和所述第二拟合函数中函数项的系数的差值的绝对值，以及所述第j绝对值和确定损失函数，j≤m。 7.根据权利要求6所述的方法，其特征在于，在根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数之前，所述方法还包括：对第一绝对值和的到第n绝对值和进行加权求和；其中，所述根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数包括：根据所述第一拟合函数中函数项的系数和所述第二拟合函数中函数项的系数的差值的绝对值，以及对第一绝对值和到第n绝对值和进行加权求和的值确定损失函数。 8.根据权利要求1至3中任一项所述的方法，其特征在于，在根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数之前，所述方法还包括：确定在车辆的样本环境信息下驾驶员实际输出的实际控制信号，以及所述训练过程模型基于车辆的样本环境信息输出的模型控制信号；计算所述实际控制信号与所述模型控制信号的差值的绝对值；其中，所述根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数包括：根据所述第一拟合函数中函数项的系数和所述第二拟合函数中函数项的系数的差值的绝对值，以及所述实际控制信号与所述模型控制信号的差值的绝对值确定损失函数。 9.一种无人驾驶车辆自动控制信号生成装置，其特征在于，包括：拟合函数确定模块，用于根据多个时刻下车辆的驾驶员实际输出的控制信号与所述多个时刻确定第一拟合函数，根据所述多个时刻下训练过程模型基于车辆的环境信息输出的控制信号与所述多个时刻确定第二拟合函数，其中，所述第一拟合函数与所述第二拟合函数的类型相同，且包含函数项的数目相同；损失函数确定模块，用于根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数；模型训练模块，用于根据所述损失函数训练所述训练过程模型以得到训练完成模型；信号生成模块，用于根据所述训练完成模型和所述车辆的环境信息生成用于自动控制所述车辆的信号。 10.一种无人驾驶车辆，其特征在于，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为实现权利要求1至8中任一项所述的方法。 11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至8中任一项所述方法中的步骤。
所属类别：	发明专利