当前位置: 首页> 交通专利数据库 >详情
原文传递 基于自动推理机制的接管巡航方法及系统
专利名称: 基于自动推理机制的接管巡航方法及系统
摘要: 本发明公开了一种基于自动推理机制的接管巡航系统,该系统主要用于自动驾驶中,能够根据给定离线样本生成基于隐变量的多模态的驾驶策略网络,以实现通用自动驾驶功能。同时,该系统还可以在用户采用手动驾驶时根据手动驾驶的风格来自动生成与之相匹配的自动驾驶策略,以实现在公路上从手动驾驶模式到自动驾驶模式之间的平滑转换,使得自动驾驶能够完美的模拟手动驾驶的驾驶风格。本发明包括:判别器模块,驾驶策略生成模块,驾驶风格自动推理模块。该模型是在给定的真实专家示范上进行训练的,具有可靠性。同时,在用户手动驾驶的过程中,模型会根据手动驾驶轨迹进行实时的调整,以增强其灵活性。
专利类型: 发明专利
国家地区组织代码: 江苏;32
申请人: 苏州大学
发明人: 姜冲;章宗长
专利状态: 有效
申请号: CN201811168888.4
公开号: CN109318897A
代理机构: 苏州市中南伟业知识产权代理事务所(普通合伙) 32257
代理人: 郭磊;冯瑞
分类号: B60W30/14(2006.01)I;B;B60;B60W;B60W30
申请人地址: 215000 江苏省苏州市相城区济学路8号
主权项: 1.一种基于自动推理机制的接管巡航方法,其特征在于,包括:输入专家驾驶示范轨迹{τi}i,然后从中随机抽取轨迹τj,使用编码器对其进行编码,得到该轨迹对应的隐变量其中,编码器使用了一个双向LSTM;将隐变量zj输入到解码器即自动驾驶策略πθ(·|zj)中,输出轨迹即策略生成驾驶轨迹;将专家驾驶示范轨迹与策略生成驾驶轨迹输入到判别器D中,判别器为一个二分类的神经网络,由1个输入层,2个隐藏层,1个输出层构成,其中输入为来自专家或生成策略的轨迹,即观察动作对(oj,aj);自动驾驶策略πθ将判别器D的输出作为近似奖赏,即并使用ACKTR方法更新策略网络参数,其中为轨迹τj中的一个观察动作对;根据判别结果使用策略梯度方法更新判别器参数ψi,梯度为:重复上述步骤直至判别器无法区分专家驾驶轨迹与策略生成轨迹,此时驾驶策略生成器能够成功的模仿专家驾驶策略;当用户开始使用本自动接管巡航系统时,如果一开始就选用自动驾驶模式,那么驾驶策略生成模型会使用默认的隐变量作为输入,生成一个默认风格的自动驾驶策略;如果用户选择手动驾驶一段,然后在切换到自动驾驶模式,那么系统会从用户的手动驾驶轨迹中推断其驾驶风格,即并将其作为隐变量输入到策略生成模型πθ中,从而得到一个具有用户驾驶风格的自动驾驶策略;从手动驾驶模式切换到自动驾驶模式时,其初始动作为a~πθ(·|o,z′),其中,z′为自动推理模型推理得到的驾驶风格;o为处于手动驾驶模式时最后采取的驾驶行为所导致的观察。
所属类别: 发明专利
检索历史
应用推荐