当前位置: 首页> 交通专利数据库 >详情
原文传递 一种换道控制方法及装置
专利名称: 一种换道控制方法及装置
摘要: 本发明实施例公开了一种换道控制方法及装置,该方法,包括:获取当前时刻被控车周围环境的当前环境数据;根据预先得到的动作评价模型和当前环境数据,获得当前时刻对换道动作的评分,换道动作包括加速度和转向角;将最高评分对应的换道动作确定为当前时刻的被选换道动作;根据被选换道动作,控制被控车动作。本发明实施例对换道过程中的加速度和转向角进行综合考虑,避免了将纵向和横向规划强行解耦导致的稳定性问题,增加了鲁棒性和乘客的舒适度。
专利类型: 发明专利
国家地区组织代码: 上海;31
申请人: 上海汽车集团股份有限公司
发明人: 徐成;邹清全;刘奋;吕成浩;卢远志;田润
专利状态: 有效
申请日期: 2017-11-02T00:00:00+0800
发布日期: 2019-05-17T00:00:00+0800
申请号: CN201711064941.1
公开号: CN109760681A
代理机构: 北京信远达知识产权代理事务所(普通合伙)
代理人: 魏晓波
分类号: B60W30/18(2012.01);B;B60;B60W;B60W30
申请人地址: 201203 上海市浦东新区张江高科技园区松涛路563号1号楼509室
主权项: 1.一种换道控制方法,其特征在于,所述方法,包括: 获取当前时刻被控车周围环境的当前环境数据; 根据预先得到的动作评价模型和所述当前环境数据,获得当前时刻对换道动作的评分,所述换道动作包括加速度和转向角; 将最高评分对应的换道动作确定为当前时刻的被选换道动作; 根据所述被选换道动作,控制所述被控车动作。 2.根据权利要求1所述的换道控制方法,其特征在于,所述动作评价模型的建立方法,具体包括: 获取换道动作训练集,所述换道动作训练集包括多组换道数据,每组换道数据包括一个换道过程中驾驶员控制第一车执行的每个换道动作和执行该换道动作时所述第一车的车速数据及其周围环境的环境数据; 根据所述换道动作训练集,基于卷积神经网络对训练目标函数进行训练,训练收敛后,得到所述动作评价模型q(s,a); 其中,a为当前换道动作,s为当前环境数据,a'为下一时刻的换道动作,s'为下一时刻的环境数据,γ为学习率,R(s)为当前时刻的即时回报。 3.根据权利要求2所述的换道控制方法,其特征在于, 在换道过程中,所述即时回报与第一舒适数据和第二舒适数据正相关,所述即时回报还与第一安全数据和/或第二安全数据正相关; 其中,所述第一舒适数据与所述第一车在预设时间段内横向加速度的变化程度负相关;所述第二舒适数据与所述第一车在所述预设时间段内纵向加速度的变化程度负相关;所述第一安全数据与第一距离和第二车的车速正相关,所述第二车在所述第一车前方且位于待转入车道,所述第一距离为所述第二车与所述第一车的纵向距离,所述第一安全数据还与所述第一车的车速、最大制动减速度和反应时延负相关;所述第二安全数据与第二距离和所述第一车的车速正相关,所述第二距离为第三车与所述第一车的纵向距离,所述第三车在所述第一车后方且位于所述待转入车道,所述第二安全数据还与所述第三车的车速、最大制动减速度和反应时延负相关; 换道结束时,所述即时回报为100。 4.根据权利要求3所述的换道控制方法,其特征在于,在换道过程中,所述即时回报具体为: 其中,[f0,f1]为横向加速度频谱,[f2,f3]为纵向加速度频谱,ax为所述第一车在所述预设时间段内的横向加速度,ay为所述第一车在所述预设时间段内的纵向加速度,y1为所述第一距离,y2为所述第二距离,v1为所述第一车的车速,v2为所述第二车的车速,v3为所述第三车的车速, amax为k对应车的最大制动减速度,τ为k对应车的反应时延。 5.根据权利要求2所述的换道控制方法,其特征在于,所述根据预先得到的动作评价模型和所述当前环境数据,获得当前时刻对换道动作的评分,具体包括: 将所述当前环境输入所述动作评价模型q(s,a),得到当前时刻的换道动作评分函数q(a); 所述将最高评分对应的换道动作确定为当前时刻的被选换道动作,具体包括: 依据公式确定所述被选换道动作a被选。 6.一种换道控制装置,其特征在于,所述装置,包括:获取单元、评分单元、确定单元和控制单元; 所述获取单元,用于获取当前时刻被控车周围环境的当前环境数据; 所述评分单元,用于根据预先得到的动作评价模型和所述当前环境数据,获得当前时刻对换道动作的评分,所述换道动作包括加速度和转向角; 所述确定单元,用于将最高评分对应的换道动作确定为当前时刻的被选换道动作; 所述控制单元,用于根据所述被选换道动作,控制所述被控车动作。 7.根据权利要求6所述的换道控制装置,其特征在于,所述装置,还包括:模型训练单元;所述模型训练单元,具体用于: 获取换道动作训练集,所述换道动作训练集包括多组换道数据,每组换道数据包括一个换道过程中驾驶员控制第一车执行的每个换道动作和执行该换道动作时所述第一车的车速数据及其周围环境的环境数据; 根据所述换道动作训练集,基于卷积神经网络对训练目标函数进行训练,训练收敛后,得到所述动作评价模型q(s,a); 其中,a为当前换道动作,s为当前环境数据,a'为下一时刻的换道动作,s'为下一时刻的环境数据,γ为学习率,R(s)为当前时刻的即时回报。 8.根据权利要求7所述的换道控制装置,其特征在于, 在换道过程中,所述即时回报与第一舒适数据和第二舒适数据正相关,所述即时回报还与第一安全数据和/或第二安全数据正相关; 其中,所述第一舒适数据与所述第一车在预设时间段内横向加速度的变化程度负相关;所述第二舒适数据与所述第一车在所述预设时间段内纵向加速度的变化程度负相关;所述第一安全数据与第一距离和第二车的车速正相关,所述第二车在所述第一车前方且位于待转入车道,所述第一距离为所述第二车与所述第一车的纵向距离,所述第一安全数据还与所述第一车的车速、最大制动减速度和反应时延负相关;所述第二安全数据与第二距离和所述第一车的车速正相关,所述第二距离为第三车与所述第一车的纵向距离,所述第三车在所述第一车后方且位于所述待转入车道,所述第二安全数据还与所述第三车的车速、最大制动减速度和反应时延负相关; 换道结束时,所述即时回报为100。 9.根据权利要求8所述的换道控制装置,其特征在于,在换道过程中,所述即时回报具体为: 其中,[f0,f1]为横向加速度频谱,[f2,f3]为纵向加速度频谱,ax为所述第一车在所述预设时间段内的横向加速度,ay为所述第一车在所述预设时间段内的纵向加速度,y1为所述第一距离,y2为所述第二距离,v1为所述第一车的车速,v2为所述第二车的车速,v3为所述第三车的车速, amax为k对应车的最大制动减速度,τ为k对应车的反应时延。 10.根据权利要求7所述的换道控制装置,其特征在于,所述评分单元,具体用于: 将所述当前环境输入所述动作评价模型q(s,a),得到当前时刻的换道动作评分函数q(a); 所述将最高评分对应的换道动作确定为当前时刻的被选换道动作,具体包括: 依据公式确定所述被选换道动作a被选。 11.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被执行时,实现以下步骤: 获取当前时刻被控车周围环境的当前环境数据; 根据预先得到的动作评价模型和所述当前环境数据,获得当前时刻对换道动作的评分,所述换道动作包括加速度和转向角; 将最高评分对应的换道动作确定为当前时刻的被选换道动作; 根据所述被选换道动作,控制所述被控车动作。 12.一种整车控制器,其特征在于,包括:存储器和处理器; 所述存储器,用于存储有计算机程序,所述计算机程序被所述处理器执行时能够实现以下步骤: 获取当前时刻被控车周围环境的当前环境数据; 根据预先得到的动作评价模型和所述当前环境数据,获得当前时刻对换道动作的评分,所述换道动作包括加速度和转向角; 将最高评分对应的换道动作确定为当前时刻的被选换道动作; 根据所述被选换道动作,控制所述被控车动作。
所属类别: 发明专利
检索历史
应用推荐