当前位置: 首页> 交通专利数据库 >详情
原文传递 一种线控转向系统传动比优化控制方法及装置
专利名称: 一种线控转向系统传动比优化控制方法及装置
摘要: 本发明公开了一种线控转向系统传动比优化控制方法及装置,包括:获取汽车在路面行驶时的车辆参数;对所述车辆参数进行预处理,获取预处理后的车辆参数;将所述预处理后的车辆参数输入预先训练过的深度强化学习算法中,得到实时的线控转向传动比,基于传动比的计算值对线控转向系统的值进行实时的调整,本发明根据传统车辆动力学算法,确定基本的传动比选择范围,然后根据深度学习强化算法,根据车辆的状态进行最优化学习,动态的调整转向传动比,让线控转向系统的性能发挥到最优,使得车辆不论在低速转弯、高速转弯、空载、满载等各种状态下均让驾驶员的感受最佳。
专利类型: 发明专利
国家地区组织代码: 上海;31
申请人: 上海砺群科技有限公司
发明人: 陈文越;朱峰;王祯;周振华;季小刚;江龙超
专利状态: 有效
申请日期: 2022-07-28T00:00:00+0800
发布日期: 2022-11-25T00:00:00+0800
申请号: CN202210901002.2
公开号: CN115384500A
代理机构: 上海合进知识产权代理事务所(特殊普通合伙)
代理人: 王寿刚
分类号: B60W30/18;B60W40/105;B60W40/11;B60W40/112;B60W40/12;B60W50/00;B;B60;B60W;B60W30;B60W40;B60W50;B60W30/18;B60W40/105;B60W40/11;B60W40/112;B60W40/12;B60W50/00
申请人地址: 201805 上海市嘉定区安亭镇曹安公路5666号242室
主权项: 1.一种线控转向系统传动比优化控制方法,其特征在于,包括: 获取汽车在路面行驶时的车辆参数; 对所述车辆参数进行预处理,获取预处理后的车辆参数; 将所述预处理后的车辆参数输入预先训练过的深度强化学习算法中,得到实时的线控转向传动比,基于传动比的计算值对线控转向系统的值进行实时的调整。 2.根据权利要求1所述的线控转向系统传动比优化控制方法,其特征在于:所述车辆参数包括车速、方向盘转角、方向盘角速度、车身俯仰角、车身横摆角速度、车身侧倾角、前轴离地高度、后轴离地高度中的任意一种或多种。 3.根据权利要求1所述的线控转向系统传动比优化控制方法,其特征在于:所述对所述车辆参数进行预处理包括: 将各个车辆参数进行滤波处理,消除噪点; 将各个车辆参数互相校对,确定参数的可用性,针对各个参数,设置对应的范围限值,超过则报警并将功能降级到初始设置的传动比值。 4.根据权利要求1所述的线控转向系统传动比优化控制方法,其特征在于:所述深度强化学习算法的训练包括: 获取汽车在路面行驶时的车辆参数; 对所述车辆参数进行预处理,获取预处理后的车辆参数; 将所述预处理后的车辆参数作为深度强化学习算法的输入,得到最优传动比; 将深度强化学习算法得到的最优传动比作为线控转向系统的输入信号,在汽车继续行驶的过程中,线控转向系统根据算法计算出的值进行传动比的输入,并得到车辆参数的反馈值; 将反馈值预处理后再次作为深度强化学习算法的输入;进行多次循环过程,采集每次循环过程中的车辆参数的数据,并使用该数据对深度强化学习算法进行训练; 对以上步骤进行多次迭代训练,从而得到训练好的深度强化学习算法;其中,所述深度强化学习算法的输出为线控转向系统的传动比。 5.根据权利要求1所述的线控转向系统传动比优化控制方法,其特征在于:所述深度强化学习算法的实现步骤包括: 算法步骤1:利用式(1)定义深度强化学习方法的车辆状态参数v: v={w,α,β,wd,αd,βd} (1) 其中,wd为理想横摆角速度;w为测量横摆角速度;αd为理想车身侧倾角;α为测量车身侧倾角;βd为理想车身俯仰角;β为测量车身俯仰角; 算法步骤2:利用式(2)定义深度强化学习方法的动作参数a: a={γ} (2) 式中:γ为线控转向系统角传动比,无单位; 算法步骤3:利用式(3)建立深度强化学习方法的奖励函数r: r=rβ+rw+rα+rt (3) 其中:rβ为车身俯仰角奖励函数、rw为车身横摆角速度奖励函数、rα为车身侧倾角奖励函数、rt为横向加速度响应时间; 算法步骤4:构建深度强化学习方法的计算模型; 算法步骤5:利用初始数据生成N个车辆数据样本; 算法步骤6:用步骤5得到的N个车辆数据样本对深度强化学习方法的模型进行训练,从而得到最优化神经网络模型; 算法步骤7:在车辆运行中,实时测量车辆当前状态参数vt,将状态参数输入到以上得到的最优神经网络模型中,直接输出目前状态下最优化的线控转向提供传动比。 6.根据权利要求5所述的线控转向系统传动比优化控制方法,其特征在于:所述奖励函数设置为3个优先级,优先级越高,则该原则越重要,设计原则为: 1级:保证横摆角速度控制和横向加速度响应时间在设定范围内; 2级:保证车身的侧倾控制高于车身的俯仰控制; 3级:保证车身的俯仰在设定范围内; 其中,rα车身侧倾角奖励函数如式(4)所示,对应于2级设计原则,公式如下: 其中,roll为车身俯仰角;△roll=|roll–roll_normal|,表示车身俯仰角变化量;所述roll_normal表示在平整路面上汽车的车身侧倾角;max_pitch为△pitch的最大值,roll_th为△pitch的阈值,max_roll≥roll_th≥0; rβ车身俯仰角奖励函数如式(5)所示,对应于3级设计原则,公式如下: 其中,pitch为车身俯仰角;Δph=|ph–ph_normal|,表示车身俯仰角变化量;所述ph_normal表示在平整路面上汽车的车身俯仰角;max_ph为△pitch的最大值,ph_th为Δph的阈值,max_ph≥ph_th≥0; rw车身横摆角速度奖励函数如式(6)所示,对应于1级设计原则,设计二次函数作为1级奖励函数,公式如下: 其中,yaw为车身横摆角速度;Δyaw=|yaw–yaw_normal|,表示车身横摆角速度变化量;所述yaw_normal表示在平整路面上汽车的车身俯仰角;max_yaw为Δyaw的最大值,yaw_th为Δyaw的阈值,max_yaw≥yaw_th≥0; rt车身横向加速度响应时间奖励函数如式(7)所示,对应于1级设计原则,设计二次函数作为1级奖励函数,公式如下: 其中,yt为车身横向加速度响应时间;Δyt=|yt–yt_normal|,表示车身横向加速度响应时间变化量;所述yt_normal表示在平整路面上汽车的车身横向加速度响应时间;max_yt为Δyt的最大值,yt_th为Δyaw的阈值,max_yt≥yt_th≥0。 7.根据权利要求6所述的线控转向系统传动比优化控制方法,其特征在于,所述构建深度强化学习方法的计算模型包括: 构建初始动作神经网络模型,模型为三层神经网络模型包括:第一层输入层,包含一个神经元,第二层为隐藏层,包含x1个神经元,第三层为包含2个神经元的输出层;初始化动作参数为ina_first; 构建评价神经网络模型,模型为三层神经网络模型,包括:第一层输入层,包含两个神经元,隐藏层包含x2个神经元,输出层包含1个神经元,初始化评价参数为inev_first; 构建目标神经网络模型,其结构与初始神经网络模型结构相同,且令目标动作参数ina_target=ina_first,构建目标评价神经网络模型,其结构与评价神经网络模型结构相同,且令目标评价参数inev_target=inev_first。 8.根据权利要求7所述的线控转向系统传动比优化控制方法,其特征在于,所述利用初始数据生成N个车辆数据样本,包括: 利用经验值或者实车测量值赋值初始车辆状态参数v_inital,并以此车辆状态参数v_inital作为初始神经网络的输入,由该模型输出f(v_inital|ina_first); 利用式(8)得到第n个车辆动作参数an: an=f(v_inital|ina_first)(8) 根据式(3)获取第n个车辆奖励值rn,并得到更新后的第n个车辆状态参数vn_new;从而得到获得第n条样本,记为(vn,an,rn,vn_new) 重复以上步骤进而得到所需要的N个数据样本。 9.根据权利要求8所述的线控转向系统传动比优化控制方法,其特征在于,所述用步骤5得到的N个车辆数据样本对深度强化学习方法的模型进行训练,从而得到最优化神经网络模型,包括: 初始化n=1,以第n个车辆状态参数vn作为当前第n个动作神经模型的输入,由所述当前第n个动作神经模型输出第n个输出值f(vn|ina_first); 以第n个车辆状态参数vn、第n个车辆动作参数an和动作网络的第n个输出值f(vn|ina_first)均作为当前第n个评价模型的输入,由第n个车辆状态参数vn和第n个车辆动作参数an经过当前第n个评价模型输出第n个输出值Fn(an);由动作神经模型的第n个输出值f(vn|ina_first)经过当前第n个评价模型输出第n个输出值Fn(f(vn|ina_first)); 以更新后的第n个车辆状态参数vn_new作为当前第n个目标动作神经模型的输入,由当前第n个目标动作神经模型输出第n个输出值f(vn_new|ina_target); 以更新后的第n个车辆状态参数vn_new和目标动作神经模型的第n个输出值f(vn_new|ina_target)作为当前第n个目标评价模型的输入,由当前第n个目标评价模型输出第n个输出值F′n(an_vew); 根据当前第n个评价模型的第n个输出值Fn(f(vn|ina_first))利用自然梯度法对当前第n个动作神经模型进行更新,从而得到第n次更新后的动作神经模型并作为第n+1个动作神经模型; 以当前第n个评价模型的输出Fn(an)以及当前第n个目标评价模型的输出F′n(an_new),利用最大似然损失对当前第n个评价模型进行更新,从而得到第n次更新后的评价模型并作为第n+1个评价模型; 如果n+1>N则表明得到最优神经网络模型,如果nN。 10.一种线控转向系统传动比优化控制装置,其特征在于,包括: 车辆参数获取单元,用于获取汽车在路面行驶时的车辆参数; 预处理单元,用于对所述车辆参数进行预处理,获取预处理后的车辆参数; 计算调整单元,用于将所述预处理后的车辆参数输入预先训练过的深度强化学习算法中,得到实时的线控转向传动比,基于传动比的计算值对线控转向系统的值进行实时的调整。
检索历史
应用推荐