论文题名: | 基于随机森林模型解释的越野路面识别算法研究 |
关键词: | 汽车自动驾驶;越野路面识别;动力学特征;随机森林模型 |
摘要: | 目前在非铺装路面下驾驶的需求依然广泛存在,而在这些相对较为恶劣的环境下想要实现自动驾驶,则有必要进行路面识别并以此作为依据来对车辆的各个控制系统进行调整来实现提升车辆性能的目的。目前的路面类型识别方法主要有两大类:基于视觉的方法以及基于车辆动力学特征的方法,而基于视觉的路面识别方法容易受到外界环境的影响,相比之下基于动力学特征的路面识别更为可靠且更容易应用到车辆的控制之中。由于不同类型的路面与车轮的作用机理复杂且车轮本身具有非线性的特点,因此想要直接通过理论确定车轮与路面的相互作用机理较为困难。针对此问题,大多学者利用机器学习处理非线性问题的能力较强的特点,通过机器学习来实现路面的识别。这些机器学习算法虽然识别效果较好,但是由于其结构复杂而往往被当作“黑盒”来处理,这就造成了人们很难理解模型做出决策的原因以及模型什么情况下更容易出错,因此对这些机器学习模型进行模型解释是有必要的。 本文针对路面与车轮作用机理复杂且机器学习具有黑盒的特性,开展了路面识别算法的研究,首先利用试验车采集路面行驶数据,并以这些数据作为基础,利用SHAP解释法对特征进行解释、分析与筛选,而后利用筛选后的特征训练随机森林路面分类器,最后利用LIME解释法提取误识别边界并利用HMM模型对识别结果进行了修正。 本文的主要研究内容包括: (1)数据采集与特征计算 根据路面的主要特征选取了四种典型路面:压实土路、沙地、良好沥青路与冰雪路,然后利用VN1630与RT3000搭建了数据采集系统,并利用试验车在四种路面下行驶来完成了数据的采集,通过利用路面参数对车辆的影响进行简单分析,将车速考虑在内定义了垂向加速度系数与轮速波动方差,并与车辆受到的滚动阻力结合作为路面识别的主要特征。 (2)基于SHAP解释法的特征提取 对主要特征的时域特征与频域特征进行计算,建立了越野路面行驶特征样本集。采用与路面分类器相同的算法,将样本集内所有特征作全部作为输入,利用随机森林算法建立预分析模型来对所有特征进行了信息挖掘。之后利用SHAP模型解释法对预分析模型进行全局解释,得到了各个特征的Shapley值,并通过部份依赖图分析了特征在不同情况下与路面类型关系的强弱,最后以解释结果为依据选取了重要的特征作为路面识别模型的输入。 (3)基于随机森林的路面识别算法研究 综合所研究的问题的特点与模型的复杂度,选取随机森林多分类器为路面识别算法,利用基于SHAP解释法筛选后的特征作为路面识别的依据,并将精简后的样本集随机拆分成训练集与测试集,在训练过程中对树的生长进行限制,完成了对随机森林路面分类器的训练,并利用实车数据进行了离线仿真以验证路面识别算法的准确性。 (4)基于LIME解释法的随机森林模型改进 针对模型输出结果存在跳变的问题,提出了三种假设,并在这三种假设的条件下得到了状态转移矩阵与观测矩阵,建立HMM模型并利用Viterbi算法对模型进行解码,得到最可能的路面状态。后利用LIME模型解释法对HMM处理后仍为错误的样本进行局部解释,提取出了模型误识别边界,并对误识别区间内的样本数目进行统计,根据统计结果与样本是否在误识别区间内对HMM模型内部参数进行调整,最后对改进后的HMM模型后处理方法进行了验证,证明了该方法可以提升模型输出结果的准确率。 |
作者: | 李扬 |
专业: | 车辆工程 |
导师: | 赵健 |
授予学位: | 硕士 |
授予学位单位: | 吉林大学 |
学位年度: | 2022 |