当前位置: 首页> 学位论文 >详情
原文传递 基于可解释深度学习的自动驾驶汽车预测任务研究
论文题名: 基于可解释深度学习的自动驾驶汽车预测任务研究
关键词: 自动驾驶;深度学习;预测模型;可解释性;多任务学习
摘要: 自动驾驶技术是汽车未来的重要变革技术之一。预测模块作为自动驾驶算法流程中承上启下的部分,将低级的环境感知信息进行高级抽象表征与理解,并输出周围智能体未来的状态。借助于深度神经网络,自动驾驶汽车能够高精度地推理预测周围智能体的运动轨迹、行为意图和风险水平,进而提高自动驾驶汽车决策与规划模块的正确率和求解速度。目前,基于深度学习的预测方法在准确率和泛化性上已经超越了基于规则与机器学习的方法,也是自动驾驶领域的研究热点。
  然而,在面对更为复杂多变的交通场景时,基于深度学习的预测方法仍然面临着许多难题与挑战亟待解决,例如带噪声的多源异构输入处理,多源异构数据的特征提取与语义融合,多预测任务间的高级语义信息共享等。此外,随着越来越多自动驾驶技术在商业汽车中部署,作为黑盒模型的深度神经网络在其透明度、可信度、可解释性方面受到了越来越多的关注。如何提高深度学习模型的可解释性,挖掘智能体意图-行为-运动模式,也是自动驾驶预测任务所需要突破的瓶颈。
  针对上述问题,本文围绕自动驾驶汽车的风险预测、轨迹预测与行为预测等任务展开研究。本文的研究内容主要包括以下几个方面:
  第一,为了解决风险预测中标签缺乏、类别不均衡等问题,本研究提出了基于代价敏感半监督深度学习的自动驾驶风险预测方法。本研究将CNN-LSTM模型嵌入至半监督学习框架,并使用自适应过均衡交叉熵损失函数实现了成本敏感学习。实验结果表明,仅使用总数据标注量的5%和2.5%,当前时刻风险预测准确率分别达到96.63%和95.82%,这对于自动驾驶汽车中海量无标签数据的低成本模型训练与数据标注有着重要的意义。此外,自适应过均衡交叉熵损失函数可以根据每个风险类别实例数量的变化自适应地调整各类别的交叉熵权重,从而提高了高风险类的精确率与召回率。
  第二,为了降低噪声和不确定性对预测输入的影响,增强模型的可解释性,本研究提出了不确定性抑制的自动驾驶行为与轨迹预测及其解释方法。本研究采用了时间模式注意力、图卷积序列编码抑制低级感知噪声、感知缺失等异方差不确定性;构建了自适应权重损失函数以抑制多任务模型引入的同方差不确定性。通过实验分析,所提方法的预测性能相较于其他对比模型提高了20%以上,并且具有更好的不确定性抑制能力。此外,为了证明时间模式注意力具有高级意图-行为模式的提取能力,本研究采用了基于扰动输入的被动模型解释法。以高速公路场景下的车辆换道行为为例,统计发现时间模式注意力可以提取出车辆换道过程中“驾驶意图-换道行为-车辆运动”对应的3个时间节点,表明神经网络可以有效地提取智能体高级“意图-行为-运动”模式。第三,为了解决复杂场景下多源异构输入统一表征、多源信息有机融合等问题,通
  过先验知识主动提高模型的可解释性,本研究提出了多源信息融合下多模态行为与轨迹预测方法。本研究构建了HolisticTransformer神经网络模型,该模型通过三种不同的注意力机制提高了多模态行为与轨迹预测的性能。通过实验分析,HolisticTransformer在各对比模型上综合预测性能表现最佳。本研究还展示了车道线意图权重的可视化结果,以换道、转向等智能体行为为例,随着行为的进行,智能体对车道线的关注程度逐渐从当前车道变更为目标车道。上述结论与人类直观感觉近似,证明了车道线意图注意力具有较高最的后可,信为度了与良好的可解释性。实现多任务的高精度预测,提升多源多维输入下深度学习模型的可解
  释性,本研究提出了多预测任务一体化实现及其多源多维细粒度解释方法。本研究以HolisticTransformer为骨干网络,借助风险、行为预测额外输入,构建了风险预测与行为预测分支网络。相对于传统的多任务网络框架,以“各任务网络流程为主,高级语义信息共享为辅”为多任务网络框架,总分式方法训练是更优的。此外,本研究推导出基于信息瓶颈限制的被动解释法,在特征、时间与空间维度上进行了分析:特征维度上,智能体横、纵向行为的预测主要依据智能体自身的横、纵向加速度;空间维度上,智能体横、纵向行为的预测主要依据目标智能体自身的特征预测,其次通过相邻智能体的交互信息预测;时间维度上,以换道行为为例,智能体跨越车道线前存在3个高重要性的时间节点。至此,本研究通过预测一体化模型及其主、被动解释方法完成了基于可解释深度学习的自动驾驶汽车预测任务研究。
作者: 王琦
专业: 车辆工程
导师: 胡宏宇
授予学位: 博士
授予学位单位: 吉林大学
学位年度: 2023
检索历史
应用推荐