详情

原文传递融合注意力机制的多任务端到端自动驾驶决策方法研究

论文题名：	融合注意力机制的多任务端到端自动驾驶决策方法研究
关键词：	自动驾驶;端到端驾驶决策;注意力机制;多任务;时空特征
摘要：	驾驶决策作为自动驾驶系统的核心技术，是保证自动驾驶车辆安全行驶的前提。端到端自动驾驶决策方法能够对传感器的感知结果直接建模，将其映射为转向角和速度，使得驾驶决策过程更为简单高效。针对传统端到端自动驾驶决策方法特征提取能力弱、难以重点聚焦驾驶场景中关键对象的问题，提出了一种融合注意力机制的多任务端到端自动驾驶决策模型，实现对转向角和速度的精确预测。论文的主要研究内容如下：　　（1）现有端到端自动驾驶决策方法将语义分割任务作为特征提取的辅助任务来提高模型的预测能力，并未深入挖掘二者之间的内在关联，导致模型的特征提取能力较弱，预测精度低。针对此问题，本文提出了一种多任务端到端自动驾驶决策模型。首先在引入语义分割子任务的基础上，设计基于参数稀疏共享的多任务学习机制，挖掘语义分割和特征提取两个子任务的依赖关系，增强网络解析场景底层空间位置特征和高层语义特征的能力。其次在长短时记忆网络的基础上构建时序特征提取网络，提取驾驶场景上下文特征，获得车辆运动时间序列信息。最后基于参数硬共享的方法构建多任务预测网络，结合空间特征信息与时序特征信息预测转向角和速度。由实验结果可得，多任务端到端自动驾驶决策模型在城市道路场景下的训练误差为0.1432，预测精确度为83.4%，在高速道路场景下的训练误差为0.1336，精确度达到84%，与FCN-LSTM、Conv-LSTM等模型相比，该模型显著提高了预测精度。　　（2）当车辆处于复杂动态交通环境时，多任务端到端自动驾驶决策模型虽然能够提取到完整的场景时空特征，但并未重点关注驾驶场景中的关键目标。其次，随着预测时长的增加，模型的训练损失会快速增大。针对上述问题，本文在多任务端到端自动驾驶决策模型的基础上提出了一种融合注意力机制的多任务端到端自动驾驶决策方法。首先引入空间注意力机制，通过在空间维度上将特征图旋转并计算其不同维度之间的依赖关系，增强模型对驾驶场景中关键目标的特征提取能力。其次，在时序特征提取网络中嵌入时间注意力机制，建模车辆运动速度序列的时序关系，突出对决策预测影响较大的时间上下文特征。最后，将未来帧的数据标签用于模型训练阶段计算损失，挖掘车辆运动序列的长时依赖关系，提高模型提取未来帧时空特征的能力。实验结果表明，模型在城市道路场景下的训练损失为0.1135，预测精确度达到86.3%，在高速道路场景下的训练损失为0.1087，预测精确度达到86.5%。与多任务端到端自动驾驶决策模型相比，其在城市道路场景和高速道路场景下的损失分别减小了0.0297、0.0249，预测精确度分别提高了2.9%、2.5%，充分证明了注意力机制和未来帧时空特征的引入能够提高端到端自动驾驶决策模型的预测性能。　　（3）基于Sim-one自动驾驶仿真测试平台构建了自动驾驶决策仿真测试系统对本文提出的模型进行测试验证。采用Sim-one搭建长安大学自动驾驶测试基地地图，设置合理的摄像头参数采集虚拟驾驶数据集，在虚拟数据集上对模型进行微调并进行测试。实验结果显示，融合注意力机制的多任务端到端自动驾驶决策模型在虚拟数据集上的训练损失为0.1236，预测精确度为86.2%，证明了模型具有较为稳定的预测能力。
作者：	范颂华
专业：	软件工程
导师：	刘占文
授予学位：	硕士
授予学位单位：	长安大学
学位年度：	2022