论文题名: | 基于深度强化学习的无人驾驶感知与决策研究 |
关键词: | 无人驾驶;环境感知;车道线检测;目标检测;驾驶决策 |
摘要: | 无人驾驶车辆作为智能交通的未来发展方向,可以高效的增强公路安全保障、缓解交通拥堵、减少空气污染、给驾驶员节省更多时间。但是随着自动驾驶级别的逐渐提高,对智能车辆在复杂场景中的感知与决策的能力提出了更高的要求,在不同环境下的感知与分析不仅面临着传感器带来的噪声等问题,同时针对突发情况还需要决策能力具有更高的鲁棒性。本文采用基于视觉的解决方案,进行了无人驾驶汽车复杂场景下的环境感知与决策研究,主要包括以下几点: 第一,深入研究了无人驾驶环境感知中的车道线检测算法,提出了基于自适应蒸馏学习的语义分割多车道线检测方法。设计了轻量化车的车道线检测神经网络结构,通过Encoder-Decoder构架对网络结构进行设计,加入多特征融合的方式(Concat函数),使得将浅层特征的细节信息引入深层,以增强车道线边缘细节特征,提升了实车车道线检测的效率;提出多级自适应蒸馏学习方法进一步优化网络,以深层注意力信息约束浅层,实现模型的语义信息由深层向浅层传递,提升检测精度;针对特定场景刹车线、阴影等错误检测情况,本文提出了一个YOLA分支用以对神经网络的输出进行补充。实验证明本文车道线检测方法有着良好的实时性与准确性。 第二,针对无人驾驶交通场景的目标检测,提出了基于一阶段网络的交通场景目标检测方法。通过增加多分支特征提取结构,使得特征在不同感受野进行提取输出,提高了小物体检测的性能;提出一种更快更准确的边框回归方法(LIoU),通过最大化检测框交集在全局中的占比,从而增大梯度,使得收敛速度更快、回归更为准确,提升了目标检测定位水平。实验证明,本文所提出的交通场景目标检测算法,在小物体检测方面具备良好的检测性能,取得了良好的目标定位效果。 第三,针对真实复杂道路无人驾驶决策问题,提出了基于监督训练特征网络的DDPG无人驾驶决策方法,通过从模仿学习中预先得到特征提取网络来提高强化学习的特征样本采集效率;提出了一种多源信息融合的决策方法,该算法将感知信息纳入决策系统,设计了多源信息融合的奖励函数,通过实验表明该算法可以加快训练速度,提高决策的稳定性。 |
作者: | 刘佳琦 |
专业: | 机械工程 |
导师: | 杨璐;余天洪 |
授予学位: | 硕士 |
授予学位单位: | 天津理工大学 |
学位年度: | 2021 |