论文题名: | 基于深度学习的交通目标感知技术及其应用 |
关键词: | 目标跟踪;无人驾驶;深度学习;环境感知;语义分割 |
摘要: | 在过去的几十年里,人工智能在各个行业都取得了巨大的进步。自动驾驶是人工智能领域的一个重要分支,已经引起广泛的关注。自动驾驶技术涉及领域广泛,而环境感知系统作为自动驾驶汽车的眼睛,不仅需要对各种传感器传回的信息及时处理,还需要将处理后的结果传入决策系统辅助车辆做出正确的判断。当前汽车的智能模块如停车辅助、紧急制动、异常检测等已经不能满足车企对当前汽车的期望,许多著名的车企都在着力打造完全自主的自动驾驶汽车,但其他车企也在研究更经济的人工智能模块辅助驾驶。将这些模块配置在相应的硬件设备中,并集成到现有的汽车辅助驾驶系统且不损失性能是个棘手的问题。实际的交通路况复杂多变,对自动驾驶汽车而言,如何高效、准确地理解汽车外部环境对汽车的环境感知系统而言挑战非常大。因此,本文从增强自动驾驶车辆环境感知系统的安全性出发,对路面交通目标检测算法、交通目标语义分割算法和交通目标跟踪网络模型进行了研究。本研究的主要内容如下: (1)研究了基于深度学习的复杂工况下实时交通目标检测算法。探究并比较了当前轻量化骨干网络的优缺点;探明了骨干网络中普通的卷积层与轻量级网络GhostNet的区别;嵌入了注意力机制融合更多空间上的特征,对每个特征通道的重要性进行评估;验证了DW卷积相对于普通卷积的优越性,减少了网络参数的同时缩短了网络的前向传播时间,提升了网络的实时性表现能力;改进了BDD100K目标检测数据集,实现了总共13类别包括交通灯颜色在内的所有常见交通目标的精准检测。实验表明,最终的网络模型文件大小为5.22MB,在Inter(R)Corei5CPU运行FPS达到15.58,能够在检测速度和精度之间达到平衡,灵活性更高,便于部署到终端。 (2)研究了基于深度学习的实时交通目标语义分割算法。探索了当前语义分割模型的结构特点,确定了基于编码器和解码器结构的语义分割算法框架;针对语义分割网络在速度和精度之间难以取得平衡的问题,在编码器结构中设计了残差聚合模块来简化模型并有效地提取特征;在解码器结构中,融合了转置卷积和普通卷积逐步恢复图像的像素信息;设计了注意力机制金字塔池化模块加强解码器和编码器之间的特征信息流动,极大地提升了网络性能;提出了联合在Cityscapes和BDD100K数据集训练,提升了模型鲁棒性,使模型在复杂工况下表现较好。实验表明,所提出的EDNet网络模型在Cityscapes和BDD100K混合数据集上获得了47.2%的mIoU,在分割效率上,FPS达到了23,使网络在精度和效率之间达到平衡。 (3)研究了基于深度学习的实时交通目标跟踪算法。分析了目标跟踪算法的基本流程,构建了基于检测的目标跟踪框架;针对在跟踪过程中目标尺度和姿态的变化、身份的遮挡给目标容易造成难以准确跟踪的问题,提出了m-yolov5s检测算法作为目标跟踪网络的检测器;运用了k-means算法将标注框聚类到不同大小的锚框中,将原来的3尺度预测提升至4尺度预测,保证了在不同大小的特征图上分配更精准的锚框;实现了匈牙利算法匹配卡尔曼滤波预测的轨迹和检测器检测的目标;构建了相似度矩阵找到帧与帧之间匹配的目标实现对常见交通目标实时跟踪。在MOT16行人跟踪数据集上的实验结果表明,整个跟踪算法能够实现在复杂交通环境下对交通目标实时跟踪。 |
作者: | 程亚楠 |
专业: | 机械工程 |
导师: | 陈国强 |
授予学位: | 硕士 |
授予学位单位: | 河南理工大学 |
学位年度: | 2022 |