论文题名: | 基于改进Faster R--CNN的视觉车辆检测算法研究 |
关键词: | 自动驾驶;车辆检测;双路残差金字塔结构;全局感兴趣区;卷积神经网络 |
摘要: | 采用机器视觉对车辆目标进行检测是新一代智能汽车实现自动驾驶的重要一环。虽然带有金字塔结构的检测算法往往有不错的检测精确度同时又有不错的检测效率,并且使用该技术的检测算法在各类自动驾驶场景中都已有所应用,但是当下检测算法模型亟需解决的难点依然存在,具体有如下三个方面:1.对于远处的车辆即在图像中像素较小的车辆目标检测效果不佳;2.对于被遮挡的车辆目标检测效果不佳;3.检测到的目标的定位信息不够精确,会影响车辆目标在图像上的位置坐标到世界坐标系下三维坐标的转换精度。因此当前的大量车辆检测算法仍需要进一步改进解决上述难题。本文对在深度学习图像检测框架下的基于金字塔结构的车辆检测算法Faster R-CNN开展深入研究,研究工作具体如下: (1)在深入分析检测算法中的特征金字塔结构的原理后,提出了一种双路残差双路金字塔结构。其基本思想是使用ResNet提取图片原始特征后,首先将小分辨率特征通过插值放大后与更大一级的大分辨率特征进行融合,然后将各个分辨率的原始特征再与融合完的特征图做相加处理,进一步丰富该层的特征信息,最后将处理完的特征图从大至小的再做一次分辨率减小的特征融合操作,能够对高层特征图进行位置信息的补充,不再受限于单向的信息流。通过添加这种残差双路金字塔结构,可有效减少车辆检测算法对于距离较远的较小车辆目标的漏检概率。实验结果表明:本算法对存在远处较小车辆目标的图像的检测效果要明显优于原始算法。 (2)针对车辆检测后得到的定位信息不精确以及较大车辆目标检测精度提升有限的问题。在构建好双路残差金字塔结构的基础上,本文进一步增加了一种增强全局感兴趣区域模块,进一步提取了全局特征来与原始的区域特征进行叠加以及在原始的区域特征中再融合了扩大后的感兴趣区,使得网络可以根据上下文周围信息更精确地定位目标。实验结果表明:通过该方法,能够有效提升本模型在不同车辆行驶场景下对较大车辆目标定位的准确度。 (3)针对本模型对被遮挡目标误检漏检的问题。在双路残差金字塔结构的基础上,本文改进了原始车辆检测算法的损失函数,加入了吸引力损失和平衡损失模块,当训练样本中存在遮挡车辆目标时,通过吸引力损失模块的目标函数的优化,能够实现被遮挡目标与周围的检测框的分离,并将该方法在障碍物数据集上进行测试。实验证明:该方法能够有效缓解被遮挡车辆检测的漏检和误检问题。 本文训练了基于双路残差金字塔结构和增强全局感兴趣区模块的视觉车辆检测模型,并设计了可视化操作界面,同时在智能驾驶测试平台进行了模型的实车实验。源码是python3.6和C++语言完成,使用Pytorch深度学习框架对模型进行训练和测试,操作系统为Ubuntu18.04操作系统,开发工具为Pycharm和Vim,为了提升模型在检测推断时的运行速度,本研究将得到的模型进一步转换成专门用于推理加速的TensorRT模型进行部署,能够有效减少模型的推断时间,达到智能车辆实时检测的要求。 |
作者: | 俞依杰 |
专业: | 车辆工程 |
导师: | 王海 |
授予学位: | 硕士 |
授予学位单位: | 江苏大学 |
学位年度: | 2020 |
正文语种: | 中文 |