当前位置: 首页> 学位论文 >详情
原文传递 基于深度学习的道路交通场景下的行人检测算法研究
论文题名: 基于深度学习的道路交通场景下的行人检测算法研究
关键词: 道路交通场景;行人检测;特征提取网络;特征融合;非极大值抑制
摘要: 随着无人驾驶技术和智能交通领域的发展,目标检测已经成为机器学习中最典型的问题,其中行人检测作为智能交通领域中重要的组成环节,因此也成为目前国内外研究者重点研究的课题之一。本论文主要针对道路交通场景下的行人检测问题进行研究,由于复杂的背景和不可控的自然条件会为我们的检测任务带来挑战,通常情况下主要表现为:一方面图像中的行人尺度和姿态不一,同时受到外界光照和天气环境等不可控自然条件的影响使得一些行人变得模糊,尤其使得模糊小尺度行人的检测难度增大;另一方面会因为局部被遮挡的情况导致后期的检测难度进一步增大,这些问题和差异会影响最终的检测效果。道路交通场景下的行人是否能被精准的检测取决于核心的行人检测算法的性能,因此基于这些不同的问题,本文采用基于深度学习的方法设计了不同的检测算法模型进行研究并验证,其主要研究工作如下:
  首先,在复杂背景的道路交通场景中,针对普遍情况下行人检测精度低的问题,为了进一步提高行人检测精度,设计了基于区域候选的二阶段算法FasterR-CNN模型。通过分析模型在真实场景下的检测效果和实现方式,设计了特征提取能力更强的深度残差网络ResNeXt模型结合检测网络搭建整体模型,通过RPN产生的特征图和候选框结合锚框机制将其输送到分类回归层进行判定,相比其他模型,其最终检测效果更有优势。
  然后,对于道路场景中的模糊小目标和不同姿态下的行人检测精度低和速度慢的问题,设计了基于回归的一阶段算法SSD模型。同样使用ResNeXt模型代替原始SSD中的VGG16作为特征提取网络,通过先验框的设计和两个匹配原则并结合置信度得分来筛选出预测的目标,此外使用非极大值抑制算法对所有预测的目标矩形框进行剔除和合并,从而得到目标的类别和位置,最后检测结果表现出其要优于同类别的其他检测算法。
  其次,在前面两个实验结果基础上,为了研究行人被局部遮挡的问题,设计了基于反卷积和多尺度特征融合的算法模型。首先引入DenseNet模型并与ResNeXt模型进行结合作为特征提取网络,其次为了充分利用上下文语义信息和获取更多底层的细节信息,通过FPN融合的方式将浅层低分辨率高语义特征和深层反卷积模块进行融合,对于输出的特征图通过K-means++聚类算法为特征做一个聚类分析,将默认候选框的长宽比信息和尺度进行匹配,采用改进的非极大值抑制算法进行后处理以降低被遮挡行人的误检率,最后相比于其他检测算法,设计的算法在行人被局部遮挡情况下取得了更好的效果。
  最后,基于GPU运算平台,对设计的三个模型进行实验验证。通过INRIA和KITTI两个基准数据集对模型进行定性和定量的验证,同时与其他经典行人检测模型进行对比,实验结果表明,本文所设计的行人检测模型在准确率、召回率等方面都有较好的表现。
作者: 杨江波
专业: 控制工程
导师: 邝先验
授予学位: 硕士
授予学位单位: 江西理工大学
学位年度: 2021
检索历史
应用推荐