当前位置: 首页> 学位论文 >详情
原文传递 基于深度学习的车辆目标检测
论文题名: 基于深度学习的车辆目标检测
关键词: 车辆目标检测;深度学习;网络架构搜索;多尺度感知
摘要: 近年来,越来越多的计算机视觉任务与深度学习相结合并取得了突破。目标检测是众多计算机视觉应用中的底层任务,在工业界的部署十分广泛,因而随着这些算法的成熟和性能提高,越来越多的场景开始尝试计算机视觉算法的落地。在这些任务中,车辆目标检测是前景巨大发展迅速的落地场景之一,比如:车辆停车检测、交通违规检测、无人驾驶等。但与学术界不同的地方在于,除了精度,工业界对算法速度和资源消耗等成本问题更为看重。因此本文使用公开数据集COCO中的车辆类,从精度和速度两个角度入手,在现有的目标检测算法的基础上分别对骨干、颈部、头部网络进行研究改进:
  (1)提出针对车辆目标检测的神经网络搜索算法。通常的网络架构搜索算法都是针对图像分类对网络结构进行设计,但是因为任务之间差异性,图像识别上的最优网络在车辆目标检测中往往性能不佳。为此本文直接针对车辆目标检测的任务对骨干网络结构进行搜索,通过超网络建立搜索空间,将延迟率可微化后引入搜索指标中。在目标函数中,精度和速度同时作为约束项,在不影响精度的情况下,搜索出最高提速16%的网络结构。该方法可以针对不同的硬件平台的特性进行搜索,同时引入设计建模的延迟率预测模型,可以在搜索过程中预测模型延迟率,达到硬件在环的效果,极大地节省了模型搜索过程中对GPU资源的消耗。
  (2)基于多尺度融合网络提出适合车辆检测的单阶段多尺度检测算法。为了解决单阶段车辆目标检测算法中尺度变化对算法性能的影响,本文设计多尺度自适应学习模块在骨干网络输出的不同特征层上分别进行目标检测,让锚框的分配更为合理的同时获得多层信息。除此之外,本文通过网格搜索得到最适合车辆目标检测算法的焦点损失函数一一困难样本重采样损失,该损失能够解决车辆目标检测中正负样本不均的问题。
  (3)基于关键点回归的单阶段多尺度车辆目标检测算法。为了进一步压缩网络结构,本文仅改进基于锚框算法中的头部网络将锚框从算法中去除,并应用基于关键点回归的检测技术。该方法能够消除因为候选框密集导致的正负类别比例不均的问题,同时也引入多尺度自适应学习模块,该模块可以抑制多重样本的问题。本文在新构造的回归器网络结构中加入一个不含参数的分支用来训练预测框的中心性,该方法在几乎不增加推导时间的同时减少了低质量预测框的生成。
作者: 唐钰佳
专业: 信号与信息处理
导师: 程建
授予学位: 硕士
授予学位单位: 电子科技大学
学位年度: 2021
检索历史
应用推荐