当前位置: 首页> 学位论文 >详情
原文传递 基于深度学习的目标检测与语义分割算法研究
论文题名: 基于深度学习的目标检测与语义分割算法研究
关键词: 深度学习;目标检测;语义分割;无人驾驶
摘要: 目标检测和语义分割作为无人驾驶计算机视觉领域中的两个基本问题,应该说,在无人驾驶场景理解方面,是无人驾驶车辆应该具备的基本能力。前者的核心任务是将视野范围内不同类别的目标识别并定位出来;后者进行的是像素级的分割,相比前者,针对单个目标的操作更加细腻,更加精准,同时也更加复杂。对于无人驾驶车辆和机器人的场景理解来说,目标检测和语义分割的研究意义重大。针对这两个任务,本论文的主要内容可以从以下几个方面描述:
  (1)基于SSD目标检测算法以及SegNet语义分割算法的网络分别重新简化设计。在目标检测方面,重点分析了RCNN系列的几篇检测方面的论文,指出在目标检测领域网络设计要点。首先针对区域候选框的获取,最开始的滑动窗口到最后的RPN网络,再到基于基本的卷积网络获取,然后是特征提取,最后分类器分类的一个过程。将最初的检测问题转化为回归问题。网络方面,加入更多的尺度融合以及更深的网络层,针对损失函数的设计,由于要在TX2的硬件平台上实现,因此在增加深度的同时,尽量调小参数,压缩模型,去除全连接层。
  (2)针对检测模型和分割模型在不同的数据集上分别进行训练,同时针对不同的数据集展开说明,突出每一个数据集的特点以及选取其做训练样本的原因,训练的过程是基于NVIDIA的型号1080Ti的GPU,以及联想的服务器。
  (3)针对上述设计的简化网络模型,以及训练得出的检测和分割模型,将具体的目标检测和语义分割算法移植到NVIDIATX2上。采用的是PointGrey灰点摄像头进行图像数据的采集,针对PointGrey摄像头传来的实时图片数据进行目标检测和语义分割,同时在显示器上进行实时的检测和分割结果展示,能够随时掌握车辆前方状况,以便为车辆的决策和控制等自主行为提供辅助。
  本文的核心内容就是针对网络的改进。基于深度学习的目标检测和语义分割发展到现在,虽然在算法上,实验结果上已经有了质的提升,在精确度以及速度上都能够达到很好的标准,但是在实际应用中仍旧有许多的限制因素,比如计算机的硬件水平。在深度学习中,尤其深度学习的训练过程,需要很高的硬件配置,同时针对数据集也有较高要求。因此,本论文力求基于一般的算法基础上做出部分改进,基于较低的计算机硬件配置也能实现一个实时的检测和分割效果。同时能够在保证精度的同时,顾及到速度方面的要求,满足基本的无人驾驶的场景理解需求。
作者: 徐博
专业: 控制工程
导师: 韩建达
授予学位: 硕士
授予学位单位: 东北大学
学位年度: 2018
检索历史
应用推荐