论文题名: | 基于自动驾驶场景的目标检测与分割算法研究 |
关键词: | 自动驾驶场景;时间序列级联;多任务网络;目标检测;分割算法 |
摘要: | 目前,智能交通及自动驾驶汽车成为人工智能行业研究的重点方向,基于自动驾驶场景的目标检测与分割算法是其中关键的技术。但自动驾驶场景包含城市道路、乡间道路、高速道路和停车场等具有复杂多样的情况,目前对自动驾驶场景理解的技术尚不成熟。基于此,本文对基于自动驾驶场景的目标检测与分割算法相关技术展开研究,主要研究内容如下: (1)针对FCN、SegNet语义分割算法在自动驾驶场景上处理的结果不够精细、边界不清晰的问题,本文利用不同网络模块在不同的训练时间节点上,会具有不同层面的分类能力的特性,将语义分割任务进行难易任务的划分,提出了一种基于时间序列级联的语义分割算法,实现了对道路可通行区域的精确表示。最后实验证明本算法在KITTI城区有标线数据集上的准确率比FCN高4.79个百分点,比SegNet高13.87个百分点。 (2)针对在自动驾驶场景中,不仅需要利用分割网络对道路可通行区域进行识别,而且需要通过检测网络对人、车、障碍物进行识别,但此时会对图像重复提取特征,产生资源浪费的问题。本文通过将多个任务统一到一个网络中,提出一种基于多任务网络的目标检测与分割算法,实现了多个任务间的资源共享,减小了模型的总的占用内存,加快了模型的推断速度,而且提高了目标检测的准确率。通过实验证明多任务网络相比于单个任务共减小3.94Mb的占用内存,推断一张图片的总耗时共节省15.07ms,而且在目标检测上的准确率提高了3.2个百分点。 (3)针对MaskR-CNN算法在进行实例分割时,需要对RPN网络产生的每个ROI都进行分割,会占用太多的资源的问题。本文通过在RRC目标检测的基础上,直接对检测框内的目标进行分割掩码的回归,提出了一种基于RRC目标检测的实例分割算法(RRCMask),实现了对实例分割的高效性。实验证明了RRCMask在推断一张图片时比MaskR-CNN每帧快45ms。此外,本文在RRCMask实例分割算法基础上进行了扩展,提出了RRCKpd关键点检测方法,实现了对车辆进行关键点检测,实验证明了实例分割框架的可扩展性。 |
作者: | 李坤仑 |
专业: | 控制工程 |
导师: | 潘峰 |
授予学位: | 硕士 |
授予学位单位: | 东北大学 |
学位年度: | 2018 |