论文题名: | 基于雷达点云深度补全的运动目标识别研究 |
关键词: | 无人驾驶;激光雷达;图像去模糊;深度补全;3D目标检测 |
摘要: | 随着第四次工业革命的到来,计算机和人工智能技术得到了快速的发展,以此为基础的无人驾驶作为新兴产业也得到了学术界以及产业界的大量关注。相较于传统驾驶模式,高性能的驾驶决策系统能够避免各种人因导致的交通事故,同时解放人类双手、缓解交通压力。精准灵敏的感知算法是无人驾驶车辆进行自主行驶的前提,目前主流的硬件冗余方案需要高昂的硬件成本,同时传感器的增多也会给数据同步和算法实时性带来很大挑战,因此研究低成本、抗干扰能力强的感知算法对于无人驾驶车辆的量产具有重要的意义。 本文以无人驾驶的精准目标感知为研究目的,针对目前领域内亟待解决的感知问题例如:运动模糊、深度补全、3D目标检测等进行深入研究,探讨不同传感器的信息融合方式。本文的具体工作和成果如下: 1)针对无人驾驶场景下由于车体抖动和相对运动所出现的摄像头采集图像运动模糊这一问题,本文提出了一种基于生成对抗网络的图像去模糊算法MobileNet-GAN。由于MobileNet中所采用的深度可分离卷积相对于传统卷积能够节省大量的计算资源,本文将其作为算法的骨干结构,同时为了降低整个模型的参数量,文中对于不同尺度下非线性层进行了权重共享,极大地降低了模型推理时间。算法在多个数据集上进行了性能比较,获得了较好的去模糊效果,同时网络的推理速度超越了其他比较算法,基本能够满足无人驾驶场景下的实时性初步要求。最后本文基于ResNet设计了Mask-RCNN目标检测网络,验证了在不同模糊程度下本文去模糊算法对于目标检测效果的提高,证明了MobileNet-GAN算法的实用价值。 2)针对目前无人驾驶车辆使用的激光雷达线束较低导致点云信患较为稀疏的问题,本文提出了一种基于稀疏点云和对应帧彩色图像的多模态特征融合深度补全算法。针对部分卷积在处理稀疏点云时,距离较远的位置需要通过多层网络才能进行信患传播这一问题,本文在全局通道引入了门控卷积,用于获取更大区域内的特征依赖;针对点云深度补全网络推理时间较长的问题,本文使用ERFNet和堆叠沙漏模型进行表面法向量的预测以及局部通道的深度补全,极大地提高了模型的效率。通过对比实验,本文提出的算法在标准深度补全数据集KITTI上验证获得了较高的推理速度和精度。最后基于第二章提出的去模糊算法,本文设计了模糊容错深度补全框架,保证模型在运动模糊的情况下仍能保持较高的深度补全精度,提高后续算法的目标识别能力。 3)针对现有的3D点云目标检测网络算法中存在的不足进行了深入研究,基于点云体素化操作提出了改进的雷达点云运动目标检测算法。原始算法中使用的最远点采样算法获取到的关键点存在一定的偶然性不能很好地对整个三维环境特征进行表征,本文通过引入空间注意力机制以及通道注意力机制更新关键点的特征信息,增强周围信息的依赖;针对关键点选取过程中会忽略局部区域上的特有结构信息从而导致小目标以及远距离目标检测的效果下降这一问题,本文在3D稀疏卷积之后引入了可变形卷积模块,用于提取更具有区分性的特征点信息,提高目标检测的效果。本文提出的检测算法在KITTI目标检测数据集上进行了效果验证,实验结果表明,在行人和自行车类别中,本文算法获得了最优的检测效果,同时对于车辆的检测也保持在较高水平。 |
作者: | 刘飞虎 |
专业: | 控制工程 |
导师: | 梁军 |
授予学位: | 硕士 |
授予学位单位: | 浙江大学 |
学位年度: | 2021 |