当前位置: 首页> 学位论文 >详情
原文传递 基于单目视觉的车前目标三维检测研究与实现
论文题名: 基于单目视觉的车前目标三维检测研究与实现
关键词: 车前目标三维检测;单目视觉;注意力机制
摘要: 近年来,随着图像处理技术以及人工智能深度学习技术的发展,基于计算机视觉的目标检测在精度和速度上都达到了理想的性能。然而在自动驾驶相关领域中,仅依靠图像平面上的二维检测结果,无法有效获取目标在三维空间中的位置与结构信息。虽然依靠激光雷达等传感器设备可以获取空间信息,但相比之下单目相机更为经济便捷。因此,针对单目场景下的三维目标检测技术的研究有着重要的现实意义,同时具有广泛的应用前景。
  随着深度学习技术在三维目标检测领域的广泛应用,涌现出大量优秀的算法,其中基于目标关键点的单目三维检测算法(Real-timeMonocular3DDetectionfromObjectKeypointsforAutonomousDriving,RTM3D)表现优异。该算法在图像空间中预测目标三维边界框的9个投影关键点,然后利用二维和三维透视图间的几何关系恢复目标在三维空间中的尺寸、位置和方向。本文针对RTM3D在三维目标检测中存在的不足,进行算法的研究与改进,具体内容如下:
  (1)针对RTM3D算法对于目标9个投影关键点预估精度差的问题,提出了基于关键点级联回归的三维目标检测算法。设计精简高效的全卷积检测框架,实现对投影关键点的初始回归预测。提出一种基于可变形卷积的区域感知模块,对初始投影关键点局部区域进行特征提取,并利用区域特征对初始投影关键点进行自适应修正。通过对目标投影关键点的级联精准估计,显著的提升了单目场景下的三维目标检测精度。
  (2)针对图像中目标多尺度以及被遮挡的问题,提出基于循环十字交叉注意力机制(RecurrentCriss-CrossAttention,RCCA)的三维目标检测算法。设计基于RCCA的全局信息注意力聚合模块,解决传统卷积单元感受野固定以及无法提取全局信息的问题,实现针对目标自身情况的自适应特征区域关注,有效捕获全局场景特征对目标三维属性进行推断。在保证高计算效率的情况下,提升了对多尺度目标的三维检测精度,同时有效缓解了遮挡和截断带来的问题。
  将关键点级联回归模块与循环十字交叉注意力机制结合,提出可应对复杂场景的单目三维目标检测算法(Real-timeMonocular3DDetectionbasedonRCCAandKeypointsCascadedRegression,CR-RTM3D)。通过在KITTI数据集上的实验,验证了各个模块设计的有效性,同时证实了所提出的算法可以显著提升三维目标检测的精度。根据本文研究成果,设计了面向车前行驶环境的三维检测系统,通过对车辆和行人进行实时三维检测,实现对车前碰撞事件的预测。
作者: 舒秀峰
专业: 计算机科学与技术
导师: 苗启广
授予学位: 硕士
授予学位单位: 西安电子科技大学
学位年度: 2021
检索历史
应用推荐