当前位置: 首页> 学位论文 >详情
原文传递 基于计算机视觉行车环境感知及识别研究
论文题名: 基于计算机视觉行车环境感知及识别研究
关键词: 自动驾驶;行车环境感知;计算机视觉;多任务检测;分割网络
摘要: 自动驾驶技术是当前深度学习领域备受关注的热门研究方向之一。在其中,行车环境感知是自动驾驶技术中最为关键的任务之一,具体包括交通目标检测、可行驶区域分割和车道线检测等多种感知任务。然而,目前的感知算法通常仅关注其中的某一项任务,忽视不同任务之间的关联性,同时也浪费了有限的自动驾驶汽车硬件资源,难以满足自动驾驶汽车同时感知多种环境因素的需求。为了解决上述问题,本文提出了一种端到端多任务检测与分割网络MdSNet(Multi-task detection and Segmentation network)模型,可实现交通目标、可行驶区域和车道线的统一检测。本文的主要研究工作如下:
  1. 多任务模型的构造研究。在主干网络方面,本文使用CSPDarkNet结合改进的 Res2Net 模块构建多尺度特征主干网络。在特征融合方面,本文引入了ULSAM注意力机制,以更好地整合浅层细节特征和高级语义信息。在目标检测任务处理阶段,本文采用向上聚合结构PAN网络与YOLO检测头对目标进行定位识别。在可行驶区域分割和车道线检测任务阶段,本文借鉴ENet网络思想构建快速分割网络,并加入 DLFM 模块以提高模型对可行驶区域和车道线边界信息的提取能力。
  2. 多任务模型训练的方法研究。首先,对BDD100K和Camvid数据集进行预处理和数据增强。其次,设计多个损失函数自动加权求和以优化整个模型的性能。同时,根据不同尺度目标的特点使用Anchor机制,降低回归难度并提高算法检测精度。最后,针对不同任务特点设计特定的训练方法,以压缩整体训练时间。
  3. 多任务模型的验证与评估。本文在BDD100K和Camvid数据集上进行了大量对比和消融实验。实验结果表明,MdSNet在两个数据集均取得了优良的检测效果,在交通目标检测上的mAP分别为47.7%和58.2%,可行驶区域的mIoU分别为92.6%和94.5%,车道线检测的IoU分别为62.6%和59.2%。此外,本文所提出的模型大小仅为7.02M,可为后期嵌入式移动终端部署提供技术支撑。
作者: 王等准
专业: 电子科学与技术
导师: 谢本亮
授予学位: 硕士
授予学位单位: 贵州大学
学位年度: 2023
检索历史
应用推荐