当前位置: 首页> 学位论文 >详情
原文传递 基于深度双分辨率网络的道路场景语义分割研究
论文题名: 基于深度双分辨率网络的道路场景语义分割研究
关键词: 自动驾驶;深度学习;语义分割;深度双分辨率网络;注意力机制
摘要: 近年,自动驾驶技术已成为科技发展的主流趋势,在商用、民用中都有着极大地实用价值。而在自动驾驶系统中通常采用语义分割技术对图像中目标和背景区域完成像素级别的区分,实现对道路场景的全面解析,为系统决策指导提供关键信息。因此,道路场景下的语义分割已成为一个热门的研究方向。但由于道路场景复杂多变容易存在目标遮挡情况,且受光照、雾霾天气、目标距离等不确定因素的影响造成道路场景语义分割十分具有挑战性,且分割效果不佳。同时,当前大多主流语义分割模型也较复杂、参数量大,存在不能应用到实际场景中的问题。
  针对上述存在的问题,本文提出一种基于深度双分辨率网络(DeepDual-ResolutionNetwork,DDRNet)的道路场景语义分割算法,实现分割精度与效率权衡。首先,本文采用性能优异的DDRNet模型作为基础进行研究。通过融合通道注意力机制模块增强图像中像素点特征信息的重要程度,并将通道特征注意力模块加入到残差模块中,构建通道残差注意力模块,然后将这一模块嵌入到网络平行分支的末尾,这对提取不同的特征信息具有关键的作用,使其能够对不同通道自身特征的重要程度进行充分学习。其次,在主干网络中设计引入深度过参数化卷积,在不影响总体模型复杂性的前提下通过增加的深度卷积操作提取更丰富的语义信息。最后,为了提升网络对于不同尺寸物体的特征信息表征能力,将混合空洞卷积集成到深度聚合金字塔模块中,解决模型因目标过小、过大分割效果不佳的问题,从而实现不同尺度语义信息提取,同时采用组归一化对该模块进行优化。
  本文方法在数据集Cityscapes上进行实验验证,并与多种当前主流语义分割算法对比分析。实验结果表明,本文方法在道路场景图像中分割效果更佳,且在分割精度和效率方面权衡的效果更好。
作者: 虎浩媛
专业: 电子信息
导师: 柳长源
授予学位: 硕士
授予学位单位: 哈尔滨理工大学
学位年度: 2023
检索历史
应用推荐