论文题名: | 基于卷积神经网络的智能车场景语义分割算法研究 |
关键词: | 卷积神经网络;智能车;场景语义分割;边缘滤波 |
摘要: | 近年来,智能驾驶越来越炙手可热。智能驾驶相关技术已经从研发阶段逐渐转向市场应用。其中,场景语义分割技术可以为智能车提供丰富的室外场景信息,为智能车的决策控制提供可靠的技术支持,并且其算法鲁棒性较好,因此场景语义分割算法在无人车技术中处于核心地位,具有广泛的应用价值。但由于传统场景语义分割模型存在精度较低和速度较慢等问题,进而难以应用于实际。针对此问题,本文重点研究了提升模型精度和速度的方法,并据此分别设计了基于卷积神经网络的FusNet和DeepSemNet两个模型。本文的主要贡献如下。 本文分别从网络输入图片尺寸、激励函数、池化三个方面研究基于卷积神经网络速度和精度的提升方法。本文以一些经典的分割模型作为实验模型,并将这些模型分别在CamVid和ADE20K数据库上训练和测试。通过大量的实验表明在一定范围内输入图片尺寸对模型精度的影响不大,但尺寸越小,模型的运行速度越快,显存的占用量越少;再者,我们发现 ReLU激励函数相比较于 PReLU激励函数,其精度有一定的提升,且运算速度较快;我们还对 Max-Pooling、Lp-Pooling、Convolution三种下采样方式进行了比较,发现 Max-Pooling在运算速度和精度方面有更好的优势,而且Max-Pooling还有着更好的去燥效果。 提出了面向实时处理的智能车语义分割模型:FusNet。FusNet采用了 SegNet的Encoder架构,并结合了多层特征融合思想。在FusNet基础上设计了两个模型:FusNet4、FusNet3。与SegNet相比,FusNet4和FusNet3的运算速度分别提高了9.5倍和18.9倍,并在CamVid数据库上,FusNet4的精度提高了3.05%,FusNet4在Cityscapes数据库上所得到的精度为82.10%。因此,我们提出的FusNet可以满足智能车实时处理和效果等要求。 提出了和FusNet的互补模型:DeepSemNet。DeepSemNet结合了语义边缘滤波和多层次的思想,可以实现面向精准的智能车室外场景语义分割任务。DeepSemNet的模型搭建建立在PSPNet和EdgeNet的基础之上,DeepSemNet采用语义边缘检测结果对语义特征进行滤波处理。与 PSPNet、EdgeNet相比, DeepSemNet在ADE20K验证集上精确度分别提高了1.76%和10.5%。与本文所提出的FusNet网络相比,DeepSemNet在Cityscapes数据库和CamVid数据库上的精度分别提高了9.11%、3.8%。 |
作者: | 郭智豪 |
专业: | 控制科学与工程 |
导师: | 郝家胜 |
授予学位: | 硕士 |
授予学位单位: | 电子科技大学 |
学位年度: | 2017 |
正文语种: | 中文 |