论文题名: | 交通场景中轻量化二值网络研究 |
关键词: | 交通场景;二值化神经网络;目标检测 |
摘要: | 交通场景中存在大量的环境感知需求,不管是在辅助驾驶还是自动驾驶情况下,都需要对车道线、可行驶区域、车辆、行人、路面标识、交通灯、交通标志等交通环境中的重要目标物进行检测和识别,通过视觉传感器从环境中检测并识别出上述重要信息,可以帮助车辆做出安全、规范的驾驶行为决策。 目前随着深度神经网络在计算机视觉领域的成功应用,交通场景中各种检测和识别的任务都可以借助深度神经网络来处理,但是通常的深度神经网络规模很大,对处理器的算力和内存要求很高,而且能耗大,因此难以在资源受限的平台上进行部署。作为智能车辆,其车载平台就存在资源受限的制约、同时也要求低功耗、实时性强,因此研究适用于资源受限的车载端的轻量级目标检测或识别深度神经网络具有重要意义和实用价值。本文针对交通场景中的车辆、行人检测与交通标志识别问题,在全精度深度神经网络模型基础上,分别开展了二值量化的深度神经检测网络模型与识别网络模型的研究,具体内容包括: 研究了用于车辆和行人检测的二值化SSD网络,首先,对以VGG16为骨干网络的SSD300运用具有跳接分支的二值化模块对卷积单元进行二值化,同时在权重二值化时考虑权重的幅值因素影响。然后通过聚类算法设置合适的候选框尺度和比率,最后用双曲正切函数的导数替换掉直通器来近似符号函数的导数进行反向传播。最后,在KITTI和PASCALVOC数据集上分别对比了实值网络与本文的二值化检测网络,本文检测模型在计算量,模型大小,检测精度等标准上取得了较好的效果。在检测精度没有较大下降的前提下,对于KITTI数据集,计算量降为原来的百分之六,参数量降低到原来的百分之十五;对于VOC数据集,计算量降为原来的百分之八,参数量降低到原来的百分之二十二。 研究了用于交通标志识别的二值化ShuffleNetV2网络,首先在保证ShuffleNetV2的普通卷积模块与深度可分离卷积模块的卷积方式不变的基础上将除第一层外的卷积模块进行二值化。同时观察到在二值化网络中,激活分布与特征图的语义特征表示关系密切,特征图的语义特征表示的变化会极大程度地影响到网络的准确率,于是通过在符号函数与激活函数中引入可以学习的参数,进行激活分布的调整,提高了网络的表达能力,进而提高网络的准确率。最后,在GTSRB和BTSC数据集上分别对比了实值网络与本文的二值化识别网络,在训练BTSC数据集时,考虑到BTSC数据集样本太少,将网络从GTSRB数据集学习到的特征迁移到BTSC数据集的学习上,本文识别模型在计算量,模型大小,识别精度等标准上取得了较好的效果。在准确率没有较大下降的前提下,对于GTSRB数据集,计算量降为原来的百分之十一,参数量降低到原来的百分之九;对于BTSC数据集,计算量降为原来的百分之十一,参数量降低到原来的百分之十一。 |
作者: | 刘科君 |
专业: | 控制科学与工程 |
导师: | 张东波 |
授予学位: | 硕士 |
授予学位单位: | 湘潭大学 |
学位年度: | 2022 |