论文题名: | 基于卷积神经网络的行人检测方法研究 |
关键词: | 卷积神经网络;行人检测;网络结构;特征图分层;检测精度 |
摘要: | 交通环境中的行人检测问题对于算法的检测精度和速度都有较高要求。传统方法能够满足速度要求,但在精度上差距较远,基于卷积神经网络的方法精度较高,但是计算量巨大。本文主要在基于卷积神经网络的基础上构建精度更高速度更快的行人检测方法。 首先,本文分别从网络结构设计,损失函数设计,正则化方法和优化策略四个方面总结了卷积网络应用相关的基础知识;然后以 MNIST数据集上的手写数字识别为例,重点比较了梯度下降优化算法不同变体之间的差别,为优化算法的选择提供了实践依据。 其次,在目标检测领域内领先的Faster RCNN方法基础上,基于总结的设计准则和行人的尺度特性,调整了网络的锚点窗口设置和区域生成网络方式,添加了环境区域池化层。然后基于开源深度学习框架对该网络在加州理工行人数据集上进行了实现,实验结果表明该方法可以实现高效的行人检测。 然后,针对单尺度区域生成网络由于输入特征图固定造成的无法兼顾大小行人检测精度的问题,设计了基于特征图分层的多尺度区域生成网络,并为之设计了相应的随机缩放裁剪数据扩增方法应对训练不均衡问题。实验结果表明,该网络能够在输入分辨率较低的情况下实现比单尺度方法在高分辨率输入情况下更高的检测精度。 最后,针对测试过程中检测速度慢的问题,设计了基于奇异值分解和Tucker-2分解的全连接层和卷积层的压缩方法,分别将高维的全连接层和卷积层近似为级联的低维全连接层和卷积层。结果表明,通过“训练-分解-调优”的三段压缩方式,该方法能够在不明显损失检测精度的情况下实现单层4倍、总体1.6倍的加速和总体4倍的模型大小压缩。压缩后的网络在GTX1080显卡加速下能够达到30帧每秒。 |
作者: | 刘键 |
专业: | 控制科学与工程 |
导师: | 何朕 |
授予学位: | 硕士 |
授予学位单位: | 哈尔滨工业大学 |
学位年度: | 2017 |
正文语种: | 中文 |