论文题名: | 基于循环神经网络的声学车型识别研究 |
关键词: | 声学车型识别;神经网络;智能交通;车辆噪声;特征信息 |
摘要: | 车辆车型识别作为智能交通运输系统中比较基本的研究方向,一直以来备受国内外相关研究者关注。经历了四十多年的发展,车型识别仍然存在识别率低、抗干扰差及数据采集处理难度大等问题,导致车型识别距离实际场景应用还有一定差距。本文从不同车型车内噪声存在区别为出发点,参考有反馈神经网络在声音识别领域取得的显著成果,提出了基于循环神经网络的车辆噪声识别方法。 为参考数据长时间背景信息,充分提取不同车辆噪声的特征信息,本文以有反馈神经网络中的循环神经网络为研究重点,根据循环神经网络的发展现状引入循环神经网络演变形式双向LSTM(Long Short-Term Memory)网络作为车辆噪声识别模型。该识别模型内部隐含层单元选用包含输入,输出及重置控制三个门结构的LSTM单元,各个单元构成了该模型前向传播层和后向传播层两个互不相连的特殊结构层且各单元与输入层为全连接方式。这种网络连接方式能够解决长时间步长双向背景信息参考问题和常见梯度爆炸或消失问题;在最终的识别输出阶段网络采用CTC(Connectionist Temporal Classification)叠加输出的方式,通过最大概率解码方法得到网络最终的标签输出。由于该结构的标签缩减算法可以消除识别后的重复和无效标签,所以避免了网络训练识别过程中需要标签和数据一一对应问题,简化了数据处理过程。 网络训练测试数据具体获取方面,本文采用随机样本起始位置点获取方法得到每个训练样本。首先,在原始录取的连续声音信号中选取随机点作为训练样本开始位置点;其次,随机点具体选取采用随原始录音信号长度均匀分布的随机函数得到;最后,从选取的随机位置点开始复制目标长度的声音采样数据作为单个样本。在后续数据预处理过程中,我们仍旧选取传统声音识别所采用的信号特征预处理方法,将声音信号的梅尔倒谱系数作为最终的训练测试数据。最终实验表明,基于双向LSTM和CTC网络结构的车辆噪声识别模型经过交叉验证后,网络识别率没有出现大的波动且网络结构稳定可靠。与传统的高斯混合模型和无反馈神经网络声学识别模型相比,该模型的识别效果更好。并且,在不同程度噪声影响条件下,该模型可以满足基本的识别任务。 |
作者: | 陈超学 |
专业: | 信息与通信工程 |
导师: | 谢雪梅 |
授予学位: | 硕士 |
授予学位单位: | 西安电子科技大学 |
学位年度: | 2015 |
正文语种: | 中文 |