论文题名: | 基于深度学习的汽车违法鸣笛识别方法研究 |
关键词: | 汽车鸣笛声识别;深度学习;特征提取;梅尔频率倒谱系数;CDBN特征 |
摘要: | 随着城市居民的机动车保有数量逐年持续增加,城市交通的压力也越来越大,交通污染现象已经成为了一个不可忽视的问题。汽车鸣笛噪声作为交通污染的重要组成部分已经对人们的生产和生活产生了巨大的影响,我国相关执法部门也颁布了相应的法律来制止和减少此现象的发生,但是人工执法不但效率低下,且浪费了大量的人力物力,所以如何能高效的对城市交通中的违法鸣笛行为进行定位和识别成为了该领域待研究的关键问题。 现有的汽车鸣笛声识别方案在实际应用的过程中存在识别效率低,计算过程复杂,过于依赖人工复核等问题。针对这些问题,本文将深度学习技术应用于汽车鸣笛声识别领域作了深入研究,重点研究了用深度信念网络作为生成性模型对汽车鸣笛声进行识别;并且研究了用卷积深度信念网络对鸣笛声信号进行特征提取,得到了相比传统特征分类效果更好的特征。 分析了汽车鸣笛声识别领域现有的方法以及存在的问题。对现有的识别算法进行了对比研究,以及深度学习技术相比于传统识别算法的优势。 本文将深度信念网络作为生成性模型用于汽车鸣笛声识别。对传统声学特征MFCC的原理及提取过程进行了详细阐述;将得到的MFCC参数作为DBN网络的输入层进行训练,从而得到MFCC特征中更深层的特征,在网络的输出层加入soft-max分类器完成对数据的分类。通过进行仿真实验,论证了当输入的MFCC特征维数不同时,其对识别准确率的影响;以及不同的测试样本长度对识别准确率的影响;同时与MFCC特征直接训练GMM模型的识别结果相比,证明了DBN在汽车鸣笛声上的优越性。 为了得到相比传统特征更具代表性的声学特征,本文在深度信念网络的基础上加入卷积操作,研究了使用卷积深度信念网络对鸣笛声信号进行特征提取。对汽车鸣笛声信号提取频谱特征,将频谱特征作为CDBN网络的输入对网络进行训练,得到CDBN特征,用得到的CDBN特征对GMM模型进行训练,对数据进行识别,通过仿真实验,论证了选取特征参数不同的统计值对识别结果的影响;以及不同测试样本长度对识别结果的影响。同时与MFCC特征直接训练GMM模型的识别结果相比,CDBN特征的识别准确率优于传统MFCC特征。 |
作者: | 郑皓 |
专业: | 通信与信息工程 |
导师: | 党建武 |
授予学位: | 硕士 |
授予学位单位: | 兰州交通大学 |
学位年度: | 2018 |
正文语种: | 中文 |