论文题名: | 驾驶环境下低信噪比语音增强算法研究 |
关键词: | 汽车电子产品;语音增强算法;低信噪比;驾驶环境;神经网络 |
摘要: | 随着人工智能技术的发展,智能驾驶逐渐成为人们关注的焦点,便携式导航仪、智能后视镜等智能车载电子产品也逐渐走入日常生活。为了减少意外事故的发生,解放驾驶员的双手,大部分车载电子产品需要通过语音命令来控制。然而,驾驶环境是充斥着多种噪声的复杂声学环境,现有的语音识别技术在该环境下难以满足人们的要求。因此,驾驶环境下语音增强技术的研究对于未来车载电子产品的设计与发展有着重要意义。 本文研究了驾驶环境下低信噪比语音增强算法,并重点介绍了基于神经网络的语音增强算法。论文给出了语音增强算法的基本原理、实现方法及测试结果,主要工作如下: 1.本文针对汽车噪声与驾驶员语音的特点,结合受限玻尔兹曼机理论,提出了一种深层神经网络训练算法的优化方案,即将原有的无监督的初始化训练方案改为以较高信噪比平行语料作为目标函数的有监督训练方案。与原有训练算法相比,该方案既可以缓解训练集数据较少时过拟合的问题,又可以简化网络模型的结构,缩短运算时间。 2.本文结合反向传播神经网络与径向基神经网络的特点,给出一种将两种网络相结合的训练算法,通过两种网络相结合,既可以弥补反向传播网络非线性映射能力较弱的不足,又可以尽量减少径向基网络隐层神经元的数量。 3.针对本文所提算法在去噪能力与鲁棒性上存在的不足,本文还给出了两方面的优化方案。为了提高增强模型的性能,本文对训练集数据依据信噪比不同进行分类训练。在增强时,为了准确而快速地判别带噪信号信噪比的强弱,本文采用基于能量统计复杂度的端点检测算法来检测语音起点,然后对语音起点之前的纯噪声片段进行分析,以确定带噪语音所属类别。为了提高算法的鲁棒性,在增强时,本文对与训练集全局均值相差过大的输入数据进行均值移位,以便更好地适应增强模型。在语音重构过程中,为了减少均值移位产生的音乐噪声,本文还采用最小值控制递归平均噪声估计算法来估计语音存在概率,然后依据语音存在概率进行加权相加。 实验结果表明,本文算法能够适用于驾驶环境下的语音增强,与现有算法相比,在分段信噪比与语音质量方面均有较大提高。 |
作者: | 杨洪校 |
专业: | 电子科学与技术 |
导师: | 魏杰 |
授予学位: | 硕士 |
授予学位单位: | 北京交通大学 |
学位年度: | 2017 |
正文语种: | 中文 |