当前位置: 首页> 学位论文 >详情
原文传递 车载环境下驾驶员语音增强方法研究
论文题名: 车载环境下驾驶员语音增强方法研究
关键词: 车载环境;语音识别系统;小波变换;盲源分离;阈值去噪
摘要: 车载语音识别系统是出于解放驾驶员双手、提供驾驶乐趣、促进安全出行等目的而诞生的。近年来,伴随着我国汽车使用量的激增,车载语音识别系统也得到了广泛关注,国内外从2000年开始已有相关产品陆续问世。现有的语音识别产品,在安静环境下识别率能达到97%左右,但在车载环境下,却难以达到实用标准。究其原因,主要是车载环境下路况复杂,各种环境噪声影响了识别率,严重时甚至会影响驾驶安全。
  车载语音识别系统中很重要的一方面是首先要在车载环境中区别出驾驶员的语音,这是后面驾驶员语音识别的关键,因此本文重点研究车载环境下驾驶员语音增强问题。车载环境噪声包含语音噪声和非语音噪声,传统的语音增强方法并不能去除非驾驶员的语音干扰,因此本文从语音分离的角度出发来增强驾驶员语音。本文所做的工作包括如下两个方面:
  (1)设计了一种基于小波阈值去噪预处理与盲源分离相结合的方法。由于车载环境下驾驶员语音分离问题属于欠定盲源分离,不易于实现,而且盲源分离算法不能高效提高信噪比,因此引入小波阈值去噪算法作为预处理。该方法首先对带噪语音进行小波阈值去噪,过滤掉非语音噪声,得到包含驾驶员语音的多人混合语音。从而将欠定盲源分离问题转化为非欠定盲源分离问题,并且大大提高了信噪比。然后采用快速独立分量分析法对多人混合语音进行分离,得到各个说话人的独立语音分量。
  (2)利用声纹特征从多人语音中选择出驾驶员语音分量。该方法选择梅尔倒谱系数(MFCC)作为声纹特征参数,并用矢量量化(VQ)作为模式匹配方法。在训练阶段,训练驾驶员的MFCC参数模板;在测试阶段,对盲源分离得到的各个说话人信号提取MFCC参数,计算其与模板的距离,将距离最小的语音分量判断为驾驶员语音。
  对上述方法的仿真结果表明,本文所提出的驾驶员语音增强方法对复杂路况的非语音噪声具有一定的去噪效果,并能提高信噪比;去除了非语音噪声能够将复杂的欠定盲源分离问题转化为简单的非欠定盲源分离问题,从而清晰地分离出多人混合语音分量;采用声纹匹配的方法,不需要麦克风阵列的支持,就能准确地识别出驾驶员语音分量。该方法较为简单、易于在车载硬件平台上实现。
作者: 朱晓敏
专业: 计算机技术
导师: 潘蓉;赵东平
授予学位: 硕士
授予学位单位: 西安电子科技大学
学位年度: 2015
正文语种: 中文
检索历史
应用推荐