当前位置: 首页> 学位论文 >详情
原文传递 基于EEMD的车内语音增强研究
论文题名: 基于EEMD的车内语音增强研究
关键词: 车内噪声;语音增强;EEMD;非线性最小二乘估计;人机语音交互;带通滤波器
摘要: 车内的各种人与设备、人与人之间的语音交互越来越显示出其重要性和广泛的需求。但车内人机语音交互由于容易受到车内环境噪声的干扰,语音识别的准确率与在纯净环境下相比将严重下降,往往不能达到实际人机语音交互的要求。研究和提出车内环境下的语音前端处理技术与方法,实现噪声消除、抑制和语音增强,是提高语音识别率的基础和关键内容之一。 针对上述问题,本文提出了一种基于集合经验模态分解(ensemble empirical modedecomposition,EEMD)的车内语音增强方法(in-car speech enhancement,ICSE)。由于EEMD分解的自适应恒比例带通滤波器特性,分解后语音和噪声在各阶IMFs中有不同的特征,也即语音和噪声分布在不同的IMFs中。因此,对带噪语言信号直接作EEMD分解,采用非线性最小二乘估计和信噪比相结合的方法,确定主要包含语音信号的固有模态函数(intrinsic mode function,IMF)的权系数,用权系数对相应的IMF进行加权处理并合成得到消除了噪声的语音信号。 试验表明,使用这种加权的方法实现语音增强是可行、有效的,语音质量得到了很大改善。而且无论信噪比高低,在波形和发声上都表现出很好的消噪效果,对一般的车内噪音环境具有普遍的适用性。与传统的方法相比,比如谱减法和带通滤波器,该方法能够有效分离语音和车内环境噪声,提出的IMF权系数在信号波形相似度的基础上最大程度地提高了合成语音的信噪比,具有很好的车内语言增强效果,为车内语音增强提供了一个可行的方法。
作者: 张佳芳
专业: 电子信息技术及仪器
导师: 黄海
授予学位: 硕士
授予学位单位: 浙江大学
学位年度: 2007
正文语种: 中文
检索历史
应用推荐