论文题名: | 车载语音识别系统的研究及DSP实现 |
关键词: | 车载设备;语音识别;特征提取;数字信号处理 |
摘要: | 近年来,以自然语言人机交互为主要目标的语音识别技术一直是人们的研究重点。随着语音识别核心算法的不断改进和大规模集成电路的飞速发展,语音识别技术开始从实验室迈向市场化,进入智能可穿戴,智能车载,智能家居等领域,越来越贴近人们的生活。根据目前技术的成熟度和市场接受度,融合了智能语音交互技术的汽车市场会成为语音识别技术的一个重要应用。但是往往车载应用环境较为复杂,诸如背景噪声,说话人差异以及信道畸变都会引起训练和测试环境的不一致,从而导致语音识别系统的识别性能显著下降。如何提高系统在复杂环境下的识别性能是一个研究的难点。本文主要针对现有车载语音识别系统抗噪鲁棒性差的问题,作了如下主要工作: (1)从语音识别技术的基本理论和框架出发,分别在信号、特征、模型三个层面上去提升语音识别系统的鲁棒性。在信号空间,引入改进的多窗谱估计语音增强算法和结合时频特性的能熵比端点检测方法;在特征空间,采用特征弯折算法和MVDA后处理技术对背景噪声进行抑制并且补偿信道;在模型空间引入带噪训练并优化DTW识别方法。 (2)深入研究了基于听觉特性的语音特征提取方法。针对基于发声机理的线性预测倒谱系数(LPCC)和传统听觉特征梅尔频率倒谱系数(MFCC)等鲁棒性不足的缺点,提出了平滑幅度包络梅尔频率倒谱系数(SMFCC)和差分相对谱感知线性预测系数(RASTA-DPLP)以及归一化子带能量规整系数(GPNCC),通过实验证明了这些特征可以大幅提高抗噪性能,并且满足系统一定的实时性要求。 (3)分析和比较了语音识别技术中识别策略,模型以及算法的优劣,构建出车载语音识别系统整体结构,对其中核心模块进行了具体设计并对比于传统方法进行了仿真实验,实验结果表明改进的各类识别算法在提升语音识别系统抗噪性能和识别率上效果显著,达到了系统设计要求。 (4)根据实验仿真流程搭建了一个基于TMS320C6713 DSK的孤立词识别系统。在该硬件平台上进行测试,其中数字识别任务的识别率约为95.27%,车载词汇任务的识别率约为90.25%,验证了语音识别系统的可移植性。 |
作者: | 龙乐凯 |
专业: | 电子与通信工程 |
导师: | 周萍 |
授予学位: | 硕士 |
授予学位单位: | 桂林电子科技大学 |
学位年度: | 2017 |
正文语种: | 中文 |