摘要: |
语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的技术。语音识别是一门交叉学科,正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术的结合,使人们能够甩掉键盘,通过语音命令进行操作。语音识别技术应用于汽车,可以使驾驶员用语音指令操纵车载设备,提高汽车驾驶的安全性和舒适性。
目前语音识别系统的研究按核心硬件来分主要有,以PC机为核心硬件的语音识别系统和以专用芯片为核心硬件的嵌入式语音识别系统。本文所研究的是基于TMS320VC5402的非特定人嵌入式语音识别系统,提出一种语音识别系统在汽车上的应用方案,介绍了其硬件组成和软件实现,指出了在汽车上的应用前景。
首先在介绍语音识别技术的在国内外的发展状况,在阐明本课题的研究背景和意义的基础上,根据语音识别系统的构成模型,介绍语音识别的基本理论。包括语音信号预处理、语音的端点检测与特征提取,重点分析LPC倒谱系数和Mel刻度频率倒谱系数,介绍了矢量量化理论,详细阐述矢量量化的基本原理、最佳码本设计。
其次简单阐述TI公司的DSP,并在借鉴已有的成熟理论的基础上,提出相应的识别系统方案。重点设计了电源模块,数模转换模块,扩展存储模块,控制及通信模块等。
再次,在软件算法上,采用过零率与短时能量特征双门限法进行语音端点检测,采用Mel倒谱系数作为语音信号特征矢量,另外,基于非特定人的嵌入式系统要求,为达到减少计算量和存储量的目的,在特征参数提取完成之后,利用矢量量化方法进行数据压缩。语音识别模型采用离散隐马尔可夫模型(DHMM),利用Baum-Welth重估算法、前向后向算法、viterbi算法来完成语音模板的训练和语音识别的任务。整个算法在PC上通过MATLAB仿真,结果表明可以达到识别任务。
最后介绍DSP的软件设计,对全文进行总结,指出今后工作和待研究的方向。
|