论文题名: | 面向车载导航的语音交互技术 |
关键词: | 车载导航系统;语音交互技术;隐马尔可夫模型;降噪处理 |
摘要: | 随着近代计算机技术的飞速发展,语音识别技术日趋成熟,尤其是孤立词语音识别技术取得了较高的识别准确率,然而随着语音识别技术限制条件的放宽及实际应用环境的限制,仍存在一系列亟待解决的问题,对于大词汇表的连续语音识别技术,在识别速度、准确率、系统顽健性等性能上还远远没有达到尽善尽美。 本文以车载导航系统为应用背景,从语音识别应用的角度出发,结合语音合成技术建立一个语音交互的系统。实现中,重点研究以下几个技术问题: (1)采用了隐马尔可夫模型建模,着重比较不同的声学建模方法对于识别结果的影响,如隐马尔可夫模型的结构,识别基元选择(音节、声韵母)等。 (2)通过对文本语料的训练,构建语言模型,实现音字转换的过程。通过结合声学模型和语言模型完成大词汇量连续语音识别系统,并通过参数调整提高系统的各方面性能。 (3)系统实际应用环境噪声的存在,严重影响了语音识别的准确性。实验中,借助语音增强技术对语音进行降噪处理,比较不同的语音增强算法的降噪效果以及对语音识别的准确率的影响。 (4)语音交互过程的设计与实现。系统主要是针对深圳市地名集合,采用了分区查询策略,建立语音交互过程。 本文通过系统的实现与实验结果发现,利用隐马尔可夫建模,相对于音节、声韵母建模,基于上下文相关的声韵母建模识别效果取得较好的识别效果,增加隐马尔可夫模型结构状态数一定程度上提高了识别准确率。在严重的车载环境噪声情况下,借助语音增强技术识别率达到50%,较噪声环境下提高了近24%。语音识别与语音合成技术结合可以建立良好的语音交互模式,提高用户使用的方便性与快捷性。 |
作者: | 曹柏余 |
专业: | 计算机科学与技术 |
导师: | 陈清财 |
授予学位: | 硕士 |
授予学位单位: | 哈尔滨工业大学 |
学位年度: | 2010 |
正文语种: | 中文 |