论文题名: | One-Shot车载语音交互系统的设计与实现 |
关键词: | 车载设备;语音交互系统;音频任务控制;WinCE平台;系统模块 |
摘要: | 随着中国汽车工业的快速发展和汽车保有量的增加,带动了汽车电子设备的蓬勃发展,越来越多的车载嵌入式设备被添加到汽车中,这些设备在提高驾车舒适度和汽车性能的同时,也增加了汽车驾驶操控的复杂度,带来了不安全的隐患。由于车载环境的限制,在驾车时通过一般的视图界面来操作车载设备的各项功能是比较复杂和危险的,将语音交互技术融入到汽车中,可以很好的解决上述问题。利用语音识别技术,可以让车载设备听懂人类的语言,实现语音点播歌曲、收听广播、接听电话、声控导航等功能;利用语音合成技术,可以将汽车状态、当前路况、新来电话等信息直接播报给驾驶员,驾驶员不用转移双眼去查看信息。 目前的车载语音交互系统在汽车上的应用局限于对少量的车载电子设备进行语音控制,一般并不能涵盖到所有的应用,例如已经成熟的导航软件中只有语音播报功能,蓝牙免提电话只能实现语音拨打电话等,语音技术只是作为一个锦上添花的功能存在,不能完全替代图形界面操作。另一方面,目前的车载应用一般采用多次对话式语音确认,相对于图形用户界面交互并没有减少操作时间,而且多次的交互也降低了识别率。繁琐的语音交互不仅不能体现语音操作的高效性,而且也影响了车载语音交互系统的可操作性。 本文针对车载环境这一特殊场景,提出一种One-Shot语音交互方案,驾驶员通过一句简单的语音命令,控制车载设备,如导航、音乐、收音机、蓝牙电话,车载设备也根据需要将反馈的内容以语音的形式给予提示。车载语音交互过程中驾驶员无需转移双眼查看屏幕,只需一句语音命令即可操控车载设备,摒弃了繁琐的多步对话确认,通过语音播报收听车载信息。相比于传统界面交互和多次对话式语音交互,极大降低了危险发生的可能性,也提高了车载设备的可操作性。 同时,基于科大讯飞语音技术在WINCE5.0平台上实现了车载语音交互系统,系统主要由词典管理模块、语音交互服务模块、语音识别模块、语音合成模块、音频任务控制模块组成,词典管理模块的任务是根据语法文件编译生成Aitalk语音识别引擎所需的识别词典,如果需要添加语音控制应用,只需修改语法文件,增加对应的语法命令,使得车载语音交互系统具有良好的可扩展性;语音交互服务负责调用语音合成模块进行语音播报,调用语音识别模块对驾驶员发出的一句语音命令进行识别,并调用语音合成模块进行语音提示播报,同时将识别结果发送给车载应用;音频任务控制模块随时监视音频任务,并获得当前的音频任务变化,在有新的音频任务申请时,根据音频任务的优先级决定是否执行申请以响应用户操作,使语音应用之间可以井然有序的协调工作,避免对语音交互的识别产生干扰。 系统在WinCE平台上测试通过,运行稳定,语音交互方便快捷。在纯净语音环境下系统识别率达到95%,在驾车关窗低车载噪音时,识别率也达到85%以上,一次语音交互时间控制在7秒之内,实现了语音技术与汽车系统简洁高效的结合。 |
作者: | 李金耀 |
专业: | 计算机应用技术 |
导师: | 刘政怡 |
授予学位: | 硕士 |
授予学位单位: | 安徽大学 |
学位年度: | 2012 |
正文语种: | 中文 |