摘要: |
目前海难事故频繁发生,在经济、人身安全、环境等诸多方面给人类造成的直接或间接损失难以计算。随着海上形势复杂多变,如何提高海上搜救能力,使搜救系统具有更高的效率成为当前的研究热点。本文以海上搜救模拟系统为背景,研究了搜救模拟系统中的语音技术。研究重点包括语音的传输、合成和识别等多方面技术中存在的瓶颈问题。主要研究内容如下:
⑴语音传输存在噪音、丢包、抖动、断续等问题,这些问题会使得接收者听起来不舒适。本文选用UDP作为语音传输协议,windows socket等编程方法,通过对现有技术的改进、综合解决语音传输中存在的困难。
⑵人类语言的多样性导致了语音合成的自然度低、合成效果差。本文将神经网络模型与现有的语音合成技术相结合,对传统语音合成韵律模型进行改进,以便提高新系统的合成自然度和较好的适应性及实用性。
⑶MSAgent功能强大,为解决人机交互界面的智能性提供了一条新途径。特别是在人机对话方面,MSAgent能够很好的完成语音识别工作。利用MSAgent技术可以有效地提高语音识别的正确率。
⑷将上述关键技术嵌入到基于多Agent的海上搜救模拟系统中,解决了分布式环境下语音的合成、传输、识别等问题。 |