基于深度学习的水下低速率语音编码关键技术研究
摘要
在水下通信中,受到水下通信带宽的要求,在与水下潜水员进行语音通信的过程中,
往往采用低速率语音编码的方案,通过对语音的特征进行传输,并在编码端合成,以此
降低速率。而在水下嘈杂复杂的环境下,传统的低速率语音编码存在多方面的问题,首
先受到人类语言特点的影响,语音中往往存在较多的不包含信息的非语音帧,对于非语
音帧的传输会导致传输效率降低;其次对噪声的无处理传输,会使得解码段合成语音的
效果较差,影响语音的质量和可识别程度;最后低速率语音编码往往也具有合成语音质
量较低,识别度较低等情况,因此,针对上述情况,本文基于混合激励线性预测编码
(MixedExcitationLinearPrediction,MELP)系统,通过神经网络建立分类模块、降噪模
块和参数优化模块,以此来提高系统传输速率和合成端的语音质量,本文主要研究内容
为
1、在语音输入MELP系统前,在语音预处理部分,本文系统通过利用神经网络引
入分类模块和降噪模块,通过分类模块对输入语音进行语音和非语音的分类,对于语音
部分,将其输入之后的降噪模块进行语音增强以后,再输入至MELP中进行特征提取
原创力文档

文档评论(0)