语音激活检测技术算法分析及其在语音编码器中的应用-algorithm analysis of speech activation detection technology and its application in speech coder.docxVIP

  • 8
  • 0
  • 约3.99万字
  • 约 52页
  • 2018-06-05 发布于上海
  • 举报

语音激活检测技术算法分析及其在语音编码器中的应用-algorithm analysis of speech activation detection technology and its application in speech coder.docx

语音激活检测技术算法分析及其在语音编码器中的应用-algorithm analysis of speech activation detection technology and its application in speech coder

摘要本文研究了几种常用的语音激活检测算法,进行了仿真和比较,并在传统算法的基础上提出改进算法,提高了VAD检测的综合性能,能够比较准确区分各种含噪语音的语音/静音帧。同时,将语音激活检测应用到高斯混合模型的低码率语音编码器系统中,大大降低了编码速率。语音激活检测技术性能的优劣很大程度影响了编码器最终的编码速率,因此准确的语音激活检测对合成语音的质量非常关键,本文提出了一些改进的激活检测算法。第一种算法是在传统的基于倒谱参数进行语音激活检测算法的基础上,综合利用短时能量和过零率,建立了综合参数的判决准则,从而提高了性能。第二种是在传统谱熵VAD检测基础上,综合利用了谱减法的降噪增强和自适应子带划分,通过这两方面的改进,使得语音激活检测的准确率进一步提高。仿真结果表明改进算法可以从不同的背景噪声中有效地检测出语音,优于传统检测算法,且运算量较之并没有明显的增加。考虑到语音激活检测技术可以对语音中声音和噪声部分进行有效的区分,为了进一步降低GMM编码器的编码速率,本文将语音激活检测技术应用到GMM语音编码器中。在语音编码之前,首先执行VAD算法检测出语音帧和静音帧,然后对两者采用不同的编码算法,语音帧采用基于高斯混合模型的编码器算法,由于GMM参数较少,可以使码率得到一定降低;另外,静音帧仅发送帧幅度均值。同样解码段,对语音/静音帧分别采用不同的解码算法。仿真结果表明:该编码器可以使全语音时的编码速率降低到2.35kb/s左右,且解码得到的语音有较理想的清晰度、可懂度和自然度,令人比较满意。关键词:语音激活检测,GMM,低码率,语音编码AbstractSomeofcommonVoiceActivityDetectionalgorithmsaresimulatedandcomparedinthispaper,andonthebasisoftraditionalalgorithms,improvedalgorithmisproposedwhichraisethecomprehensivefunctionthatisabletoaccuratelydistinguishspeech/muteframeofvariousnoisevoice.MeanwhiletheimprovedalgorithmisappliedtotheGaussianMixtureModellowbitratevoiceencoderssystemandreducethecodingspeed.ThequalityofVADaffectthefinalencodingspeedgreatly,soexactdetectioniscrucialforthequalityofsynthesizedspeech.Forthispurpose,someimprovementisproposed.Thefirstkindofalgorithmisbasedonthetraditionalcepstrumparametersofvoiceactivationdetectionalgorithm,andutilizetheparameterwhichintegratesenergyandshort-timezero-crossingrate,therebytheperformanceismuchbetter.ThesecondisbasedonthetraditionalVADusingspectralentropy,simultaneouslyspectralsubtractionofnoiseandadaptivesub-banddivisionareapplied.Throughthoseimprovingoftheaspects,theaccuracyisfurtherimproved.Simulationresultsshowthattheimprovedalgorithmcandetectspeechfromdifferentnoisebackgroundeffectivelyandit’ssuperiortothetraditionalalgorithmwithoutobviouscomputationincrease.ConsideringtheVADtechnologycaneffectivelydistinguishnoisepart,hereappliedittoGMMspeechencoderinordertofurtherreducetheencodingspeed.Beforethespeechcodingalgorithm,VADisexecutedtodeterminatethespeechframesandsoundlessvoice,thend

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档