- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
西安电子科技大学信息科学研究所 第5章 语音编码 杨家玮 盛敏 刘勤 5.1 引 言 语音编码是将模拟语音信号转换为数字语音信号,以便在数字信道中传输。 语音编码的技术在数字移动通信中具有相当关键的作用。 本章介绍语音编码的基本原理,简要分析其基本算法,给出一些适合于移动信道的语音编码技术,包括欧洲GSM系统的规则码激励长期预测编码(RPE-LPT)、美国提出的矢量和激励线性预测编码(VSELP)和3G系统采用的AMR等。 一、 语音编码的基本概念 语音编码技术可以分为波形编码、参量编码和混合编码等类型。 波形编码是将时间域信号直接变换为数字代码,目标是尽可能精确地再现原来语音波形。 波形编码的基本方法是抽样、量化,编码 编码速率较高时,语音质量好。 波形编码广泛应用与有线通信,在频率受限的移动通信中,单纯的波形编码已经不适合。 波形编码技术包括脉冲编码调制(PCM)和增量调制(?M)及它们的各种改进型。 参量编码(声源编码) 将信源信号在频率域或其他正交变换域中提取特征参量,并将其变换为数字代码进行传输。 解码是从接收信号中恢复特征参量,然后根据这些特征参量重建语音信号。 可实现低速率语音编码,可压缩到2~4.8 Kb/s,甚至更低,但语音质量只能达到中等。 线性预测编码(LPC)及其各种改进型都属于参量编码。 混合编码 混合编码力图保持波形编码的高质量及参量编码的低速率的优点。 混合编码语音信号中既包括若干语音特征参量又包括部分波形编码信息。 可将比特速率压缩到4~16 Kb/s,并且在8~16 Kb/s范围内能达到良好的语音质量。 规则码激励长期预测编码(RPE- LPT)就是一种混合编码方案。显然,混合编码是适合于在数字移动通信中采用。 信息压缩技术 在语音编码中广泛采用的信息压缩技术可以分为两类:波形处理技术和量化技术。 波形处理技术的目标是削减语音波形的冗余度,包括线性预测分析、频带分割、正交变换和分析合成等。 量化技术的目标是在幅度量化上实现优化,包括自适应量化、自适应比特分配和矢量量化等。 二、 语音质量评价 语音质量高低的直接感受者是听者的主观感觉 广泛采用的评定方法是主观评定等级,或称平均评价得分(MOS)。 方法是,由数十名试听者在不同信道环境中试听并给予评分,然后对评分进行统计处理,求出平均得分,分数等级采用五级分制。 听者对语音质量的主观感觉往往是和其注意力集中的程度相联系的,因而,对应于主观评定等级,还有一个收听注意力等级 主观评定等级 从用户角度看,语音质量得分在4分和4分以上者为高质量语音编码,达到网络质量。 语音质量得分在3.5分者称为达到通信质量的语音编码。听者可以感觉出语音质量下降,但不影响正常的电话通信。 语音质量得分不超过3分者称为达到合成质量的语音编码。这种语音达到一定的可懂度,但自然较差,不容易识别出讲话者。 三、 语音编码技术的进展与现状 语音编码技术首先应用于有线通信和保密通信 最成熟的实用数字语音系统是64 Kb/s的PCM,典型的波形编码技术,语音质量好,可与模拟语音相比,达到网络质量。 另一类型的波形编码是增量调制,较简单且能抗误码。当速率在32 Kb/s~40 Kb/s之间时,语音质量较好; 码速率2400 bit/s的声码器是典型的参量编码,优点是速率低,主要用于军方保密通信,语音质量仅达到合成质量,且对背景噪声敏感。 在数字通信发展的推动下,语音编码的研究进展迅速。研究方向有两个:一是降低语音编码速率,这主要针对语音质量好但速率高的波形编码;二是提高语音质量,这主要针对速率低但语音质量较差的参量编码。 波形编码的改进主要有自适应差分PCM(ADPCM)、子带编码(SBC)、自适应变换域编码(ATC)和时域谐波压扩(TDHS)等。编码速率9600 bit/s~32 Kb/s,语音质量较好。提取某些语音特征参量来传输,以达到压缩速率的目的,已不是单纯的波形编码。 参量编码的一项突出进展提出了矢量量化编码,可进一步压缩速率。 改进参量编码语音质量,提出多脉冲激励线性预测编码(MPE-LPC)、规则脉冲激励线性测编码(RPE-LPC):速率从4.8 Kb/s~16 Kb/s,可达到中等语音质量,属于混合编码。 码本激励线性预测编码(CELP)也是近年来提出的较好的编码方案。 低速率编码器:速率低于4800 bit/s;中速率编码器,速率4.8 Kb/s~32 Kb/s 。 在语音编码技术的发展中,特别要提及的是数字信号处理器(DSP)的出现和应用。 实际上,许多新编码算法较早就提出了,由于硬件方面的困难,没能应用到实用系统中。 DSP的出现改变了这种状况,许多复杂算法的实现已成为可能。目前,许多低速高质语音编码器都是用DSP实现的。
文档评论(0)