语音信号编码 .pdfVIP

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

语音信号编码

早期的语音信号处理及传输均是以模拟的方式进行的。20世纪30年代末脉冲编码调制(PCM,Pulse

CodeModulation)原理和声码器(Vocoder)概念被提出后,语音数字编码便一直沿着这两个方向发展。

语音数据压缩目的是能在尽可能低的传输速率上获得高质量的语音效果,即希望语音信号可以在带宽较窄

的信道中传输而语音质量下降的不多或尽可能不下降。语音编码系统早期用的是波形编码方法,也叫波形

编码(或非参数编码),其目的是力图使重建的语音波形保持原语音信号的波形形状。这种编码器是把语

音信号当成一般的波形信号来处理,而并未考虑语音信号的冗佘度。它的优点是具有较强的适应能力,有

较好的合成语音质量,然而编码速率高(64Kbit/s),编码效率极低。脉冲编码调制(PCM)、自适应

增量调制(ADM)、自适应差分编码(ADPCM)、自适应编码(APC)等都是属于波形编码(非参数编

码)。而声码器则是不同于波形编码器的高效编码方式。声码器又称参数编码(或模型编码),它主要是

对提取的语音信号特征参数进行编码,目的主要是使重建的语音信号具有尽可能高的可懂度,而不是要求

重建波形保持原语音波形的形状。因此,可能出现的情况是即使重建语音的可懂度高,但其时域波形与原

语音的时域波形有较大的差别。这种编码器的优点是可达到极低的编码速率而语音依然可懂,编码速率可

达到8Kbit/s、4.8Kbit/s甚至更低。主要缺点是重建语音自然度低,韵律感差,合成语音质量差。声

码器的典型代表是通道声码器、共峰声码器及线性预测声码器等。

广告插播信息

维库最新热卖芯片:LM2901DR2MC7805BTLM2676T-ADJLA3430RYT113432

CY62147CV18LL-70BAITNJM072DKA8603MC145160PAT45DB161D-TU

20世纪80年代至今,不仅声码器和波形编码器得到了很大发展,并且还有一种全新的革命性编码方

法被普遍推广,这类编码器叫混合编码器。这种编码器在传送器中对给定编码结构的所有可能性进行综合,

找出输人语音的最好编码形式,并从这些可能性中发现输入语音的最优主观匹配,然后用数码表示这种主

观匹配并发送到接收器。利用线性预测、VQ、A-B-S、感觉加权、后滤波等技术得到的多脉冲激励线性

预测(MPELP,MultiPulseEnspiritLinePrognosticate),规则脉冲激励线性预测(RPELP,RulePulse

EnspiritLinePrognosticate),码本激励线性预测(CELP,CodeEnspiritLinePrognosticate)编

码速率达到8~16Kbit/s甚至更底,其话音质量高、编码速率低,但算法复杂。

近年来,ITU-T在多媒体数字通信方面(包括电视会议等)制定了一系列国际标准(按ITU的说法

是建议)。

表1ITU-T多媒体会议标准(基本模式)

在现有的网路设施条仵下,H.320和H.323比较适用的标准。H.320的基本音频模式是G.711

log-PCM(对数脉码调制)编码解码器,它是一种简单的8kHz采样频率对数脉码调制模式,长期以来它

都是数字电话网络主要的编码方法(长途电话尽管起源于模拟电话,现在长途电话在数字网络上传输)。

G.711定义为8位编码,速率为64Kbit/s,但在H.320中采样截短为6或7比特位,因为速率

相应变为48Kbit/s或56Kbit/s。G.711提供了出色的长话音质窄带(3kHz音频带宽)语音、不太

明显的编解码延迟(低于1ms)以及非常低的实现复杂性。为了提供与普通G.711音频电话的兼容性,

所有的H.320呼叫在H.221FAS和BAS信道中进行同步初始化和模式协商时开始发送和接收G.711

音频。

G.711有很多优点,但是G.711指定了两个不同的编码A律和μ律,在采用G.711标准的区域,

不同地方使用上述两种不同的方法。CCITT不能达成统一的编码方法。结果是H.320系统必须由远端在

每次呼叫开始时自动发现使用的编码律,或者避免使用音频直到H.320控制过程能用来建立另一

文档评论(0)

150****2006 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档