- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第章 声音数字语音的压缩编码
南京大学多媒体研究所 第3章 声音(2) —数字语音的压缩编码 内容 一、引言 二、数字语音的波形编码 三、数字语音的参数编码 四、数字语音的混合编码 一、引 言 数字语音压缩编码的必要性 码率 = 取样频率 x 量化位数 x 通道数目 例: 电话语音 =8k x 8b x 1 = 64kbps =8kB/s=28MB/h 对数字语音进行数据压缩的目的: 提高通信/存储效率 降低通信/存储成本 数字语音压缩编码的可能性 声音信号中包含有大量的冗余信息 邻近样本之间有很大的相关性 周期之间的相关性 基音之间的相关性 长时(几十秒)自相关性 话音间歇(静音) 可以利用人的听觉感知特性进行压缩, 可以利用语音信号的生成机理进行数据压缩。 对语音数据压缩的要求 码率低(bitrate) 质量高(quality : excellent, good, fair ) 延时短(time delay) 25ms 成本合理(cost effective) 语音压缩编码方法分类 波形编码 (Perception model-based compression) 优点 : 通用、音频质量较高 缺点 : 很难获得较大的压缩比 示例 : PCM, ADPCM, SBC 参数编码,源编码 (Production model-based compression) 优点: 压缩比较大 缺点: 信号源必须已知 示例: LPC 混合编码(Hybrid compression) 示例 : CELP 三类语音编码器性能比较 二、数字语音的波形编码 波形编译码器 算法比较简单,容易实现,低延迟, 压缩效率不高,数据速率在16 kbps以上, 声音质量相当好, 通用性好,适用于任意类型的数字声音, 很成熟,有一系列国际标准: CCITT G.711 PCM 64kb/s CCITT G.721 ADPCM 32Kb/s CCITT G.726 ADPCM 48, 32, 24, 16 Kb/s 已广泛应用于电话语音的中继线传输 1. CCITT G.711 (脉冲编码调制) Pulse Code Modulation (PCM) of Voice Frequency 编码过程: 对数变换 F=ln(x) 目的 : 适应听觉的非线性特性;压缩数据。 压扩算法的实现 x(n): 线性码(1+12位) F(n): PCM码(1+7位) 0 0 0 0 0 0 0 W X Y Z a 0 0 0 W X Y Z 0 0 0 0 0 0 1 W X Y Z a 0 0 1 W X Y Z 0 0 0 0 0 1 W X Y Z a b 0 1 0 W X Y Z 0 0 0 0 1 W X Y Z a b c 0 1 1 W X Y Z 0 0 0 1 W X Y Z a b c d 1 0 0 W X Y Z 0 0 1 W X Y Z a b c d e 1 0 1 W X Y Z 0 1 W X Y Z a b c d e f 1 1 0 W X Y Z 1 W X Y Z a b c d e f g 1 1 1 W X Y Z PCM 的应用 应用于数字声音的编辑处理(多媒体计算机) 应用于声音的传输(通信): 长途电话 (8 KHz x 8 bit x 1), 时分多路复用TDM (time-division multiplexing) 应用于全频带数字声音的表示/存储: CD-DA(CD唱片),DAT (44.1 KHz x 16 bit x 2) 2. ADPCM自适应差分脉冲编码调制 (Adaptive Differential PCM) 原理: 声音信号具有很强的相关性,可从已知信号来预测未知信号, 即使用前面的样本预测当前的样本,实际样本值与预测值之间的误差往往很小。 利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值, 效果:量化位数可以显著减少,从而降低了总的码率。 无损预测编码(1) 信号在时间上的冗余性 无损地恢复初始信号 e可能的范围 解决办法:SU, SD 无损预测编码(2) 21, 22, 27, 25, 22 f’2= 21 e2=1 f’3=21 e3=
文档评论(0)