第章声音数字语音的压缩编码.pptVIP

下载本文档

3
0
约1.15万字
约 52页
2018-10-17 发布于江苏
举报
版权申诉

第章声音数字语音的压缩编码.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第章声音数字语音的压缩编码

南京大学多媒体研究所第3章声音(2) —数字语音的压缩编码内容一、引言二、数字语音的波形编码三、数字语音的参数编码四、数字语音的混合编码一、引言数字语音压缩编码的必要性码率 = 取样频率 x 量化位数 x 通道数目例: 电话语音 =8k x 8b x 1 = 64kbps =8kB/s=28MB/h 对数字语音进行数据压缩的目的: 提高通信/存储效率降低通信/存储成本数字语音压缩编码的可能性声音信号中包含有大量的冗余信息邻近样本之间有很大的相关性周期之间的相关性基音之间的相关性长时（几十秒）自相关性话音间歇（静音）可以利用人的听觉感知特性进行压缩, 可以利用语音信号的生成机理进行数据压缩。对语音数据压缩的要求码率低（bitrate）质量高（quality ： excellent, good, fair ) 延时短（time delay） 25ms 成本合理（cost effective）语音压缩编码方法分类波形编码 (Perception model-based compression) 优点 : 通用、音频质量较高缺点 : 很难获得较大的压缩比示例 : PCM, ADPCM, SBC 参数编码,源编码 (Production model-based compression) 优点: 压缩比较大缺点: 信号源必须已知示例: LPC 混合编码(Hybrid compression) 示例 : CELP 三类语音编码器性能比较二、数字语音的波形编码波形编译码器算法比较简单，容易实现，低延迟，压缩效率不高，数据速率在16 kbps以上，声音质量相当好，通用性好，适用于任意类型的数字声音，很成熟，有一系列国际标准： CCITT G.711 PCM 64kb/s CCITT G.721 ADPCM 32Kb/s CCITT G.726 ADPCM 48, 32, 24, 16 Kb/s 已广泛应用于电话语音的中继线传输 1. CCITT G.711 (脉冲编码调制) Pulse Code Modulation (PCM) of Voice Frequency 编码过程：对数变换 F=ln(x) 目的 : 适应听觉的非线性特性；压缩数据。压扩算法的实现 x(n): 线性码(1+12位) F(n): PCM码(1+7位) 0 0 0 0 0 0 0 W X Y Z a 0 0 0 W X Y Z 0 0 0 0 0 0 1 W X Y Z a 0 0 1 W X Y Z 0 0 0 0 0 1 W X Y Z a b 0 1 0 W X Y Z 0 0 0 0 1 W X Y Z a b c 0 1 1 W X Y Z 0 0 0 1 W X Y Z a b c d 1 0 0 W X Y Z 0 0 1 W X Y Z a b c d e 1 0 1 W X Y Z 0 1 W X Y Z a b c d e f 1 1 0 W X Y Z 1 W X Y Z a b c d e f g 1 1 1 W X Y Z PCM 的应用应用于数字声音的编辑处理（多媒体计算机）应用于声音的传输（通信）: 长途电话 (8 KHz x 8 bit x 1), 时分多路复用TDM (time-division multiplexing) 应用于全频带数字声音的表示/存储: CD-DA（CD唱片），DAT (44.1 KHz x 16 bit x 2) 2. ADPCM自适应差分脉冲编码调制 (Adaptive Differential PCM) 原理：声音信号具有很强的相关性，可从已知信号来预测未知信号, 即使用前面的样本预测当前的样本，实际样本值与预测值之间的误差往往很小。利用自适应的思想改变量化阶的大小，即使用小的量化阶(step-size)去编码小的差值，使用大的量化阶去编码大的差值，效果：量化位数可以显著减少，从而降低了总的码率。无损预测编码（1）信号在时间上的冗余性无损地恢复初始信号 e可能的范围解决办法：SU, SD 无损预测编码（2） 21, 22, 27, 25, 22 f’2＝ 21 e2=1 f’3=21 e3=

您可能关注的文档

文档评论（0）

jyf123 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

用户编号：6153235235000003

1亿VIP精品文档

更多 >

第章声音数字语音的压缩编码.pptVIP