多媒体数据压缩技术99705.pptVIP

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多媒体数据压缩技术 频域分析 频域分析 多媒体数据压缩技术 音频压缩标准 电话质量的语音压缩标准-应用于数字移动通讯。语音信号的频率范围300HZ-3.4KHZ 三种语音编译 码器: 波形编译码器 音源编译码器 混合编译码器 普通编译码器的音质与数据率 多媒体数据压缩技术 电话质量语音信号的频率范围是300HZ-3.4KHZ,采用标准的PCM: 采样频率为8KHZ,量化位数为8b,所对应的速率为64kb/s。 最简单的波形编码是脉冲编码调制(pulse code modulation,PCM) 电话质量的语音压缩标准: G.711、G.721、G.723等(参见书P56) 多媒体数据压缩技术 PCM是概念上最简单、理论上最完善的编码系统,是最早研制成功、使用最为广泛的编码系统,它仅仅是对输入信号进行采样和量化,但也是数据量最大的编码系统 下图中的“防失真滤波器”是一个低通滤波器,用来滤除声音频带以外的信号;“波形编码器”可暂时理解为“采样器”,“量化器”可理解为“量化阶大小(step-size)”生成器或者称为“量化间隔”生成器。 多媒体数据压缩技术 多媒体数据压缩技术 高保真立体声音频压缩标准-频率范围50HZ-20KHZ 目前国际上比较成熟的高保真立体声音频压缩标准为MPEG音频。 MPEG-1和MPEG-2的声音数据压缩编码不是依据波形本身的相关性和模拟人的发音器官的特性,而是利用人的听觉系统的特性来达到压缩声音数据的目的,这种压缩编码称为感知声音编码(perceptual audio coding)。 多媒体数据压缩技术 进入20世纪80年代之后,尤其最近几年,人类在利用自身的听觉系统的特性来压缩声音数据方面取得了很大的进展,先后制定了MPEG-1 Audio, MPEG-2 Audio等标准 它们处理10 Hz-20000 Hz范围里的声音数据,使用“心理声学模型(psychoacoustic model)”来达到压缩声音数据的目的。 心理声学模型中一个基本的概念就是听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到,因此就可以把这部分信号去掉。 多媒体数据压缩技术 心理声学模型中的另一个概念是听觉掩饰特性,意思是一种频率的声音阻碍听觉系统感受另一种频率的声音的现象。例如,同时有两种频率的声音存在,一种是1000 Hz的声音,另一种是1100 Hz的声音,但它的强度比前者低18分贝,因此,1100 Hz的声音就会听不到 比如在一安静房间里的普通谈话可以听得很清楚,但在播放摇滚乐的环境下同样的普通谈话就听不清楚了。声音压缩算法也同样可以确立这种特性的模型来取消更多的冗余数据。 多媒体数据压缩技术 多媒体数据压缩技术 音频压缩标准 音频层根据压缩质量和编码复杂度分为Layer1、Layer2、Layer3三层 音频压缩标准 ① 层1的编码器最为简单,编码器的输出数据率为384 kb/s,主要用于小型数字盒式磁带(digital compact cassette,DCC)。 ② 层2的编码器的复杂程度属中等,编码器的输出数据率为256 kb/s-192 kb/s,其应用包括数字广播声音(digital broadcast audio,DBA)、数字音乐、CD-I(compact disc-interactive)和VCD(video compact disc)等。 ③ 层3的编码器最为复杂,编码器的输出数据率为64 kb/s,广泛用于INTERNET传播。 音频压缩标准 MPEG-1 Audio (ISO/IEC 11172-3)压缩算法是世界上第一个高保真声音数据压缩国际标准,并且得到了极其广泛的应用。虽然MPEG声音标准是MPEG标准的一部分,但它也完全可以独立应用。数据的输入/输出图如下: 音频压缩标准 MPEG-1 Audio的编码对象是20~20kHz的宽带声音,因此它采用了感知子带编码。或叫做子带编码(sub-band coding,SBC)。 利用子带编码达到既压缩声音数据又尽可能保留声音原有质量的目的。 这种方法的具体思想是首先把时域中的声音数据变换到频域中的多个子带当中,对每个子带里的信号分别进行量化和编码,根据心理声学模型确定样本的精度,从而达到压缩数据量的目的。 音频压缩标准 输入声音信号经过一个“时间-频率多相滤波器组”变换到频域里的多个子带中。 滤波器组:实现时域到频域的转换,采用多相正交分解滤波器组将数字化的宽带音频信号分成32个子带 音频压缩标准 利用心理学模型控制量化和编码的一组数据-人们利用模型来判断哪些频率中的音在整个音中对人们影响最大,因此编码时候决定分配给子带信号的量化位数 最后通过“数据流帧包装”将量化的

文档评论(0)

ygxt89 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档