第5章多媒体数据压缩.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图5.14 预测图像P的压缩算法框图 (3)双向预测图像B的压缩编码算法 双向预测图像B,它参照前一幅和后一幅I图像或P图像产生,压缩编码框图如图5.15所示。具体计算方法与预测图像P的算法类似,这里不再重复。 图5.15 双向预测图像B的压缩编码算法框图 2)MPEG—1视频图像的结构 MPEG编码器算法允许选择帧内图像I的频率和位置。帧内图像I的频率是指每秒钟出现帧内图像I的次数,位置是指时间方向上帧所在的位置。一般情况下,帧内图像I的频率为2。MPEG编码器也允许在一对帧内图像I或者预测图像P之间选择双向预测图像B的数目。帧内图像I、预测图像P和双向预测图像B数目的选择依据主要是根据节目的内容。例如,对于快速运动的图像,帧内图像I的频率可以选择高一些,而双向预测图像B的数目可以选择少一点;对于慢速运动的图像帧内图像I的频率可以低一点,而双向预测图像B的数目可以选择多一点。此外,在实际应用中还要考虑媒体的速率。 一个典型的帧内图像I、预测图像P和双向预测图像B的安排如图5.16所示。编码参数为:帧内图像I的距离为N=15,预测图像P的距离为M=3。 图5.16 MPEG视频图像帧编排 MPEG—2标准分为9个部分,各部分的内容描述如下。 第1部分(系统,Systems):规定视频数据、声音数据及其他相关数据的同步。 第2部分(视频,Video):规定视频数据的编码和解码。 第3部分(音频,Audio):规定声音数据的编码和解码,是MPEG—1 Audio的扩充,支持多个声道,向下兼容MPEG—1 Audio标准。 第4部分(一致性测试,Conformance Testing):描述测试一个编码码流是否符合MPEG—2码流的方法。 第5部分(软件仿真,Software Simulation):描述了MPEG—2标准的第1,2,3部分的软件实现方法。 第6部分(数字存储媒体命令和控制扩展协议,DSM—CC,Digital Storage Media Command and Control):用于管理MPEG—1和MPEG—2的数据流,使数据流既可在单机上运行,又可在异构网络环境下运行。 1.MPEG—2的音频编码 MPEG—2标准委员会定义了两种声音数据压缩格式,一种称为MPEG—2 Audio,或者称为MPEG—2多通道(Multichannel)声音,因为它与MPEG—1 Audio是兼容的,所以又称为MPEG—2 BC(Backward Compatible)。另一种称为MPEG—2 AAC(Advanced Audio Coding),因为它与MPEG—1声音格式不兼容,因此通常称为非向下兼容MPEG—2 NBC(Non-Backward-Compatible)标准。 (1)MPEG—2 Audio MPEG—2 Audio(ISO/IEC 13818—3)和MPEG—1 Audio(ISO/IEC 1117—3)标准都使用相同种类的编译码器,层1、层2和层3的结构也相同。MPEG—2声音标准与MPEG—1标准相比,MPEG—2做了如下扩充:①增加了16kHz,22.05kHz和24kHz采样频率;②扩展了编码器的输出速率范围,由32~384kbps扩展到8~640kbps;③增加了声道数,支持5.1声道和7.1声道的环绕声。此外MPEG—2还支持Linear PCM(线性PCM)和Dolby AC3(Audio Code Number 3)编码。它们的差别见表5.4。 参数名称 采样频率(kHz) 每个样本的比特数 最大数据传输率(bps) 最大声道数 Linear PCM 48/96 16/20/24 6.144M 8 Dolby AC3 32/44.1/48 压缩(16bit) 448k 5.1 MPEG—1 Audio 32/44.1/48 压缩(16bit) 32~448k 2 MPEG—2 Audio 16/22.05/24/32/44.1/48 16 8~640k 5.1/7.1 表5.4 MPEG—1和MPEG—2的声音数据规格差别 MPEG—2 Audio的“5.1环绕声”也称为“3/2-立体声加LFE”,其中的“.1”就是指LFE声道。它的含义是播音现场的前面可有3个喇叭声道(左、中、右),后面可有2个环绕声喇叭声道,LFE(Low Frequency Effects)是低频(3~120Hz)音效的加强声道,如图5.17(a)所示。7.1声道环绕立体声与5.1类似,如图5.17(b)所示。 图5.17 立体环绕声 (2)MPEG—2 AAC MPEG—2 AAC是MPEG—2标准中的一种非常灵活的声音感知编码标准。就像所有感知编码一样,MPEG—2 AAC主要使用听觉系统

文档评论(0)

小教资源库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档