- 1、本文档共65页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
MPEG1 数据传输速率为1.5Mb/s的数字存储媒体运动图像及其伴音编码标准 时间 1993年8月 输入 视频:352×240×30,352×288×25 音频:32、44.1、48kHz的线性PCM 输出 1.5Mb/s、32-384 Kb/s(音频) 压缩率 20~30 压缩算法 运动补偿帧间预测(单向预测+双向预测)+DCT 应用 VCD、MP3、局域网视频传输 MPEG Video MPEG2 运动图像及其伴音通用编码标准 时间 1994年11月 输入 352×288~1920×1152 采用频率为16、22.05、24、32、44.1、48kHz的线性PCM、支持5.1声道 输出 1.5-80Mb/s、8-640 Kb/s(音频) 压缩率 30-40 压缩算法 运动补偿帧间预测(单双向预测)+DCT、可伸缩性、前向兼容 应用 DVD、DVB、HDTV MPEG Video 结束 由于声音频率与掩蔽曲线不是线性关系,为从感知上来统一度量声音频率,引入了“临界频带(critical band)”的概念。通常认为,在20 Hz到16 kHz范围内有24个临界频带临界频带的单位叫Bark(巴克), 1 Bark = 一个临界频带的宽度 (频率) 500 Hz的情况下, 1 Bark ? /100 (频率) 500 Hz的情况下, 1Bark ? 9 + 4log( /1000) 感知特性-掩蔽效应(续) 2. 时域掩蔽 除了同时发出的声音之间有掩蔽现象之外,在时间上相邻的声音之间也有掩蔽现象,并且称为时域掩蔽。时域掩蔽又分为超前掩蔽(pre-masking)和滞后掩蔽(post-masking),如图9-05所示。产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间。一般来说,超前掩蔽很短,只有大约5~20 ms,而滞后掩蔽可以持续50~200 ms。这个区别也是很容易理解的。 感知特性-掩蔽效应(续) 一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽 感知特性-掩蔽效应(续) 以上我们讨论了响度、音高和掩蔽效应,尤其是人的主观感觉。其中掩蔽效应尤为重要,它是心理声学模型的基础。 感知特性-掩蔽效应(续) MPEG Audio与感知特性 MPEG Audio标准在本书中是指MPEG-1 Audio、MPEG-2 Audio和MPEG-2 AAC,它们处理10 Hz~20000 Hz范围里的声音数据,数据压缩的的主要依据是人耳朵的听觉特性,使用“心理声学模型(psychoacoustic model)”来达到压缩声音数据的目的。 心理声学模型中一个基本的概念就是听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到,因此就可以把这部分信号去掉。听觉阈值的大小随声音频率的改变而改变,各个人的听觉阈值也不同。 心理声学模型中的另一个概念是听觉掩饰特性,意思是听觉阈值电平是自适应的,即听觉阈值电平会随听到的不同频率的声音而发生变化。声音压缩算法也同样可以确立这种特性的模型来取消更多的冗余数据。 MPEG Audio与感知特性 MPEG-1 Audio 1:声音编码 声音的数据量由两方面决定:采样频率和样本精度。对单声道信号而言,每秒钟的数据量(位数)=采样频率 ′ 样本精度。要减小数据量,就需要降低采样频率或者降低样本精度。但是人耳可听到的频率范围大约是20 Hz~20 kHz。根据奈奎斯特理论,要想不失真地重构信号,采样频率不能低于40 kHz。再考虑到实际中使用的滤波器都不可能是理想滤波器,以及考虑各国所用的交流电源的频率,为保证声音频带的宽度,所以采样频率一般不能低于44.1 kHz。这样,压缩就必须从降低样本精度这个角度出发,即减少每位样本所需要的位数。 MPEG-1 Audio 2:声音的性能 (1) MPEG编码器的输入信号为线性PCM信号,采样率为32, 44.1或48 kHz,输出为32 kb/s~384 kb/s。 (2) MPEG声音标准提供三个独立的压缩层次:层1(Layer 1)、层2(Layer 2)和层3(Layer 3),用户对层次的选择可在复杂性和声音质量之间进行权衡。 ① 层1的编码器最为简单,编码器的输出数据率为384 kb/s,主要用于小型数字盒式磁带(digital compact cassette,DCC)。 ② 层2的编码器的复杂程度属中等,编码器的输出数据率为256 kb/s~192 kb/s,其应用包括数字广播声音(digital broadcast audio,DBA)、数字音乐、CD-I(compact disc-interactive)和VCD(video compact disc)等。 ③ 层3的编码
文档评论(0)