走进数字AV压缩技术(中).docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
走进数字AV压缩技术(中)

走进数字AV压缩技术(中)2、WAV编码 WAV是由微软制定并开发的一种音频编码格式,由于微软本身的影响力,这个格式目前事实上已经成为了各种系统平台中最为通用也是最常见的音频文件格式。WAV文件格式,符合 RIFF(Resource Interchange File Format)规范。所有的WAV文件都有一个文件头,这个文件头内包含有音频流的编码参数。WAV可以使用多种音频编码来压缩其音频流,我们最常见的都是经PCM编码处理的WAV,但这不表示WAV只能使用PCM编码。WAV对音频流的编码没有硬性规定,除了PCM之外,还有几乎所有支持ACM(Audio Compression Manager)规范的编码都可以为WAV的音频流进行编码。在Windows平台上通过ACM结构及相应的CODEC(编码译码器),可以在WAV文件中存放超过20种的压缩格式。只要有软件支持,你甚至可以在WAV格式里面存放图像,所以MP3编码同样也可以运用在WAV中。只要安装好了相应的译码器,就可以欣赏这些WAV了。 在Windows平台下,基于PCM编码的WAV是被支持得最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较高的音质的要求,支持多种音频位数、采样频率和声道,因此WAV也是音乐编辑创作的首选格式,但其缺点是文件体积较大(一分钟时长44kHz、16bit采样的WAV文件约需要占用10MB左右的硬盘空间),所以不适合长时间记录。它的主要用途是存放音频数据并用作进一步的处理,而不是像mp3那样用于聆听。因此,基于PCM编码的WAV被作为了一种中介的格式,常常使用在其它编码的相互转换之中,例如将mp3转换成WMA时。 3、mp3编码 mp3是1993年由Fraunhofer-IIS研究院和Thomson公司的研究成果。它是MPEG(Moving Picture Experts Group) Audio Layer-3的简称,是MPEG1的衍生编码方案。mp3是第一个实用的有损音频压缩编码,虽然几大音乐商极其反感这种开放的格式,但也无法阻止这种音频压缩的格式的生存与流传。各种与mp3相关的软件产品层出不穷,现在各种支持mp3格式的硬件产品也是随处可见了。 在mp3出现之前,一般的音频编码即使以有损方式进行压缩能达到4:1的压缩比例已经非常不错了。mp3可以做到12:1的惊人压缩比,这使得mp3迅速地流行起来。mp3之所以能够达到如此高的压缩比例同时又能保持相当不错的音质是因为利用了知觉音频编码技术,也就是利用了人耳的特性,削减音乐中人耳听不到的成分,同时尝试尽可能地维持原来的声音质量。 mp3编码技术的发布之初其实是非常不完善的,由于缺乏对声音和人耳听觉的研究,早期的mp3编码器几乎全是以粗暴方式来编码,音质破坏严重。随着新技术的不断导入,mp3编码技术一次一次的被改良,其中有2次重大技术上的改进。 第一次改进是VBR(Variant Bit Rate,可变位率)的引入。我们知道,衡量mp3文件的压缩比例通常使用位率(Bit Rate)来表示。通常位率越高,压缩文件就越大,但音乐中获得保留的成分就越多,音质就越好。由于位率与文件大小音质的关系,所以后来出现了VBR方式编码的mp3。VBR编码的特点是可根据编码的内容动态地选择合适的位率,因此编码的结果是在保证了音质的同时又照顾了文件的大小,结果大受欢迎。同时,mp3格式的文件有一个有意思的特征,就是可以边读边放,这也符合流媒体的最基本特征,也就是说播放器可以不用预读文件的全部内容就可以播放,读到哪里播放到哪里,即使是文件有部分损坏。VBR技术的优越性是显而易见的,但要运用确实是一件难事,因为这要求编码器知道如何为每一段分配位率,这对没有波形分析的编码器而言,这种技术如同虚设。正是如此,VBR技术并没有一出现就显得光彩夺目。 第二次改进就是听觉模型的引入。专家们通过长期的声学研究,发现人耳存在遮蔽效应。声音信号实际是一种能量波,在空气或其它媒介中传播,人耳对声音能量的多少即响度或声压最直接的反应就是听到这个声音的大小,我们称它为响度,表示响度这种能量的单位为分贝(dB)。即使是同样响度的声音,人们也会因为它们频率不同而感觉到声音大小不同。人耳最容易听到的就是4kHz的频率,不管频率是否增高或降低,即使是响度在相同的情况下,大家都会觉得声音在变小。但响度降到一定程度时,人耳就听不到了,每一个频率都有着不同的值。 0dB是听觉灵敏度的极限,而120dB是痛苦灵敏度的极限。人耳在2000Hz到5000Hz范围内的灵敏度最高,两端就迅速下降。所以人耳对中频的灵敏度远高于高低频。 从人耳听觉等效曲线图中,我们可以看到这条曲线基本成一个V字型,当频率超

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档