音频编解码介绍.pdfVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
音频编解码介绍

音频编解码原理介绍 一.为什么要进行音频编解码 二.音频编解码原理 三.几种基本音频编解码介绍 一、为什么要进行音频编解码 随着人们对多媒体图像和声音的要求越来越高,在高清晰数字电视 (HDTV)和数字电 影中不仅应有高质量的图像,也应当具有CD 质量的立体声。因为用数字方法记录声音比用 模拟方法记录声音具有更强的优势,例如传输时抗噪声能力强、增加音频动态范围、多次翻 录没有信号衰减等。但是数字声音最大的缺陷是记录的数据量大,表现在两个方面:其一是 在传输过程中,传输数字声音需要占用很宽的传输带宽;其二是在存储过程中,需要占用大 量的存储空间。所以在数字音频中需要采用数字音频压缩技术,对音频数据进行压缩。 二、音频编解码原理 每张CD 光盘重放双声道立体声信号可达74 分钟。VCD 视盘机要同时重放声音和图像, 图像信号数据需要压缩,其伴音信号数据也要压缩,否则伴音信号难于存储到VCD 光盘中。 一、伴音压缩编码原理 伴音信号的结构较图像信号简单一些。伴音信号的压缩方法与图像信号压缩技术有相 似性,也要从伴音信号中剔除冗余信息。人耳朵对音频信号的听觉灵敏度有规律性,对于不 同频段或不同声压级的伴音有其特殊的敏感特性。在伴音数据压缩过程中,主要应用了听觉 阈值及掩蔽效应等听觉心理特性。 1、阈值和掩蔽效应 (1) 阈值特性 人耳朵对不同频率的声音具有不同的听觉灵敏度,对低频段(例如 100Hz 以下)和超高频 段(例如16KHZ 以上)的听觉灵敏度较低,而在 1K-5KHZ 的中音频段时,听觉灵敏度明显提 高。通常,将这种现象称为人耳的阈值特性。若将这种听觉特性用曲线表示出来,就称为人 耳的阈值特性曲线,阈值特性曲线反映该特性的数值界限。将曲线界限以下的声音舍弃掉, 对人耳的实际听音效果没有影响,这些声音属于冗余信息。 在伴音压缩编码过程中,应当将阈值曲线以上的可听频段的声音信号保留住,它是可 听频段的主要成分,而那些听觉不灵敏的频段信号不易被察觉。应当保留强大的信号,忽略 舍弃弱小的信号。经过这样处理的声音,人耳在听觉上几乎察觉不到其失真。在实际伴音压 缩编码过程中,也要对不同频段的声音数据进行量化处理。可对人耳不敏感频段采用较粗的 量化步长进行量化,可舍弃一些次要信息;而对人耳敏感频段则采用较细小的量化步长,使 用较多的码位来传送。 (2)掩蔽效应 掩蔽效应是人耳的另一个重要生理特征。如果在一段较窄的频段上存在两种声音信号, 当一个强度大于另一个时,则人耳的听觉阈值将提高,人耳朵可以听到大音量的声音信号, 而其附近频率小音量的声音信号却听不到,好像是小音量信号被大音量信号掩蔽掉了。由于 其它声音信号存在而听不到本声音存在的现象,称为掩蔽效应。 根据人耳的掩蔽特性,可将大音量附近的小音量信号舍弃掉,对实际听音效果不会发生 影响。既使保留这些小音量信号,人耳也听不到它们的存在,它属于伴音信号中的冗余信息。 舍弃掉这些信号,可以进一步压缩伴音数据总量。 经仔细观察,掩蔽效应分为两大类,一类是同时掩蔽效应,另一类是短时掩蔽效应。 其中,同时掩蔽效应是指同时存在一个弱信号和一个强信号,两者频率接近,强信号将提高 弱信号的听阈值,将弱信号的听阈值提高到一定程度时,可使人耳听不到弱信号。例如,同 时出现A 、B 两声,若A 声的听觉阈值为50dB,由于存在另一个不同频率的B 声,将使A 声的阈值提高到64~68dB,例如取68dB,那么数值(68~50)dB=18dB,该值称为掩蔽量。将 强大的B 声称为掩蔽声,而较弱的A 声称为被掩蔽声。上述掩蔽现象说明,若仅有A 声时, 其声压级50dB 以上的声音可以传送出去,而50dB 以下的声音将听不到;若同时出现B 声, B 声具有同时掩蔽效应,使得A 声在声压级68dB 以下的声音也听不到了,即50~68dB 之间 的A 声人耳也听不到了,这些声音不必传送,即使传送也听不到,只须传送声压级68dB 以 上的声音。总之,为了提高一个声音的阈值,可以同时设置另一个声音,使用这种办法可以 压缩掉一部分声音数据。在周围十分安静的环境下,人耳可以听到声压级很低的各种频率声 音,但对低频声和高频声的掩蔽阈值较高,即听觉不灵敏。经研究还发现,掩蔽声越强,掩 蔽作用越强;当掩蔽声与被掩蔽声的频率相差越小,掩蔽效果越明显,两者频率相等时,掩 蔽效果最佳;低频声(设为 B)可有效地掩蔽高频声(设为A) ,而高频声(设为 B)几乎不能掩蔽 低频声(设为A) 。因而输

文档评论(0)

aqlsxc66163 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档