第8章 数字音频技术1.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第8章 数字音频技术1

信息工程系 数字电视原理 信息工程系 数字电视原理 第八章 数字音频技术 8.2 MPEG音频压缩技术 8.2.1 音频特性及其编码 研究听觉系统对声音的感知特性,下面介绍已经用在MPEG Audio压缩编码算法中的三个特性:响度、音高和掩蔽效应,听觉感知编码。 1. 对响度的感知 声音的响度就是声音音频弱。 在物理上(客观),声音的响度使用客观测量单位来度量,即dyn/cm2(达因/平方厘米)(声压)或W/cm2(瓦特/平方厘米)(声强)。 在心理上(主观),主观感觉的声音强弱使用响音频“方(phon)”或者“宋(sone)”来度量 8.2 MPEG音频压缩技术 这两种感知音频强弱的计量单位是完全不同的两种概念,但是它们之间又有一定的联系 当音频弱到人的耳朵刚刚可以听见时,我们称此时的音频强度为“听阈”。例如,1 kHz纯音的声强达到10-16w/cm2(定义成零dB声强级)时,人耳刚能听到,此时的主观响度级定为零方 实验表明,听阈是随频率变化的。测出的“听阈—频率”曲线如图所示。图中最靠下面的一根曲线叫做“零方等响度级”曲线,也称“绝对听阈”曲线,即在安静环境中,能被人耳听到的纯音的最小值 另一种极端的情况是音频强到使人耳感到疼痛。实验表明,如果频率为1 kHz的纯音的声强级达到120 dB左右时,人的耳朵就感到疼痛,这个阈值称为“痛阈” 8.2 MPEG音频压缩技术 “听阈—频率”曲线 8.2 MPEG音频压缩技术 人耳对不同频率的敏感程度差别很大,其中对2 kHz~4 kHz范围的信号最为敏感,幅度很低的信号都能被人耳听到。而在低频区和高频区,能被人耳听到的信号幅度要高得多 8.2 MPEG音频压缩技术 2. 对音高的感知 客观上用频率来表示声音的音高,其单位是Hz 主观感觉的音高单位则是“美(Mel)”,主观音高与客观音高的关系是: 其中 f的单位为Hz 这也是两个既不相同又有联系的单位 人耳对频率的感觉也有一个范围。人耳可以听到的最低频率约20 Hz,最高频率约20000 Hz 8.2 MPEG音频压缩技术 音高—频率曲线 8.2 MPEG音频压缩技术 3. 掩蔽效应 一种频率的声音阻碍听觉系统感受另一种频率的声音的现象称为掩蔽效应。前者称为掩蔽声音(masking tone),后者称为被掩蔽声音(masked tone) 掩蔽可分成频域掩蔽和时域掩蔽 (1). 频域掩蔽 一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽(simultaneous masking) 8.2 MPEG音频压缩技术 声强为60 dB、频率为1000 Hz纯音的掩蔽效应 8.2 MPEG音频压缩技术 频率为250 Hz、1 kHz、4 kHz和8 kHz纯音的掩蔽效应,它们的声强均为60 dB ①在250 Hz、1 kHz、4 kHz和8 kHz纯音附近,对其他纯音的掩蔽效果最明显 ②低频纯音可以有效地掩蔽高频纯音,但高频纯音对低频纯音的掩蔽作用则不明显 8.2 MPEG音频压缩技术 2. 时域掩蔽 时间上相邻的声音之间也有掩蔽现象,并且称为时域掩蔽。时域掩蔽又分为超前掩蔽(pre-masking)和滞后掩蔽(post-masking) 超前掩蔽较短,只有大约5~20 ms,而滞后掩蔽可以持续50~200 ms 8.2 MPEG音频压缩技术 时域掩蔽 8.2 MPEG音频压缩技术 听觉感知编码的编码思路: 1. 根据听觉域度对可闻信号进行编码 8.2 MPEG音频压缩技术 2.根据掩蔽效应,只对幅度强的掩蔽信号进行编码 8.2 MPEG音频压缩技术 3.量化噪声使得不必全部编码原始信号 8.2 MPEG音频压缩技术 4. 通过子带分割来进行优化、编码 8.2 MPEG音频压缩技术 8.2.2 MPEG-1音频压缩技术 MPEG音频压缩的的主要依据是人耳朵的听觉特性,使用“心理声学模型(psychoacoustic model)”来达到压缩声音数据的目的 心理声学模型 听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到,因此就可以把这部分信号去掉 听觉阈值的大小随声音频率的改变而改变,各个人的听觉阈值也不同。大多数人的听觉系统对2 kHz~5 kHz之间的声音最敏感。一个人是否能听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值 8.2 MPEG音频压缩技术 听觉系统存在掩蔽特性,听觉阈值电平是自适应的,即听觉阈值电平会随听到的不同频率的音频而发生变化 例如,同时有两种频率的音频存在,一种是1000 Hz的音频,另一种是1100 Hz的音频,但它的强度比前者低18分贝,在这种情况下,1100 Hz的音频就听不到 8.2 MPEG

文档评论(0)

dajuhyy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档