101听觉系统的感知特性.PPT

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
101听觉系统的感知特性

多媒体技术教程 第10章 MPEG声音 林福宗 清华大学 计算机科学与技术系 linfz@ 2008年9月 第10章 MPEG声音目录 10.1 听觉系统的感知特性 10.1.1. 对响度的感知 10.1.2. 对音高的感知 10.1.3. 掩蔽效应 10.2 感知声音编码 10.2.1 MPEG声音的压缩依据 10.2.2 感知子带编码 10.2.3 杜比数字编码 10.3 MPEG-1 Audio 10.3.1 声音编码 10.3.2 声音的性能 10.3.3 子带编码 10.3.4 多相滤波器组 10.3.5 编码层 10.4 MPEG-2 Audio 10.4.1 MPEG-2 Audio简介 10.4.2 MPEG-2 Audio使用的环绕声 10.4.3 MPEG-2 Audio的后向兼容结构 第10章 MPEG声音 前言 MPEG声音的数据压缩和编码不是依据波形本身的相关性和模拟人的发音器官的特性,而是利用人的听觉系统的特性来达到压缩声音数据的目的,这种压缩编码称为感知声音编码 进入20世纪80年代,人类在利用自身的听觉系统的特性来压缩声音数据方面取得了很大的进展,先后制定了MPEG-1 Audio, MPEG-2 Audio,MPEG-2 AAC和MPEG-4 Audio等标准[1][2][3][4],并把它们统称为MPEG声音。 本章涉及的许多具体算法已经超出本教材的要求。为给需要深入研究和具体开发产品的读者提供方便,本章提供了大量宝贵的参考文件和站点地址 10.1 听觉系统的感知特性 10.1.1 对响度的感知 声音的响度就是声音的强弱 在物理上,用dyn/cm2(达因/平方厘米)(声压)或W/cm2(瓦特/平方厘米)(声强)度量 在心理上,主观感觉的声音强弱使用响度级“方(phon)”或“宋(sone)”来度量 这两种计量单位完全不同,但它们之间有一定的联系 人耳的听觉范围 听阈:当声音弱到人耳朵刚可听见时的声音强度 痛域:声音强到使人耳感到疼痛时的声音强度 听觉范围:位于听阈和痛域之间,见图10-1 10.1 听觉系统的感知特性(续1) 10.1 听觉系统的感知特性(续2) 10.1.2 对音高(频率)的感知 客观上用频率表示声音的音高,其单位是Hz。而主观感觉的音高单位则是“美(Mel)”。 主观音高与客观音高的关系为 10.1 听觉系统的感知特性(续3) 音高-频率曲线 测量主观音高时,让实验者听两个声强级为40 dB的纯音,固定其中一个纯音的频率,调节另一个纯音的频率,直到他感到后者的音高为前者的两倍,就标定这两个声音的音高差为两倍。测出的“音高—频率”曲线见图10-2 10.1 听觉系统的感知特性(续4) 10.1.3 掩蔽效应 一种频率的声音阻碍听觉系统感受另一种频率的声音的现象 前者称为掩蔽声音(masking tone) 后者称为被掩蔽声音(masked tone) 掩蔽可分成频域掩蔽和时域掩蔽 频域掩蔽 一个强纯音掩蔽在其附近同时发声的弱纯音的特性,也称同时掩蔽(simultaneous masking), 如图10-3所示 10.1 听觉系统的感知特性(续5) 10.1 听觉系统的感知特性(续6) 图10-4中的一组曲线表示为250 Hz,1 kHz和4 kHz纯音的掩蔽效应,它们的声强均为60 dB 250 Hz,1 kHz和4 kHz附近,对其他纯音的掩蔽效果最明显 低频纯音可有效地掩蔽高频纯音,相反则不明显 10.1 听觉系统的感知特性(续7) 临界频带(critical band) 人耳刚可感知两种频率的声音有差别的频率范围 通常认为声音(audio)有25个临界频带,见表10-1 临界频带的宽度随声音频率的变化而变化 在低频端,宽度小于100 Hz,可认为接近于常数 在高频端,宽度近似线性增加,宽度可大到4 kHz 临界频带的单位为Bark(巴克) 1 Bark等于一个临界频带的宽度 10.1 听觉系统的感知特性(续8) 10.1 听觉系统的感知特性(续9) 时域掩蔽 在时间上相邻的声音之间的掩蔽现象 [6][7] 一个强掩蔽音出现前、同时存在时或消失后的掩蔽效果见图10-5 同时掩蔽(simultaneous masking):信号和掩蔽音同时产生的现象 滞后掩蔽(post-masking):信号出现在掩蔽音消失后出现的现象,可以持续50~200 ms 超前掩蔽(pre-masking):信号出现在掩蔽音出现之前产生的现象。虽然对超前掩蔽有许多研究报告,但这种现象依然令人费解[9] [7]。超前掩蔽很短,通常只有大约2~20 ms, 产生时域掩蔽的主要原因 人的大脑处理信息需要花费一定的时间 10.1 听觉系统的感知特性(续10) 10.2 感知声音编码

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档