信源编码(数据压缩)课程课后题与答案(第四章).docVIP

信源编码(数据压缩)课程课后题与答案(第四章).doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信源编码 Assignment of CH4 1、详细解释下面概念: (a)绝对掩蔽门限; 图1.听觉区域图 图1是人类的听觉区域图,横坐标表示声音的频率,从20Hz到20000Hz;纵坐标代表音量的大小,单位是dB。图中被Threshold of Hearing和Threshold of Feeling两条曲线所围成的部分就是人耳能够听到的声音区域。在Threshold of Feeling之上的声音,人耳已经不能承受;在Threshold of Hearing之下的声音,人耳感知不到。而最下面这条曲线,就是绝对掩蔽门限,代表了某一频率的纯音,人耳能够感知到的最小的dB。 (b)临界频带; 临界频带称为Critical Bandwidth,当噪声掩蔽纯音时,起作用的是以纯音频率为中心频率的一定频带宽度内的噪声频率。如这频带内的噪声功率等于在噪声中刚能听到的该纯音的功率,则这频带就称为听觉临界频带。 临界频带表征了人类最主要的听觉特性,它是在研究纯音对窄带噪声掩蔽量的规律时被发现的,在加宽噪声带宽时,最初是掩蔽量增大,但带宽超过某一定值后,掩蔽量就不再增加,这一带宽就称为临界频带。 (c)听觉门限; 由掩蔽效应产生的各种掩蔽门限叠加在绝对掩蔽门限后的掩蔽门限,成为听觉门限。即一段音频中各个频率处人耳能够感知到的最小音量。 图2.掩蔽效应叠加在绝对掩蔽门限 由图看出,在频率为1000Hz附近,有一个接近80dB的大信号掩蔽掉了附近频率处的小信号,产生了新的掩蔽门限(蓝色线处),于是人耳能感知到的声音响度在该频率附近发生了变化,不在是绝对掩蔽门限了。叠加后的门限曲线就被称为听觉门限。 (d)掩蔽效应。 听觉中的掩蔽效可以指人的耳朵只对最明显的声音反应敏感,而对于不明显的声音,反应则较不为敏感,前者称为掩蔽音,后者称为被掩蔽声。其主要可以分为两大类:时域掩蔽效应和频域掩蔽效应。 图3.听觉掩蔽效应 一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽。如,一个声强为60dB、频率为1000Hz的纯音,另外还有一个1100Hz的纯音,前者比后者高18dB,在这种情况下我们的耳朵就只能听到那个1000Hz的强音。 除了同时发出的声音之间有掩蔽现象之外,在时间上相邻的声音之间也有掩蔽现象,并且称为时域掩蔽。时域掩蔽又分为超前掩蔽和滞后掩蔽,产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间。一般来说,超前掩蔽很短,只有大约5~20ms,而滞后掩蔽可以持续50~200ms。 2、详细说明: (a)什么是心理声学模型,它的输入和输出分别是什么? 在人耳的声域范围内,声音听觉心理的主观感受主要有响度、音高、音色等特征和掩蔽效应、高频定位等特性。心理声学模型是对人听感的统计性质的数学表述模型,它解释人各种听感的生理原理。心理声学模型可以在主观听感劣化不多的条件下,大大降低数字音频信号传输的带宽。它主要基于人的听觉器官的生理结构和感知模式,通过对数字音频信号的相应处理,去除不可闻的信号成分及引入不可闻的畸变,达到普通熵编码无法达到的压缩比率。 它的输入是音频原始样本数据,输出是听觉掩蔽门限或者信号掩蔽比(SMR)。 (b)心理声学模型在音频编码中的作用? 心理声学模型在音频编码中的作用主要是基于其模仿人类听觉器官原理和感知模式的前提下,指导人们进行音频信号编码的思路和方向。它通过对原始音频样本数据进行分析,计算语音的掩蔽门限,并根据掩蔽门限控制量化编码,除不可闻的信号成分及引入不可闻的畸变,尽可能地减少数据量,达到普通熵编码无法达到的压缩比率。 3、(a)MPEG-1音频编码分几层,各层在编码效率、算法复杂度和算法延迟上有和区别? MPEG-1音频编码共有三层,分别为MPEG-1 Layer1、MPEG-1 Layer2和MPEG-1 Layer3,高层兼容低层。其中第三层协议简称MP3。 MPEG-1 Layer1采用每声道192kbit/s,每帧384个样本,32个等宽子带,固定分割数据块。子带编码用DCT离散余弦变换和FFT快速傅立叶变换计算子带信号量化比特数。采用基于频域掩蔽效应的心理声学模型,使量化噪声低于掩蔽值。量化采用带死区的线性量化器,主要用于数字盒式磁带。 MPEG-1 Layer2采用每声道128kbit/s,每帧1152个样本,32个子带,属不同的分帧方式。采用共同频域和时域掩蔽效应的心理声学模型,并对高、中、低频段的比特分配进行限制,并对比特分配、比例因子,取样进行附加编码。Layer2 广泛用于数字电视,CD-ROM,CD-I和VCD等。 MPEG-1 Layer3采用每声道64kbit/s,用混合滤波器组提高频率分辨率,按信号分辨率分成6×32或18×32个子

文档评论(0)

ldj215323 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档