第三章音频信号处理技术.ppt

  1. 1、本文档共165页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
范铁生 岳承君 王 军 王丹华 编著 电子工业出版社 第三章 一维的音频信号理技术 学习要点 了解音频信号的基本概念 理解人类的听觉特性 理解时频域掩蔽效应 理解音频信号压缩技术 了解常见音频编码标准 通过实例掌握常用的音频处理软件 3.1 音频信号的基本概念 3.1.1音频信号的特点 3.1.2 音频信号的离散化 3.1.3 音频信号的音质指标 3.1.4 音频文件的格式 3.2 人类听觉特性 3.2.1 人耳的构造 3.2.2 频率 3.2.3 时域掩蔽效应 3.2.4 频域掩蔽效应 3.2.5 音频的有关定律 3.3 音频信号的压缩技术 3.3.1 脉冲编码调制 3.3.2 感知编码 3.3.3 子带编码 3.4 音频编码标准 3.4.1 CCITT G系列标准 3.4.2 MP3压缩标准 3.4.3 AC-3压缩标准 3.4.4 MIDI标准 3.5 应用实例 数字化声音压缩的必要性 储存: 计算一分钟未经压缩的CD高保真立体声数字声音文件的大小为10MB左右,必须进行压缩才能储存。经过MP3压缩编码后只有1MB左右 。 传输:音频压缩的目标是将数据传输率由1.5Mbit/s码率降低到100~400kbit/s 。 MP3音频文件通常码率为32kbit/s 与视频压缩相似,音频压缩也有两种方式: 冗余度消除——省略多余信息,无损 不相关性消除——省去接收端(人耳)不能察觉的信息,有损 所有音频压缩方法基于心理声学模型,利用人耳的不足,消除音频信号中的不相关信息。 人耳不能察觉频域和时域中强声音脉冲邻近的声音 对人耳而言,某些声音可以掩盖其他低幅度的声音信号。 语音信号冗余几个方面: 1). 幅度非均匀分布 语音中小幅度样本比大幅度样本出现的概率要高。通话会有间隙,且实际语音信号的功率电平也趋向于出现在编码范围的较低电平端。 2). 样本之间的相关性 对语音波形分析表明,采样数据的最大相关性存在于邻近样本之间。当采样速率为8KHz时,相邻采样值之间的相关系数大于0.85,甚至在相距十个样本之间,相关系数还有0.3左右的数量级。 3). 周期之间的相关性 虽然电话语音信号的频率分布在300-3400Hz的频带内,但在特定的瞬间,某一声音却往往只是该频带内的少数频率起作用。当声音中只存在少数几个基本频率时,就会像某些振荡波形一样,在周期与周期之间存在着一定的相关性。 4). 基音之间的相关性 语音可以分为清音和浊音两种基本类型.浊音是由声带振动产生,每一次振动使一股空气从肺部流进声道。激励声道的各股空气之间的间隔称为基音周期。浊音的波形对应于基音周期的长期重复波形。对浊音编码是对一个基音周期波形进行编码,并以它作为其它基音段的模板。 人耳心理声学模型 冗余度降低(无损)和不相关性降低(有损)可以将原始声音信号码率降低90%。 不相关性降低依赖于人耳的心理声学模型——Zwicker教授 知觉编码----人耳不能分辨的声音分量不传输。 人耳剖面图,分为三个主要部分:外耳、中耳、内耳。 人耳心理声学模型 外耳实现阻抗匹配功能,声音通过空气传输,类似3kHz区域回声递升滤波器。人耳灵敏度最高的范围正是:3kHz~4kHz。 耳膜或鼓膜将声波转换为机械振动,通过锤骨、砧骨、镫骨传送到通向感觉内耳的膜状窗. 内耳有平衡器官,由几个充满液体的弓形和耳蜗构成。 耳蜗是真正的听觉器官,直接听到声音。如果展开耳蜗会在其入口处发现高频传感器,然后是中频传感器,最末端是低频传感器。 内耳膜上分布着频率选择、声音采集传感器,将听觉神经连接到大脑。 与音频 编码相关的人耳特性 人耳的灵敏度在很大程度上依赖于频率。 低于20Hz,高于20kHz的声音信号人耳无法听到。 人耳最敏感范围为3kHz~4kHz,在该范围之外,人耳敏感度向高频和低频两个方向降低。 低于某个阈值的声音人耳无法听到,该阈值取决于频率,声音信号中低于该阈值的分量无需传送,对人耳而言是不相关信息。 与音频 编码相关的人耳特性 掩蔽现象: 例如一个测试人员听一个幅度固定的1kHz正弦波,同时添加其他不同频率和幅度的正弦波,发现在1kHz附近低于某个阈值的其他正弦信号听不到,该阈值取决于频率,称作掩蔽阈值。 掩蔽阈值曲线取决于掩蔽信号的频率,掩蔽信号的频率越高,被掩蔽的范围越大。这一特性叫做频域掩蔽。 在掩蔽阈值以下的声音分量不需传送。 与音频 编码相关的人耳特性 时域掩蔽 时域中一个强脉冲会掩蔽该脉冲前后低于某个阈值的声音信号。 这种现象,尤其是前掩蔽,很难想象,但可以进行很好的解释。是由于人耳的有限时域分辨率,再加上信号通过听觉神经传输到大脑的方式。 目前的音频压缩方法只利用了频域掩蔽。

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档