网站大量收购独家精品文档,联系QQ:2885784924

第3章 数字音频.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 数字音频

第3章 数字音频 3.1 基本概念 3.2 音频信号数字化 3.3 音频信号压缩编码 3.4 语音压缩编码标准 3.5 常见多媒体应用的语音编码器的选择 3.6 IP电话技术 §3.1 基 本 概 念 1.听觉掩蔽 在人类听觉系统中,一个声音的存在会影响人们对其他声音的听觉能力,使一个声音在听觉上掩蔽了另一个声音, 即所谓的“掩蔽效应”。 2.频谱掩蔽 频谱掩蔽发生在高电平音调使附近频率的低电平声音不能被人耳听到的情况下。当频率离掩蔽音调越远时,掩蔽效应减弱的速度就越快。 3. 瞬态掩蔽 声音有一个冲击时间(即幅值随时间推移而增大的时间段)和一个衰退时间(即幅值随时间推移而减小的时间段)。 拨小提琴所产生声音的冲击和衰退都很快, 而拉小提琴所产生声音的冲击和衰退都很慢。 此外, 在冲击前和衰退后, 声音都有掩蔽效应。 前掩蔽时间为50~200 ms, 而后掩蔽时间约为该范围的1/10。 4. 失真 失真是用得非常广泛的概念, 在这里主要用来描述重现声音和原来声音的相差程度。而表示这种相差程度的方法有两种:  (1) 失真的主观度量。 失真的一个主观评价指标称为平均观点分(Mean Opinion Score, MOS)。 听众根据系统质量的好坏使用N分制给系统打分。 例如, 在为HDTV选择音频压缩方案时就使用了这种度量方法。 表3.1-1给出了一种常见的5分制系统。  5. 声道 单声道(Monophonic)意味着单个声源,而立体声并不表示有两个声源,立体声(Stereophonic)指的是三维听觉效果。为了确定声源位置,大脑要将每个耳朵所听到声音的三个属性进行比较, 这三个属性分别是: (1) 幅值(Amplitude): 如果左耳听到的声音比右耳的大, 那么我们就认为声音在左边。 (2)相位(Phase):如果人的两耳听到的信号具有相同的相位,那么大脑就认为声音在中部;如果两耳听到信号有180°的相位差,那么声音就不包含方向信息了。  (3)时序(Timing): 声音的传播速度为1英尺每毫秒;如果声音到达右耳的时间比到达左耳的早,我们就认为声源就在右边。 一般来说,如果听众所处的位置刚好是两个声源(例如两个扬声器)的中轴线上,则听众就可以享受三维立体声的效果。 声源位置可以通过添加一个中央通道的方法来确定。 为此, Dolby公司在上个世纪70年代就实现了由四个声道产生三维立体声的效果, 这四个声道分别是: 左声道、 右声道、 中央声道、 环绕声道。 为了使声音更加丰富, 现在的立体声剧院(包括家庭剧院)都增加了一个超低音声道, 主要目的是增强低音。  §3.2 音频信号数字化 音频信息处理主要包括音频信号的数字化和音频信息的压缩两大技术, 图3.2-1为音频信息处理结构框图。 音频信号的数字化是为音频信息的压缩作准备的 音频信号的数字化过程就是将模拟音频信号转换成有限个数字表示的离散序列,即数字音频序列,在这一处理过程中涉及到模拟音频信号的采样、量化和编码。 (1) 采样过程。 模拟音频信号是一个在时间上和幅值上都连续的信号。 采样过程就是在时间上将连续信号离散化的过程,采样一般是按均匀的时间间隔进行的。  (2) 量化过程。量化过程是指将每个采样值在幅度上再进行离散化处理。量化可分为均匀量化(量化值的分布是均匀的或者说每个量化阶距是相同的)和非均匀量化。 量化会引入失真, 并且量化失真是一种不可逆失真, 这就是通常所说的量化噪声。  (3) 编码过程。 编码过程是指用二进制数来表示每个采样的量化值。如果量化是均匀的,又采用自然二进制数表示,这种编码方法就是脉冲编码调制(Pulse Code Modulation, PCM),这是一种最简单、 最方便的编码方法。 §3.3 音频信号压缩编码 从20世纪30年代提出PCM(脉冲编码调制)原理以及声码器的概念以来, 音频信息压缩编码技术主要是向基于波形和基于参数两个方向发展的, 从这个角度出发, 音频信息编码技术可分为三类:  (1) 波形编码。 这种方法主要基于语音波形预测,它力图使重建的语音波形保持原信号的波形状态。它的优点是编码方法简单、易于实现、适应能力强、 语音质量好等,缺点是压缩比相对来说较低,需要较高的编码速率。 常用的波形法编码有增量调制(DM)、自适应差分脉冲编码调制(ADPCM)等等。  (2) 参数编码。 这种方法主要基于参数的编码方法。 与波形编码不同的是, 这类编码方法通过语音信号的数学模型对语音信号特征参数(主要是指表征声门振动的激励参数和表征声道特性的声道参数)进行提取及编码,力图使重建的语音信号尽可能保持原信号的语意,而重建的语音信号波形同原信号的波形可能会有

文档评论(0)

jgx3536 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档