- 1、本文档共248页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章_音频信息处理技术
第3章 音频信息处理技术 3.1 基本概念 3.2 音频信号数字化 3.3 音频信号压缩编码 3.4 语音压缩编码标准 3.5 常见多媒体应用的语音编码器的选择 3.6 IP电话技术 练习与思考题 3.1 基 本 概 念 1. 听觉掩蔽 在人类听觉系统中, 一个声音的存在会影响人们对其他声音的听觉能力, 使一个声音在听觉上掩蔽了另一个声音, 即所谓的“掩蔽效应”。 由于掩蔽声的存在, 使被掩蔽声的闻域(人刚好可听到声音的响度)必须提高的分贝数被定义为一个声音对另一个声音的掩蔽值。 掩蔽效应受四种要素的影响: 时间、 频率、 声压级、 声音品质(例如, 纯音和噪音)。 2. 频谱掩蔽 频谱掩蔽发生在高电平音调使附近频率的低电平声音不能被人耳听到的情况下。 当频率离掩蔽音调越远时, 掩蔽效应减弱的速度就越快。 可以这样来解释这种效应, 雪橇上的铃声可以掩蔽高音碰撞的声音, 但不能掩蔽低音鼓的声音。 3. 瞬态掩蔽 声音有一个冲击时间(即幅值随时间推移而增大的时间段)和一个衰退时间(即幅值随时间推移而减小的时间段)。 拨小提琴所产生声音的冲击和衰退都很快, 而拉小提琴所产生声音的冲击和衰退都很慢。 此外, 在冲击前和衰退后, 声音都有掩蔽效应。 前掩蔽时间为50~200 ms, 而后掩蔽时间约为该范围的1/10。 4. 失真 失真是用得非常广泛的概念, 在这里主要用来描述重现声音和原来声音的相差程度。 而表示这种相差程度的方法有两种: (1) 失真的主观度量。 失真的一个主观评价指标称为平均观点分(Mean Opinion Score, MOS)。 听众根据系统质量的好坏使用N分制给系统打分。 例如, 在为HDTV选择音频压缩方案时就使用了这种度量方法。 表3.1-1给出了一种常见的5分制系统。 一方面, MOS确实是度量音频重现的最低限度: 听起来感觉怎么样?另外一方面, 度量的结果随听众、 测试位置和原材料的不同而不同, 因此, 很难将一组结果和另一组结果相比较。 (2) 失真的客观度量。 失真的客观度量是一种可以校准和重现的测试, 它可对原始信号和重现信号之间的差别进行度量。 这里有个问题, 就是失真的绝对大小也许和失真声音使人厌烦的程度没有多大关系。 现实生活中有一个失真的例子, 我们几乎每天都会碰到, 但它并不是那么令人厌烦, 这个例子就是削波。 如果一个纯音(正弦波)通过一个动态范围不足的放大器, 那么, 放大器也许会将该正弦波的波峰和波谷拉平, 这样就产生了一组奇谐波。 对于这种类型的失真, 原始(或基波)信号和失真之间有一种一致的对应关系, 因此, 这种失真并不一定使你感到烦躁。 5. 声道 单声道(Monophonic)意味着单个声源, 而立体声并不表示有两个声源, 立体声(Stereophonic)指的是三维听觉效果。 为了确定声源位置, 大脑要将每个耳朵所听到声音的三个属性进行比较, 这三个属性分别是: (1) 幅值(Amplitude): 如果左耳听到的声音比右耳的大, 那么我们就认为声音在左边。 (2) 相位(Phase): 如果人的两耳听到的信号具有相同的相位, 那么大脑就认为声音在中部; 如果两耳听到信号有180°的相位差, 那么声音就不包含方向信息了。 (3) 时序(Timing): 声音的传播速度为1英尺每毫秒; 如果声音到达右耳的时间比到达左耳的早, 我们就认为声源就在右边。 一般来说, 如果听众所处的位置刚好是两个声源(例如两个扬声器)的中轴线上, 则听众就可以享受三维立体声的效果; 否则听众就会失去完全的立体声效果, 因为他距离其中一个声源的距离更短。 声源位置可以通过添加一个中央通道的方法来确定。 为此, Dolby公司在上个世纪70年代就实现了由四个声道产生三维立体声的效果, 这四个声道分别是: 左声道、 右声道、 中央声道、 环绕声道。 为了使声音更加丰富, 现在的立体声剧院(包括家庭剧院)都增加了一个超低音声道, 主要目的是增强低音。 3.2 音频信号数字化 音频信息处理主要包括音频信号的数字化和音频信息的压缩两大技术
文档评论(0)