- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多媒体通信技术音频信息处理技术
第3章 音频信息处理技术 ; 3.1 基 本 概 念 ; 2. 频谱掩蔽
频谱掩蔽发生在高电平音调使附近频率的低电平声音不能被人耳听到的情况下。 当频率离掩蔽音调越远时, 掩蔽效应减弱的速度就越快。 可以这样来解释这种效应, 雪橇上的铃声可以掩蔽高音碰撞的声音, 但不能掩蔽低音鼓的声音。
; 3. 瞬态掩蔽
声音有一个冲击时间(即幅值随时间推移而增大的时间段)和一个衰退时间(即幅值随时间推移而减小的时间段)。 拨小提琴所产生声音的冲击和衰退都很快, 而拉小提琴所产生声音的冲击和衰退都很慢。 此外, 在冲击前和衰退后, 声音都有掩蔽效应。 前掩蔽时间为50~200 ms, 而后掩蔽时间约为该范围的1/10。; 4. 失真
失真是用得非常广泛的概念, 在这里主要用来描述重现声音和原来声音的相差程度。 而表示这种相差程度的方法有两种:
(1) 失真的主观度量。
失真的一个主观评价指标称为平均观点分(Mean Opinion Score, MOS)。 听众根据系统质量的好坏使用N分制给系统打分。 例如, 在为HDTV选择音频压缩方案时就使用了这种度量方法。 表3.1-1给出了一种常见的5分制系统。 ;表3.1-1 5分制平均观点分举例 ; 一方面, MOS确实是度量音频重现的最低限度: 听起来感觉怎么样?另外一方面, 度量的结果随听众、 测试位置和原材料的不同而不同, 因此, 很难将一组结果和另一组结果相比较。
; (2) 失真的客观度量。
失真的客观度量是一种可以校准和重现的测试, 它可对原始信号和重现信号之间的差别进行度量。 这里有个问题, 就是失真的绝对大小也许和失真声音使人厌烦的程度没有多大关系。 现实生活中有一个失真的例子, 我们几乎每天都会碰到, 但它并不是那么令人厌烦, 这个例子就是削波。 如果一个纯音(正弦波)通过一个动态范围不足的放大器, 那么, 放大器也许会将该正弦波的波峰和波谷拉平, 这样就产生了一组奇谐波。 对于这种类型的失真, 原始(或基波)信号和失真之间有一种一致的对应关系, 因此, 这种失真并不一定使你感到烦躁。 ; 5. 声道
单声道(Monophonic)意味着单个声源, 而立体声并不表示有两个声源, 立体声(Stereophonic)指的是三维听觉效果。 为了确定声源位置, 大脑要将每个耳朵所听到声音的三个属性进行比较, 这三个属性分别是: (1) 幅值(Amplitude): 如果左耳听到的声音比右耳的大, 那么我们就认为声音在左边。 ; (2) 相位(Phase): 如果人的两耳听到的信号具有相同的相位, 那么大脑就认为声音在中部; 如果两耳听到信号有180°的相位差, 那么声音就不包含方向信息了。
(3) 时序(Timing): 声音的传播速度为1英尺每毫秒; 如果声音到达右耳的时间比到达左耳的早, 我们就认为声源就在右边。
一般来说, 如果听众所处的位置刚好是两个声源(例如两个扬声器)的中轴线上, 则听众就可以享受三维立体声的效果; 否则听众就会失去完全的立体声效果, 因为他距离其中一个声源的距离更短。 ; 声源位置可以通过添加一个中央通道的方法来确定。 为此, Dolby公司在上个世纪70年代就实现了由四个声道产生三维立体声的效果, 这四个声道分别是: 左声道、 右声道、 中央声道、 环绕声道。 为了使声音更加丰富, 现在的立体声剧院(包括家庭剧院)都增加了一个超低音声道, 主要目的是增强低音。 ; 3.2 音频信号数字化 ;图3.2-1 音频信息处理框图 ; (1) 采样过程。 模拟音频信号是一个在时间上和幅值上都连续的信号。 采样过程就是在时间上将连续信号离散化的过程, 采样一般是按均匀的时间间隔进行的。 目前常见的音频信号的频率范围如图3.2-2所示, 由图可见: 电话信号的频带为200 Hz~3.4 kHz, 调幅广播(AM)信号的频带为50 Hz~7 kHz, 调频广播(FM)信号的频带为20 Hz~15 kHz, 高保真音频信号的频带为10 Hz~20 kHz。 根据不同的音频信源和应用目标, 可采用不同的采样频率, 如8 kHz、 11.025 kHz、 22.05 kHz、 16 kHz、 37.8 kHz、 44.
您可能关注的文档
最近下载
- 药物设计软件:Schrodinger二次开发_(13).Schrodinger二次开发基础.docx VIP
- 药物设计软件:Schrodinger二次开发_(12).药物吸收、分布、代谢、排泄和毒性预测.docx VIP
- GB_T 8564-2023 水轮发电机组安装技术规范.pdf VIP
- 药物设计软件:Schrodinger二次开发_(11).量子力学与分子力学计算.docx VIP
- 药物设计软件:Schrodinger二次开发_(10).分子动力学模拟技术.docx VIP
- 2025届东北三省三校高三第二次联合模拟考试英语试题参考答案及听力原文.pdf VIP
- 浙江省9+1高中联盟2024-2025学年高二上学期语文11月期中考试试卷(含答案).docx VIP
- 医院职业暴露报告处理制度.docx VIP
- 药物设计软件:Schrodinger二次开发_(9).药效团模型构建与应用.docx VIP
- 药物设计软件:Schrodinger二次开发_(8).药物-靶标相互作用分析.docx VIP
文档评论(0)