- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
引言:数字化 数字化是趋势 信息量非常大,高传输带宽或存储容量 5.1 声道环绕立体声: 6×48KHz×16bits=4.608Mbit/s 引言:声音压缩编码理论基础 冗余(Redundance) 信号一部分可由另一部分重建或另外表达形式简单说明,称为信号有冗余 去除冗余实现压缩编码 信号冗余是变化的,故不能产生恒定码流输出 不相关 (Irrelevance) 听觉不能感觉的那部分信号,它对声音信号的确定或音色和发音位置没有贡献 不相关信号部分不传输 利用掩蔽效应来掩盖量化失真 人耳听觉特性 人耳分辨能力 人耳对不同频段声音的敏感程度不同,通常对低频比对高频更敏感 人耳对语音信号的相位不敏感 人耳掩蔽效应 Masking Effect … 引言:语音信号的时域冗余度 幅度非均匀分布 小幅度样本出现的频率高 样本之间的相关性 当取样频率为 8KHz 时,相邻样本间的相关系数大于 0.85; 周期之间的相关性 在特定瞬间,某段声音往往只是总频带 300~3400Hz 的少数几个频率分量在起作用?象某些振荡波一些,在周期与周期之间存在一定的相关性 基音之间的相关性 男声基音周期为 5~20ms,而典型的浊音持续 100ms 静止系数(话音间隙) 全双工话路的典型效率约为 40%(静止系数为 0.6) 长期相关性(long term correlation) 如几十秒内的相关性 引言:语音信号的频域冗余度 从频域考察语音信号的功率谱密度: 非均匀的长时间功率谱密度 长时间功率谱呈现强烈的非平坦性,高频能量较低?时域上相邻样本相关 语音特有的短时功率谱密度 语音的短时功率谱,在某些频率出现峰值(该频率称为共振峰频率),在另外一些频率上出现谷值。 出现共振峰的频率不止一个,最主要的是前两个,决定了不同的语音特征 整个谱也随频率增加而递减 功率谱的细节以基音频率为基础,形成高次谐波结构 另外,人的声道形状及其变化规律是有限的?按一定的时间段(帧)来计算声道滤波器的参数或语音谱包络 引言:语音信号的短时功率谱 人类的发音器官 人的发音器官由三个部分组成: (1) 肺和气管产生气源; (2) 喉和声带称为声门; (3) 由咽腔、口腔、鼻腔组成的声道 (从声带延展到嘴,成人平均声道 长度为17cm) 由等响曲线可以看出不同的声音强度,人的听觉频响不同! 将不同强度的听觉频响典型曲线规范成计权曲线,用于模拟听觉频响 人的听觉生理延时效应,声信号在时域上的听觉融合! 频域掩蔽(Frequeney domain masking effect) 同时发出的两个声音,一个较弱的信号被另一个相近频率的较强信号的声音所掩蔽 两个声音频率相同时,掩蔽效应最明显 在高频端,随着两者频率偏离,掩蔽效果缓慢减弱 在低频端,随着两者频率偏离,掩蔽效应急剧减小 例:1KHz 的声音的掩蔽效应 临界频带 (Critical Band):由于声音频率与掩蔽曲线不是线性关系,为从感知上统一度量声音频率,引入了“临界频带”的概念。 一个声音可被另一个声音掩蔽的频率范围称为临界频带 人耳不能区分临界频带内的频率 听觉特性:掩蔽效应(7) 时域和频域掩蔽效应的折衷 稳态信号,滤波器组要有好的频谱分辨力,这意味着需要一个长的窗函数或长的 FIR 滤波器。 瞬态信号,滤波器组要有好的时间分辨力,这就要求短的窗函数和 FIR 长度。 听觉特性:掩蔽与量化 听觉特性:掩蔽与量化 听觉特性:掩蔽与量化噪声 听觉特性:子带编码 听觉特性:掩蔽/比特分配 听觉特性:声音的方位 声学基础:电声产品的听感测试 什么声信号有资格进行电声产品的听感测试? 声信号样件的充分性: 信号样件应尽量多地反映各种声音特征 声信号样件的代表性: 信号样件应能够充分代表同类声音信号 对电声产品的听觉缺欠判断能力: 能够较容易地判断电声产品的听觉缺欠 什么声环境有资格进行电声产品的听感测试? 重放环境的反射声必须足够弱: 重放房间产生的“二次反射声”会对电声产品的重放声产生干扰和附加“染色”, 因而重放房间应该进行相当强的吸声处理, 称为保证“声学比”。 重放环境的背景噪声必须足够低: 环境噪声对判断电声产品的听觉质量会有影响,因而重放房间应该进行严格的隔声处理, 称为保证“信噪比”。 什么人有资格进行电声产品的听感测试? 听感测试人(听感评价人)的听觉生理: 不言而喻, 听感测试人必须具有良好的听觉生理, 能够判断重放声的细微差异 , 以及具备不受参考声影响而能记住常遇到的声源声色的绝对记忆能力。 听感测试人(听感评价人)的音乐水平: 不言而喻, 听感测试人必须具有相当的音乐水平, 对常遇到的器乐和声乐作品和乐理相当熟悉 语音信号产生的数字
文档评论(0)