- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.3 音频编码基础和标准 2.3.1 音频编码基础 2.3.2 音频编码标准 2.3.1 音频编码基础 一、压缩编码的必要性 二、音频编码基础 三、音频编码的分类 压缩编码的必要性 多媒体音频数据的存储和传输中,必须压缩数据。利用音频编码压缩数据。 压缩编码的必要性 数据压缩造成音频质量的下降、计算量的增加。人们在实施数据压缩时,要在音频质量、数据量、计算复杂度三方面进行综合考虑。 各领域的专家致力于算法的研究,众多的企业致力于芯片和产品的研制,国际标准化组织也先后推出一系列建议。 高质量高效率的音频压缩技术广泛地用于多媒体应用、音像制品、数字广播、数字电视等领域。 音频编码基础 从信息保持的角度讲,只有当信源本身具有冗余度,才能对其进行压缩。根据统计分析结果,语音信号存在着多种冗余度,其最主要部分可以分别从时域和频域来考虑。另外由于语音主要是给人听的,所以考虑了人的听觉机理,也能对语音信号实行压缩。 1、时域信息的冗余度 2、频域信息的冗余度 3、人的听觉感知机理 1、时域信息的冗余度 幅度的非均匀分布 一般语音中小幅度样本比大幅度样本出现的概率要高,并且通话中必然会有间隙,更会出现大量低电平样本。因此.语音信号取样值的幅度分布是非均匀的,可以采用非均匀量化对其编码。 样本间的相关 对语音波形的分析表明,取样数据的最大相关性存在于邻近样本之间,并且取样速率越高,样本间相关性越强。根据相关性,可利用N阶差分编码技术,进行有效的数据压缩。 1、时域信息的冗余度(续) 周期之间的相关 虽然语音信号需要一个电话通路提供整个200~3400HZ的带宽,但在特定的瞬间,某声音只有少数频率成分在作用,它们在周期域周期间,存在着一定的相关性。 基音之间的相关 人说话声音分为浊音和清音,浊音不仅有周期间的冗余度,还对应于音调间隔的长期重复波形。 1、时域信息的冗余度(续) 静音系数两人间打电话,平均每人的讲话时间为通话总时间的一半,另一半时间听对方讲。听的时候—般不讲活,而即使是在讲话的时候,也会出现停顿。声音间隔本身就是一种冗余,若能正确检测出该静比段,便可“插空”传输更多的信息。 长时自相关函数 上述周期间等相关性,都是在20 ms间隔内进行统计的所谓短时自相关。如果在较长的时问间隔(如几十秒)进行统计,便得到长时自相关函数。 2、频域信息的冗余度 非均匀的长时功率谱密度 在相当长的时间间隔内进行统计平均,可得到长时功率谱密度函数.其功率谱呈现强烈的非平坦性。从统计的观点看,这意味着没有充分利用结定的频段,有固有的冗余度 语音特有的短时功率谱密度语音信号的短时功率谱,在某些频率上出现峰值,这些峰值频率不只一个,但最主要的是第一和第二个,由它们决定不同的语音特征。 3、人的听觉感知机理 人的听觉具有掩蔽效应 当两个响度不同的声音作用于人耳时,响度较高的频率成分会影响对响度较低频率成分的感受。 人耳对不同频段的声音敏感度不同 低频成分容易掩蔽高频成分。即使是对同样声压级的声音,人耳的实际感觉到的音量也是随频率而变化。 人耳对语音信号的相位变化不敏感 入耳听不到或感知极不灵敏的声音分量都不妨视为冗余的。 音频编码的分类 音频编码分位三类: 基于音频数据的统计特性进行编码,其典型技术是波形编码。其目标是使重建语音波形保持原波形的形状; 基于音频的声学参数,进行参数编码,可进一步降低数据率。其目标是使重建音频保持原音频的特性; 基于人的听觉特性,进行感知编码 。 音频编码的分类(续) 波形编码: 脉冲编码调制(PCM) 自适应脉冲编码调制(APCM) 差值脉冲编码调制(DPCM) 自适应差值脉冲编码调制(ADPCM) 参数编码: 预测方式:前向/后向, 短时/长时 参数类型:LPC, LSP, CEP 激励方法: 编码策略:合成-分析法 感知编码---MPEG,AC-3 2.3.2 音频编码标准 当前编码技术发展的一个重要的方向就是综合现有的编码技术,制定全球的统一标准,使信息管理系统具有普遍的互操作性并确保了未来的兼容性。国际上,对于语音信号压缩编码的审议在CCITT下设的第十五研究组进行,相应的建议为G系列,多由ITU发表。 CCITT和ISO先后提出一系列有关音频编码的建议,推荐的标准: 1972年:G.711---
原创力文档


文档评论(0)