多媒体技术 音编码基础和标准.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.3 音频编码基础和标准 2.3.1 音频编码基础 2.3.2 音频编码标准 2.3.1 音频编码基础 一、压缩编码的必要性 二、音频编码基础 三、音频编码的分类 * 压缩编码的必要性 多媒体音频数据的存储和传输中,必须压缩数据。利用音频编码压缩数据。 高质量音频 采样数据率(每秒比特数): 信号类型 频率范围 ( H Z ) 采样率 ( KH Z ) 量化精度 (位) 数据率 (位 / 秒) 电话话音 200 ~ 3400 8 8 64k 高质量音频 20 ~ 20K 44.1 16 705.6k 压缩编码数据率: 信号类型 数据率 (位 / 秒) 压缩编码 标准 数据率 ( 位 / 秒 ) 数据率 ( 字节 / 分钟 ) IP 电话话音 64k G.723 5.3k 40 K 705.6k 44.1 128k 960k * 压缩编码的必要性 数据压缩造成音频质量的下降、计算量的增加。人们在实施数据压缩时,要在音频质量、数据量、计算复杂度三方面进行综合考虑。 各领域的专家致力于算法的研究,众多的企业致力于芯片和产品的研制,国际标准化组织也先后推出一系列建议。 高质量高效率的音频压缩技术广泛地用于多媒体应用、音像制品、数字广播、数字电视等领域。 * 音频编码基础  从信息保持的角度讲,只有当信源本身具有冗余度,才能对其进行压缩。根据统计分析结果,语音信号存在着多种冗余度,其最主要部分可以分别从时域和频域来考虑。另外由于语音主要是给人听的,所以考虑了人的听觉机理,也能对语音信号实行压缩。 1、时域信息的冗余度 2、频域信息的冗余度 3、人的听觉感知机理 * 1、时域信息的冗余度 幅度的非均匀分布 一般语音中小幅度样本比大幅度样本出现的概率要高,并且通话中必然会有间隙,更会出现大量低电平样本。因此.语音信号取样值的幅度分布是非均匀的,可以采用非均匀量化对其编码。 样本间的相关 对语音波形的分析表明,取样数据的最大相关性存在于邻近样本之间,并且取样速率越高,样本间相关性越强。根据相关性,可利用N阶差分编码技术,进行有效的数据压缩。 * 1、时域信息的冗余度(续) 周期之间的相关 虽然语音信号需要一个电话通路提供整个200~3400HZ的带宽,但在特定的瞬间,某声音只有少数频率成分在作用,它们在周期域周期间,存在着一定的相关性。 基音之间的相关 人说话声音分为浊音和清音,浊音不仅有周期间的冗余度,还对应于音调间隔的长期重复波形。 * 1、时域信息的冗余度(续) 静音系数 两人间打电话,平均每人的讲话时间为通话总时间的一半,另一半时间听对方讲。听的时候—般不讲活,而即使是在讲话的时候,也会出现停顿。声音间隔本身就是一种冗余,若能正确检测出该静比段,便可“插空”传输更多的信息。 长时自相关函数 上述周期间等相关性,都是在20 ms间隔内进行统计的所谓短时自相关。如果在较长的时问间隔(如几十秒)进行统计,便得到长时自相关函数。 * 2、频域信息的冗余度 非均匀的长时功率谱密度 在相当长的时间间隔内进行统计平均,可得到长时功率谱密度函数.其功率谱呈现强烈的非平坦性。从统计的观点看,这意味着没有充分利用结定的频段,有固有的冗余度 语音特有的短时功率谱密度 语音信号的短时功率谱,在某些频率上出现峰值,这些峰值频率不只一个,但最主要的是第一和第二个,由它们决定不同的语音特征。 * 3、人的听觉感知机理 人的听觉具有掩蔽效应 当两个响度不同的声音作用于人耳时,响度较高的频率成分会影响对响度较低频率成分的感受。 人耳对不同频段的声音敏感度不同 低频成分容易掩蔽高频成分。即使是对同样声压级的声音,人耳的实际感觉到的音量也是随频率而变化。 人耳对语音信号的相位变化不敏感 入耳听不到或感知极不灵敏的声音分量都不妨视为冗余的。 * 音频编码的分类 音频编码分位三类: 基于音频数据的统计特性进行编码,其典型技术是波形编码。其目标是使重建语音波形保持原波形的形状; 基于音频的声学参数,进行参数编码,可进一步降低数据率。其目标是使重建音频保持原音频的特性; 基于人的听觉特性,进行感知编码 。 * 音频编码的分类(续) 波形编码: 脉冲编码调制(PCM) 自适应脉冲编码调制(APC

文档评论(0)

139****3928 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档