[工学]多媒体技术021音频编码综述.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[工学]多媒体技术021音频编码综述

音频编码算法 音频编码基础 压缩编码的必要性 压缩编码的评价 编码分类和原理 提高语音编码质量的基本途径 波形编码分类和原理 语音信号中的冗余及其编码方法 参数编码分类和原理 提高语音编码质量的基本途径 人的听觉特性和感知加权 压缩编码的必要性 多媒体音频数据的存储和传输中,必须压缩数据。 利用音频编码压缩数据。 压缩编码的必要性 数据压缩造成音频质量的下降、计算量的增加。 人们在实施数据压缩时,要在音频质量、数据量、计算复杂度三方面进行综合考虑。 多领域的专家致力于算法的研究,众多的企业致力于芯片和产品的研制,国际标准化组织也先后推出一系列建议。 高质量高效率的音频压缩技术广泛地用于多媒体应用、音像制品、数字广播、数字电视等领域。 压缩编码的评价 编/解码的评价: 音频质量 算法复杂度 编/解码延时 数据率 性能价格比 音频质量: 信噪比;满意度;可懂度、清晰度和自然度; 算法复杂度:算法复杂度高,致使计算量大、缓存增加,速度减慢,硬件成本提高。 编码延时:编码延时长,会影响通信质量,引起回声。单次语音编码延时最好小于10ms。 压缩编码的评价 压缩编码的评价 压缩编码的评价 评价方法: 客观评定----测量信噪比、加权信噪比、平均分段信噪比。 计算较为简单,但与人对音频的感知不完全一致。 主观评定----判断满意度测量(Diagnostic Acceptability Measure) 判断韵字测量(Diagnostic Rhyme Test) 主观意见打分(Mean Opinion Score - MOS) 5(优)---若觉察不到编码失真。 4(良)---达到长途电话网的质量要求。 3(中)---话音质量有所下降,但不足以妨碍正常通信。 2(差)--- 1(劣)---不可忍受 “汉语清晰度诊断押韵字测试(DRT)法” 国家标准 DRT清晰度计算公式:R---正确回答数,W---错误回答数,T---总的测试项数。 108对押韵字:Wei1-fei1; shu3-zhu3 计算区别特征得分,某听音人某类特征的平均得分;全体听音人得分的算术平均值。 被测系统的DRT清晰度得分等级如下: DRT得分(%) 音质评价 100 A ? 95 优(excellent) 95 A ? 85 良好(good) 85 A ? 75 中等(fair) 75 A ? 65 差(poor) 65 A 不可接受(unacceptable) 编码分类和原理 波形编码: 参数编码: 变换编码: 感知编码---MPEG,AC-3 识别编码---汉语识别声码器(85.1.00576) 编码分类和原理 波形编码: 脉冲编码调制(PCM) 自适应脉冲编码调制(APCM) 差值脉冲编码调制(DPCM) 自适应差值脉冲编码调制(ADPCM) 参数编码: 预测方式:前向/后向, 短时/长时 参数类型:LPC, LSP, CEP 激励方法: 编码策略:合成-分析法 感知编码---MPEG,AC-3 识别编码---汉语识别声码器(85.1.00576) 波形编码分类和原理 波形编码: 脉冲编码调制---┌---线形(均匀) (PCM) ?---非线性(瞬时压扩—μ律、A律)G.711 └---最佳SNR 自适应脉冲编码调制--┌--前馈自适应 (APCM) ?---反馈自适应 └--最佳自适应 差值脉冲编码调制-┌-增量调制-┌线性增量调制(DM) (DPCM) ? ?-连续可变增量调制(CVSD)LM13111 ? └自适应增量调制(ADM) T6668 UM5101 └--差值脉冲编码调制 自适应差值脉冲编码调制----┌--自适应差值脉冲编码调制 MSM5248 7756 (ADPCM) G.721 └--自适应预测自适应差值脉冲编码调制 输入输出特性 第二节 音频编码算法 A律 提高语音编码质量的基本途径 利用语音信号的冗余: 幅度分布的非均匀性----非

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档