- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多媒体技术基础 四川大学 计算机学院 陈 虎 huchen@scu.edu.cn MPEG声音 一、 MPEG-1 Audio 二、 MPEG-2 Audio 三、 MPEG-2 ACC 四、 MPEG-4 Audio * * * * * * * * * * * * * * * * * * MPEG-1 Audio 、MPEG-2 Audio、MPEG-2 ACC声音数据压缩编码—— 感知声音编码(perceptual audio coding) 利用人的听觉系统的感知特性来达到压缩声音数据的目的 不同于与波形声音压缩编码(如ADPCM)和参数编码(如LPC) :依据波形本身的相关性和模拟人的发音器官的特性) MPEG声音 对响度的感知 “听阈—频率”曲线 MPEG声音 对音高的感知 “音高—频率”曲线 MPEG声音 掩蔽效应 一种频率的声音阻碍听觉系统感受另一种频率的声音的现象 频域掩蔽 一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽 时域掩蔽 在时间上相邻的声音之间的掩蔽现象。 两种时阈掩蔽:超前掩蔽和滞后掩蔽 MPEG声音 MPEG声音 心理声学模型(psychoacoustic model) 听觉阈值电平 听觉阈值的大小随声音频率的改变而改变,各个人的听觉阈值也不同。(大多数人2 kHz~5 kHz) 一个人是否能听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值。 听觉掩饰特性 听觉阈值电平是自适应的,即听觉阈值电平会随听到的不同频率的声音而发生变化。 MPEG声音 MPEG Audio 采用的两种感知编码: 感知子带编码(perceptual sub-band coding) 思想是首先把时域中的声音数据变换到频域,对频域内的子带分量分别进行量化和编码,然后根据心理声学模型确定样本的精度,从而达到压缩数据量的目的。 不局限于只对话音进行编码,也不局限于哪一种声源。 Dolby AC-3编码 MPEG-1 Audio 感知子带编码压缩算法框图 MPEG-1 Audio Dolby AC-3压缩编码算法框图 MPEG-1 Audio MPEG声音编码器结构图 MPEG-1 Audio MPEG声音解码器结构图 MPEG-1 Audio ISO/MPEG audio层1和层2编码器和解码器的结构 MPEG-1 Audio ISO/MPEG audio层3编码器和解码器的结构 MPEG-2 Audio MPEG-1和-2的声音数据规格 参数名称 Linear PCM Dolby AC-3 MPEG-2 Audio MPEG-1 Audio 采用频率 48/96 kHz 32/44.1/48 kHz 16/22.05/24/ 32/44.1/48 kHz 32/44.1/48 kHz 样本精度(每个样本的比特数) 16/20/24 压缩 (16 bits) 压缩 (16 bits) 16 最大数据传输率 6.144 Mb/s 448 kb/s 8~640 kb/s 32~448 kb/s 最大声道数 8 5.1 5.1/7.1 2 MPEG-2 ACC MPEG-2 AAC (Advanced audio coding) 编码思想: 主要使用听觉系统的掩蔽特性来减少声音的数据量,并且通过把量化噪声分散到各个子带中,用全局信号把噪声掩蔽掉。 与MPEG-1声音格式不兼容 适用范围: AAC支持的采用频率可从8 kHz到96 kHz AAC编码器的音源可以是单声道的、立体声的和多声道的声音。(AAC标准可支持48个主声道、16个低频音效加强通道LFE (low frequency effects)、16个配音声道(overdub channel)或者叫做多语言声道(multilingual channel)和16个数据流。) MPEG-2 ACC MPEG-2 AAC (Advanced audio coding) 压缩率: MPEG-2 AAC压缩比为11:1(即每个声道的数据率为(44.1×16 )/11=64 kb/s)。 在5个声道的总数据率为320 kb/s的情况下,很难区分还原后的声音与原始声音之间的差别。 与MPEG的层2相比,MPEG-2 AAC的压缩率可提高1倍,而且质量更高;与MPEG的层3相比,在质量相同的条件下数据率是它的70%。 MPEG-2 ACC MPEG-2 AAC的配置 开发MPEG-2 AAC标准采用模块化的方法: 把整个AAC系统分解成一系列模块,用标准化的AAC工具(advanced audio coding tools)对模块进行定
您可能关注的文档
- 首都师范大学现代汉语课件第二章 普通话语音 第四节声调.ppt
- 首都师范大学现代汉语课件第二章 普通话语音 第五节音节.ppt
- 首都师范大学现代汉语课件第二章 普通话语音 第一节概说.ppt
- 首都师范大学现代汉语课件第六章 修辞 第二节词语修辞.ppt
- 首都师范大学现代汉语课件第六章 修辞 第三节句式修辞.ppt
- 首都师范大学现代汉语课件第六章 修辞 第四节篇章修辞 .ppt
- 首都师范大学现代汉语课件第六章 修辞 第五节辞格的运用.ppt
- 首都师范大学现代汉语课件第六章 修辞 第一节概说.ppt
- 首都师范大学现代汉语课件第三章 现行汉字.ppt
- 首都师范大学现代汉语课件第四章 词汇 第八节 词汇的发展变化和词汇的规范化 .ppt
- 2025年AI课堂大数据智能分析系统建设方案最新版.pptx
- 江西南昌邮政招聘试题带答案分析2024年.docx
- 江西萍乡烟草招聘工作人员试题带答案分析2024年.docx
- 2025年天津市超导材料在城市电网电缆升级改造中应用可行性研究报告.docx
- 2025年证券从业之证券市场基本法律法规题库500道附参考答案(研优卷).docx
- 2025年证券从业之证券市场基本法律法规题库500道带答案(预热题).docx
- 2024年安徽省广德县移动公司公开招聘工作人员试题带答案详解.docx
- 2025年天津市宾馆酒店锅炉改造热水供应可行性研究报告.docx
- 江西萍乡邮政招聘试题带答案分析2024年.docx
- 2025年证券从业之证券市场基本法律法规题库500道带答案(b卷).docx
文档评论(0)