- 1、本文档共29页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多媒体技术基础;MPEG声音;MPEG-1 Audio 、MPEG-2 Audio、MPEG-2 ACC声音数据压缩编码——
感知声音编码(perceptual audio coding)
利用人的听觉系统的感知特性来达到压缩声音数据的目的
不同于与波形声音压缩编码(如ADPCM)和参数编码(如LPC) :依据波形本身的相关性和模拟人的发音器官的特性);对响度的感知 “听阈—频率”曲线 ;对音高的感知 “音高—频率”曲线;掩蔽效应
一种频率的声音阻碍听觉系统感受另一种频率的声音的现象
频域掩蔽
一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩??,也称同时掩蔽
时域掩蔽
在时间上相邻的声音之间的掩蔽现象。
两种时阈掩蔽:超前掩蔽和滞后掩蔽;心理声学模型(psychoacoustic model)
听觉阈值电平
听觉阈值的大小随声音频率的改变而改变,各个人的听觉阈值也不同。(大多数人2 kHz~5 kHz)
一个人是否能听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值。
听觉掩饰特性
听觉阈值电平是自适应的,即听觉阈值电平会随听到的不同频率的声音而发生变化。 ;MPEG Audio 采用的两种感知编码:
感知子带编码(perceptual sub-band coding)
思想是首先把时域中的声音数据变换到频域,对频域内的子带分量分别进行量化和编码,然后根据心理声学模型确定样本的精度,从而达到压缩数据量的目的。
不局限于只对话音进行编码,也不局限于哪一种声源。
Dolby AC-3编码;感知子带编码压缩算法框图 ;Dolby AC-3压缩编码算法框图;MPEG声音编码器结构图;MPEG声音解码器结构图;ISO/MPEG audio层1和层2编码器和解码器的结构;ISO/MPEG audio层3编码器和解码器的结构;MPEG-1和-2的声音数据规格
;MPEG-2 AAC (Advanced audio coding)
编码思想:
主要使用听觉系统的掩蔽特性来减少声音的数据量,并且通过把量化噪声分散到各个子带中,用全局信号把噪声掩蔽掉。
与MPEG-1声音格式不兼容
适用范围:
AAC支持的采用频率可从8 kHz到96 kHz
AAC编码器的音源可以是单声道的、立体声的和多声道的声音。(AAC标准可支持48个主声道、16个低频音效加强通道LFE (low frequency effects)、16个配音声道(overdub channel)或者叫做多语言声道(multilingual channel)和16个数据流。);MPEG-2 AAC (Advanced audio coding)
压缩率:
MPEG-2 AAC压缩比为11:1(即每个声道的数据率为(44.1×16 )/11=64 kb/s)。
在5个声道的总数据率为320 kb/s的情况下,很难区分还原后的声音与原始声音之间的差别。
与MPEG的层2相比,MPEG-2 AAC的压缩率可提高1倍,而且质量更高;与MPEG的层3相比,在质量相同的条件下数据率是它的70%。; MPEG-2 AAC的配置
开发MPEG-2 AAC标准采用模块化的方法:
把整个AAC系统分解成一系列模块,用标准化的AAC工具(advanced audio coding tools)对模块进行定义 (MPEG Audio标准是对整个系统进行标准化)
AAC标准定义了三种配置:
基本配置
低复杂性配置
可变采样率配置;;;MPEG-4 Audio标准:
集成从话音~高质量的多通道声音;从自然声音~合成声音
编码方法:
参数编码(parametric coding)
码激励线性预测(code excited linear predictive,CELP)编码
时间/频率T/F(time/frequency)编码
结构化声音SA(structured audio)编码
合成声音:MIDI;TTS;自然声音 (natural audio)
MPEG-4声音编码器支持数据率2 kb/s~64 kb/s之间的自然声音。
三种类型声音编码器: ;1、参数编码器
?参数编码提供了两种编码工具:HVXC和HILN。?
??谐音矢量激励编码 HVXC(Harmonic Vector Xcitation Coding)编码工具允许对语言信号在2kbit/s和4kbit/s之间进行可分级性编码。
???谐音和独立线性加性噪声HILN(Harmonic and Individual Line?plus?Noise)编码工具允许对非语言信号,例如音乐以4kbit/s和更高的码率进行编码。HILN支持在速度、音调、码率和复杂度上的可分级性。
可以将HVXC和HILN联合起来使用以获
您可能关注的文档
- 商品和价值概述.pptx
- 商品展示的管理资料.pptx
- 商品成本核算与价格的确定.pptx
- 商品包装的种类与包装材料.pptx
- 商品期货业务会计.pptx
- 商品检验与报关实务.pptx
- 商品流通企业主要经济业务的核算.pptx
- 商品流通企业会计批发商品流转核算.pptx
- 商品流通企业会计零售商品流转核算.pptx
- 商品流通企业纳税稽查指南.pptx
- 2025至2031年中国脂肪烃溶剂油行业投资前景及策略咨询研究报告.docx
- 2025年中国感冒喷剂市场调查研究报告.docx
- 2025年中国古典双人床市场调查研究报告.docx
- 2025年中国炉具灶片市场调查研究报告.docx
- 2025年中国龙门式高速综合雕铣机市场调查研究报告.docx
- 2025年中国女童羊毛外套市场调查研究报告.docx
- 2025年中国外线钳市场调查研究报告.docx
- [自贡]2024下半年四川自贡富顺县事业单位招聘30人笔试历年参考题库频考点试题附带答案详解 .docx
- 2025至2030年中国耐腐蚀耐磨防附着热电偶数据监测研究报告.docx
- [重庆]2024年重庆市巫溪县基层医疗卫生事业单位招聘6人笔试历年参考题库频考点试题附带答案详解 .docx
文档评论(0)