多媒体技术应用2音频处理技术.ppt

  1. 1、本文档共77页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2.2.1音频压缩基础 2.数据冗余 空间冗余 时间冗余 统计冗余 结构冗余 信息熵冗余 知识冗余等。 2.2.1音频压缩基础 2.数据冗余 空间冗余: 一幅图像表面上各采样点的颜色之间往往存在着空间连贯性。 图像数据中经常存在的一种冗余,如规则物体和规则背景(像素相关性强)。 2.2.1音频压缩基础 2.数据冗余 时间冗余: 视频和音频中存在的、在时间尺度上相关的一种冗余,如相邻帧之间像素的相关性;语音的连续和渐变过程。 空间冗余和时间冗余,存在大量的统计特征重复,因此称为统计冗余。 2.2.1音频压缩基础 2.数据冗余 结构冗余: 有些图像存在着非常强的纹理结构,我们称它们在结构上存在冗余。 例如,布纹图像和草席图像。 2.2.1音频压缩基础 2.数据冗余 信息熵冗余: 也称为编码冗余,是指数据所携带的信息量少于数据本身而反映出来的数据冗余。 例如:自然界的很多状态不可能正好用2的整数次幂来表示,这样就会造成编码冗余。 2.2.1音频压缩基础 2.数据冗余 知识冗余: 举例:成语、人脸的图像有固定的结构。 这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。 2.2.1音频压缩基础 3.数据压缩算法分类 图2-10 数据压缩算法分类 2.2.1音频压缩基础 3.数据压缩算法分类 无损压缩(冗余压缩、熵编码)法:无损压缩法去掉或减少了数据中的冗余量,但这些冗余量是可以重新恢复的,因此,无损压缩是可逆的过程。 例如:压缩软件WinRAR应用。 注意:无损压缩特点是压缩比小。 无损压缩法不会产生失真,在多媒体技术中一般用于文本数据的压缩。常见的例子是磁盘压缩。 2.2.1音频压缩基础 3.数据压缩算法分类 有损压缩(熵压缩)法:有损压缩减少了信息量,而这些损失信息量是不能再恢复的,因此,有损压缩法是不可逆的。 例如:视/听觉等冗余,由于人的感觉对某些失真不易觉察的生理特征,决定了在某些场合可以减少信息量。 注意:有损压缩特点是压缩比大,但不可逆。 2.2.2常用音频压缩标准 1.G.711 64Kb/s脉冲编码调制(PCM) 2.G.721自适应差分脉冲编码调制(ADPCM) 3.G.722 7kHz声音编码器 4.G.723 双速率语音编码器 5.G.728 16Kb/s低延迟码激励线性预测编码(LD-CELP) 6.G.729 语音编码器 7.MPEG-1音频编码 8.AC音频编码 9.空间音频编码 10.移动音频编码 2.2.2常用音频压缩标准 1.G.711 64Kb/s脉冲编码调制(PCM) 脉冲编码调制(Pulse Code Modulation,PCM)是ITU制定出来的一套语音压缩标准,主要用于电话。 1972年,CCITT对一个64Kb/s压扩型PCM编码器做了标准化,称为G.711。这个标准主要有两种压缩算法,在北美和日本,使用μ律PCM;而世界其他国家使用A律PCM。 G.711在64Kb/s速率话音质量能够达到网络等级,目前已广泛应用于各种数字通信系统中,如电缆、微波、卫星、光缆等。 2.2.2常用音频压缩标准 2.G.721自适应差分脉冲编码调制(ADPCM) 自适应差分脉冲编码调制(Adaptive Differential Pulse Code Modulation,ADPCM)在PCM的基础上进行改进,进一步利用了语音信号样点间的相关性,并针对语音信号的非平稳特点,使用了自适应预测和自适应量化 1984年,CCITT首先对32Kb/s ADPCM做了标准化,称为G.721。 G.721于1986年根据两年间运行中出现的一些问题,做了进一步修正,又重新标准化。 2.2.2常用音频压缩标准 3.G.722 7kHz声音编码器 1988年,正式通过关于“用64Kb/s或低于此编码速率的7kHz音频信号编码器”的标准,称为G.722。 G.722的主要目标是保持64Kb/s的数据率,而音频信号的质量要明显高于G.711的质量。 .2.2常用音频压缩标准 4.G.723 双速率语音编码器 G.723是在1996年制定的一种多媒体语音编解码标准。 G.723标准传输码率有5.3Kb/s和6.3Kb/s两种,在编程过程中可随时切换。 2.2.2常用音频压缩标准 5.G.728 16Kb/s低延迟码激励线性预测编码(LD-CELP) G.728的工作进程是从1988年开始的,试图建立通用的16Kb/s长话质量的语音编码标准。 G.728开始是按照浮点CELP编码算法规定的 。 1994年完成了按照严格定点规定的算法。 2.2.2常用音频压缩标准 6.G.729 语音编码器 在1996年3月,ITU-T的第15研究小组提出

文档评论(0)

it + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体阳春市夕秋图文设计有限公司
IP属地广东
统一社会信用代码/组织机构代码
91441781MA55YY8A1L

1亿VIP精品文档

相关文档