第四章多媒体数据压缩技术重点解析.ppt

  1. 1、本文档共97页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
小结 作业 实验 作业: 小结 作业 实验 实验: 4.3 语音信号编码的标准与方法 4.3 语音信号编码的标准与方法 4.3 语音信号编码的标准与方法 4.3 语音信号编码的标准与方法 MP3音频压缩编码 MP3是一种音频压缩的国际技术标准。MP3格式开始于二十世纪80年代中期,是在德国夫朗和费研究所(Fraunhofer Institute)开始的,研究致力于高质量、低数据率的声音编码。 1989年,夫朗和费研究所在德国被获准取得了MP3的专利权,几年后这项技术被提交到国际标准组织(ISO),整合进入了MPEG-1标准。 MP3格式是一个让音乐界产生巨大震动的一个声音格式。MP3的全称是Moving Picture Experts Group, Audio Layer 3,它所使用的技术是在VCD(MPEG-1)的音频压缩技术上发展出的第三代,而不是MPEG-3。 MP3音频压缩编码 MPEG代表的是MPEG活动影音压缩标准,MPEG音频文件指的是MPEG标准中的声音部分即MPEG音频层。MPEG音频文件根据压缩质量和编码复杂程度的不同可分为三层(MPEG AUDIO LAYER 1/2/3分别与MP1、MP2和MP3这三种声音文件相对应)。 MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为4:1和6:1-8:1,而MP3的压缩率则高达10:1~12:1,也就是说一分钟CD音质的音乐未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,同时其音质基本保持不失真。 MP3音频压缩编码 音乐信号中有许多冗余成分,其中包括间隔和一些人耳分辨不出的信息(如混杂在较强背景中的弱信号)。MP3为降低声音失真采取了名为“感官编码技术”的编码算法:编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的MP3文件,并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。 虽然它是一种有损压缩,但是它的最大优势是以极小的声音失真换来了较高的压缩比。 音频编码标准 G.711 G.722 G.723.1 G.728 G.729 音频编码标准比较 G.711 1972年CCITT为电话质量和语音压缩制定了PCM标准G.711。其速率为64kb/s,使用μ律或A律的非线性量化技术,主要用于公共电话网中。 G.722 1988年CCITT为调幅广播质量的音频信号压缩制定了G.722标准,它使用子带编码(SBC)方案,其滤波器组将输入信号分成高低两个子带信号,然后分别使用ADPCM进行编码。 G.722能将224kb/s的调幅广播质量的音频信号压缩为64kb/s,主要用于视听多媒体和会议电视等。 G.722的主要目标是保持64kb/s的数据率,而音频信号的质量要明显高于G.711的质量。 G.723.1 1996年ITU-T通过了G.723标准-“用于多媒体传输的5.3kb/s或6.3kb/s双速率话音编码”。它采用多脉冲激励最大似然量化(MP-MLQ)算法,此标准可应用于可视电话及IP电话等系统中。 G.728 为了进一步降低压缩的速率,CCITT于1992年制定了G.728标准,使用基于低时延码本激励线性预测编码(LD-CELP)算法,其速率为16kb/s,主要用于公共电话网中。 G.729 ITU-T于1996年3月通过了G.729标准,它使用8kb/s的共轭结构代数码激励线性预测(CS-ACELP)算法,此标准将在无线移动网、数字多路复用系统和计算机通信系统中应用。 音频编码标准比较 第四讲 数字语音处理技术 ?数字音频压缩技术 三维音效 语音识别 自然语言理解 语音合成 三维音效 人类的听觉 3D音效的分类 杜比AC-3 DTS 人类的听觉 人耳的基本声音定位原理是IID(Interaural Intensity Difference,两侧声音强度差别)和ITD(Interaural Time Difference,两侧声音时间延迟差别)。 IID指距离音源较近的哪一边耳朵,所收到的声音强度比另一侧高,感到声音更大一些。 ITD指方位的不同,使声音到达两耳的时间有差别,人们会觉得声音位于到达时间早些的那一边,IID+ITD的结果是把音源定位到以听者两耳这间连线为轴线的锥体范围之内。 人类的听觉 耳廓(外耳)的作用是滤波器,根据声音的不同角度,加强/减弱音波能量,过滤之后传给大脑,让我们更准确地声源的位置。耳廓的大小有限,因此能够收到的音波范围也有限,通常是20Hz到20KHz,即波长16米到1.6厘米的音波。换言之,低于此范围是次声波,高于此范围是超声波。 由于两耳机的距离约为15厘米,当波长大于

文档评论(0)

我是兰花草 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档