第二章-数字视音频技术原理.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2.3 数字音频技术 2.3.1 声音记录的原理 另外,根据人耳的频率响应特性可以看出,人耳在低频时的灵敏度在700Hz以后急剧降低,如果将频段均匀划分,每个频段625Hz宽,在低频端就只有一个频段,这样就可以减小低频时的带宽;根据人耳在某些频率上不能分辨其声源的方向这一特性,可以在某些频率上采用单声道,这样也能达到降低码率的效果。 2.3 数字音频技术 2.3.2 音频信号的数字化 和视频信号数字化类似,将模拟声音数字化同样需要经过采样、量化、编码三个步骤。 2.3 数字音频技术 2.3.2 音频信号的数字化 1、采样 根据奈奎斯特采样定律,采样频率至少是信号中的最高频率分量的两倍,才能有较好的还原效果。人耳能听到的频率范围是20Hz-20kHz,所以高质量的音频系统其采样频率必须在40kHz以上,CD即采用44.1kHz的采样频率还有11.5kHz和22.05kHz、48kHz等采样频率,22.05kHz只能达到FM广播的声音品质,44.1kHz则是理论上的CD音质界限,48kHz则更加精确一些。 2.3 数字音频技术 2.3.2 音频信号的数字化 2、量化 对音频信号一般采用16比特或更高的量化字长进行量化,20比特的量化即把一个采样点的幅度等物理量分为220=1,048,576个级别进行比较取值,16比特量化的分辨率也可达到65536个音量级。量化字越长,记录的声音就越精确,同时所占的存储空间也会越大。 2.3 数字音频技术 2.3.2 音频信号的数字化 3、编码 音频信号数字化的编码方式也采用PCM编码,是一种直接进行模数(A/D)变换的方法。直接数字化的最大缺点是要求的存储容量非常高,如CD立体声的码率达到 44.1K×16×2=1411.2kbps 要记录1分钟的音乐,就需要约8.5MB的存储容量,而要记录几十分钟的音乐就需要几百兆的存储容量。 2.4 数字视音频格式 2.4.1 数字音频格式 2.4.2 数字视频格式 2.4 数字视音频格式 2.4.1 数字音频格式 数字音频格式有很多种。比较常见的数字音频格式有PCM编码格式、WAVE格式、MIDI格式、AIFF/AU格式、Dolby AC-3格式、MP3格式等 2.4 数字视音频格式 1.PCM编码格式 PCM即脉冲代码调制编码(Pulse Code Modulation)的缩写,它是数字音频的鼻祖。其优点主要是保真度高,具有很强的抗干扰性,在传输中混入的干扰及丢失的数码信号,可在接收端通过检出错误和纠错,把干扰剔除,补上丢失的部分,最终使信号恢复原状。 2.4 数字视音频格式 2.WAVE格式 WAV格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,由于Windows本身的影响力,这个格式事实上已经成为通用的音频格式。WAV记录的是声音本身,所以它占的硬盘空间很大。 2.4 数字视音频格式 3.MIDI格式 MIDI是Musical Instrument Digital Interface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。MIDI文件本身只是一堆数字信号而已,不包含任何声音信息,它记录的是在音乐的什么时间用什么音色发多长的音等等,把这些指令发送给声卡,由声卡按照指令将声音合成出来。正因为这样,通常的MIDI文件都非常小。 2.4 数字视音频格式 4.AIFF/AU格式 AIFF是苹果电脑中的标准音频格式,属于QuickTime技术的一部分。AIFF远不如WAV盛行,但由于苹果电脑在多媒体领域里的领导地位,所以,大部分音频编辑软件和播放软件都对它提供了支持。AU则是Unix平台下一种常用的音频格式,起源于Sun公司的Solaris系统。AU格式本身也支持多种压缩方式,但其文件结构的灵活性就比不上AIFF和WAV。由于Unix平台应用较少,因而,它得到的支持也远不如AIFF和WAV。 2.4 数字视音频格式 5.Dolby AC-3 Dolby AC-3是一种感知型压缩编码技术。在Dolby AC-3中,音频输入以音频块为单位,块长度为512个样值,在48kHz采样率时即为10.66毫秒,各声道单独处理。AC-3的帧结构由同步字、CRC、同步信息(SI)、码流信息(BSI)、音频块和附加数据等组成。 2.4 数字视音频格式 6.其它数字音频格式 非线性编辑系统中还可以使用其它压缩音频格式,

文档评论(0)

哆啦 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档