多媒体课件数字音频处理技术.ppt

下载文档 降价啦

35
0
约7.9千字
约 38页
2016-06-07 发布于湖北
举报
版权申诉
保障服务

多媒体课件数字音频处理技术.ppt

1、本文档共38页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

声音是携带信息的极其重要的媒体是多媒体技术研究中的一个重要内容在多媒体应用中，很多方面都需要使用到声音，这样多媒体才会有声有色 2.1 数字音频基础声音是通过空气传播的一种连续的波声音信号可以用一条连续的曲线来表示，在任一时刻都可以分解为一系列正弦波的线性叠加。思考：为什么乐队合奏时能分辨是什么乐器在演奏？为什么几个人同时讲话时，我们能分辨出各自的声音？声音的三个要素（总结）根据奈奎斯特（Nyquist）理论，只有采样频率高于声音信号最高频率的两倍时，也就是当信号是最高频率时每个周期至少采样两个点，才能把数字信号表示的声音较好地还原为原来的声音。根据该采样理论，CD激光唱盘采样频率为44KHz，可记录的最高音频为22KHz，这样的音质与原始声音相差无几，也就是我们常说的超级高保真音质（Super High Fidelity-HiFi）。最常用的采样频率有： 11.025kHz、22.05kHz、44.1kHz等。如以8位量化，其波形的幅度值可分为256份；而当用 16 位量化时，则共有 65536 个值。可见增加量化位数有利于细腻地表示声音信号的变化程度，从而减小量化失真；但同时也使相应的数据量大大增加了。同样，也需要在声音质量与数据量之间作出恰当的选择。量化分为均匀量化和非均匀量化。均匀量化：幅度的划分是等间隔的。非均匀量化：大的输入信号采用大的量化间隔，小的输入信号采用小的量化间隔在满足精度要求的情况下用较小的位数表示。 3、编码：将量化后的信号编码形成一个二进制码组输出（把声音数据写成计算机的数据格式无压缩编码，如PCM(Pulse Code Modulation)，编码后的保真度高，但数据量大，需要很高的传输速率。在MPC中，声卡都具有PCM编码和解码的功能。激光唱盘（CD-DA）记录声音时就采用这种方法，存储未经压缩的数字音频信号。压缩编码，如ADPCM(Adaptive Differential PCM)，数据量是PCM的四分之一。因为音频信号一般不会发生突然变化，相邻的语音采样值之间存在很大的相关性，从一个采样值到相邻的另一个采样值的差值要比样值本身小得多。利用预测编码方法建立预测模型，通过预测器对未来的样本进行预测，然后对样本值与预测器得到的预测值之差进行量化和传输。由于这个差值的幅度远远小于样本值本身，需要较少的比特数来表示，这样可以降低数据的编码率，从而使编码数据得到压缩。声道数：指所使用的声音通道的个数它表明声音记录是产生一个波形（即单音或单声道）还是两个波形（即立体声或双声道）。采样、量化和编码技术是音频数字化的关键技术。采样频率、每个采样值的量化位数以及音频信息的声道数目，是影响数字化音频信息质量和容量的三个重要因素如何减少失真？原始数字音频数据传输率的计算: 传输率（bytes/s）=R×r×N/8 R 表示采样频率，单位是Hz； r 表示量化位数，单位是bit； N 表示声道数；占用存储空间的计算: 声音信号数据量S=数据传输率×D(持续时间,Byte) 在制作多媒体或其他作品时，经常要在声音质量与内存需要或网络速度等诸多因素之间妥协在多媒体开发与制作中，声音文件一般推荐质量是22.050 kHz、16-bit 。【例】双声道立体声音乐采样频率为44.1KHz,量化精度为16位,计算1小时的数据量. 数据传输率: 44100*2*2=1411.2kb/s=176.4KB/s 1小时数据量: 176.4*3600/1024≈605.62MB. 数字波形声音数据量非常大,需要压缩以减少存储空间,提高传输效率. 音频信号压缩编码的主要依据是人耳的听觉特性，主要有两点： 1.人的听觉系统中存在一个听觉阈值电平，低于这个电平的声音信号人耳听不到 . 2.人的听觉存在屏蔽效应。当几个强弱不同的声音同时存在时，强声使弱声难以听到，并且两者之间的关系与其相对频率的大小有关. 声音编码算法就是通过这些特性来去掉更多的冗余数据，来达到压缩数据的目的。数据压缩算法应能满足下列需求: 2.1.5 声音文件的存储格式 2.1.5 声音文件的存储格式 2.1.5 声音文件的存储格式 2.1.5 声音文件的存储格式 2.3 声卡的应用 Line-in：音频输入端口，连接外部设备的输出端 Microphone(MIC)：用来与话筒连接 Line-out：用于连接外部音频设备的输入，如CD唱机。 Speaker：用于连接耳机、无源喇叭或有源立体音箱。 Game Port/MIDI：用于连接游戏操作杆或具有MIDI接口的电子乐器。声卡的基本功能（1）录制、编辑和回放