网站大量收购闲置独家精品文档,联系QQ:2885784924

多媒体课件数字音频处理技术.ppt

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
声音是携带信息的极其重要的媒体 是多媒体技术研究中的一个重要内容 在多媒体应用中,很多方面都需要使用到声音,这样多媒体才会有声有色 2.1 数字音频基础 声音是通过空气传播的一种连续的波 声音信号可以用一条连续的曲线来表示,在任一时刻都可以分解为一系列正弦波的线性叠加。 思考:为什么乐队合奏时能分辨是什么乐器在演奏?为什么几个人同时讲话时,我们能分辨出各自的声音? 声音的三个要素(总结) 根据奈奎斯特(Nyquist)理论,只有采样频率高于声音信号最高频率的两倍时,也就是当信号是最高频率时每个周期至少采样两个点,才能把数字信号表示的声音较好地还原为原来的声音。 根据该采样理论,CD激光唱盘采样频率为44KHz,可记录的最高音频为22KHz,这样的音质与原始声音相差无几,也就是我们常说的超级高保真音质(Super High Fidelity-HiFi)。最常用的采样频率有: 11.025kHz、22.05kHz、44.1kHz等。 如以8位量化,其波形的幅度值可分为256份;而当用 16 位量化时,则共有 65536 个值。可见增加量化位数有利于细腻地表示声音信号的变化程度,从而减小量化失真;但同时也使相应的数据量大大增加了。同样,也需要在声音质量与数据量之间作出恰当的选择。 量化分为均匀量化和非均匀量化。 均匀量化:幅度的划分是等间隔的。 非均匀量化:大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔 在满足精度要求的情况下用较小的位数表示。 3、编码:将量化后的信号编码形成一个二进制码组输出(把声音数据写成计算机的数据格式 无压缩编码,如PCM(Pulse Code Modulation),编码后的保真度高,但数据量大,需要很高的传输速率。在MPC中,声卡都具有PCM编码和解码的功能。激光唱盘(CD-DA)记录声音时就采用这种方法,存储未经压缩的数字音频信号。 压缩编码,如ADPCM(Adaptive Differential PCM),数据量是PCM的四分之一。 因为音频信号一般不会发生突然变化,相邻的语音采样值之间存在很大的相关性,从一个采样值到相邻的另一个采样值的差值要比样值本身小得多。利用预测编码方法建立预测模型,通过预测器对未来的样本进行预测,然后对样本值与预测器得到的预测值之差进行量化和传输。由于这个差值的幅度远远小于样本值本身,需要较少的比特数来表示,这样可以降低数据的编码率,从而使编码数据得到压缩。 声道数 :指所使用的声音通道的个数 它表明声音记录是产生一个波形(即单音或单声道)还是两个波形(即立体声或双声道)。 采样、量化和编码技术是音频数字化的关键技术。 采样频率、每个采样值的量化位数以及音频信息的声道数目,是影响数字化音频信息质量和容量的三个重要因素 如何减少失真? 原始数字音频数据传输率的计算: 传输率(bytes/s)=R×r×N/8 R 表示采样频率,单位是Hz; r 表示量化位数,单位是bit; N 表示声道数; 占用存储空间的计算: 声音信号数据量S=数据传输率×D(持续时间,Byte) 在制作多媒体或其他作品时,经常要在声音质量与内存需要或网络速度等诸多因素之间妥协 在多媒体开发与制作中,声音文件一般推荐质量是22.050 kHz、16-bit 。 【例】双声道立体声音乐采样频率为44.1KHz,量化精度为16位,计算1小时的数据量. 数据传输率: 44100*2*2=1411.2kb/s=176.4KB/s 1小时数据量: 176.4*3600/1024≈605.62MB. 数字波形声音数据量非常大,需要压缩以减少存储空间,提高传输效率. 音频信号压缩编码的主要依据是人耳的听觉特性,主要有两点: 1.人的听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号人耳听不到 . 2.人的听觉存在屏蔽效应。当几个强弱不同的声音同时存在时,强声使弱声难以听到,并且两者之间的关系与其相对频率的大小有关. 声音编码算法就是通过这些特性来去掉更多的冗余数据,来达到压缩数据的目的。 数据压缩算法应能满足下列需求: 2.1.5 声音文件的存储格式 2.1.5 声音文件的存储格式 2.1.5 声音文件的存储格式 2.1.5 声音文件的存储格式 2.3 声卡的应用 Line-in:音频输入端口,连接外部设备的输出端 Microphone(MIC):用来与话筒连接 Line-out:用于连接外部音频设备的输入,如CD唱机。 Speaker:用于连接耳机、无源喇叭或有源立体音箱。 Game Port/MIDI:用于连接游戏操作杆或具有MIDI接口的电子乐器。 声卡的基本功能 (1)录制、编辑和回放

文档评论(0)

boss + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档