多媒体通信原理第二章.pptVIP

下载本文档

5
0
约2.1万字
约 113页
2017-05-06 发布于北京
举报
版权申诉

多媒体通信原理第二章.ppt

1、本文档共113页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

多媒体通信原理第二章

多媒体技术第2章多媒体音频技术本章主要内容音频信号的相关概念音频信号的基本概念；数字化方法；压缩编码的可行性与分类；声音类别与数据率… 音频信息压缩编码技术标准体系 G.7XX系列和MPEG-X系列 G.7XX声音压缩编码技术各标准的编码方法；编/解码器等 MPEG-X声音压缩编码电子乐器数字接口MIDI 2.1 音频信号声音的产生源于物体的震动，这种震动引起物体周围气压的变化并传播，最后形成了声音。声音是一种波，由两个参数描述：频率：声音的尖锐程度。振幅：声音的大小，又称响度。音频信号是指处在20Hz～20kHz频率范围的声音。音频信号音频信号根据音频信号占用频谱的不同，可以将音频信号分为3类： 1.语音信号：又称话音信号，是人在正常情况下发出的一种声音，频率范围大约为300Hz～3KHz，成年人多为60Hz-400Hz, 男声音调10ms，女声音调6ms。 2.音乐信号：各种乐器发出的声音，频率范围大约为20Hz～20kHz。 3.噪音信号：人们不感兴趣的一类声音，通常研究如何去掉它。以上这些声音都可以称为波形声音。通常声音的声强通常声音的分类音频信号的数字化音频信号通常是连续信号，要利用计算机来处理，首先需要对其数字化。音频信号的数字化对声音信号进行采样时，一般使用音频范围的ADC（模数转换器）进行。不同的ADC主要区别于以下两个重要参数：（1）采样频率：采样频率是指每秒钟采集声音样本的个数。它的取值应该满足Nyquist Theory，即采样频率fs应该大于等于声音信号中最高频率fm的两倍。采样频率的单位是：Hz或samples/s。如：数字电话的采样率为8KHz。音频信号的数字化（2）采样精度：采样精度用样本位数来表示。样本位数越多，则声音质量越高，因为每个样本的量化值与原样本值越接近。采样精度的单位是：bits/sample。音频信号的数字化采样频率越高，采样精度越大，则数字化声音效果越好，但是需要的存储量就越大。因此在实际应用中，需要折中考虑声音质量和存储量的问题。音频信号的数字化声音硬件：音频信号压缩编码的可行性与分类对于高质量和长时间的音频数据，由于数据量都特别大，为了有效地存储和传输，需要进行压缩编码。压缩的可能性存在于：（1）声音信号中包含大量的冗余信息，如样本相关性、时间周期相关性、基音相关性等。（2）利用人的感知特性进行压缩。（3）根据话音产生机理进行压缩。音频信号压缩编码的可行性与分类根据压缩编码思想的不同，把音频编码技术分为三类：（1）波形编码（Waveform Coding）（2）源编码（Source Coding）（3）混合编码（Hybrid Coding）衡量语音编码性能的主要因素有：编码质量；编码速率；算法复杂度。音频信号压缩编码的可行性与分类波形编码：没有利用语音信号自身的特点。如： 1.CD质量音频数据量：2x44100x16 b/s 2.电话质量音频数据量：8Kx8 b/s(DPCM 56Kb/s;ADPCM 32Kb/s) 源编码：参数化，利用语音信号的特点进行数据压缩。例如：信道声码器的工作原理：将语音信号基于语音分析原理分解成一系列频率分量，将这些分量在信道中传输。音频信号压缩编码的可行性与分类接收方基于收到的数据进行语音重建：将收到的数据中的频率分量作为语音的基频，产生一系列脉冲作为浊音，用噪声发生器的输出作为清音。此方法可以将语音的传输速率降低至3Kb/s。混合编码：如：利用语音识别和语音合成系统构建的语音压缩。声音类别与数据率声音根据频带分为5类：（1）电话（Telephone）声音（2）调幅（Amplitude Modulation）广播声音（3）调频（Frequency Modulation）广播声音（4）数字音频光盘（CD-Audio）声音（5）数字录音带（Digital Audio Tape）声音这些不同的声音数据区别于采样频率、采样精度、通道数、数据率和频率范围等参数。声音类别与数据率声音类别与数据率我们所熟悉的数字音频文件格式如下表所示：声音质量的度量声音质量的度量分为：客观质量度量和主观质量度量。声音客观质量的度量用信噪比来展开：信噪比越大，声音质量越好；反之，信噪比越小，声音质量越差声音主观质量的度量是利用人的感觉（听觉）来进行度量，通常分5分： 1分:劣(极反感);2分:差(讨厌但不反感);3分:中(有点讨厌);4分:良(基本可以接受);5分:优(效果很好) 声音质量的度量 2.5 数字音乐的文件格式 WAV文件微软公司定义的音频文件格式基于PCM编码表示一种直接的表达声波的数字形式，用.wav为