多媒体技术Chap.ppt

下载文档

4
0
约1.3万字
约 83页
2015-08-15 发布于湖北
举报
版权申诉
保障服务

多媒体技术Chap.ppt

1、本文档共83页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

多媒体技术Chap.ppt

第2章数字声音及MIDI简介声音是携带信息的极其重要的媒体，是多媒体技术研究中的一个重要内容。第2章数字声音及MIDI简介 2.1 声音与听觉器官复合信号和分量信号：对声音信号的分析表明，声音信号由许多频率不同的信号组成，这类信号称为复合信号单一频率的信号称为分量信号。两个基本参数频率和幅度。话音信号：人的发音器官频率大约是80—3400 Hz 说话信号频率通常为300—3000 Hz 一般人的听觉器官能感知的声音频率大约在20—20000 Hz之间，在这种频率范围里感知的声音幅度大约在0—120 dB之间。 2.2.1 从模拟过渡到数字 A/D ＋ DSP（数字信号处理器） DSP与通用微处理器相比，除了它们的结构不同外，其基本差别是，DSP有能力响应和处理采样模拟信号得到的数据流，如做乘法和累加求和运算。　在数字域中做信号处理的主要优点是：话音信号的连续性：时间“连续”是指在一个指定的时间范围里声音信号的幅值有无穷多个幅度“连续”是指幅度的数值有无穷多个。把在时间和幅度上都是连续的信号称为模拟信号。时间离散：在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling)，由这些特定时刻采样得到的信号称为离散时间信号。声音数字化包括采样和量化两步工作：声音的采样和量化量化（quantization）：将连续的信号幅度离散化。如果幅度的划分是等间隔的，称为线性量化，否则为非线性量化。采样频率的高低是根据奈奎斯特理论(Nyquist theory)和声音信号本身的最高频率决定的。采样频率不应低于声音信号最高频率的两倍，能把以数字表达的声音还原成原来的声音，这叫做无损数字化。采样定律用公式表示为 fs = 2f 或者 Ts = T/2 其中f为被采样信号的最高频率。　　如何理解奈奎斯特理论？例如，电话话音的信号频率约为3.4 kHz，采样频率就选为8 kHz。 CD? 　　样本大小是用每个声音样本的位数bit/s(即bps)表示的，它反映度量声音波形幅度的精度。样本位数的大小影响到声音的质量，位数越多，声音的质量越高，而需要的存储空间也越多；位数越少，声音的质量越低，需要的存储空间越少。采样精度的另一种表示方法是信号噪声比，简称为信噪比(signal-to-noise ratio,SNR)，并用下式计算： SNR＝ 10 log [(Vsignal)2 / (Vnoise)2] ＝20 log (Vsignal / Vnoise) 其中，Vsignal表示信号电压，Vnoise表示噪声电压；SNR的单位为分贝(dB)。例1：假设Vnoise＝1，采样精度为1位表示Vsignal＝21，它的信噪比SNR＝6分贝。例2：假设Vnoise＝1，采样精度为16位表示Vsignal＝216，它的信噪比SNR＝96分贝。电话(telephone)、调幅(amplitude modulation，AM)广播、调频(frequency modulation，FM)广播、激光唱盘(CD-Audio) 数字录音带(digital audio tape，DAT)的声音。声音质量和数据率质量采样频率(kHz) 样本精度(bit/s) 单道声/立体声数据率(未压缩)(kb/s) 频率范围(Hz) 电话* 8 8 单道声 64 200～3400 AM 11.025 8 单道声 88.2 20～15000 FM 22.050 16 立体声 705.6 50～7000 CD 44.1 16 立体声 1411.2 20～20000 DAT 48 16