多媒体技术Chap.ppt

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多媒体技术Chap.ppt

第2章 数字声音及MIDI简介 声音是携带信息的极其重要的媒体,是多媒体技术研究中的一个重要内容。 第2章 数字声音及MIDI简介 2.1 声音与听觉器官 复合信号和分量信号: 对声音信号的分析表明,声音信号由许多频率不同的信号组成,这类信号称为复合信号 单一频率的信号称为分量信号。 两个基本参数频率和幅度。 话音信号: 人的发音器官频率大约是80—3400 Hz 说话信号频率通常为300—3000 Hz 一般人的听觉器官能感知的声音频率大约在20—20000 Hz之间,在这种频率范围里感知的声音幅度大约在0—120 dB之间。 2.2.1 从模拟过渡到数字 A/D + DSP(数字信号处理器) DSP与通用微处理器相比,除了它们的结构不同外,其基本差别是,DSP有能力响应和处理采样模拟信号得到的数据流,如做乘法和累加求和运算。  在数字域中做信号处理的主要优点是: 话音信号的连续性: 时间“连续”是指在一个指定的时间范围里声音信号的幅值有无穷多个 幅度“连续”是指幅度的数值有无穷多个。 把在时间和幅度上都是连续的信号称为模拟信号。 时间离散:在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling),由这些特定时刻采样得到的信号称为离散时间信号。 声音数字化包括采样和量化两步工作: 声音的采样和量化 量化(quantization):将连续的信号幅度离散化。如果幅度的划分是等间隔的,称为线性量化,否则为非线性量化。 采样频率的高低是根据奈奎斯特理论(Nyquist theory)和声音信号本身的最高频率决定的。 采样频率不应低于声音信号最高频率的两倍,能把以数字表达的声音还原成原来的声音,这叫做无损数字化。采样定律用公式表示为 fs = 2f 或者 Ts = T/2 其中f为被采样信号的最高频率。    如何理解奈奎斯特理论? 例如,电话话音的信号频率约为3.4 kHz,采样频率就选为8 kHz。 CD?    样本大小是用每个声音样本的位数bit/s(即bps)表示的,它反映度量声音波形幅度的精度。 样本位数的大小影响到声音的质量, 位数越多,声音的质量越高,而需要的存储空间也越多; 位数越少,声音的质量越低,需要的存储空间越少。 采样精度的另一种表示方法是信号噪声比,简称为信噪比(signal-to-noise ratio,SNR),并用下式计算: SNR= 10 log [(Vsignal)2 / (Vnoise)2] =20 log (Vsignal / Vnoise) 其中,Vsignal表示信号电压,Vnoise表示噪声电压;SNR的单位为分贝(dB)。 例1:假设Vnoise=1,采样精度为1位表示Vsignal=21,它的信噪比SNR=6分贝。 例2:假设Vnoise=1,采样精度为16位表示Vsignal=216,它的信噪比SNR=96分贝。 电话(telephone)、 调幅(amplitude modulation,AM)广播、 调频(frequency modulation,FM)广播、 激光唱盘(CD-Audio) 数字录音带(digital audio tape,DAT)的声音。 声音质量和数据率 质量 采样频率(kHz) 样本精度(bit/s) 单道声/立体声 数据率(未压缩)(kb/s) 频率范围(Hz) 电话* 8 8 单道声 64 200~3400 AM 11.025 8 单道声 88.2 20~15000 FM 22.050 16 立体声 705.6 50~7000 CD 44.1 16 立体声 1411.2 20~20000 DAT 48 16

文档评论(0)

000 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档