多媒体音频技术.pptVIP

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多媒体音频技术.ppt

数字声音及MIDI简介 本章内容: 声音的基本概念 声音的数字化 计算机对声音的处理 计算机处理声音的硬件设备 声音的计算机存储格式 语音技术的应用。 MIDI技术 第二章 声音信号数字化 声音的基本概念 通过空气传播的一种连续的机械波。 强弱: 声压 ,音调: 频率 声音信号的两大参数 振幅 频率 一般的耳語大約是20分貝 超靜音冷氣機的音量是33分貝 極安靜的住宅區40分貝 一般公共場所50分貝 交談約60分貝(所以若兩耳的聽力皆超過60分貝,交談便會產生困難,會出現說話像吵架的情形) 交通繁忙地區85分貝 飛機場跑道120分貝。 (2)频率(音频周期) 20HZ 次音信号亚音信号(subsonic) 20hz~20khz 音频信号(audio) 20khz 超声波(ultrasonic) 各种音频的带宽 人的发音:80hz~3.4khz 人的说话:300hz~3khz 人的听觉:20hz~20khz 从模拟过渡到数字 音频信号的产生与还原 模拟处理方法 音源—机电转换—滤波放大—存储电磁(光)转换(磁带、唱盘等)—滤波放大—电机转换—声音 数字处理方法 音源--信号转换(电信号)--模数转换--压缩、编码--存储介质(磁盘、光盘等)--数模转换—电机转换—声音 模拟域处理的特点: 速度快、受环境变化影响大、成本高。 数字域处理的特点: 容易实现、精确处理、不受时间和环境变化的影响、可编程成本低、 可智能化。 模拟信号与数字信号 话音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。在时间上“连续”是指在一个指定的时间范围里声音信号的幅值有无穷多个,在幅度上“连续”是指幅度的数值有无穷多个。我们把在时间和幅度上都是连续的信号称为模拟信号。 模拟信号与数字信号 我们把时间和幅度都用离散的数字表示的信号就称为数字信号。 采样—在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling),由这些特定时刻采样得到的信号称为离散时间信号。 量化—采样得到的幅值是无穷多个实数值中的一个,因此幅度还是连续的。如果把信号幅度取值的数目加以限定,这种由有限个数值组成的信号就称为离散幅度信号。 声音信号数字化 声音进入计算机的第一步就是数字化,数字化实际上就是采样和量化。 如前所述,连续时间的离散化通过采样来实现,就是每隔相等的一小段时间采样一次,这种采样称为均匀采样(uniform sampling); 连续幅度的离散化通过量化(quantization)来实现,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就称为线性量化,否则就称为非线性量化。 声音信号数字化 声音信号数字化 声音数字化需要回答两个问题: ①每秒钟需要采集多少个声音样本,也就是采样频率(fs)是多少, ②每个声音样本的位数(bit per sample,bps)应该是多少,也就是量化精度。 采样频率 采样频率的高低是根据奈奎斯特理论(Nyquist theory)和声音信号本身的最高频率决定的。奈奎斯特理论指出,采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,这叫做无损数字化(lossless digitization)。采样定律用公式表示为 fs =2fmax 或者 Ts =T/2 其中f max为被采样信号的最高频率。 采样频率 可以这样来理解奈奎斯特理论:声音信号可以看成由许许多多正弦波组成的,一个振幅为A、频率为f的正弦波至少需要两个采样样本表示,因此,如果一个信号中的最高频率为 fmax ,采样频率最低要选择2fmax 。例如,电话话音的信号频率约为3.4 kHz,采样频率就选为8 kHz。 采样精度  样本大小是用每个声音样本的位数bit/sample 表示的,它反映度量声音波形幅度的精度。例如,每个声音样本用16位(2字节)表示,测得的声音样本值是在0~65536的范围里,它的精度就是输入信号的1/65536。 样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低,需要的存储空间越少。 采样精度 采样精度的另一种表示方法是信号噪声比,简称为信噪比(signal-to-noise ratio,SNR),并用下式计算: SNR= 10 log [(Vsignal)2 / (Vnoise)2]=20 log (Vsignal / Vnoise) 其中,Vsignal表示信号电压,Vnoise表示噪声电压;SNR的单位为分贝(db)   例1:假设Vnoise=1,采样精度为1位表示Vsignal=21,它的信噪比SNR=6分贝。   例2:假设

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档