多媒体音频技术.pptVIP

下载本文档

13
0
约1.06万字
约 67页
2017-08-21 发布于重庆
举报
版权申诉

多媒体音频技术.ppt

1、本文档共67页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

多媒体音频技术.ppt

数字声音及MIDI简介本章内容：声音的基本概念声音的数字化计算机对声音的处理计算机处理声音的硬件设备声音的计算机存储格式语音技术的应用。 MIDI技术第二章声音信号数字化声音的基本概念通过空气传播的一种连续的机械波。强弱: 声压，音调: 频率声音信号的两大参数振幅频率一般的耳語大約是20分貝超靜音冷氣機的音量是33分貝極安靜的住宅區40分貝一般公共場所50分貝交談約60分貝(所以若兩耳的聽力皆超過60分貝，交談便會產生困難，會出現說話像吵架的情形) 交通繁忙地區85分貝飛機場跑道120分貝。（2）频率（音频周期） 20HZ 次音信号亚音信号(subsonic) 20hz~20khz 音频信号(audio) 20khz 超声波(ultrasonic) 各种音频的带宽人的发音：80hz~3.4khz 人的说话：300hz~3khz 人的听觉：20hz~20khz 从模拟过渡到数字音频信号的产生与还原模拟处理方法音源—机电转换—滤波放大—存储电磁（光）转换（磁带、唱盘等）—滤波放大—电机转换—声音数字处理方法音源--信号转换（电信号）--模数转换--压缩、编码--存储介质（磁盘、光盘等）--数模转换—电机转换—声音模拟域处理的特点：速度快、受环境变化影响大、成本高。数字域处理的特点：容易实现、精确处理、不受时间和环境变化的影响、可编程成本低、可智能化。模拟信号与数字信号话音信号是典型的连续信号，不仅在时间上是连续的，而且在幅度上也是连续的。在时间上“连续”是指在一个指定的时间范围里声音信号的幅值有无穷多个，在幅度上“连续”是指幅度的数值有无穷多个。我们把在时间和幅度上都是连续的信号称为模拟信号。模拟信号与数字信号我们把时间和幅度都用离散的数字表示的信号就称为数字信号。采样—在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling)，由这些特定时刻采样得到的信号称为离散时间信号。量化—采样得到的幅值是无穷多个实数值中的一个，因此幅度还是连续的。如果把信号幅度取值的数目加以限定，这种由有限个数值组成的信号就称为离散幅度信号。声音信号数字化声音进入计算机的第一步就是数字化，数字化实际上就是采样和量化。如前所述，连续时间的离散化通过采样来实现，就是每隔相等的一小段时间采样一次，这种采样称为均匀采样(uniform sampling)；连续幅度的离散化通过量化(quantization)来实现，就是把信号的强度划分成一小段一小段，如果幅度的划分是等间隔的，就称为线性量化，否则就称为非线性量化。声音信号数字化声音信号数字化声音数字化需要回答两个问题： ①每秒钟需要采集多少个声音样本，也就是采样频率(fs)是多少， ②每个声音样本的位数(bit per sample，bps)应该是多少，也就是量化精度。采样频率采样频率的高低是根据奈奎斯特理论(Nyquist theory)和声音信号本身的最高频率决定的。奈奎斯特理论指出，采样频率不应低于声音信号最高频率的两倍，这样就能把以数字表达的声音还原成原来的声音，这叫做无损数字化(lossless digitization)。采样定律用公式表示为 fs =2fmax 或者 Ts =T/2 其中f max为被采样信号的最高频率。采样频率可以这样来理解奈奎斯特理论：声音信号可以看成由许许多多正弦波组成的，一个振幅为A、频率为f的正弦波至少需要两个采样样本表示，因此，如果一个信号中的最高频率为 fmax ,采样频率最低要选择2fmax 。例如，电话话音的信号频率约为3.4 kHz，采样频率就选为8 kHz。采样精度　样本大小是用每个声音样本的位数bit/sample 表示的，它反映度量声音波形幅度的精度。例如，每个声音样本用16位(2字节)表示，测得的声音样本值是在0～65536的范围里，它的精度就是输入信号的1/65536。样本位数的大小影响到声音的质量，位数越多，声音的质量越高，而需要的存储空间也越多；位数越少，声音的质量越低，需要的存储空间越少。采样精度采样精度的另一种表示方法是信号噪声比，简称为信噪比(signal-to-noise ratio，SNR)，并用下式计算： SNR＝ 10 log [(Vsignal)2 / (Vnoise)2]＝20 log (Vsignal / Vnoise) 其中，Vsignal表示信号电压，Vnoise表示噪声电压；SNR的单位为分贝(db) 　　例1：假设Vnoise＝1，采样精度为1位表示Vsignal＝21，它的信噪比SNR＝6分贝。　　例2：假设