第2章数字音频处理与实践.pptVIP

下载本文档

6
0
约2.96千字
约 40页
2017-05-30 发布于四川
举报
版权申诉

第2章数字音频处理与实践.ppt

1、本文档共40页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第二章数字音频处理技术与Cakewalk SONAR实验;2.1 多媒体音频信息处理; 图2-1 用声音录制软件记录的英文单词”Hello”语音的实际波形体之间的关系;2.1.2 模拟音频信号的物理特征模拟音频信号有两个重要参数：频率和幅度。声音的频率体现音调的高低，声波幅度的大小体现声音的强弱。;1.频率一个声源每秒钟可产生成百上千个波，我们把每秒钟波峰所发生的数目称之为信号的频率，单位用赫兹(Hz)或千赫兹(kHz)表示。人们在日常说话时的语音信号：频率范围300～3000Hz 亚音(subsonic)：频率小于20 Hz的信号音频(Audio)：频率范围为20～20kHz的信号超音频(ultrasonic)：高于20kHz的信号 ;2.周期周期是指信号在两个峰点或谷底之间的相对时间。周期和频率之间的关系是互为倒数。如果每隔—定时间波形就重复相同的形状，那么就称这个时间为周期。 3.幅度信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大，声音越强。声音的强度水平(声响或者音量)用dB来测量。dB的测量值等于在对数标尺上选定的参考声强与实际感受的声强的比值。分贝数＝10log(P1／P0) ;2.1.3 与声音有关的几个术语;6.声音的质量声音的质量与它所占用的频带宽度有关，频带越宽，信号强度的相对变化范围就越大大，音响效果也就越好。按照带宽可将声音质量分为4级;2.1.4 模拟音频的数字化过程; 采样和量化的过程可由数模（A/D）转换器转换器实现。A/D转换器以固定的频率去采样，即每个周期测量和量化信号一次。经采样和量化后声音信号经编码后就成为数字音频信号，可以将其以文件形式保存在计算机的存储介质中，这样的文件一般称为数字声波文件。1.采样为实现A/D转换，需要把模拟音频信号波形进行分割，以转变成数字信号，这种方法称为采样(Sampling)。采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值，把时间上的连续信号，变成时间上的离散信号。该时间间隔称为采样周期，其倒数为采样频率。采样频率是指计算机每秒钟采集多少个声音样本。采样频率越高，即采样的间隔时间越短，则在单位时间内计算机得到的声音样本数据就越多，对声音波形的表示也越精确。;2.量化对声波波形幅度的数字化表示称之为“量化” 量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合，把落入某个区段内的样值归为一类，并赋于相同的量化值。如何分割采样信号的幅度呢? 采取二进制的方式，以８位(bit)或16位的方式来划分纵轴。也就是说在一个以8位为记录模式的音效中，其纵轴将会被划分为个量化等级(quantization levels)，用以记录其幅度大小。在相同的采样频率之下，量化位数愈高，声音的质量越好。同理，在相同量化位数的情况下，采样频率越高，声音效果也就越好。;3.编码 ;脉冲编码调制PCM PCM是把模拟信号变换为数字信号的一种调制方式，既把连续输入的模拟信号变换为在时域和振幅上都离散的量，然后将其转化为代码形式传输或存储。 PCM的主要优点是：抗干扰能力强；失真小；传输特性稳定，尤其是远距离信号再生中继时噪声不累积，而且可以采用压缩编码、纠错编码和保密编码等来提高系统的有效性、可靠性和保密性。;2.1.5 声卡声卡（也称为声效卡）在多媒体计算机中是不可缺少的重要部件，直接决定了对声音数据的处理能力与质量。现在的声卡已不仅仅作为发声之用，还兼备了声音的采集、编辑、语音识别、网络电话等种种功用 ;1.声卡的工作原理;2.声卡的输入/输出接口声卡的输/入输出接口均为3.5mm规格插口（MIDI/Joystick除外）; 2.1.6 数字音频的文件格式目前较常用的声音文件格式 ;1．WAV格式(.wav) 　　WAV格式是微软公司专门为Windows设计的最为古老而流行的波形声音文件存储格式，基本上是按照声波的实际振动的波形进行存储，是未经压缩的格式，所需存储空间较大。 2．CD-DA格式(.cda) 　　CD-DA是由Philips和Sony公司结盟于1979年联合开发的，常见的CD唱片是数字音频录制的，将音频数字信号直接写在盘片上，重现时用激光读出这些信息，再通过D/A（数/模）转换成模拟音频。;3. MPEG音频文件——MP3 　　　这里的音频文件格式指的是MPEG标准中的音频部分，即MPEG音频层(MPEG Audio Layer)。MPEG音频文件的压缩是一种有损压缩，根据压缩质量和编码复杂程度的不同可分为三层(MPEG Audio Layer 1/2/3)，分别对应MP1、MP2和MP3这