音基础与信号数字化处理要点.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

4.6音

4.6.1音频概念扫盲

在实际生活中,我们感受到的信号都是模拟信号,不管是声音还是光线,这些模拟信号

需要被A/D转换器转换成数字信号,才能被在计算机中,从概念上讲,我们可以将A/D

转换视为三步完成的过程:采样、量化和编码。如下图所示:

几个重要的基本概念:

A)采样,这个概念很容易理解,就是使用采样器每隔一段时间一次模拟信号,用

这些离散的值来代表整个模拟信号的过程。单位时间内的采样值个数被称为采样频率。常用

的采样频率是11025Hz、22050Hz和44100Hz。当然,也可以是其他更高或者更低的频率。

采样是对连续模拟信号在时间上的离散化。

B)量化,对于每次采样得到的值,考虑使用多少个bit来它。如果使用8个bit(即

一个字节)来描述采样值,那么能表达的值的范围是256,如果使用16个bit来描述,范围

就被扩展为65536,描述一个采样值所使用的位数,也被称为分辨率。常用的量化为8位、

16位或者32位。

量化是对连续模拟信号在幅度上的离散化。

C)香农采样定理,表面上看,采样频率越高越好,频率越高采样点就越密集,所得到

的离散值就越覆盖模拟量,但并非如此,实际上如果模拟信号的最高频率为F,那么采

样频率只要达到2F就足以完全包含模拟信号的全部信息了。

香农采样定理说明了采样频率和信号频谱之间的关系,是连续信号离散化的基本依据,

香农采样定理又被称为奈奎斯特采样定理。

D)奈奎斯特频率,指的是离散信号系统采样频率的一半。由以上采样定理可知,只要

A/D系统中的奈奎斯特频率大于等于模拟信号的最高频率,就能完全复现模拟信号。

对于音频信号而言,由于人类听觉系统的限制,人能感受到频率大概介于20Hz-

22000Hz之间,因此只要在音频采样前加一个低通滤波器,将高于人类听觉极限的频率过滤

掉,然后再使采样系统的奈奎斯特频率大于等于22000Hz,就可以做到在人类听觉范围内的

完全保真效果,此时的采样频率就是44000Hz,为了避免在最高频率处发生混叠,可以使采

样频率再提高一点点,这就是常用的44.1kHz采样频率的由来。

E)PCM,所谓PCM是脉冲编码调制(PulseCodeModulation)的简写,脉冲编码调制

就是把一个时间连续,取值连续的模拟信号变换成时间离散,取值离散的数字信号后在信道

中传输。脉冲编码调制就是对模拟信号先抽样,再对样值幅度量化,编码的过程。

PCM数字接口是G.703,通过75Ω同轴电缆或120Ω双绞线进行非对称或对称传

输,传输码型为含有定时关系的HDB3码,接收端通过译码可以恢复定时,实现时钟同步。

F)缓冲区(buffer)、处理周期(perio)、帧(frame/blockalign),一帧的大小等于量化

级数乘与声道个数,但为了效率起见,声卡在到一帧数据并不会立即回送给系统,

而是先放置在一个缓冲区中,缓冲区可被分割为若干个处理周期,当数据填满了一个处理周

期,就会触发周期,进而将数据传送到系统,他们的关系如下:

(图……)

处理周期尺寸越大,数目越多,系统的效率越高,但同时系统时延也越大。在他们之间,

我们需要做一个适当的折中和权衡,比如如果buffer有16384个帧,那么可以将他分成4个

周期处理,一个周期就是4096个帧(buffer和perio一般都以帧为单位)。

一般而言,这些A/D系统会被封装在声卡的驱动程序中,我们不需要操心他们。但是

理解这些概念是进行音频编程的必备基础知识。

4.6.2音频接口ALSA

ALSA是AdvanceLinuxSounArchitecture,高级Linux声音架构的简称,它在LINUX

操作系统上了音频和MIDI(MusicalInstrumentDigitalInterface,音乐设备数字化接口)

的支持。ALSA是LINUX内核默认子系统(2.4以前的内核使用的OSS声音子

系统已经被摒弃)。

ALSA是一个完全开放源代码的音频驱动程

文档评论(0)

honglajiao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档