音基础与信号数字化处理要点.pdfVIP

下载本文档

1
0
约2.34万字
约 19页
2025-12-12 发布于北京
举报
版权申诉

音基础与信号数字化处理要点.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

4.6音

4.6.1音频概念扫盲

在实际生活中，我们感受到的信号都是模拟信号，不管是声音还是光线，这些模拟信号

需要被A/D转换器转换成数字信号，才能被在计算机中，从概念上讲，我们可以将A/D

转换视为三步完成的过程：采样、量化和编码。如下图所示：

几个重要的基本概念：

A)采样，这个概念很容易理解，就是使用采样器每隔一段时间一次模拟信号，用

这些离散的值来代表整个模拟信号的过程。单位时间内的采样值个数被称为采样频率。常用

的采样频率是11025Hz、22050Hz和44100Hz。当然，也可以是其他更高或者更低的频率。

采样是对连续模拟信号在时间上的离散化。

B)量化，对于每次采样得到的值，考虑使用多少个bit来它。如果使用8个bit（即

一个字节）来描述采样值，那么能表达的值的范围是256，如果使用16个bit来描述，范围

就被扩展为65536，描述一个采样值所使用的位数，也被称为分辨率。常用的量化为8位、

16位或者32位。

量化是对连续模拟信号在幅度上的离散化。

C)香农采样定理，表面上看，采样频率越高越好，频率越高采样点就越密集，所得到

的离散值就越覆盖模拟量，但并非如此，实际上如果模拟信号的最高频率为F，那么采

样频率只要达到2F就足以完全包含模拟信号的全部信息了。

香农采样定理说明了采样频率和信号频谱之间的关系，是连续信号离散化的基本依据，

香农采样定理又被称为奈奎斯特采样定理。

D)奈奎斯特频率，指的是离散信号系统采样频率的一半。由以上采样定理可知，只要

A/D系统中的奈奎斯特频率大于等于模拟信号的最高频率，就能完全复现模拟信号。

对于音频信号而言，由于人类听觉系统的限制，人能感受到频率大概介于20Hz-

22000Hz之间，因此只要在音频采样前加一个低通滤波器，将高于人类听觉极限的频率过滤

掉，然后再使采样系统的奈奎斯特频率大于等于22000Hz，就可以做到在人类听觉范围内的

完全保真效果，此时的采样频率就是44000Hz，为了避免在最高频率处发生混叠，可以使采

样频率再提高一点点，这就是常用的44.1kHz采样频率的由来。

E)PCM，所谓PCM是脉冲编码调制（PulseCodeModulation）的简写，脉冲编码调制

就是把一个时间连续，取值连续的模拟信号变换成时间离散，取值离散的数字信号后在信道

中传输。脉冲编码调制就是对模拟信号先抽样，再对样值幅度量化，编码的过程。

PCM数字接口是G.703，通过75Ω同轴电缆或120Ω双绞线进行非对称或对称传

输，传输码型为含有定时关系的HDB3码，接收端通过译码可以恢复定时，实现时钟同步。

F)缓冲区（buffer）、处理周期（perio）、帧（frame/blockalign），一帧的大小等于量化

级数乘与声道个数，但为了效率起见，声卡在到一帧数据并不会立即回送给系统，

而是先放置在一个缓冲区中，缓冲区可被分割为若干个处理周期，当数据填满了一个处理周

期，就会触发周期，进而将数据传送到系统，他们的关系如下：

（图……）

处理周期尺寸越大，数目越多，系统的效率越高，但同时系统时延也越大。在他们之间，

我们需要做一个适当的折中和权衡，比如如果buffer有16384个帧，那么可以将他分成4个

周期处理，一个周期就是4096个帧（buffer和perio一般都以帧为单位）。

一般而言，这些A/D系统会被封装在声卡的驱动程序中，我们不需要操心他们。但是

理解这些概念是进行音频编程的必备基础知识。

4.6.2音频接口ALSA

ALSA是AdvanceLinuxSounArchitecture，高级Linux声音架构的简称,它在LINUX

操作系统上了音频和MIDI（MusicalInstrumentDigitalInterface，音乐设备数字化接口）

的支持。ALSA是LINUX内核默认子系统（2.4以前的内核使用的OSS声音子

系统已经被摒弃）。

ALSA是一个完全开放源代码的音频驱动程

您可能关注的文档

文档评论（0）

honglajiao + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

音基础与信号数字化处理要点.pdfVIP