音频信号及其处理.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
音频信号及其处理

第二章 音频信号及其处理 第二章 音频信号及其处理 * 第二章 音频信号及其处理 2.1 声音信号 2.2 数据压缩基础 2.3 语音编码技术 2.1.1 声音信号的物理特征 2.1.2 声音信号的数字化处理 2.1.3 电子乐器数字接口(MIDI)系统 2.2.1 数据压缩及其必要性 2.2.2 数据压缩技术的分类 2.2.3 信源的数字化与压缩系统评价 2.2.4 压缩的理论极限 第二章 音频信号及其处理 2.3 语音编码技术 2.3.1话音编码概要 2.3.2 脉冲编码调制(PCM) 2.3.3 PCM在通信中的应用 2.3.4 增量调制与自适应增量调制 2.3.5 自适应差分脉冲编码调制 2.3.6 子带编码 2.3.7 线性预测编码(LPC) 2.3.8 GSM编译码器简介 第二章 音频信号及其处理 2.1 声音信号 2.1.1 声音信号的物理特征 图2-01 声音是一种连续的波 1.频率和振幅 声音信号又两个基本的参数:频率和振幅。声音按照频率分为三种类型:次声、可听声、超声。低于20Hz的声音为次声,或称为亚音信号(subsonic);可听声的声音频率范围为20~20000 Hz;高于20000 Hz的声音为超声,或称超声波(ultrasonic)信号。多媒体计算机中处理的声音主要指可听声。频率能反映出声音的声调,我们所听到的声音如果细尖表示频率高,声音粗低表示频率低。 第二章 音频信号及其处理 一般情况下人说话的话音信号的频率范围在300~3000 Hz,称为话音(speech)信号,在这种频率范围里感知的声音幅度大约在0~120 dB之间。 声音信号的另一个基本参数是振幅,它表示声音信号的强弱。声音信号的强度相差很大,从可以听见的最弱声到最强声,其强度相差1万亿倍。声音的强弱采用分贝作为量纲,区别两个强度I和I0的分贝数(dB)是: 声音分贝数 = 10*log(I/ I0 ) 在心理上,声音有两个最重要的量纲,即响度和音调,其他还有音色、和谐、不和谐等 第二章 音频信号及其处理 振幅和频率不变的声音信号为单音,或称纯音。我们将不同的振幅和频率合成得到的声音信号称为复音。 2.单音和复音 复音 基频:是决定声音音调的基本因素 谐音 基频和谐音合成复音,形成了声音的不同音质和音色。 第二章 音频信号及其处理 2.1.2 声音信号的数字化处理 1.模拟信号和数字信号 我们把在时间和幅度上都是连续的信号称为模拟信号。  在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling),由这些特定时刻采样得到的信号称为离散时间信号。采样得到的幅值是无穷多个实数值中的一个,因此幅度还是连续的。如果把信号幅度取值的数目加以限定,这种由有限个数值组成的信号就称为离散幅度信号。我们把时间和幅度都用离散的数字表示的信号就称为数字信号。 话筒和摄像机产生的信号为模拟信号。模拟信号经过采样可获得离散信号。离散信号经模拟/数字转换变成二进制的数字信号。数字信号就可以直接输入计算机进行处理。 第二章 音频信号及其处理 声音进入计算机的第一步就是数字化,数字化实际上就是采样和量化。连续幅度的离散化通过量化(quantization)来实现,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就称为线性量化,否则就称为非线性量化。  声音数字化需要回答两个问题:①每秒钟需要采集多少个声音样本,也就是采样频率(fs)是多少,②每个声音样本的位数(bit per sample,bps)应该是多少,也就是量化精度。 图2-04 声音的采样和量化 第二章 音频信号及其处理 3.采样定理 采样频率的高低是根据奈奎斯特理论(Nyquist theory)和声音信号本身的最高频率决定的。奈奎斯特理论指出,采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,这叫做无损数字化(lossless digitization)。采样定律用公式表示为 fS = 2f 或者 Ts = T/2 其中f为被采样信号的最高频率。   例如,电话话音的信号频率约为3.4 kHz,采样频率就选为8 kHz。 如果不遵循采样定理,则必然造成误差,通常称为混叠效应。为了更好地防止混叠效应,一是对信号进行滤波,滤除高频成分,使信号的最高频率限制在fmax之内。其二是严格依据定理,以2*fmax的频率进行采样。 第二章 音频信号及其处理 4.采样精度、采样位数、声道数 采样数据位数(Sampling Data)也称量化精度,是指每个采样点在A/D转换后所表示的数据范围。常用的采样数据位数有:8bit,14bit,16bit。位数越少,声

文档评论(0)

zhuwenmeijiale + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档