第三章声音的合成课件.ppt

下载文档 降价啦

5
0
约4.79千字
约 65页
2019-11-26 发布于湖北
举报
版权申诉
保障服务

第三章声音的合成课件.ppt

1、本文档共65页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第二章声音的合成一、音频信号 1 .声音是一种波声波可以在空气中传播，也可以在液体及固体中传播。声音三要素 (1) 音调 — (高低) (2) 音强 — (强弱) (3) 音色 — (特质) 2 .音质音质与频率范围成正比，频率范围越宽音质越好 3 .声音采样把声音信号按固定的时间间隔，转换成有限个数字表示的离散序列。常用声音信号与采样频率 4 .音频文件的种类及特点 (1)MIDI文件（电子乐器数字接口）是用于在音乐合成器、电子乐器、音序器和计算机之间交换音乐信息的一种标准协议。 MIDI实质上是由MIDI控制器（或MIDI文件）产生的指示电子音乐合成器要做什么、怎么做（如演奏某个音符、加大音量、生成音响效果）的一套标准指令。MIDI不是声音信号，在MIDI电缆上传送的不是声音，而是动作指令。由于MIDI只是记录音乐信息的数字代码，所以生成的文件比较小，便于传播，也便于编辑修改与Mp3、Wav等音频格式不同的是MIDI的播放质量很大程度上取决于硬件或软件的音源环境，也就是说同样的MIDI文件在不同的电脑上可能有非常明显的效果差别，究其原因是因为它们调用的波表音色库不一样 (2) WAVE (Waveform Audio)波形音频文件多媒体系统、音乐光盘制作，记录物理波形，数据量大 WAVE格式文件是以RIFF为标准的在Windows中，把声音文件存储到硬盘上的扩展名为WAV。WAV记录的是声音的本身，所以它占的硬盘空间大的很。例如：16位的44.1KHZ的立体声声音一分钟要占用大约10MB的容量，和MIDI相比就差的很远。标准格式的WAV文件和CD格式一样，也是44.1K的采样频率，速率88K/秒，16位量化位数 WAV格式的声音文件质量和CD相差无几 MP3也就是指的是MPEG标准中的音频部分，也就是MPEG音频层。根据压缩质量和编码处理的不同分为 3层，分别对应“*.mp1”/“*.mp2”/“*.mp3”这3种声音文件。 MPEG音频文件的压缩是一种有损压缩， MPEG3高压缩率，基本保持低音频部分不失真，但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸相同长度的音乐文件，用＊.mp3格式来储存，一般只有＊.wav文件的1/10，而音质要次于CD格式或WAV格式的声音文件。文件尺寸小，音质好二、录音编辑 1.基于句子和单词的录音编辑方式可以预先将句子、单词作为录音的单位，对录音、讲话所涉及的有关句子或单词逐个进行录音并保存为了实现这种录音编辑方式，应事先存入大量的有关单词、句子（即需要大量的存储空间），声音合成时还需要快速地检出和呈现（需要高速的检索和控制）。 2.基于音节的编辑合成方式在任何语言中，音节的数量比单词的数量少很多；基于音节的编辑方式在合成时的检索、控制变得十分方便；基于音节的合成方式的音质较差，很难表现人们在讲话时的各种情感和声调的变化；根据发音耦合的原理和要求，人们对单词的发音制定了一定的规则，基于这种规则进行声音合成，可以得到较好的声音效果。 3.录音编辑声音合成的分析（1）以录音编辑的方式进行声音合成，需要大容量的存储设备（2）为了让一定容量的存储设备能存储更多的声音信息，需要对声音信息的数据量进行压缩（3）通过编码的方式，减少声音信息中的冗余性是实现声音信息压缩的基本方法。三、脉冲代码调制PCM 脉冲代码调制 PCM（pulse code modulation）是一种对模拟信号的编辑声音信号是一种模拟信号，经PCM编码后，变成数字信号通常所说的PCM录音就是一种数字录音。 1.基本原理 PCM编码过程：（1）对模拟声音信号进行采样（2）将各个采样点的声音信号值通过模∕数变换（A ∕ D转换）变换成由0和1组成的脉冲变换序列（3）在PCM（脉冲代码调制）中所分配码字的首位为符号位，信号为正时，首位为0 信号为负时，首位为1 （4）对声音采样的频率称为采样频率：f 经采样后对每一个采样点分配的码字为a位，用于存储1秒钟的声音信号所需的存储容量为f·a ，它也表示了传递声音信号所需的速率。例：设声音信号的采样频率为10KHz，PCM编码所分配码字长度为8bit，传送该声音信号所需的传递速率应不低于 10×103×8=8×104 bit∕s （5）PCM录音及其声音合成系统 2.采样与量化（1）在PCM调制中，采样频率应是声音信号中最高频率的两倍以上（2）声音信号中包括有多种不同的频率成分，为使各种不同的频率成分都能很好地传递、呈现，所需的带宽应是 20Hz---20KHz 采样频率应选为40Hz （3）对于连续的声音信息，由于