第三章声音的合成课件.ppt

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 声音的合成 一、音频信号 1 .声音是一种波 声波可以在空气中传播,也可以在液体及固体中传播。 声音三要素 (1) 音调 — (高低) (2) 音强 — (强弱) (3) 音色 — (特质) 2 .音质 音质与频率范围成正比,频率范围越宽音质越好 3 .声音采样 把声音信号按固定的时间间隔,转换成有限个数字表示的离散序列。 常用声音信号与采样频率 4 .音频文件的种类及特点 (1)MIDI文件(电子乐器数字接口) 是用于在音乐合成器、电子乐器、音序器和计算机之间交换音乐信息的一种标准协议。 MIDI实质上是由MIDI控制器(或MIDI文件)产生的指示电子音乐合成器要做什么、怎么做(如演奏某个音符、加大音量、生成音响效果)的一套标准指令。MIDI不是声音信号,在MIDI电缆上传送的不是声音,而是动作指令。 由于MIDI只是记录音乐信息的数字代码,所以生成的文件比较小,便于传播,也便于编辑修改 与Mp3、Wav等音频格式不同的是MIDI的播放质量很大程度上取决于硬件或软件的音源环境,也就是说同样的MIDI文件在不同的电脑上可能有非常明显的效果差别,究其原因是因为它们调用的波表音色库不一样 (2) WAVE (Waveform Audio)波形音频文件 多媒体系统、音乐光盘制作,记录物理波形,数据量大 WAVE格式文件是以RIFF为标准的 在Windows中,把声音文件存储到硬盘上的扩展名为WAV。WAV记录的是声音的本身,所以它占的硬盘空间大的很。例如:16位的44.1KHZ的立体声声音一分钟要占用大约10MB的容量,和MIDI相比就差的很远。 标准格式的WAV文件和CD格式一样,也是44.1K的采样频率,速率88K/秒,16位量化位数 WAV格式的声音文件质量和CD相差无几 MP3也就是指的是MPEG标准中的音频部分,也就是MPEG音频层。根据压缩质量和编码处理的不同分为 3层,分别对应“*.mp1”/“*.mp2”/“*.mp3”这3种声音文件。 MPEG音频文件的压缩是一种有损压缩, MPEG3高压缩率,基本保持低音频部分不失真,但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸 相同长度的音乐文件,用*.mp3格式来储存,一般只有*.wav文件的1/10,而音质要次于CD格式或WAV格式的声音文件。文件尺寸小,音质好 二、录音编辑 1.基于句子和单词的录音编辑方式 可以预先将句子、单词作为录音的单位,对录音、讲话所涉及的有关句子或单词逐个进行录音并保存 为了实现这种录音编辑方式,应事先存入大量的有关单词、句子(即需要大量的存储空间),声音合成时还需要快速地检出和呈现(需要高速的检索和控制)。 2.基于音节的编辑合成方式 在任何语言中,音节的数量比单词的数量少很多; 基于音节的编辑方式在合成时的检索、控制变得十分方便; 基于音节的合成方式的音质较差,很难表现人们在讲话时的各种情感和声调的变化; 根据发音耦合的原理和要求,人们对单词的发音制定了一定的规则,基于这种规则进行声音合成,可以得到较好的声音效果。 3.录音编辑声音合成的分析 (1)以录音编辑的方式进行声音合成,需要大容量的存储设备 (2)为了让一定容量的存储设备能存储更多的声音信息,需要对声音信息的数据量进行压缩 (3)通过编码的方式,减少声音信息中的冗余性是实现声音信息压缩的基本方法。 三、脉冲代码调制PCM 脉冲代码调制 PCM(pulse code modulation) 是一种对模拟信号的编辑 声音信号是一种模拟信号,经PCM编码后,变成数字信号 通常所说的PCM录音就是一种数字录音。 1.基本原理 PCM编码过程: (1)对模拟声音信号进行采样 (2)将各个采样点的声音信号值通过模∕数变换(A ∕ D转换)变换成由0和1组成的脉冲变换序列 (3)在PCM(脉冲代码调制)中所分配码字的首位为符号位, 信号为正时,首位为0 信号为负时,首位为1 (4)对声音采样的频率称为采样频率:f 经采样后对每一个采样点分配的码字为a位, 用于存储1秒钟的声音信号所需的存储容量为f·a ,它也表示了传递声音信号所需的速率。 例: 设声音信号的采样频率为10KHz,PCM编码所分配码字长度为8bit,传送该声音信号所需的传递速率应不低于 10×103×8=8×104 bit∕s (5)PCM录音及其声音合成系统 2.采样与量化 (1)在PCM调制中,采样频率应是声音信号中最高频率的两倍以上 (2)声音信号中包括有多种不同的频率成分,为使各种不同的频率成分都能很好地传递、呈现,所需的带宽应是 20Hz---20KHz 采样频率应选为40Hz (3)对于连续的声音信息,由于

文档评论(0)

558955999 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档