数字声音-公开课件(设计).pptVIP

  • 3
  • 0
  • 约5.17千字
  • 约 35页
  • 2019-11-02 发布于广西
  • 举报
多媒体技术 第3讲 主要内容 声音本质与人的听觉特性 声音信号数字化 声音质量的度量 音乐的基础知识 电子音乐合成技术 电子乐器数字接口(MIDI) 人听觉系统的感知特性 响度 响度,又称声强或音量,它表示的是声音能量的强弱程度,主要取决于声波振幅的大小。声音的响度一般用声压(达因/平方厘米,或Pa)或声强(瓦特/平方厘米)来计量。在心理上,主观感觉的声音强弱使用响度级“方(phon)”或者“宋(sone)”来度量。 分贝(dB)的概念 声压(声强)与基准声压(基准声强)比值的对数值称为声压级,单位是分贝(dB)。 “听阈”与“痛阈” 当声音减弱到人耳刚刚可以听见时,此时的声音强度称为“听阈” (0 dB),而当声音增强到使人耳感到疼痛时,这个阈值称为“痛阈”(120 dB)。 等响度曲线(弗莱彻—芒森曲线) 音高 掩蔽效应 频域掩蔽阈值曲线 时域掩蔽 声音信号数字化 声音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。 声音进入计算机的第一步就是数字化,数字化实际上就是采样和量化。 声音信号数字化 采样(sampling):将声音信号在时间上离散化,即每隔相等的一段时间抽取一个信号样本。 量化(quantization):将连续的信号幅度离散化。如果幅度的划分是等间隔的,称为线性量化,否则为非线性量化。 采样频率 奈奎斯特理论指出:采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,称为无损数字化。 fs = 2fmax 话音信号最高频率约为3.4kHz,所以采样频率取为8kHz。 采样精度 每个声音样本的数字化位数反映了声音波形幅度的采样精度。 声音文件的存储格式(1) 在计算机上,比较常用的声音文件的存储格式有WAV、MIDI、MP3、和RA(流式媒体)格式。 WAV格式是将声音源发出的模拟音频信号通过采样,量化转换成数字信号,再进行编码存储的波形文件格式。WAV格式的音质较好,通用性较强,但其体积庞大,使用Windows操作系统的录音机录制的文件格式即为WAV格式,在实际应用中常用此格式存储语音数据。 MIDI格式是将电子乐器演奏音乐的过程用一种专门的语言来描述,并以MIDI文件存储。输出时通过这种专门的语言去驱动MIDI合成器,在由MIDI合成器生成相应的音乐,放大后由扬声器输出。 声音文件的存储格式(2) MP3格式是现在普遍流行的一种高压缩比的专门用于存储音乐的音频格式。 MP3的全称应为MPEG1 Layer-3音频文件,MP3采取了“感官编码技术”(利用听觉系统的掩蔽特性) 使压缩率高达10:1—12:1,并且编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,使压缩后的文件在回放时能够达到比较接近原音源的声音效果。虽然它是一种有损压缩方式,但它以极小的声音失真换来较高的压缩比,因此得以在因特网上广泛传播。 RA (Real Audio)格式是一种流式音频媒体格式这是Real Networks公司开发的一种新型音频流(Streaming Audio)文件格式,主要用于在低速率的因特网上实时传输音频信息。 声音工具 Sound Recorder 买声音卡时带的工具 网络上下载的工具 声音质量的度量 声音的质量与声音的带宽有关,一般来说频率范围越宽,声音质量也就越高。 主观平均判分法(MOS) 音乐 音乐的起源 对于音乐的起源,古近中外众说纷纭,但从出土的原始乐器和传说中的原始音乐来看,音乐的起源与人类的生产劳动有着密切的关系。 乐器 所谓乐器就是奏出音乐的工具,以小提琴为例,当它的A弦振动时,整根弦在振动,这根弦的二分之一、三分之一、四分之一、五分之一……处都在振动着。于是,整根弦的振动产生了最主要的频率,我们称之为基音,而弦长的二分之一、三分之一、四分之一等处的振动则产生了一些次要的频率,我们称之为泛音。 乐音 如果一个物体振动所发出的泛音为基音的整数倍,这个音就会具有清晰可辨的音高,我们称之为乐音,如钢琴,小提琴等发出的都是乐音;如果泛音是基音的非整数倍,这个音就不具备清晰可辨的音高,我们称之为噪音,如汽车发动机、计算机风扇等发出的都是噪音。 音乐的四要素 音高:由基音的频率决定。即“哆”“唻”“咪”等音符。 响度:由声波的振幅决定。 音色:由基音与泛音的比例、泛音的分布、泛音随时间的衰减变化决定。不同发音源(乐器)的材质、形状不同,其泛音的排列组合也不同,也就构成了这一物体特殊的音色。 时值:乐音振动的持续时间,即节奏。 电子音

文档评论(0)

1亿VIP精品文档

相关文档