第3章多媒体技术及应用 多媒体音频技术教程.ppt

第3章多媒体技术及应用 多媒体音频技术教程.ppt

第3章多媒体技术及应用 多媒体音频技术教程

3.1 数字音频的基本概念 3.2 音频接口卡 3.3 数字音频的压缩编码 3.4 音频编码标准 3.5 数字音频处理软件简介 3.6 数字音频的获取与文件格式转换 3.7 语音识别技术 学习目标 1.了解声音信号的特点、存储格式及质量的度量方法 2.了解音频卡的功能、构成、原理及其应用 3.理解音频信号处理的方法 4.了解音频信号压缩方法及音频编码标准 5.掌握应用常用的音频处理软件对声音信号进行处理的过程 6.了解语音识别技术及其应用 3.1 数字音频的基本概念 声音 数字音频的基本概念 音频 音频(Audio)是用声音的频率界定的,指频率在20Hz~20kHz范围内的声波。音频所覆盖的声音频率是人的耳朵所能听到的声音。 3.1.2 模拟音频和模拟音频记录技术 就记录技术而言,为了模拟声音的波形形状从而将声波振动转变成唱片的波状沟纹或磁带的磁向排列的技术都可以称为模拟音频记录技术。 数字音频 数字音频并非一种新的声音,它不过是模拟音频声音进入计算机后的一种记录和存储形式。计算机在处理声音时,除了输出仍用波形形式外,记录、存储和传送都不能使用波形形式,即声音在进入计算机时,必须进行数字化,使时间上连续变化的波形声音变成一串0、1构成的数据序列。 模拟音频与数字音频特点比较 模拟音频是连续的波动信号,数字音频是离散的数字信号。 模拟音频不便进行编辑修改,数字音频编辑、特效处理容易。 模拟音频用磁带或唱片做记录媒体,容易磨损、发霉和变形,不利长久保存;数字音频主要用光盘存储,不易磨损,适宜长久保存。 模拟音频进入计算机必须数字化为数字音频,而数字音频最终要转换为模拟音频才能输出。 3.1.3 音频信号的数字化 音频信号的数字化就是对时间上连续波动的声音信号进行采样和量化,对量化的结果选用某种音频编码算法进行编码,所得结果就是音频信号的数字形式,即数字音频。 3.1.4 语音合成 3.1.5 音乐合成 音乐合成是声音合成的另一分支,与语音合成的对象不同,音乐合成的对象是乐音,而不是人类的语音 音乐合成的原理和方法 音乐合成方法 一是调频合成法,又称FM合成法; 一是波形表(Wavetable)合成法 ,又称波表合成法。 FM合成法 FM合成法正是从乐音的频谱特性分布中得到启示,通过使用调频(FM)技术,利用不同调制波频率和调制指数,对载波进行调制,得到了具有不同频谱分布的波形。 波表合成技术 波表合成技术是先把音乐演奏家在各种不同乐器上演奏的不同音符、以适当的采样率、量化位数录制下来,形成乐音的波形数据。然后将各种波形数据存储在ROM中。发音时,通过查找到所选预期的波形数据,然后经过调制、滤波、再合成等处理形成立体声后发声。 MIDI MIDI(Musical Instrument Digital Interface)是乐器数字接口英文首写字母的缩写,实际上,它是一套有关数字合成音乐的国际标准。 3.1.6 声音文件格式 3.2.1 声卡的功能 3.2.2声卡的结构 声卡的技术指标 声卡与外部设备的连接 3.3数字音频的压缩编码 将量化后的数字声音信息直接存入计算机将会占用大量的存储空间。在多媒体音频信号处理中,一般需要对数字化后的声音信号进行压缩编码,使其成为具有一定字长的二进制数字序列,以减少音频的数据量,并以这种形式在计算机内传输和存储 。 声音的压缩编码 PCM编码 编码原理: PCM 编码调制是对连续语音信号进行空间采样、幅度值量化及用适当码字将其编码的总称,即它把连续输入的模拟信号变换为在时域和振幅上都离散的量,然后将其转化为代码形式传输或存储。 PCM编码框图 均匀量化 如果采用相等的量化间隔对采样得到的信号进行量化称为均匀量化。 非均匀量化 非线性量化的基本想法是,对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔 3.4.2 MP3压缩技术 MP3的全名是MPEG Audio Layer-3,简单地说就是一种声音文件的压缩格式 MP3的好处在于大幅降低数字声音文件的容量,而不会破坏原来的音质。 3.4 MP4压缩技术 MP4并不是MPEG-4或者MPEG-1 Layer 4,它的出现是针对MP3的大众化、无版权的一种保护格式,由美国网络技术公司开发,美国唱片行业联合会倡导公布的一种新的网络下载和音乐播放格式。 3.5 数字音频处理软件 Adobe Au

文档评论(0)

1亿VIP精品文档

相关文档