第4章多媒体音频处理技术.pptxVIP

  • 3
  • 0
  • 约8.62千字
  • 约 52页
  • 2021-09-16 发布于河北
  • 举报
第4章 多媒体音频处理技术 4.2 音频编码技术 4.4 音频素材的编辑 4.1 音频技术简介 4.3 音频素材的获取 4.1 音频技术简介 4.1.1 数字音频基础 1.声音 声音是一种由机械振动产生的波,叫声波。声音的强弱体现在声波振动的幅度大小上,音调的高低体现在声波振动的频率上,人们可以使用麦克风(话筒)把声波转换成电信号,即音频信号。音频信号是一种频率范围为20Hz~20KHz的波形信号,它有两个基本的参数:频率和幅度。电压的幅度表示声音的强弱,频率表示声音的音调,它是一种在时间和幅度上都是连续的模拟信号。 4.1.1 数字音频基础 2.数字音频 模拟音频信号主要有下述几点缺点: 一、抗干扰能力差 二、噪声会累积 三、无法使用计算机进行存储,不能在计算机网络中传输 4.1.1 数字音频基础 由于模拟音频信号存在上述难以克服的缺点,为了使人们能够获得更好的声音质量,更加便捷的处理方式,随着数字电子技术的发展,数字音频技术逐渐出现在音频应用的各个领域,并成为多媒体技术及应用的核心。 音频是连续变化的模拟信号,而数字音频是一个数据序列,在时间上是断续的。把模拟音频信号通过采样和量化转换成用由许多“0”、“1”表示的数字信号,这个过程就是音频的数字化。在这一处理技术中,涉及到音频的采样、量化和编码。 1.采样 模拟音频信号实际上是连续信号,或称连续时间函数x(t)。数字化时,必须先对连续信号采样,即按一定的时间间隔(T)取值, 得到x(nT)(n为整数)。T称采样周期,1/T称为采样频率, x(nT)是离散信号。 虽然数字音频信号可以克服模拟音频的缺点,但是在播放声音的时候,数字音频必须重新还原为模拟音频,为了保证还原的音频信号不失真,数字化时采样频率必须满足采样定理的要求。 采样定理:在进行模拟/数字信号的转换过程中,为保证还原后的信号不出现失真,采样频率至少是信号最高频率的2倍;采样定理又称奈奎斯特定理。 常用的音频采样率有:8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz。 4.1.2 数字音频的采样、量化和编码 2.量化 采样后的信号x(nT),其幅值仍然是连续变化的数值,为了便于在计算机中处理,必须将取样值量化成一个有限个幅度值的集合x(nT)。 量化的过程如下:量化器先将整个幅度划分成为有限个小幅度(量化间隔)的集合,把落入某个间隔内的样值归为一类,并赋予相同的量化值。量化间隔的数目,称为量化级。量化过程存在量化误差,在还原信号的D/A转换后,这种误差作为噪声再生,称为量化噪声。量化级数越多,量化误差就越小,质量就越好。增加量化级数能够把噪声降低到无法察觉的程度,但随着信号幅度的降低,量化噪声与信号之间的相关性变得更加明显。 4.1.2 数字音频的采样、量化和编码 3.编码 编码是根据一定的协议或格式把模拟信息转换成二进制比特流的过程。多媒体信息数字化的过程中,最简单的编码方式就是直接用量化后的二进制数作为输出的数字信号,这种编码方式也就是PCM(脉冲代码调制)编码。 多媒体信息的一个特点是存在各种冗余信息,具有很大的压缩潜力。因为在多媒体数据中,存在着空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余统计冗余等,它们为数据压缩技术的应用提供了可能的条件。因此,在多媒体系统中可以采用数据压缩技术对数字信号进行压缩,在保证人的主观感受不变的前提下,使得存储的数据量大大下降。采用不同的压缩技术,也即采用了不同的编码技术。 4.1.2 数字音频的采样、量化和编码 4.数字音频文件的存储量 以字节为单位,模拟波形声音被数字化后未被压缩的音频文件的存储量为: 存储量=采样频率×量化位数/8×声道数×时间 其中,声道是指处理的声音是单声道还是立体声。单声道在声音处理过程中只有一个数据流,而立体声则需要左右声道两个数据流。 4.1.2 数字音频的采样、量化和编码 WAV文件 WMA文件 RA文件 4.1.3 数字音频文件格式 AIF或AIFF文件 PCM文件 MPl、MP2、MP3文件 MIDI文件 CD-DA文件 MP4 1.WAV文件 WAV文件也叫作波形文件,是Microsoft公司开发的一种声音文件格式,存储文件扩展名为“.wav”。WAV格式文件的数据是直接来源于对声音模拟波形的采样。用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点,以不同的量化位数(8~64bit)把这些采样点的值转

文档评论(0)

1亿VIP精品文档

相关文档