多媒体通信技术_第二章.pptVIP

  • 6
  • 0
  • 约1.29万字
  • 约 106页
  • 2019-11-07 发布于浙江
  • 举报
多媒体通信技术 语音信号压缩编码的评价系统 语音质量是衡量语音编码算法优劣的关键性能之一。语音质量通常分为四类: (1)广播级:宽带(0~7000Hz)高质量的语音,感觉不出噪声存在。 (2)网络或电话级:200Hz~3200Hz,信噪比大于30dB。 (3)通信级:完全可以听懂,但和长途电话相比,有明显失真。 (4)合成级:80%~90%可懂度,音质较差,听起来像机器讲话,失去了讲话者的个人特征。 声音质量评价 对声音质量的评价分为主观评价和客观评价两种。 不同的人背景不同,对声音的评价也是大不相同的,可以说主观评价方式是比较全面的。 MOS得分为五个等级:优、良、中、差、劣。满分为5分,相当调频广播质量;4分以上是长途电话网标准;3.5分为通信标准; 3.0分仍有较好的可懂度,保持自然度;2.5分只维持可懂度,是战术通信标准。 客观评价方法 (1)波形失真度,用信噪比来度量 (2)频谱失真测量 (3)谱包络失真测量 常见的波形压缩编码方法有: 脉冲编码调制(PCM) 增量调制编码(DM) 差值脉冲编码调制(DPCM) 自适应差分脉冲编码调制(ADPCM) 子带编码(SBC) 矢量量化编码(VQ) 参量编码的特点:可实现低速率语音编码,比特率可压缩到2~9.6kbit/s 之间。 缺点:重建信号的波形同原语音信号的波形有相当大的差别,语音质量较差,清晰度满足要求但自然度较低,难以分辨处讲话者;其次是电路实现复杂度高。 构成声音的音素可以分为:浊音(声带振动)和清音(声带不振动)。 浊音又称有声音,语声发声时声带在气流的作用下激励起准周期的声波。这一准周期音称为基音,其基音周期为4~20ms相当于基音频率在50~250Hz范围内。 清音又称无声音。清音没有周期特性。从清音的频谱分析可知,清音中不含具有周期或准周期特性的基音及其谐波成分。 语声信号产生模型 语声信号产生模型 语声信号的这种实现过程称为语声信号的分析合成,实现这一过程的系统称为声码器。 语音的发声过程是一个近似的短时平稳随机过程,在短时间内(10~20ms)发声过程中的参数变化比较慢。 参数编码的典型代表是线性预测编码(LPC)。 例:一路模拟话音信号,采样速率8k,采样后进行编码,以200个采样值为一帧信号,并以帧作为处理的基本单元进行参数编码。每一帧语音用一组参数表示,判决位:浊音和清音(1位);浊音的基频(周期)(6位);音源的幅度(5位);线性滤波器参数(10个参数,每个参数6位),则总的码速率是多少? 采用混合编码的编码器有: 三种压缩编码的性能比较 差分脉冲编码调制系统 为了进一步提高编码性能,将自适应量化技术和自适应预测技术结合,实现自适应差分脉冲编码调制,它的核心思想是:利用自适应的思想改变量化阶的大小,即使用小的量化阶去编码小的差值,使用大的量化阶去编码大的差值。 自适应量化的方式可以分为:前向自适应量化和后向自适应量化两种。 线性预测编码是一种比较简单的编码方法。将语声激励信号简单的划分为浊音信号和清音信号。由于语声信号是短时平稳的,根据语声信号的短时分析和基音提取方法,可以用若干的样值对应的一帧来表示短时语声信号。这样逐帧将语音信号用基音周期、清/浊音判决、声道模型参数和增益来表示。对这些参数进行量化编码,在接收端再进行语声的合成。 按照线性预测编码原理实现的LPC-10声码器已经用于美国第三代保密电话中,其编码速率只有2.4bit/s,虽然其编码速率很低,但是由于其信号源只采用简单的二元激励,在噪声环境中的语音质量不好,所以目前已被新的编码器替代。 矢量量化的理论基础是香农的速率失真理论,利用码书中与输入矢量最匹配的码字下标(索引)代替输入矢量进行传输和存储,而解码时只需要简单地查表操作即可还原信息。 矢量量化编码的原理是:在发送端将语音信号的样值数据序列按某种方式进行分组,每个组假定有k个数据,一组数据就构成了一个k维矢量。每个矢量有对应的用二进制数来表示的下标。把每个数据组所形成的矢量视为一个码字,语音数据所分成的组就形成了各自对应的码字。把所有这些码字进行排列,可以形成一个表,这样的表就称为码本或码书。 在矢量量化编码方法中,传输的不是对应的矢量,而是每个矢量对应的下标。由于下标的数据相比于矢量本身来说要小得多,因此就实现了数据的压缩。 在对码本进行描述时,构成码本的码字数量称为码本的长度,用N来表示,则每个码字的位

文档评论(0)

1亿VIP精品文档

相关文档