多媒体通信技术_第二章.pptVIP

下载本文档

6
0
约1.29万字
约 106页
2019-11-07 发布于浙江
举报

多媒体通信技术_第二章.ppt

多媒体通信技术语音信号压缩编码的评价系统语音质量是衡量语音编码算法优劣的关键性能之一。语音质量通常分为四类：（1）广播级:宽带(0～7000Hz)高质量的语音，感觉不出噪声存在。（2）网络或电话级：200Hz～3200Hz,信噪比大于30dB。（3）通信级:完全可以听懂，但和长途电话相比，有明显失真。（4）合成级：80%～90%可懂度，音质较差，听起来像机器讲话，失去了讲话者的个人特征。声音质量评价对声音质量的评价分为主观评价和客观评价两种。不同的人背景不同，对声音的评价也是大不相同的，可以说主观评价方式是比较全面的。 MOS得分为五个等级:优、良、中、差、劣。满分为5分，相当调频广播质量；4分以上是长途电话网标准；3.5分为通信标准； 3.0分仍有较好的可懂度，保持自然度；2.5分只维持可懂度，是战术通信标准。客观评价方法（1）波形失真度，用信噪比来度量（2）频谱失真测量（3）谱包络失真测量常见的波形压缩编码方法有：脉冲编码调制（PCM）增量调制编码（DM）差值脉冲编码调制（DPCM）自适应差分脉冲编码调制（ADPCM）子带编码（SBC）矢量量化编码（VQ）参量编码的特点：可实现低速率语音编码，比特率可压缩到2～9.6kbit/s 之间。缺点：重建信号的波形同原语音信号的波形有相当大的差别，语音质量较差，清晰度满足要求但自然度较低，难以分辨处讲话者；其次是电路实现复杂度高。构成声音的音素可以分为：浊音（声带振动）和清音（声带不振动）。浊音又称有声音，语声发声时声带在气流的作用下激励起准周期的声波。这一准周期音称为基音，其基音周期为4～20ms相当于基音频率在50～250Hz范围内。清音又称无声音。清音没有周期特性。从清音的频谱分析可知，清音中不含具有周期或准周期特性的基音及其谐波成分。语声信号产生模型语声信号产生模型语声信号的这种实现过程称为语声信号的分析合成，实现这一过程的系统称为声码器。语音的发声过程是一个近似的短时平稳随机过程，在短时间内（10～20ms）发声过程中的参数变化比较慢。参数编码的典型代表是线性预测编码（LPC）。例：一路模拟话音信号，采样速率8k,采样后进行编码，以200个采样值为一帧信号，并以帧作为处理的基本单元进行参数编码。每一帧语音用一组参数表示，判决位：浊音和清音（1位）；浊音的基频（周期）（6位）；音源的幅度（5位）；线性滤波器参数（10个参数，每个参数6位），则总的码速率是多少？采用混合编码的编码器有：三种压缩编码的性能比较差分脉冲编码调制系统为了进一步提高编码性能，将自适应量化技术和自适应预测技术结合，实现自适应差分脉冲编码调制，它的核心思想是：利用自适应的思想改变量化阶的大小，即使用小的量化阶去编码小的差值，使用大的量化阶去编码大的差值。自适应量化的方式可以分为：前向自适应量化和后向自适应量化两种。线性预测编码是一种比较简单的编码方法。将语声激励信号简单的划分为浊音信号和清音信号。由于语声信号是短时平稳的，根据语声信号的短时分析和基音提取方法，可以用若干的样值对应的一帧来表示短时语声信号。这样逐帧将语音信号用基音周期、清/浊音判决、声道模型参数和增益来表示。对这些参数进行量化编码，在接收端再进行语声的合成。按照线性预测编码原理实现的LPC-10声码器已经用于美国第三代保密电话中，其编码速率只有2.4bit/s，虽然其编码速率很低，但是由于其信号源只采用简单的二元激励，在噪声环境中的语音质量不好，所以目前已被新的编码器替代。矢量量化的理论基础是香农的速率失真理论，利用码书中与输入矢量最匹配的码字下标（索引）代替输入矢量进行传输和存储，而解码时只需要简单地查表操作即可还原信息。矢量量化编码的原理是：在发送端将语音信号的样值数据序列按某种方式进行分组，每个组假定有k个数据，一组数据就构成了一个k维矢量。每个矢量有对应的用二进制数来表示的下标。把每个数据组所形成的矢量视为一个码字，语音数据所分成的组就形成了各自对应的码字。把所有这些码字进行排列，可以形成一个表，这样的表就称为码本或码书。在矢量量化编码方法中，传输的不是对应的矢量，而是每个矢量对应的下标。由于下标的数据相比于矢量本身来说要小得多，因此就实现了数据的压缩。在对码本进行描述时，构成码本的码字数量称为码本的长度，用N来表示，则每个码字的位

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

多媒体通信技术_第二章.pptVIP