网站大量收购独家精品文档,联系QQ:2885784924

信源编码分析报告.ppt

  1. 1、本文档共88页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信源编码 赵振东 电子与通信工程系 教学目的与要求 通信的数字化是它能与计算机技术和数字信号处理技术相结合的基础,而实现通信数字化的前提是信源所提供的各种用于传递的消息,例如语音、图像、数据、文字等都必须以数字化形式表示。通过本章的学习,应掌握信源编码的基本知识,能熟悉掌握几种信源编码的方式。 教学内容及学时分配: 模拟信号的数字化(0.5学时) 语音编码技术(5.5学时) 3 教学重点:参数编码、混合编码。 4 教学内容的深化和拓展:线性预测技术应用,语音识别技术。 本章主要内容 A/D变换 信源编码的基本概念 线性预测技术 ADPCM编码器(波形编码) 参数编码(重点) 一、A/D变换 抽样:将模拟信号从时间上离散。例如,语音 信号的抽样频率为fs=8KHz。 量化:将样值信号从幅度上离散。 标量量化:均匀和非均匀 标量量化:多维 编码:用一组特定的代码来代表每个量化电平值。在具体实现上,编码与量化通常是同时完成,换句话说,量化实际是在编码过程中实现的。 矢量量化(VQ) 记连续的矢量空间为X,离散的码本矢量空间为C,则矢量量化就是完成X→C的映射过程。设待量化的参数为X=[x1 x2 ……xp] ,搜索码本确定的最佳匹配的矢量为Ci,则有:D(X,Ci)≤D(X,Cj) j≠I 矢量量化(VQ)的核心部件是码本(codebook)。码本包含的矢量数称为码本尺寸,记作L;每个矢量包含的比特数称为码本的维数,记作k。L=2 。设每个矢量记录了P个参数的量化值,平均每个参数分配的比特数称之为量化比特,记作R,R=k/P。被量化的参数可以是话音抽样值,线性预测系数,激励脉冲等。 矢量量化过程如图 矢量量化的另一问题是如何建立码本,不同的发话者、不同的音素的发音数椐,通过模拟确定合适的码本矢量,建立一个数据库。 每个码本矢量描述一帧或一个子帧激励信号。采用码本激励的线性预测合成分析编码器称为CELP编码器。 二、信源编码的基本概念 目的:提高通信的有效性。(主要指压缩编码) 2.1 语音编码方法的分类 波形编码:从语音信号波形出发,对波形的采样值、预测值或预测误差值进行编码。它以重建语音波形为目的,力图使重建波形接近原信号波形。(PCM、ADPCM、子带编码) 参数编码(声码器):从语音信号的产生机理出发,构造语音信号模型,提取描述语音信号的特征参数,对模型参数或其预测值进行编码:它不以重建语音波形为目的,而是根据从语音段中提取的参数在接收端合成一个新的声音相似但波形不尽相同的语音信号,实现这一过程的系统叫做声码器。 混合编码: 混合编码是介于波形编码和参数编码之间的一种编码,即在参数编码的基础上,引入了波形编码的一些特征,以达到改善声音自然度的目的。最典型的算法都利用线性预测,采用分析合成的方法构成 。 2.2 编码器的要求 速率 降低比特率往往是话音编码的主要目标,它直接关系到传输资源的有效利用和网络容量的提高。根据比特率和输入话音的关系可将编码器分为两类: 固定比特率编码器 可变比特率编码器 编码器的要求 时延 算法时延。编码器通常都是根据一定数量的采样值生成话音编码的,这些值的集合称之为一帧。某些算法还需要知道下一帧的部分数据,称之为“前视”。因此,算法时延就等于帧长和前视长度之和,其值完全取决于算法,和具体实现无关。 计算时延:即编码器分析时间和解码器重建时间,其值取决于硬件速度。通常认为计算时延等于或略小于帧长,以确保下帧数据到齐后,当前帧已处理完毕。 复用时延:编码器发送之前和解码器解码之前,必得将整个数据块的所有比特都装配好 传输时延:其值离散性很大,取决于是采用专用线还是共享信道。对于共享信道而言,常假设传输时延和复用时延之和约为1个帧长。 上述4部分时延之和称为单向系统时延,粗略估计至少为3个帧长。 编码器的要求 复杂度:以百万指令秒(MIPS)为计量单位。 低:<15百万指令/s 中:>15百万指令/s,且 <30百万指令/s 高:>30百万指令/s 质量。主观评价方法: 诊断性音律测试(DRl)法 诊断性可接受性测试(DAM)法 “平均意见分(MOS)法 在具体实现中,这些属性往往是有矛盾的,因此必须根据实际应用进行取舍,对各个属性提出折衷的要求,从而确定合适的编码方法。 2.3 编码器其他主要技术 静音检测技术 分组丢失补偿技术 三、线性预测技术 3.1 线性预测的基本概念 一个语音的抽样能够用过去若干个语音抽样的线性组合来逼近。通过使实际语音抽样和线性预测抽样之间差值的达到最小值,即进行最小均方误差的逼近,能够决定唯一的一组预测系数。 应用:语音合成 原理:将被分析的信号用一个模型来表示,即将信号看作是某一个模

文档评论(0)

我是兰花草 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档