第四章_矢量量化技术.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章_矢量量化技术

第四章 矢量量化技术4.1概述4.2矢量量化的基本原理4.3矢量量化的失真测度4.4矢量量化器的最佳码本设计4.5矢量量化技术的优化设计4.1概述 矢量量化(Vector Quantization,VQ)技术是20世纪70年代后期发展起来的一种数据压缩和编码技术,广泛应用于语音编码、语音合成、语音识别和说话人识别等领域。矢量量化在语音信号处理中占有十分重要的地位,在许多重要的研究课题中,矢量量化都起着非常重要的作用。4.2矢量量化的基本原理 一、矢量量化的基本原理 二、矢量量化在语音识别中的应用 三、矢量量化的关键之处一、矢量量化的基本原理1、矢量的定义 若干个标量数据组成一个矢量,标量的个数就为矢量的维数。如语音信号某一帧中提取的声道参数,共K个,Xi={ai1,ai2,…,aiK}。则Xi是一个K维矢量。设共有N个K维矢量X={X1,X2,…,XN},其中第i个矢量为Xi,i=1,2,…N。类比过来,N个语音帧,每帧中共有K个声道参数,共组成N个K维矢量。一、矢量量化的基本原理2、矢量空间的划分 把K维欧几里德空间 无遗漏的划分为J个互不相交的子空间R1,R2…RJ , 这些子空间Rj称为胞腔。 在每一个子空间Rj找一个代表矢量Yj ,则J个代表矢量可以组成矢量集为 Y={Y1,Y2,…,YJ} 这样就组成了一个矢量量化器,在矢量量化里Y叫做码书或码本; Yj称为码矢或码字;Y内矢量的个数J则叫做码本长度或者码本尺寸。一、矢量量化的基本原理3、矢量量化的过程 当给矢量量化器输入一个任意矢量 进行矢量量化时,矢量量化器首先判断它属于哪个子空间Rj ,然后输出该子空间Rj的代表矢量Yj。矢量量化过程就是用Yj代替Xi的过程,或者说把Xi量化成了Yj ,即 Yj=Q(Xi),1?j?J,1?i?N 式中, Q(Xi)为量化器函数。从而矢量量化的全过程完成一个从K维欧几里德空间 中的矢量Xi到K维空间有限子集Y的映射 Q: 一、矢量量化的基本原理4、判断规则 当给矢量量化器输入一个任意矢量Xi进行矢量量化时,首先要选择一个合适的失真测度,而后根据最小失真原理,分别计算用各码矢Yj代替Xi所带来的失真。其中产生最小失真的那个码矢Yj,就是Xi的重构矢量(或称恢复矢量),或者称为矢量Xi被量化成了那个码矢。二、矢量量化在语音识别中的应用 矢量量化技术在语音识别中应用时,一般是先用矢量量化的码本作为语音识别的参考模板,即系统词库中的每一个字(词)做一个码本作为该字(词)的参考模板。识别时对于任意输入的语音特征矢量序列X1,X2,…,XN ,计算该序列对每一个码本的总平均的失真量化误差,即语音每一帧特征矢量与码本的失真之和除以该语音的长度(帧数)。总平均失真误差最小的码本所对应的字(词)即为识别结果,这一过程如下图所示。二、矢量量化在语音识别中的应用三、矢量量化的关键之处1、设计一个好的码本关键在于如何划分J个区域边界。这需要大量的输入信号矢量,经过统计实验才能确定,这个过程称为“训练”或“学习”。应用聚类算法,按照一定的失真度准则,对训练的数据进行分类,从而把训练数据在多维空间中划分成一个个以码字为中心的胞腔,常用的是LBG算法来实现。三、矢量量化的关键之处2、未知矢量的量化对未知矢量,按照选定的失真测度准则,把未知矢量量化为失真测度最小的区域边界的中心矢量值(码字矢量),并获得该码字的序列号。其次是未知矢量量化时的搜索策略,好的搜索策略可以减少量化时间。4.3矢量量化的失真测度 一、失真测度的定义 二、欧氏距离测度 三、线性预测失真测度 四、识别失真测度一、失真测度的定义失真测度(距离测度)就是将输入矢量Xi用码本重构矢量Yj来表征时所产生的误差或失真的度量方法,它可以描述两个或多个模型矢量之间的相似程度。K维语音特征矢量X和码本Y的失真测度d(X,Y)需满足下列条件: 1)对称性 d(X,Y)=d(Y,X) 2)正值性 d(X,Y)0;d(X,X)=0 3)d(X,Y)在频域有物理意义 4)对d(X,Y)有高效率的计算方法最常用的失真测度是欧氏距离测度、加权欧氏距离测度、识别失真测度等。 二、欧氏距离测度 设未知模式的K维特征为X,与码本中某个K维码矢Y进行比较, , 分别表示X和Y的同一维分量( ),则几种常用的欧氏距离测度如下: 1)均方误差欧氏距离 这里, 的下标2表示平方误差。 2)r方平均误差 二、欧氏距离测度 3)r平均误差 4)绝对值平均误差 5)最大平均误差二、欧氏距离测度 6)加权欧氏距离测度 式中, 称为加权系数。 常用的加权系数有三、线性预测失真测度当语音信号特征矢量是用线性预测方法求出的LPC系数时,为了比较用这种参数表征的矢量,不宜直接使用欧氏距离。因为,仅由预测

文档评论(0)

cgtk187 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档