语音信号处理(张力编)课件第四章.pptVIP

语音信号处理(张力编)课件第四章.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号处理(张力编)课件第四章

标量量化和矢量量化比较 标量量化是维数为k=1的矢量量化。一般矢量量化均指k1多维量化。 一个k维最佳矢量量化器的性能总是优于k个最佳标量量化器。 在相同的编码速率下,矢量量化的失真明显比标量量化的失真小;而在相同的失真条件下,矢量量化所需的码速率比标量量化所需的码速率低得多。 由于矢量量化的复杂度随矢量维数成指数形式增加,故矢量量化的复杂度比标量量化的复杂度高。 矢量量化的三大关键技术 码本设计 码字搜索 3、链映射法 (1)特征空间各矢量按规律排序:在待聚类的点中先任选一点,称之为X1排在首位,求其最近邻点称为X2,列为第二位……,依次类推,得一矢量序列X1,X2,…,XN (2)设Xi、Xi-1间的距离为di,则可得距离序列:d1,d2,…dN-1。 (3)做di~i的关系图 矢量量化技术用于语音信号处理的局限性 (1)完成全部搜索的计算量大,实时性差 (2)码本的形成过程中容易陷入局部最优 解决的办法 (1)无记忆的矢量量化器 (2)有记忆的矢量量化器 1、树形搜索的矢量量化系统 2、近邻划分算法的适量量化系统 第一、对每一个输入矢量X找到一个尽可能接近的码字,以此码字作为搜索的出发点, 第二、对每一个出发点初始码字找到其邻接码字, 第三、建立一套正确的搜索策略 算法的步骤: (1)搜索初始码字的确立:对X的每一维分量进行标量量化,根据标量量化的值确定与之最接近的码字矢量作为初始码字 (2)每个码字邻接码字的确定:利用最近邻条件确定J-1个不等式,由此确定最近邻区域 (3)搜索步骤: ①确定初始码字Yl,计算输入矢量X与Yl的失真d(X,Yl) ②计算X与Yl的各邻接码字之间的失真,如果所有失真都大于d(X,Yl),那么Yl就是要找的码字,搜索结束 ③如果在Yl的邻接码字中遇到第一个与X的失真小于d(X,Yl),以这个码字为初始码字,转入②继续搜索 3、多级矢量量化系统 思想:利用多个码本分级量化,后一个量化器量化的对象是前一个量化器的量化误差 有记忆的矢量量化系统 思想:利用矢量与矢量之间的相关性,提高矢量量化的性能 分类 反馈矢量量化 预测矢量量化PVQ(Predictive VQ) 有限状态矢量量化FSVQ(Finite-State VQ) 自适应矢量量化 FSVQ工作原理:S为有限个状态所构成的状态空间,S={sn,n=1,2,…N},每个状态都有一个编码器asn、解码器bsn、和码本cn,进行编码时,除了要输出该码本中最小失真的那个码矢的角标Jn外,还要给出下一个状态Sn+1。也就是说:每个编码量化的状态是根据上一个状态和上一个编码结果来确定的。 假设输入信号矢量为Xi . . . . . . x 训练集合X M 训练矢量 . . . . . . . 码本C y1 y2 yN N 个码字 . . . . . . . x d(x,y1) d(x,y0) d(x, yN-1) min d(x,yj) 码本C y0 y1 yN-1 所谓最佳设计,就是从大量信号样本中训练出好的码本;从实际效果出发寻找到好的失真测度定义公式;用最少的搜索和计算失真的运算量。 一、最佳码本设计的原则 最佳码本的设计,就是在一定条件下,使得d(X,Y)的统计平均最小。需满足下列条件: (1)最邻近准则;根据该条件对信号空间进行最佳划分,得到Sl称为一个胞腔。 (2)所有选择码字Yl的输入矢量X的集合为Sl, Yl是Sl中所有矢量的质心。根据这两条原则,这个算法就是LBG算法。 Nl为集合中矢量的个数 x x x x x x x x x x x 质心的形成 LBG算法是一种递推算法,从一个事先选定的初始码本开始迭代。把训练序列按照码本中的元素根据最邻近准则分组,对每一分组找质心,得到新的码本,又作为初始码本,再进行分组,重复上述过程,直到系统性能满足要求和不再有明显的改进为止。 二、LBG算法 初始码本的选择 随机选取法:从训练序列中随机选取J个矢量作为初始码字,从而构成初始码本。 . . . . . . x . . . . 训练集合X . . 初始码本 J=2个码字 分裂法 (1)求出S中全体训练序列的质心 (2)然后在S中找一个与此质心的失真测度最大的矢量 ,再在S中找一个与 的失真测度最大的矢量 (3)以 和 为基准,根据最邻近准则,进行S的划分,得到两个子集 和 ,求其质心; (4)对这两个子集分别按同样方法进行处理,可以得到四个子集。依次类推,经过r次分裂,得到J=2r 个子集,分别求子集的质心,得到J个初始码字,构成初始码本。 x x x x x x x x x x x x x x x x x x x x x x

文档评论(0)

zhuliyan1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档