网站大量收购独家精品文档,联系QQ:2885784924

数字语音编码课件作者赵晓群第8章节语音信号的矢量量化.pptVIP

数字语音编码课件作者赵晓群第8章节语音信号的矢量量化.ppt

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
国家“十一五”规划教材 《数字语音编码》讲议 同济大学电子与信息工程学院 赵晓群 编著 机械工业出版社,2007年 第8章 语音的矢量量化 8.1 概述 矢量量化(VQ):1956年Steinhaus首次提出, 1970年代后期发展,数据压缩和编码技术; 应用于:语音编码、语音合成、语音识别和说话人识别。 矢量量化在语音信号处理中占有重要地位。 标量量化和矢量量化: ◆标量量化:是对标量进行量化,即一维的矢量量化。 将动态范围分成若干个小区间,每小区间有一个代表值。 当输入信号落入某区间时,量化成该代表值。 ◆矢量量化:是对矢量进行量化。 将矢量空间分成若干个小区域,每小区域有一个代表矢量。 当输入矢量落入某区域时,量化成该代表矢量。 矢量量化是标量量化的发展。 矢量量化总是优于标量量化,维数越高,性能越优越。 矢量量化有效利用各分量间的互相关性。 1970年代未,Linda,Buzo,Gray和 Markel等人首次解决了矢量量化码书 生成的方法,并首先将矢量量化用于 语音编码获得巨大的成功。 ◆ 2.4 kbit/s线性预测声码器,每帧10个反射系数用10维的矢量量化,可使数码率降低到0.8 kbit/s,音质基本未下降; ◆分段声码器采用矢量量化,数码率可降低到0.15 kbit/s; …. 矢量量化与隐马尔可夫模型、人工神经网络等的结合, 可提高性能,研究和应用较多。 第8章 语音的矢量量化 8.2 矢量(VQ)量化的基本原理 矢量的组成:若干个标量数据或一帧语音的特征参数。 设有 N 个 k 维特征矢量 X : 其中, ◆ xi 可以是语音信号中某帧参数组成的矢量。 把 k 维Euclid空间分成 J 个互不相交子空间R1,R2,…,RJ,即 式中,Rj——Voronoi胞腔,简称胞腔。 在每个胞腔中选一代表矢量 yj , J 个代表矢量组成矢量集合: 矢量量化器: ◆输入矢量xi到量化器Q,并判断属于哪个子空间Rj ,然后输出该子空间Rj的代表矢量yj 。 ◆即:矢量量化过程是用yj代表xi的过程(把 yj 量化成 xi ), ◆表达式: 式中,Q( ) ——矢量量化器函数。 ◆ 称为码书(码本), yj 称为码矢(码字)。 J 为码书容量 (码书尺寸) 。 不同的代表矢量的选取方法 构成不同的矢量量化器。 图8.1:二维矢量量化器例(容量7) (香农信息论)矢量维数越大,矢量量化性能越好。 矢量量化的过程与标量量化相似。 在矢量量化时,将输入矢量量化为“距离”最小的区域边界的中心矢量值。 矢量量化也会产生量化误差(量化噪声), ◆码书容量足够大,量化误差就会足够小。 ◆合理地选择码书(码书优化)也可以降低误差。 图8.2:基于矢量量化的语音通信系统。 ◆编码器、解码器各有相同的码书;码书含 J 个 k 维码字。 ◆工作原理:(1) 每输入一帧语音(帧长N),形成与之相应的k 维特征矢量( kN),并送入VQ编码器。 (2) 根据输入特征矢量从编码器码书中选择一与之失真误差最小的码矢 yv ,取yv的编码(标号)v ,即: ; (3) 传输 v ,若不产生误差,则收端的信号仍是 v; (4) 解码器按照v 从解码器码书中选出具有相同下标的码字 yv作为输出,yv 即为xi的重构矢量(恢复矢量),即: 。 矢量量化应用于语音识别: ◆一般工作过程: (1) 将待识别的语音样本(一个字或一个词)分帧矢量量化,其量化码书序列作为识别的参考模板。 (2)识别时,对输入的语音计算其矢量量化序列,并计算该序列与每一参考模板的总平均失真量化误差(语音每一帧矢量量化值与码书的失真之和除以该语音的帧数) (3) 误差最小的码书序列所对应的字(或词)即为识别结果。 利用矢量量化技术,主要解决两个问题: (1) 好的码书:有两个标志,J 个区域边界和代表码字。 ◆“训练”或“学习”阶段:对大量的输入信号矢量,经过统计实验,划分 J 个区域边界,其任务是建立码书。 ◆建立码书时,按照失真度准则,用聚类算法对训练数据进行分类,将数据在多维空间中划分成胞腔,常用LBG算法。 ◆为建立好的码书,要求训练数据量大、有代表性;并选择好的失真准则以及码书优化方法。 (2) 未知矢量的量化: ◆按照失真测度准则,把未知矢量量化为矢真测度最小的区域边界的代表(码字)矢量,该码字的编号为编码

您可能关注的文档

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档