数字语音编码课件作者赵晓群第8章节语音信号的矢量量化.pptVIP

下载本文档

6
0
约1.18万字
约 10页
2017-11-16 发布于广东
举报
版权申诉

数字语音编码课件作者赵晓群第8章节语音信号的矢量量化.ppt

1、本文档共10页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

国家“十一五”规划教材《数字语音编码》讲议同济大学电子与信息工程学院赵晓群　编著机械工业出版社，2007年第8章　语音的矢量量化 8.1　概述矢量量化（VQ）：1956年Steinhaus首次提出， 1970年代后期发展，数据压缩和编码技术；应用于：语音编码、语音合成、语音识别和说话人识别。矢量量化在语音信号处理中占有重要地位。标量量化和矢量量化： ◆标量量化：是对标量进行量化，即一维的矢量量化。将动态范围分成若干个小区间，每小区间有一个代表值。当输入信号落入某区间时，量化成该代表值。 ◆矢量量化：是对矢量进行量化。将矢量空间分成若干个小区域，每小区域有一个代表矢量。当输入矢量落入某区域时，量化成该代表矢量。矢量量化是标量量化的发展。矢量量化总是优于标量量化，维数越高，性能越优越。矢量量化有效利用各分量间的互相关性。 1970年代未，Linda，Buzo，Gray和 Markel等人首次解决了矢量量化码书生成的方法，并首先将矢量量化用于语音编码获得巨大的成功。 ◆ 2.4 kbit/s线性预测声码器，每帧10个反射系数用10维的矢量量化，可使数码率降低到0.8 kbit/s，音质基本未下降； ◆分段声码器采用矢量量化，数码率可降低到0.15 kbit/s； …. 矢量量化与隐马尔可夫模型、人工神经网络等的结合，可提高性能，研究和应用较多。第8章　语音的矢量量化 8.2　矢量（VQ）量化的基本原理矢量的组成：若干个标量数据或一帧语音的特征参数。设有 N 个 k 维特征矢量 X ：其中， ◆ xi 可以是语音信号中某帧参数组成的矢量。把 k 维Euclid空间分成 J 个互不相交子空间R1,R2,…,RJ，即式中，Rj——Voronoi胞腔，简称胞腔。在每个胞腔中选一代表矢量 yj ， J 个代表矢量组成矢量集合：矢量量化器： ◆输入矢量xi到量化器Q，并判断属于哪个子空间Rj ，然后输出该子空间Rj的代表矢量yj 。 ◆即：矢量量化过程是用yj代表xi的过程(把 yj 量化成 xi )， ◆表达式：式中，Q( ) ——矢量量化器函数。 ◆ 称为码书(码本)， yj 称为码矢(码字)。 J 为码书容量 (码书尺寸) 。不同的代表矢量的选取方法构成不同的矢量量化器。图8.1：二维矢量量化器例（容量7）（香农信息论）矢量维数越大，矢量量化性能越好。矢量量化的过程与标量量化相似。在矢量量化时，将输入矢量量化为“距离”最小的区域边界的中心矢量值。矢量量化也会产生量化误差（量化噪声）， ◆码书容量足够大，量化误差就会足够小。 ◆合理地选择码书（码书优化）也可以降低误差。图8.2：基于矢量量化的语音通信系统。 ◆编码器、解码器各有相同的码书；码书含 J 个 k 维码字。 ◆工作原理：(1) 每输入一帧语音（帧长N），形成与之相应的k 维特征矢量（ kN），并送入VQ编码器。 (2) 根据输入特征矢量从编码器码书中选择一与之失真误差最小的码矢 yv ，取yv的编码（标号）v ，即：； (3) 传输 v ，若不产生误差，则收端的信号仍是 v； (4) 解码器按照v 从解码器码书中选出具有相同下标的码字 yv作为输出，yv 即为xi的重构矢量（恢复矢量），即：。矢量量化应用于语音识别： ◆一般工作过程： (1) 将待识别的语音样本（一个字或一个词）分帧矢量量化，其量化码书序列作为识别的参考模板。 (2)识别时，对输入的语音计算其矢量量化序列，并计算该序列与每一参考模板的总平均失真量化误差（语音每一帧矢量量化值与码书的失真之和除以该语音的帧数） (3) 误差最小的码书序列所对应的字（或词）即为识别结果。利用矢量量化技术，主要解决两个问题： (1) 好的码书：有两个标志，J 个区域边界和代表码字。 ◆“训练”或“学习”阶段：对大量的输入信号矢量，经过统计实验，划分 J 个区域边界，其任务是建立码书。 ◆建立码书时，按照失真度准则，用聚类算法对训练数据进行分类，将数据在多维空间中划分成胞腔，常用LBG算法。 ◆为建立好的码书，要求训练数据量大、有代表性；并选择好的失真准则以及码书优化方法。 (2) 未知矢量的量化： ◆按照失真测度准则，把未知矢量量化为矢真测度最小的区域边界的代表（码字）矢量，该码字的编号为编码