- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
国家“十一五”规划教材
《数字语音编码》讲议
同济大学电子与信息工程学院
赵晓群 编著
机械工业出版社,2007年
第8章 语音的矢量量化
8.1 概述
矢量量化(VQ):1956年Steinhaus首次提出,
1970年代后期发展,数据压缩和编码技术;
应用于:语音编码、语音合成、语音识别和说话人识别。
矢量量化在语音信号处理中占有重要地位。
标量量化和矢量量化:
◆标量量化:是对标量进行量化,即一维的矢量量化。
将动态范围分成若干个小区间,每小区间有一个代表值。
当输入信号落入某区间时,量化成该代表值。
◆矢量量化:是对矢量进行量化。
将矢量空间分成若干个小区域,每小区域有一个代表矢量。
当输入矢量落入某区域时,量化成该代表矢量。
矢量量化是标量量化的发展。
矢量量化总是优于标量量化,维数越高,性能越优越。
矢量量化有效利用各分量间的互相关性。
1970年代未,Linda,Buzo,Gray和
Markel等人首次解决了矢量量化码书
生成的方法,并首先将矢量量化用于
语音编码获得巨大的成功。
◆ 2.4 kbit/s线性预测声码器,每帧10个反射系数用10维的矢量量化,可使数码率降低到0.8 kbit/s,音质基本未下降;
◆分段声码器采用矢量量化,数码率可降低到0.15 kbit/s;
….
矢量量化与隐马尔可夫模型、人工神经网络等的结合,
可提高性能,研究和应用较多。
第8章 语音的矢量量化
8.2 矢量(VQ)量化的基本原理
矢量的组成:若干个标量数据或一帧语音的特征参数。
设有 N 个 k 维特征矢量 X :
其中,
◆ xi 可以是语音信号中某帧参数组成的矢量。
把 k 维Euclid空间分成 J 个互不相交子空间R1,R2,…,RJ,即
式中,Rj——Voronoi胞腔,简称胞腔。
在每个胞腔中选一代表矢量 yj , J 个代表矢量组成矢量集合:
矢量量化器:
◆输入矢量xi到量化器Q,并判断属于哪个子空间Rj ,然后输出该子空间Rj的代表矢量yj 。
◆即:矢量量化过程是用yj代表xi的过程(把 yj 量化成 xi ),
◆表达式:
式中,Q( ) ——矢量量化器函数。
◆ 称为码书(码本), yj 称为码矢(码字)。
J 为码书容量 (码书尺寸) 。
不同的代表矢量的选取方法
构成不同的矢量量化器。
图8.1:二维矢量量化器例(容量7)
(香农信息论)矢量维数越大,矢量量化性能越好。
矢量量化的过程与标量量化相似。
在矢量量化时,将输入矢量量化为“距离”最小的区域边界的中心矢量值。
矢量量化也会产生量化误差(量化噪声),
◆码书容量足够大,量化误差就会足够小。
◆合理地选择码书(码书优化)也可以降低误差。
图8.2:基于矢量量化的语音通信系统。
◆编码器、解码器各有相同的码书;码书含 J 个 k 维码字。
◆工作原理:(1) 每输入一帧语音(帧长N),形成与之相应的k 维特征矢量( kN),并送入VQ编码器。
(2) 根据输入特征矢量从编码器码书中选择一与之失真误差最小的码矢 yv ,取yv的编码(标号)v ,即: ;
(3) 传输 v ,若不产生误差,则收端的信号仍是 v;
(4) 解码器按照v 从解码器码书中选出具有相同下标的码字 yv作为输出,yv 即为xi的重构矢量(恢复矢量),即: 。
矢量量化应用于语音识别:
◆一般工作过程:
(1) 将待识别的语音样本(一个字或一个词)分帧矢量量化,其量化码书序列作为识别的参考模板。
(2)识别时,对输入的语音计算其矢量量化序列,并计算该序列与每一参考模板的总平均失真量化误差(语音每一帧矢量量化值与码书的失真之和除以该语音的帧数)
(3) 误差最小的码书序列所对应的字(或词)即为识别结果。
利用矢量量化技术,主要解决两个问题:
(1) 好的码书:有两个标志,J 个区域边界和代表码字。
◆“训练”或“学习”阶段:对大量的输入信号矢量,经过统计实验,划分 J 个区域边界,其任务是建立码书。
◆建立码书时,按照失真度准则,用聚类算法对训练数据进行分类,将数据在多维空间中划分成胞腔,常用LBG算法。
◆为建立好的码书,要求训练数据量大、有代表性;并选择好的失真准则以及码书优化方法。
(2) 未知矢量的量化:
◆按照失真测度准则,把未知矢量量化为矢真测度最小的区域边界的代表(码字)矢量,该码字的编号为编码
您可能关注的文档
- 数字设计基础双语教学版课件作者英BarryWilknson双语课件(第2章节).ppt
- 数控机床加工程序编制第4版课件作者顾京主编第5章节加工中心的程序编制.ppt
- 数字设计基础双语教学版课件作者英BarryWilknson双语课件(第3章节).ppt
- 数字设计基础双语教学版课件作者英BarryWilknson双语课件(第4章节).ppt
- 数控机床控制技术与系统第2版课件作者王侃夫上海市职业技术教育课程改革与教第六章节数控机床伺服系统.ppt
- 数字设计基础双语教学版课件作者英BarryWilknson双语课件(第5章节).ppt
- 数控机床控制技术与系统第2版课件作者王侃夫上海市职业技术教育课程改革与教第四章节驱动装置.ppt
- 液压与气压传动第2版课件作者刘延俊主编5 液压阀.ppt
- 液压与气压传动第2版课件作者刘延俊主编6 液压辅助元件.ppt
- 数字设计基础双语教学版课件作者英BarryWilknson双语课件(第7章节).ppt
- 小学五年级上册数学期末考试试卷及参考答案【预热题】.docx
- 《 备考指南 政治 》课件_必修1 第1课.doc
- 小学五年级上册数学期末考试试卷含答案【培优a卷】.docx
- 小学五年级上册数学期末考试试卷含答案【培优a卷】.docx
- 初中信息技术教学中虚拟现实技术应用的实践探索教学研究课题报告.docx
- 2025届高考语文一轮复习专题二现代文阅读Ⅱ学案新人教版.doc
- 6 《健身俱乐部会员流失原因探究与会员行为分析策略》教学研究课题报告.docx
- 高中信息技术编程思维训练课程的开发与应用教学研究课题报告.docx
- 【计算机、 通信和其他电子设备制造业】XX汽车电子有限公司XX项目职业病危害控制效果评价报告书.pdf
- 小学五年级上册数学期末考试试卷含答案(综合卷).docx
文档评论(0)