- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第06讲共振峰估计矢量量化
上次课内容简单回顾 基音检测 纯音是指单一正弦振荡的声波; 复音则是由多个正弦波组成的声音,其中各个频率的最大公约数称为基音频率,相应的一个声波成分叫基音。 谐音或泛音指频率相当于基音频率整数倍的正弦形声波。乐音和语音中的浊音都可以近似地看作是含有许多谐波分量的复音。 语音的基音频率大约在60一500Hz的范围内,一般女声比男声的基音频率高,童声比成人语音的基音频率高。语音的最高谐波频率可达5000以上,因此可能包含有几十次、上百次的谐波分量。 基音提取的方法大致包括时域估计法、变换法和混合法。 时域估计法,即直接由语音波形来估计基音周期,分析出波形上的周期峰值。如:自相关法、并行处理法、平均幅度差法等。 变换法,是将语音信号变换到频域或倒谱域来估计基音周期,比如倒谱法,倒谱分析法比较复杂,但基音周期估计效果好。 混合法,先将信号提取声道模型参数,然后利用它对信号进行滤波,得到音源序列,最后再利用自相关法或法求得基音周期,例如简化逆滤波法等。 4.1概述 4.2矢量量化的基本原理 4.3失真测度 4.4最佳矢量量化器和码本设计 4.5降低复杂度的矢量量化系统 4.6语音参数的矢量量化 §4.1 概述 §4.2 矢量量化的基本原理 标量量化是对信号的单个样本或参数的幅度进行量化;标量是指被量化的变量,为一维变量。 矢量量化的过程是将语音信号波形的K个样点的每一帧,或有K个参数的每一参数帧构成K维空间的一个矢量,然后对这个矢量进行量化。 标量量化可以说是K=1的矢量量化。矢量量化过程和标量量化过程相似。将K维无限空间划分为M个区域边界,然后将输入矢量与这些边界进行比较,并被量化为“距离”最小的区域边界的中心矢量值。 以K=2进行说明:当K=2时,所得到的是二维矢量。所有可能的二维矢量就形成了一个平面。记为(a1,a2),所有可能的(a1,a2)就是一个二维空间。如图7-1(a)所示 通常这些代表值Yi称为量化矢量。 对一个矢量X进行量化,首先选择一个合适的失真测度,然后用最小失真原理,分别计算用量化矢量Yi替代X所带来的失真。 其中最小失真值所对应的那个量化矢量,就是矢量X的重构矢量(或恢复矢量)。 所有M个量化矢量构成的集合 称为码书或码本; 把码书中的每个量化矢量Yi(i=1,2….M)称为码字或码矢。 不同的划分或不同的量化矢量选取就可以构成不同的矢量量化器。 注:根据仙农信息论,矢量越长越好。实际中码书是不完备的,即矢量数是有限的,而对于任何一个实际应用来说,矢量通常是无限的。在实际运用中,输入矢量和码书中码字不匹配的情况下,这种失真是允许的。 特点: 传输存储的不是矢量本身而是其序号,所以 据有高保密性能 收发两端没有反馈回路,因此比较稳定 矢量量化器的关键是编码器的设计,译码器 只是简单的的查表过程。 §4.3 失真测度 前面我们讲过设计矢量量化器的关键是编码器的设计。而在编码的过程中,就需要引入失真测度的概念。 失真度选择必须具备的特性 必须在主观评价上有意义,即小的失真应该对应于好的主观语音质量; 必须是易于处理的,即在数学上易于实现,这样可以用于实际的矢量量化器的设计; 平均失真存在并且可以计算; 易于硬件实现 §4.3.1 欧氏距离-均方误差 模糊c均值聚类算法目标函数为如下式所示: 模糊矢量量化码本估计的步骤如下: 1)设定初始码本和每个码字的初始隶属度函数 ,为了方便可以令每个码字的初始隶属度函数为相等的值; 2)对于训练观察矢量序列 ,利用式(4-34)计算新的聚类中心 及新的隶属度函数 ; 3)利用式(4-33)的目标函数,判断迭代计算是否收敛。如果前后差值小于某个阈值,则迭代计算结束,由新的聚类中心和隶属度函数集组成重估后的新码本;否则继续进行下一轮迭代计算。 模糊矢量量化的步骤如下: 1)对于待矢量量化的输入矢量 ,模糊矢量量化不是通过矢量量化把输入矢量 量化成为某个码字 ,而是把输入矢量 量化成由隶属度函数组成的矢量 ,它表示 分别属于码字 的程度是多少;其中 由下式给定: 2)这时 的量化误差由下式给定: §4.4.1 LBG算法 §4.4.2 初始码本的生成 §4.5 矢量量化技术的优化设计 上面介绍的矢量量化技术应用于语音信号处理时有其局限性: 实
您可能关注的文档
- 泰山版品德与社会六年级上册11课科学技术造福人类课件.ppt
- 测试技术基础-精密测量物理导论.ppt
- 浙江专用2018版高考数学大一轮复习第十一章概率随机变量及其分布11.3离散型随机变量及其分布列课件.ppt
- 浙江大学普通化学(第六版)第一章课件-热化学与能源.ppt
- 波的衍射和干涉(修改版含多个演示动画).ppt
- 浙江鸭2017版高考物理二轮复习高分突破专题六磁场第19课时磁场的描述及磁吃电流的作用课件.ppt
- 浙江鸭2017版高考物理二轮复习高分突破专题四静电场第16课时电容器带电粒子在电场中的运动课件.ppt
- 浙江鸭2018届高三物理一轮复习第3章牛顿运动定律第2节牛顿运动定律力学单位制课件.ppt
- 浙江省2018高考化学一轮复习3氧化还原反应课件.ppt
- 汽轮发电机运行维护及故障分析.ppt
原创力文档


文档评论(0)