语音信号处理 第4版 课件 第3章:语音信号处理的常用算法.pptx

语音信号处理 第4版 课件 第3章:语音信号处理的常用算法.pptx

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

南京邮电大学通信与信息工程学院第3章语音信号处理的常用算法

矢量量化隐马尔可夫模型深度学习

3.1矢量量化标量量化:整个动态范围被分成若干个小区间,每个小区间有一个代表值。对于一个输入的标量信号,量化时落入小区间的值就用这个代表值来代替,或者被量化为这个代表值。矢量量化:是对矢量进行量化,和标量量化一样,它把矢量空间分成若干个小区域,每个小区域寻找一个代表矢量,量化时落入小区域的矢量就用这个代表矢量代替,或者称为“被量化为这个代表矢量”。矢量量化的目的:将若干个标量数据组成一个矢量(或者从一帧语音数据中提取的特征矢量)在多维空间给予整体量化,从而可以在信息量损失较小的情况下压缩数据量。

3.1矢量量化—基本原理设有N个K维特征矢量其中第i个矢量(可看作语音信号中某帧参数组成的矢量)可记为把K维欧几里得空间无遗漏地划分成J个互不相交的子空间满足:在每个子空间Rj找一个代表矢量Yj,则j个代表矢量可以组成矢量集为这样组成了一个矢量量化器。Y称为码书或码本;Yj称为码矢或码字;J称为码本尺寸。不同的划分或不同的代表矢量选取方法可以构成不同的矢量量化器。

3.1矢量量化—基本原理矢量量化过程:当输入任意矢量进行矢量量化时,矢量量化器首先判断它属于哪个子空间Rj,然后输出该子空间Rj的代表矢量Yj。即,用Yj代表Xi的过程,即,量化过程就是完成一个从K维欧几里得空间中的矢量X到K维空间有限子集Y的映射通常Q(.)选择是根据最小失真原理,分别计算用各码矢Yj代替Xi所带来的失真,其中产生最小失真值时所对应的那个码矢,就是最终量化的输出码矢。缺点:存在量化噪声!

3.1矢量量化—基本原理矢量量化在语音通信中的应用:编码:解码:矢量量化在语音识别中的应用:

3.1矢量量化—基本原理矢量量化需要解决的两大关键问题:(1)设计一个好的码本(“训练”或“学习”):需要搜集海量且具有代表性的数据;要选择一个好的失真度量准则以及码本优化方法(常用LBG算法来实现)。(2)未知矢量的量化:需要按照选定的失真测度准则,把未知矢量量化为失真测度最小的区域边界的中心(码字)矢量值,并获得该码字的序列号(码字在码本中的地址或标号)。存在两矢量在进行比较时的测度问题;未知矢量量化时的搜索策略。

3.1矢量量化—失真测度失真测度的定义:是将输入矢量Xi用码本重构矢量Yj表征时所产生的误差或失真的度量方法,用以描述两个或多个模型矢量间的相似程度。失真测度的选择好坏直接影响到聚类效果和量化精度。设对两个k维语音特征矢量X和Y进行比较,要使其距离测度d(X,Y)在语音信号处理中有效,必须具备以下条件:

3.1矢量量化—失真测度常用的失真测度:(1)均方误差欧氏距离(2)r平方误差(3)r平均误差(4)绝对值平均误差(5)最大平均误差(6)加权欧氏距离测度

3.1矢量量化—失真测度线性预测失真测度:当语音信号特征矢量是用线性预测方法求出的LPC系数时(即,用LPC参数描述语音信号时),不能直接用欧氏距离。当预测器的阶数p趋近于无穷大,信号与模型完全匹配时,信号功率谱为相应地,如码本中某重构矢量的功率谱为可定义I-S距离来衡量二者失真:其中另外,还有对数似然比失真测度、模型失真测度、识别失真测度等。

3.1矢量量化—最佳码本设计码本设计:用d(X,Y)表示训练用的特征矢量X和训练出的码本的码字Y之间的畸变,那么最佳码本设计的任务就是在一定的条件下,使得此畸变的统计平均值D=E[d(X,Y)]达到最小。应遵循的两条原则:(1)最近邻原则,表示为(2)设所有选择码字Yl(即归属于Yl所表示的区域)的输入矢量X的集合为Sl,那么Yl应使该集合中的所有矢量与Yl之间的畸变值最小。如果采用欧氏距离来度量X与Y之间的畸变值,那么容易证明Yl应等于Sl中所有矢量的质心:根据上述两条原则,设计码本设计的递推算法——LBG算法。整个算法就是上述两个条件的反复迭代过程,即从初始码本寻找最佳码本的迭代过程。

3.1矢量量化—最佳码本设计LBG算法的步骤:

矢量量化隐马尔可夫模型深度学习

3.2隐马尔可夫模型—概述隐马尔可夫模型(HiddenMarkovModels,HMM)作为语音信号的一种统计模型,在语音信号处理各个领域中获得广泛的应用。HMM是一个输出符号序列的统计模型,具有N个状态S1,S2,…,SN,它按一定的周期从一个状态转移到另一个状态,每次转移时,输出一个符号。转移到哪一个状态,转移时输出什么符号,分别

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档