二阶隐马尔科夫模型在语音处理中线性计算原理及优化.docVIP

下载本文档

4
0
约3.33千字
约 8页
2018-06-25 发布于福建
举报
版权申诉

二阶隐马尔科夫模型在语音处理中线性计算原理及优化.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

二阶隐马尔科夫模型在语音处理中线性计算原理及优化

二阶隐马尔科夫模型在语音处理中线性计算原理及优化　　摘要：简要介绍二阶隐马尔科夫模型在语音处理中的基本原理，对隐马尔科夫模型中生成序列观察、前向――后向算法中的线性计算原理进行归纳，将二维空间向量和矩阵计算的方法引入语音处理的二阶隐马尔科夫过程。　　关键词：隐马尔科夫模型语音处理算法线性优化矩阵　　中图分类号：O211.62 文献标识码：A 文章编号：1007-3973（2013）007-097-03 　　1 隐马尔科夫模型　　隐马尔科夫模型是一种在语音识别中被广泛应用的统计模型。过去隐马尔科夫模型在语音处理中的应用主要局限在一阶隐马尔科夫过程。一阶隐马尔科夫模型的两个基本假设在语音处理的研究中并不合理。　　其中关于状态转移的假设认为：在t+1时刻的状态转移只与该时刻的状态有关，而与之前的时刻没有关系，这显然是不合理的。比如在计算语言学中，福田算法是基于上下文无关文法的高效的自然语言分析方法，这种算法考虑了句法结构、图结构线、子树共享和局部歧意紧缩的技术，证实了相邻词汇之间紧密的相关性。而输出值的马尔科夫假设认为：在t时刻输出观察值的概率，只取决于ti≤t的时刻，这显然也是不合理的，因为它忽略了在数值输出中的前后相继的必然联系，比如生物信息学中处于生物序列中的核苷酸与其前后链中的分子具有极其密切的关系。以上两点均说明了一阶隐马尔科夫模型的不合理性。　　2 二阶隐马尔科夫模型　　二阶隐马尔科夫模型基于这样的假设：时刻的t的状态与时刻t?康淖刺??泄叵担?创嬖冢?ijk=P（xt+1=Sk|xt=sj，xt-1=si，xt-2=…）=p（xt+1=sk|xt=sj，xt-1=si），其中：aijk=1；aijk≥0；i≥1；N≥j，N表示模型中的状态个数；观察当前特征矢量的状态，依赖于系统在t?渴笨趟?Φ淖刺??创嬖冢? 　　bij（）=P（yt=vt|xt=sj，xt-1=si），1≤i；j≤N；1≤≤M 　　二阶隐马尔科夫模型的参数集合可以记为： =（，A，B），其中假设： ={ i}；A={aijk}；B={bij（）}表示二阶隐马尔科夫模型的初始状态分布、转移状态分布、观测值的概率分布，二阶马尔科夫模型是我们在计算语言学中实现线性计算和优化的基础。　　3 隐马尔科夫模型中生成序列观察　　隐马尔科夫模型中生成序列的观察原理是指，把马尔科夫模型看做一个观察值的生成装置，按照一定的步骤，隐马尔科夫模型可以生成如下的观察序列：O=（o1o2o3…oT）（oi为i时刻的观察值）　　按照这样一个生成装置的假设，初始状态概率分布函数，选择一个初始状态q1=i，令t=1，根据状态i观察符号概率分布bi（k）选择观察值ot=vk，按照状态转移概率分布aij，选择t+1时刻的状态qt+1=j。如果t 　　那么 T=（a0，a1，…，ap），a0=1即为LPC系数，RS（i）为ST的自相关函数，则：　　2就是LPC分析时的预测残差将语音帧ST化为语音XT=ST/ ，根据条件概率的计算方法，有：　　也就是说，线性预测隐马尔科夫模型的概率密度函数为：　　其中K为语音帧长，aij为描述f（X）的参数，也是一组LPC系数。经过推倒，在实际中L个训练序列O（i），=1，2，…，i，…，L，的重估公式为：　　为了使隐马尔科夫模型在有限帧的语音中的处理中实现计算机化，常常需要运用线性预测的隐马尔科夫模型，但在实际的编程中，我们需要增加一个比例系数的公式：　　为了防止计算的下溢，通常把实现公式写作：　　其中为隐马尔科夫链中生成观测值的概率。系数的算法多达几十种，其中以自相关法、协方差法和格型法最为常用。上面的线性计算方法，是对线性预测的隐马尔科夫模型的改进，利用概率密度函数可以有效地将离散隐马尔科夫模型与完全连续的隐马尔科夫模型的计算方法归为同一类。　　6 二阶隐马尔科夫模型在噪声中实现语音加强的线性原理　　在语音处理的研究中，噪声对于语音效果的影响和语音压缩编码的质量有很重要的影响，因此噪声环境下语音加强的研究意义十分重大。隐马尔科夫模型在噪声环境下语音处理的研究中起到了重要作用，其中加强型高斯白噪声的语音加强方法是比较常见的方法之一。　　假设Yt为噪声语音帧，St为无噪声语音帧，ni为高斯白噪声帧，且有：　　Yt=St+nt，t=1，…，T 　　作为线性预测隐马尔科夫模型的输出序列观察值St，如果利用线性预测隐马尔科夫模型表示高斯有色噪声的先验知识，把高斯有色噪声序列作为线性预测隐马尔科夫模型的输出值序列，从而使得有色噪声的相关性包涵在预测性的隐马尔科夫模型中。　　白化算法和语音增强算法是另外两种常见的噪声环境下的语音处理的计算方法，我们在这里不再单