CDCPM及其在语音识别中的应用.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
CDCPM及其在语音识别中的应用.PDF

《软件学报《软件学报(J. of S/W》,》,863高技术项目智能主题专刊高技术项目智能主题专刊(863 Special Issue), 7:69-75, Oct. 1996 《软件学报《软件学报 》,》, 高技术项目智能主题专刊高技术项目智能主题专刊 CDCPM及其在语音识别中的应用及其在语音识别中的应用 及其在语音识别中的应用及其在语音识别中的应用 郑郑 方方 吴文虎吴文虎 方棣棠方棣棠 郑郑 方方 吴文虎吴文虎 方棣棠方棣棠 清华大学计算机科学与技术系 100084 fzheng@sp.cs.tsinghua.edu.cn, (010 摘摘 要要 :: 本文 提 出了 一种称为 “中心距离连续概率模型”(Center-Distance Continuous 摘摘 要要 :: Probabilistic Model ,CDCPM)的新概率统计模型,可用于非特定人或特定人、孤立词或连续语 音识别。模型的参数是每个状态的均值特征矢量以及特征矢量与其均值特征矢量之间距离的 均值;与连续HMM(CHMM)不同的是,它没有状态转移概率矩阵A ,且输出观察概率矩阵B 中 各状态的概率密度函数只是一个一维的( 中心距离的)概率密度函数(PDF) 。在三个不同的数据 库上进行的实验表明这是一个很有潜力的模型,它极大地减小了模型存储的空间复杂度和模 型训练及识别的时间复杂度 。 关键字关键字:: 中心距离、中心距离正态分布(CDN)、中心距离连续概率模型(CDCPM)、 关键字关键字:: 连续HMM(CHMM) I. CDCPM简介简介 简介简介 在语音识别领域中占据主导地位的HMM ,包括有满协方差矩阵和对角协方差矩阵的连续 混合密度的HMM [1-3 、半连续的HMM [4 ,以及基于VQ 的离散HMM [5]. 一个HMM通常由状态转移概率矩阵A 、观察概率密度函数矩阵B和初始概率分布矢量π表 征。本文所描述的中心距离连续概率模型(CDCPM) 将只保留HMM模型中的B矩阵,且B 中的 PDF被一个一维的PDF取代。这种取代可以在保证良好性能的前提下降低时空复杂度。 1.1 关于CDCPM模型 N 个状态的从左向右连续HMM模型的第n个状态的观察输出PDF可采用下列形式的混合 Gauss密度(MGD)[2 : M bn (x) = ∑ gnmN (x;µ nm , Σnm) (1) m= 1 其中 N (x;µ , Σ ) 表示均值矢量为µ 、协方差矩阵为Σ 的D维正态分布密度函数,那么一个连续 混合密度的HMM需要选择下列参数:状态数N 、混合密度数M 、特征矢量的维数D 、状态转移 矩阵 、混合成分的均值矢量µ = (µ (nm) ) 、混合成分的协方差矩阵Σnm = (σ (nm) ) 以及混合增 nm d pq 益 gnm 。其中1≤n≤N, 1≤m≤M, 1≤d,p,q≤D 。 现在考虑均值矢量为 µ = (µ 1 ,µ 2 , !,µ D ) 、协方差矩阵为Σ = (σ pq ) 的D维正态密度函数: 1 1 − 1 T p (x;µ , Σ) = D / 2 1/ 2 exp(−

文档评论(0)

sunyangbill + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档