- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于增量估计的快速高斯计算.pdf
NCMMSC’2009 ,8 月14-16 日,新疆乌鲁木齐
基于增量估计的快速高斯计算
1 1 2
钱胜 ,吕萍 ,吴及
(1. 清华-讯飞语音技术联合实验室,北京 100084 ;2. 清华大学电子工程系,北京 100084)
文 摘: 本文分析讨论了连续语音识别系统中的快速高斯计算问题。语音信号的短时平稳特性,使得相邻语音帧可
能共享相似的分布。利用该特性,估计当前帧与基准帧间似然值增量的最大值,以此减少似然值的精确计算量。这种
快速高斯计算方法称为最大概率增量估计算法。本文深入讨论了该算法在实际应用中的若干问题:增量上界估计、最
优高斯候选、风险因子等。实验结果表明,在几乎不损失识别率的情况下,MPIE 算法可节约40% 的维数计算,解码
速度相对提高10%。
关键词:语音识别;快速高斯计算
中图分类号: TP912.34
当前,连续语音识别系统中声学建模的主流技 Estimation :MPIE )算法。由于语音信号具有短时
术是连续概率隐马尔可夫模型(Continuous Density 平稳特性,MPIE 算法发掘已经计算过的高斯似然
Hidden Markov Model, CD-HMM )。以三音子 值对当前帧高斯计算的影响,选择部分高斯进行精
(triphone )为声学建模单元的HMM 中,经过状态 确计算,余下的则只需要估计其似然值增量。然而,
共享后,声学模型通常包含 2000~6000 个状态。 由于所有的高斯分量共享相同的增量上界,对很多
而每个状态用混合高斯模型(Gaussian Mixture 高斯分量而言,增量上界远大于实际增量值。本文
Model , GMM )来描述其概率分布。通常 GMM 将重点讨论 MPIE 算法在实际应用中遇到的高估
中高斯分量数目为8~64 个。如此精细的声学模型, (overestimation )问题:增量上界估计、最优高斯候
在保证较高识别正确率的同时,也使得系统花费大 选、风险因子选择等等。
量时间来计算高斯似然值。文献[1]显示,依识别任 本文余下部分安排如下:第一节介绍MPIE 算
务和声学模型的复杂程度,高斯计算占识别时间的 法的基本思想。第二节讨论MPIE 算法在实际应用
30%~70% 。因此,优化高斯计算是提高语音识别 中遇到的问题,及相应的修改方法。实验结果和分
系统速度的途径之一。 析在第三章进行描述。最后,第四章是本文总结。
针对语音识别中的高斯计算加速问题,已经提
出了几种不同的方法。一些方法在识别准确性和识
1 MPIE算法
别速度两方面寻找折中,以牺牲识别率来换取速度
提升。例如:高斯聚类[2]和基于树的搜索算法[3] 在基于HMM 的连续语音识别系统中,高斯似
对某帧数据,快速定位出最可能的高斯子集,从而 然值计算公式如下:
高斯似然值计算可以用汉明距离近似法(Hamming p (o ) N (o ;μ ,Σ )
m m m
Distance Approximation )来估计[4]。另一些方法则 1 ⎛ 1 T −1 ⎞
=⋅exp − o −μ Σ o −μ( ) ( )
旨在不损失识别率的情况下,来提高计算速度。典 (2π)D Σm ⎜⎝ 2 m m m ⎟⎠
型的算法有
您可能关注的文档
- 基于GIS的吉林省玉米生产发展时空变异分析.pdf
- 基于GIS的风暴潮减灾辅助决策信息系统.pdf
- 基于GrabCut改进的图像分割算法_周良芬.pdf
- 基于GTM旋转压实试验参数的沥青混合料高温性能评价指标.pdf
- 基于HOG和DMMA的单样本人脸识别_杨秀坤_岳新启_汲清波.pdf
- 基于ITS的供应链研究.pdf
- 基于JavaScript的世界大学城网页界面重构_刘云.pdf
- 基于LabSQL的LabVIEW数据库访问功能研究.pdf
- 基于LabVIEW的信号分析与仿真.pdf
- 基于LOG算子的自适应图像边缘检测方法.pdf
- 2025年中国锻铁围栏市场调查研究报告.docx
- 2025年中国椭圆型市场调查研究报告.docx
- 2025年中国无蔗糖原味豆浆市场调查研究报告.docx
- 2025-2031年中国泛在电力物联网行业发展运行现状及投资潜力预测报告.docx
- 2025年中国制袋机零件市场调查研究报告.docx
- 2025年中国智能除垢型电子水处理仪市场调查研究报告.docx
- 2025-2031年中国甘肃省乡村旅游行业市场深度研究及投资策略研究报告.docx
- 2025-2031年中国干海产品行业市场发展监测及投资战略规划报告.docx
- 2025年中国全铝图解易拉盖市场调查研究报告.docx
- 2025年中国人造毛皮服装市场调查研究报告.docx
文档评论(0)