基于网格的语音关键词检索算法改进.pdfVIP

下载本文档

7
0
约1.82万字
约 6页
2017-10-18 发布于河北
举报
版权申诉

基于网格的语音关键词检索算法改进.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于网格的语音关键词检索算法改进.pdf

ISSN 1000-0054 清华大学学报 (自然科学版) 2015年第 55卷第 5期 5／18 — — CN 11-2223／N JTsinghuaUniv(Sci8LTechno1)，2015，Vo1．55，No．5 5O8—513 基于网格的语音关键词检索算法改进肖熙，王竞千 (清华大学电子工程系，北京 100084) 摘要：针对多候选汉语音节网格语音关键词检索任务，在用，但基于文本内容的检索技术对于包含语音等的 Gauss混合模型以及多候选识别算法方面进行了研究改进。多媒体数据仍不能进行较好的理解。语音检索技术首先探讨了Gauss混合模型的不同简化策略并用实验进行的出现，弥补了基于文本内容的检索技术的不足。了验证，证明了全协方差矩阵在识别性能上的优越性；随后本文针对语音数据的关键词检索系统 (keyword 对经典的多候选令牌传递算法做出了针对汉语特点的改进。 spottingsystem，KWS)所需要的关键技术进行了实验表明这 2方面的研究不仅提高了以音节作为输出的语研究，力图从改善模型精度和搜索算法等方面提高音识别gf擎的单候选识别效果，也大幅提高了多候选的识语音检索的性能。别性能。最后搭建了一个基于多候选网格的语音关键词检目前，隐 Markov模型 (HMM)和多 Gauss混索系统，在该系统中验证了上述改进的效果。合模型(GMM)E1]被普遍地用作描述语音的概率模关键词：语音关键词检索；多候选网格；Gauss混合模型；型。即使深层神经网络 (DNN)技术E2--3]被广泛应 CUDA；三音子模型用，各种基于 HMM—GMM架构的改进方法仍被研中图分类号：TP391．4 文献标志码：A 究者所关注。例如，文-14]采用了鉴别训练的方法文章编号：1000—0054(2015)05—0508—06 对 HMM 的状态进行训练，得到了比传统的最大似然估计 (MLE)更好的结果；文 [5]提出了子空间 GMM，其中HMM 向量通过一次全局映射映射到 GMM 向量空间，从而改进了识别性能。文 [6]仍然采用了传统的HMM—GMM 结构，但采用了加速分量学习(boostedmixturelearning)的方法训练每个 GMM 的分量，实验表明这种方法对小尺寸模型