基于 HTK 连续语音识别系统的研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于 HTK 连续语音识别系统的研究.pdf

计算机光盘软件与应用 工程技术 Computer CD Software and Applications 2012 年第15期 基于HTK 连续语音识别系统的研究 李毅 深圳市公安消防支队,广东 深圳 518000 ) 要:语音识别也称自动语音识别,是将人类语音中的词汇转换为计算机可读的输入,而HTK (HMM ToolKit )是构 建隐马尔可夫模型和识别的工具包,最早是由英国剑桥大学工程系设计和开发的,目前广泛应用于语音识别、语音合成、字 识别等多个领域。本文主要是使用语音识别工具HTK 建立语音识别系统。 关键词 HTK;数字家庭;语音识别系统 中图分类号:TN912.34 文献标识码:A 文章编号:1007-9599 (2012) 15-0098-02 1 引言 数据准备阶段,主要包括语料准备、语音标注、字典的创 建、语言模型建立等工作。 随着计算机科学与信息技术的迅速发展,智能技术也得到 (1)语料准备。在语音识别中,为了对声学模型进行充 迅速的提高。语音识别技术作为一种人机交互技术越来越得到 分的训练,所挑选的语料必须具有代表性,好的语料库应是尽 关注,近些 来,因其发展速度非常快,在许多领域已经有了 可能的覆盖语音语言现象,对语料选择的好坏直接影响语音识 很好的应用。语音识别技术是一门涉及面很广的交叉学科,正 别的识别率。 逐步成为信息技术中人机交互的关键技术。目前,语音识别技 准备好语料之后,语音识别中第一项工作就是对语料进行 术的应用已经成为一个具有竞争性的新兴高技术产业,随着其 处理。首先使用准备好的字典对句子脚本文件进行切分断句, 他各学科理论的不断发展和深入,一些新技术,新理论的不断 断句是以字典中出现的字词为基本单元对句子进行切分,然后 涌现,为语音识别的研究奠定了基础。 保存为字词列表的格式文件,接着使用字典将断句后的每个字 2 语音识别基本原理 词进行音节级或音素级的标注,生成音节或音素列表标注文 件,之后将语料中的一部分语料进行有时间段的标注用来作为 语音识别本质上是模式识别的一种,就是让机器能够听懂 初始化训练语料。 人说话,是非常重要的人机交互技术。目前,绝大部分语音识 (2 )语音标注。在声学模型训练之前,需要对语音波形 别系统都是采用统计模型匹配的原理。通常来讲,语音识别系 文件进行标注。对波形文件的标注,可以是有时间段的标注, 统可分为两个核心部分:一是利用特征提 的参数根据合适的 也可以是无时间段的标注;可以采用手工的标注方法(一般适 算法训练出一组模型;二是根据识别算法和训练好的模型对未 用于孤立词小词汇量语音识别系统),也可以采用自动、平均 知的语音进行识别。

文档评论(0)

rewfdgd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档