HTK手册_第三章.docVIP

  • 135
  • 0
  • 约2.38万字
  • 约 25页
  • 2017-12-11 发布于河南
  • 举报
HTK手册_第三章

第三章 一个例子——使用HTK指南 本章作为指南部分的最后一章,将描述构造一个简单的用于语音拨号的识别器的过程。这个识别器可以识别连续的数字串和有限个名字。由于这是一个子词[译者注:并非为整个单词建立模型,而是词的一部分建立模型,可理解成对音素建模](sub-word)识别系统,所以向词典中加入一个新的名字只需要修改发音词典和语法网络(task grammar)。HMM模型使用的是连续密度混合高斯模型,且使用决策树聚类的状态绑定的triphone。虽然这个语音拨号系统本身相当简单,但是系统的设计具有代表性,对学习HTK的使用很有帮助。 我们将从无到有构建此系统,包括使用HTK工具HSLab录制训练数据和测试数据。为了简化,这个系统是说话人相关的,但是建造一个说话人无关的系统可以采用相同的设计方法。唯一的不同在于需要足够数量的不同说话人的数据,以及相应地增加模型复杂度。 构造一个“全新”的识别器包括很多相关的子任务,而且没有一个明确的实现这些任务的最佳顺序。这里就按时间顺序来介绍,构造类似系统时可以参考本书介绍的步骤。本书剩下的部分相当详细地描述了完整的过程,并清晰地给出HTK工具集所涉及的范围。 HTK的发行软件中也包含了一个用于ARPA海军资源管理任务的1000个词的识别系统的例子,放在HTK软件包的目录RMHTK下。在HTKDemo目录下有更多体现HTK性能和功能的实

文档评论(0)

1亿VIP精品文档

相关文档