基于HHM的实时数字串语音识别系统.pdfVIP

下载本文档

32
0
约6.96千字
约 5页
2017-03-17 发布于广东
举报
版权申诉

基于HHM的实时数字串语音识别系统.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于HHM的实时数字串语音识别系统.pdf

基于HHM的实时数字串语音识别系统景新幸1陈远鹏2 1桂林电子工学院教学实践部桂林541004 2桂林电信分公司桂林541001 摘要：要实现实时的语音识别，首先必须要选择一个合适的识别数学模型并且训练出该模型的模型特征参数。为此，本文通过对不同的识别模型在PC机上进行识别，并从识别过程中找到一些误识别的规律，再从发音上对这些规律进行分析，得到了一些有用的结论，并把这些结论用到系统的建模中；最后选择出一个适合实时系统设计的模型，即以词为识别单元、以lo阶LPCC参数加能量参数加10阶LPCC一阶差分倒谱参数加差分能量参数构成的22阶的HMM．CD模型，训练出该模型的模型参数表。关键词：语音识别实时数字连接词HMM识别率 1 引言语音识别的研究工作大约开始于20世纪50年代，当时ATTBell实验室实现了第一个 Tune Markov Model)等理论的先后出现和应用，语音识别技术得到了飞速的发展。进入90年代，随着多媒体时代的来临，迫切要求语音识别系统从实验室走向实用。许多发达国家如美国、日本、韩国以及IBM、Appie、ATT、N盯等著名公司，都为语音识别系统的实用化开发研究投以巨资。我国语音识别研究工作一直紧跟国际水平，国家也很重视，并把大词汇量语音识别的研究列入”863”计划，由中科院自动化所、声学所及北京大学等单位研究开发。鉴于中国未来庞大的市场，国外也非常重视汉语语音识别的研究。．美国、新加坡等地聚集了一批来自大陆、台湾、香港等地的学者，研究成果已达到相当高水平。目前语音识别研究的方向是生理学和自然语言处理与语音识别技术的结合。因此，国内除了要加强理论研究外，更要加快从实验室演示系统到商品的转化。语音识别从语音讲述方式来分一般可以分成孤立词、连接词、和连续语音三种识别方式；按说话人来分一般可分为非特定人与特定人两种。对每一种讲述方式的识别，目前常采用的识别方式有两种：一是采用模式识别的方法也就是模板匹配法来实现，一是采用统计的方法来实现。用模式识别的方法是把任何一串待识别的语音看成是一个模式(pattern)，通过把事先已经训练好了的语音模板库中的模板与待识别的模式在一定的规则下对某个参数(通常为欧氏距离)进行比较，从中选出在这个准则下(通常为最小畸变准则)最优的模板作为被识别的 ·424· 语音串的内容。这种方法思路比较简单，对于特定人的孤立词和连接词的识别也比较有效。但是当用于非特定人或中大词汇量时，它的识别效果就会急剧下降，计算量也明显增大。这种方法在目前的语音识别研究中已很少采用。用统计的方法来实现是把一串待识别的语音看成是由一组隐马尔可夫过程(HMM)构成。把待识别的语音串看成—个观测序列，然后采用一定的规则(最大后验概率)，利用已经训练好了的HMM参数，计算这些观测序列所符合的HMM状态的一条最优的转移路径，并判决由这条路径构成的内容就是待识别的语音串的内容。该方法采用了与语音比较相似的模型，因此有比较好的识别效果，特别是在非特定人和中大词汇量的情况下，比模式识别的方式有效，所以是目前采用得比较多的识别方法。语音识别技术在近十年得到迅速发展，它具有其自身的发展特点，这些特点对理解语音识别技术的开发和应用具有重要意义。这些特点概括起来有如下几点： (1)语音识别在受限条件下已取得重大进展，在技术上相对比较成熟。例如办公环境下具有说话人自适应能力的专用文本标准语音听写识别，恶劣环境下的专用小词汇量识别，小词汇量非特定人命令识别；小词汇量关键词检测；专用领域的中、小词汇人机对话等等；事实上，对于许多应用来说，并不需要一个系统具有像人类能力一样的高级识别能力，一个系统只要对一组词汇或命令能进行比较一致的区分，它就可能为用户提供一个有效的工具来完成任务。这一点决定了现有的语音识别技术已经具备了完成越来越多的实际应用需求的能力。 (2)除了一些通用环境下的语音识别外，几乎所有的系统都需要针对某一个应用进行工程化的设计和实现。对于不同的应用系统解决问题的着重点不一样，而目前的语音识别还不能在同一框架下去解决所有复杂的问题，因而有针对性地解决问题的方法至关重要。这需要遵循一定的开发模式，这种开发模式从应用的提出、识别