智能机器人语音识别技术.docxVIP

下载本文档

59
0
约4.01千字
约 8页
2021-12-06 发布于天津
举报
版权申诉

智能机器人语音识别技术.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

.专业整理 .专业整理. . .学习帮手. 智能机器人语音识别技术 : 占博学号：201215715 关键词：智能机器人; 语音识别；隐马尔可夫模型 DSP 摘要：给出了一种由说话者说出控制命令，机器人进行识别理解，并执行相应动作的实现技术。在此，提出了一种高准确率端点检测算法、高精度定点 DSP动态指数定标算法，以解决定点DSP实现连续隐马尔科夫模型 CHM识别算法时所涉及的大量浮点小数运算问题，提高了定点DSP实现的实时性、精度，及其识别率。关键词：智能机器人；语音识别；隐马尔可夫模型；DSP 1语音识别概述语音识别技术最早可以追溯到 20世纪50年代，是试图使机器能“听懂”人类语音的技术。按照目前主流的研究方法，连续语音识别和孤立词语音识别采用的声学模型一般不同。孤立词语音识别一般采用 DTW动态时间规整算法。连续语音识别一般采用 HMM模型或者 HMM与人工神经网络 ANN相结合。语音的能量来源于正常呼气时肺部呼出的稳定气流，喉部的声带既是阀门，又是振动部件。语音信号可以看作是一个时间序列，可以由隐马尔可夫模型 (HMM进行表征。语音信号经过数字化及滤噪处理之后，进行端点检测得到语音段。对语音段数据进行特征提取，语音信号就被转换成为了一个向量序列，作为观察值。在训练过程中，观察值用于估计 HMM 的参数。这些参数包括观察值的概率密度函数，及其对应的状态，状态转移概率等。当参数估计完成后，估计出的参数即用于识别。此时经过特征提取后的观察值作为测试数据进行识别，由此进行识别准确率的结果统计。训练及识别的结构框图如图 1所示。 S 1 语音祺躋卓构框團 1. 1端点检测找到语音信号的起止点，从而减小语音信号处理过程中的计算量，是语音识别过程中一个基本而且重要的问题。端点作为语音分割的重要特征，其准确性在很大程度上影响系统识别的性能。能零积定义：一帧时间围的信号能量与该段时间信号过零率的乘积。能零积门限检测算法可以在不丢失语音信息的情况下，对语音进行准确的端点检测，经过450个孤立词(数字“ 0?9”)测试准确率为 98%以上，经该方法进行语音分割后的语音，在进入识别模块时识别正确率达 95%。当话者带有呼吸噪声，或周围环境出现持续时间较短能量较高的噪声，或者持续时间长而能量较弱的噪声时，能零积门限检测算法就不能对这些噪声进行滤除，进而被判作语音进入识别模块，导致误识。图 2(a)所示为室环境，正常情况下采集到的带有呼气噪声的数字“ 0?9”的语音信号，利用能零积门限检测算法得到的效果示意图。最前面一段信号为时附4).A 08呼气噪声，之后为数字“ 0?9”的语音。时附 4).A 08 从图2(a)直观的显示出能零积算法在对付能量较弱，但持续时间长的噪音无能为力。由此引出了双门限能零积检测算法。所谓的双门限能零积算法指的是进行两次门限判断。第一门限采用能零积，第二门限为单词能零积平均值。也即在前面介绍的能零积检测算法的基础上再进行一次能零积平均值的判决。其中，第二门限的设定依据取决于所有实验样本中呼气噪声的平均能零积及最小的语音单词能零积之间的一个常数。如图 2(b)所示，即为图2(a)中所示的语音文件经过双门限能零积检测算法得到的检测结果。可以明显看到，最前一段信号，即呼气噪声已经被视为噪音滤除。 1. 2隐马尔可夫模型 HMM 隐马尔可夫模型，即HMM是一种基于概率方法的模式匹配方法。它的应用是20世纪 80年代以来语音识别领域取得的重要成果。一个HMM模型可以表示为： A = (jr.Arfi) (1 式中：n为初始状态概率分布，n i=P(q1= 0 i) , K i N,表示初始状态处于 Qi 的概率；A为状态转移概率矩阵，(aij)N x N, aij=P( qt+1 = 0 j|qt= 0 i) , 1 i , j N; B 为观察值概率矩阵，B={bj(ot)} , j=1 , 2，…，N,表示观察值输出概率分布，也就是观察值ot处于状态j的概率。 1. 3模型训练 HMM有多种结构类型，并且有不同的分类方法。根据状态转移矩阵(A参数)和观察值输出矩阵(B参数)的不同有不同类型的 HMM 对于CHMM模型，当有多个观察值序列时，其重估公式由参考文档给出，此处不再赘述。 1. 4概率计算利用HMM勺定义可以得出 P(O|入)的直接求取公式： P(O I A) — 2 箕』输(伽》… | 式(2)计算量巨大，是不能接受的。Rab in er提出了前向后向算法，计算量大大减小。定义前向概率： ?f (i)=卩畑心严— I A C3 那么有昧 1)初始化】 ai (i) — C4) (2) Mt N (J