- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于HMM算法的仿人机器人语音识别技术的研究-计算机科学与技术专业论文
Classified Index: TN912.34 U.D.C: 004.93
Dissertation for the Master Degree in Engineering
THE RESEARCH OF HUMANOID ROBOT SPEECH RECOGNITION BASED ON HMM ALGORITHM
Candidate: He Xingmin
Supervisor: Prof. Wang Hongpeng
Academic Degree Applied for: Master of Engineering
Specialty: Computer Science and Technology
Affiliation: Shenzhen Graduate School
Date of Defence: December, 2013
Degree-Conferring-Institution: Harbin Institute of Technology
摘 要
目前随着科学技术的发展,人们对人机交互的方式提出了更高的要求。用 什么来代替笨拙的键盘或按键,是人们一直在致力解决的问题,而语言则是人 类最方便、快捷有效的交流工具,因此语音识别技术应运而生并且取得了飞速 的发展。语音识别技术就是让机器通过语音采集、特征提取、建模等一系列的 过程后,将音频信号变为人类看到的文本文字的一种技术。目前语音识别技术 经由几十年的研究业已获得了很大的成果,一些语音产品已经投入市场使用, 其中语音机器人产品也得到应用。
本文致力于仿人机器人语音识别技术的研究,并采用隐马尔可夫模型算法 成功实现了仿人机器人的语音口令控制系统。不同于 PC 机上的系统,仿人机 器人语音识别有其自身的局限性,其中噪音是本文主要的影响因素,另外当前 的 HMM 算法存在局部最优问题,因而如何降噪和对 HMM 算法的改进是本文 要解决的主要问题。
首先,本文对语音识别的原理和实现流程做了深入研究,在特征提取中选 用了具有良好的辨别力和抗干扰性的梅尔倒谱系数,对于非特定人识别采用 HMM 模 型 , 对 HMM 模 型 的 三 个 经 典 问 题 的 Back-forword 、 Viterbi 和 Baum-welch 算法进行深入剖析后,针对 Baum-welch 的局部最优和收敛速度慢 等缺点,进一步采用了 K 均值算法进行改进。然后,对实验室环境下的噪音和 机器人本身自带的机器噪音利用改进的频谱减法进行了抗干扰设计,提高了识 别率。最后对仿人智能机器人的系统控制方案和硬件平台设计搭建进行了介绍, 并做算法移植。对实验结果在不同实验条件下、不同说话风格、异性之间音频 的区别、双通道输入等做了较全面的比较与分析,充分证明了系统的健壮性和 适用性。
关键词:仿人机器人;隐马尔科夫模型;K 均值算法;频谱减法;
-I-
Abstract
Science and technology is increasingly developed, electronic devices will becom smaller and smaller which has more challenge, which has put forward higher requirements for the way of human-computer interaction. What to be used to replace the clumsy keyboard or keys is a big problem that people have been efforts to solve. The convenient, efficient,effective tool to communicate is human language, so voice recognition technology comes into being and has made rapid development. The speech recognition technology is that through the transformation of speech acquisition, feature extraction and modeling the machine turn audio frequency into a plain text. In recent years, ASR technology now has achieved a lot, which has take the technology leave for the market from t
您可能关注的文档
- 基于HHT的语音情感识别分析-物理电子学专业论文.docx
- 基于HHT的非平稳信号特征提取方法及应用研究-控制科学与工程专业论文.docx
- 基于HHT的语音情感识别技术研究-计算机科学与技术专业论文.docx
- 基于HI3515开发板的视频监控系统设计-电子与通信工程专业论文.docx
- 基于HHT的磁控自动焊接系统的研究-机械工程专业论文.docx
- 基于HHT算法的定时抖动研究-通信与信息系统专业论文.docx
- 基于Hi3518E的嵌入式门禁设计-控制科学与工程专业论文.docx
- 基于Hi3515的视频传输终端的设计与实现-信号与信息处理专业论文.docx
- 基于hi+2011的数字机顶盒的设计实现-检测技术与自动化装置专业论文.docx
- 基于HIBERNATE的JAVA对象持久化-计算机应用技术专业论文.docx
- 基于HMM的语音识别技术的研究-计算机应用技术专业论文.docx
- 基于HMM的情感语音识别-信号与信息处理专业论文.docx
- 基于hog特征的教室人数拥挤度检测系统的设计与实现-软件工程专业论文.docx
- 基于HOG特征的人脸表情识别算法研究-信号与信息处理专业论文.docx
- 基于HOG特征的交通标志检测与识别算法研究-交通信息工程及控制专业论文.docx
- 基于hms30c7202嵌入式平台设计与应用-电路与系统专业论文.docx
- 基于HOG特征LBP特征的人脸识别方法研究-控制工程专业论文.docx
- 基于HOG特征的人脸识别系统研究-信号与信息处理专业论文.docx
- 基于HOG的熵流导航方法-控制工程专业论文.docx
- 基于HNC理论的期刊文献知识组织研究-信息管理与电子政务专业论文.docx
文档评论(0)