语音识别综述解析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
山西大学研究生学位课程论文 (2014 ---- 2015 学年 第 2 学期) 学院(中心、所): 计算机与信息技术学院 专 业 名 称: 计算机应用技术 课 程 名 称: 自然语言处理技术 论 文 题 目: 语音识别综述 授课 教师(职称): 研 究 生 姓 名: 年 级: 学 号: 成 绩: 评 阅 日 期: 山西大学研究生学院 2015年 6 月 2日 语音识别综述 摘要 随着大数据、云时代的到来,我们正朝着智能化和自动化的信息社会迈进,作为人机交互的关键技术,语音识别在五十多年来不仅在学术领域有了很大的发展,在实际生活中也得到了越来越多的应用。本文主要介绍了语音识别技术的发展历程,国内外研究现状,具体阐述语音识别的概念,基本原理、方法,以及目前使用的关键技术HMM、神经网络等,具体实际应用,以及当前面临的困境与未来的研究趋势。 关键词 语音识别;隐马尔科夫模型;神经网络;中文信息处理 引言 语言是人类相互交流最常用、有效的和方便的通信方式,自从计算机诞生以来,让计算机能听懂人类的语言一直是我们的梦想,随着大数据、云时代的到来,信息社会正朝着智能化和自动化推进,我们越来越迫切希望能够摆脱键盘等硬件的束缚,取而代之的是更加易用的、自然的、人性化的语音输入。语音识别是以语音为研究对象,通过对语音信号处理和模式识别让机器自动识别和理解人类口述的语言。 语音识别技术的发展历史及现状 2.1语音识别发展历史 语音识别的研究工作起源与上世纪50年代,当时ATT Bell实验室实现了第一个可识别十个英文数字的语音识别系统——Audry系统。1959年,J.W.Rorgie和C.D.Forgie采用数字计算机识别英文元音及孤立字,开始了计算机语音识别的研究工作。 60年代,计算机应用推动了语音识别的发展。这时期的重要成果是提出了动态规划(DP)和线性预测分析技术(LP),其中后者较好的解决了语音信号产生模型的问题,对后来语音识别的发展产生了深远的影响。 70年代,LP技术得到了进一步的发展,动态时间归正技术(DTW)基本成熟,特别是矢量量化(VQ)和隐马尔科夫(HMM)理论的提出,并且实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。 80年代,实验室语音识别研究产生了巨大的突破,一方面各种连接词语音识别算法被开发,比如多级动态规划语音识别算法;另一方面语音识别算法从模板匹配技术转向基于统计模型技术,研究从微观转向宏观,从统计的角度来建立最佳的语音识别系统。隐马尔科夫模型(HMM)就是其典型代表,能够很好的描述语音信号的时变性和平稳性,使大词汇量连续语音识别系统的开发成为可能,在80年代中期在实践开发中成功应用了HMM模型和人工神经网络(ANN)。1988年Kai-FuLee等用VQ/HMM方法实现的非特定人连续语音识别系统SPHINX是语音识别历史上的一个里程碑。 90年代以后,人工神经网络技术为语音识别开辟了一条新途径,ANN具有自适应性、并行性、鲁棒性、容错性和学习特性,在结构和算法都显示了很大的潜力,更在细化模型的设计、参数提取和优化,以及系统的自适应技术上取得了关键进展,语音识别开始进入实际应用。 2.2语音识别国内外发展现状 近几年语音技术发展迅速,虽然国内对语音识别商业化仍有一些欠缺。但整体来说国内的语音技术研究与国外基本同步。科大讯飞,捷通华声等语音企业相继成立。2010年Google发布的Voice Action支持语音操作与检索,2011年初微软的深度神经网络(DNN)模型在语音搜索任务上获得成功;同年10月苹果公司Siri首次亮相,人机交互开启了新的篇章;国内科大讯飞首次将DNN技术运用到语音云平台;2013年Google发布的Glass使用语音交互,同时苹果公司加大了对iWatch的研发投入,穿戴式语音交互设备成为新热点。 我国在语音识别方面的研究最早起源于1958年,当时中科院声学所通过最简单的电子管电路来完成对10个元音的识别,由于计算机技术的滞后,直到国家执行863计划后,语音识别技术和其他关键技术才得到一定的扶持,研究工作才步入了高速发展时期,目前我们的研究水平基本与国外接轨,在汉语语音识别已经处于领先水平, 3.语音

文档评论(0)

光光文挡 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档