关于语音识别技术发展趋势分析.docVIP

下载本文档

19
0
约3.28千字
约 8页
2018-06-20 发布于福建
举报
版权申诉

关于语音识别技术发展趋势分析.doc

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

关于语音识别技术发展趋势分析

关于语音识别技术发展趋势分析　　摘要：在2010年前十年间，信息技术领域中发生了众多重大的科技发展，语音识别技术就是其中之一。这种技术包括3个方面：特征提取、模式匹配及模型训练。所涉及的技术范围非常广泛，主要有：信号的处理、人工智能技术的研究、语言控制等方面。而本文通过对语音识别技术的发展历史、发展方向和发展趋势的分析，使大家对语音识别技术的发展有所了解。　　关键词：语音识别；信息技术；发展趋势　　中图分类号：TP391.42 文献标识码：A 文章编号：1007-9599　（2012）　19-0000-02 　　近年来，随着科学技术的进步，语音识别技术的发展，通过语言操纵机器的梦想正在逐步变为现实。语音识别是语音信号处理的一个重要的研究方向，经过50多年的积累研究，尤其是近20年来，语音识别技术取得了显著进步，并且广泛应用于商业，比如苹果的siri系统。本文从语音识别的发展历史、发展方向来着重分析未来语音识别技术的发展趋势。　　1 语音识别技术的发展历史　　1.1 语音识别技术在国际的发展　　早在三四十年前，美国的一些大学和实验室就开始了语音识别技术的研究，50年代的AT　T　Bell实验室研发的Audry系统第一个实现了可识别十个英文数字。60和70年代，提出了线性预测分析技术（LP）等相关理论并深入研究，创造出可以实现特定人孤立语音识别系统；80年代和90年代是语音识别技术应用研究方向的高潮，HMM模型和人工神经元网络（ANN）的成功应用，使得语音识别系统的性能比以往更优异；伴随着多媒体时代的来临，微软，Apple等著名公司都研发出相当成功的商业应用语音识别系统，比如，Apple的Siri系统，微软的Phone　Query　（电话语音识别）引擎等。　　1.2 语音识别技术在国内的发展　　我国的语音识别研究工作虽然起步较晚，但由于国家的重视，研究工作进展顺利，相关研究紧跟国际水平。由于中国有不可忽视的庞大市场，国外对中国的语音识别技术也非常重视，汉语语音语义的特殊性也使得中文语音识别技术的研究更具有挑战。但是，国内研究机构在进行理论研究的同时，应注重语音识别系统在商业中的应用，加快从实验室演示系统到商品的转化。　　现如今，许多用户已经能享受到语音识别技术带来的方便，比如智能手机的语音操作等。但是，这与实现真正的人机交流还有相当遥远的距离。目前，计算机对用户语音的识别程度不高，人机交互上还存在一定的问题，语音识别技术还有很长的一段路要走，必须取得突破性的进展，才能做到更好的商业应用，这也是未来语音识别技术的发展方向。　　2 语音识别技术的技术实现及困难　　语音识别技术的实现方式是声音通过转换装置进入机器，而机器配有“语音辨识”程序，程序将得到的声音样本与数据库存储的样本进行比对，输出最匹配的结果，转化为机器语言，进而执行命令。真正建立辨识率高的语音辨识程序组，是非常困难而专业的，专家学者们研究出许多破解这个问题的方法，如傅立叶转换、倒频谱参数等，使目前的语音辨识系统已达到一个可接受的程度，并具有较高辨识度。　　2.1　语音识别的技术实现方式　　语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面，其中，最基础的就是语音识别单元的选取。　　（1）语音识别单元的选取。语音识别研究的基础是选择语音识别单元。语音识别单元有单词（句）、音节和音素三种，具体选择哪一种语音识别单元由具体研究任务的类型决定：　　单词（句）单元在中小词汇语音识别系统中应用广泛，但由于模型库过于庞大，模型匹配算法复杂，实时性不强，所以不适合大词汇系统；　　音节单元主要应用于汉语语音识别，因为汉语是单音节结构的语言，虽然有大约1300个音节，但无调音节共408个，相对较少，所以音节单元在中、大词汇量的汉语语音识别系统上是可行的。　　音素单元之前曾广泛应用于英语语音识别，也越来越多的应用于中、大词汇量汉语语音识别系统中。原因在于汉语音节仅由22个声母和28个韵母构成，把声母细化，虽然增加了模型数量，但是提高了易混淆音节的区分能力　　（2）特征参数提取技术。特征提取就是对语音信号进行分析处理，把丰富的语音信息中的冗余信息去除，获得对语音识别有用的信息。这是一个对语音信号进行信息压缩的过程，目前经常采用的特征参数提取技术是线性预测（LP）分析技术。基于LP技术提取的倒谱参数再加上Mel参数和基于感知线性预测（PLP）分析提取的感知线性预测倒谱对人耳处理声音的模拟，进一步提高了语音识别系统的性能。　　（3）模式匹配及模型训练技术。早期的语音识别应用的模式匹配和模型训练技术是动态时间归正技术（DTW），它在孤立词语音识别中获得了良好性能，但是由于对大词汇量以及连续语音识别的不准确