基于人工智能下语音识别方法与装置及系统研究.docVIP

下载本文档

35
0
约3.05千字
约 7页
2018-08-28 发布于福建
举报
版权申诉

基于人工智能下语音识别方法与装置及系统研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于人工智能下语音识别方法与装置及系统研究

基于人工智能下语音识别方法与装置及系统研究　　摘要：随着科学技术的迅猛发展，信息技术水平显著提升，人工智能诞生并且在社会多个领域得到广泛应用，对人们的生产生活都产生了较大的影响。在信息化时代背景下，人工智能机器作为智能化技术的产物，凭借自身独特的特性得到人们高度关注。本文将对目前人工智能语言识别系统的研究现状进行分析，并对语言识别方式加以阐述。　　关键词：人工智能语音识别方法装置系统　　中图分类号：TP183 文献标识码：A 文章编号：1672-3791（2018）01（c）-0017-02 　　随着科学技术的不断进步，人类已经进入到“智能时代”，机器学习属于智能化领域中一个重点内容。现阶段，人类在语音识别、网络搜索等方面都获得了一定的成就。在人工智能的支持下，能够实现深度问答、自动驾驶等技术的使用，并且在发展过程中，已经超出了人类智能操作功能。在此背景下，应在人工智能基础上，加强对语言识别方式、装置以及系统等研究。　　1 目前人工智能语言识别系统的研究现状　　1956年，人工智能技术被发明出来，引领科学界开始了一场关于机器模拟智能的相关研讨浪潮，而人工智能也作为一门新兴学科，在社会多个领域中得到广泛应用，促进着社会经济的进步与发展，尤其是在语言识别系统的建设方面。　　1.1 在理论研究方面　　目前，随着科学技术的迅猛发展，以往传统的语音识别模式已经难以符合当代需求，虽然以往诸多智能设备中，都能够安装了语音识别软件，可以实现人机对话功能，但在算法以及其他方面，语音识别技术的发展已经进入了瓶颈期，难以得到很大的突破。深度学习模型则能够对人类大脑的学习和感知外界信息进行模拟，在理论研究层面较为丰富和完善。但是，在实际运用的过程中缺乏代表性产品。为了能够真正实现理论与实践的有机结合，使人们的现代化需求得到切实满足，在日后对此方面的研究过程中，应加强对语音信号产生、传播等多个方面进行综合分析，进而使此项技术得到全面发展。　　1.2 在应用研究方面　　近年来，互联网得到了显著的发展和壮大，使得我国社会开始从信息时代迈进智能时代，对于语言识别技术的研究将与时代的发展潮流充分符合，使人们能够从众多渠道和角度中获得原始语音信息。以往对此方面的研究都只是单纯地停留在算法方面，使得数据信息的作用难以得到充分发挥。深度学习理论将能够实现云计算与数据信息的有机结合，进而对数据信息进行直接识别，充分满足了人员对语言数据的应用需求，也使得语言识别系统得到更加良好的发展[1]。　　2 人工智能基础上的语音识别方法　　2.1 语音拾取及特征提取　　在对语音数据的拾取方面主要包括采样和端点检测，其中，采样主要是指通过声卡的作用对语音信息进行收集，然后将其转变为数字化的形式。而端点检测主要是对语音的起点和终点进行确定，属于预处理中的关键内容。在对语音信息进行端点检测时，最常用的算法方式为能量与过零率相结合的方式。另外，在语音识别的过程中，一个十分重要的问题就是特征的选择，良好准确地对特征进行选取，能够使语言之间产生区别，进而对有用语音进行采集，将无用信息进行屏蔽。　　2.2 模拟训练与语音识别　　在此环节中主要包括两个部分：第一，训练，即选取一种恰当的识别方式，采用训练以及聚类的方式获得该汉字的语言参数，并且将其作为参考加以存储。在识别系统中，应对所有系统需要识别的汉字信息进行存储，进而构成一个参考模板库。第二，识别，将带识别文字与参考数据库中的模板进行对比分析之后，以最为相近的字为所识别汉字，主要包括以下3种方式。　　（1）将训练语言所提取的结果作为模板进行直接存储，在进行识别的过程中，将语音信号输入到语音识别系统当中，其将会对汉字的特征进行提取，得到一个待识别字的向量数列，将该序列与模板进行逐一的对比，按照特定的计分或者距离计算出该模板的计分或者距离，并且选择出一个计分或者距离最小的汉字作为识别字。在对距离进行计算的过程中，应注意到训练模板中同一词的瞬时速度之间的差距，因此，应采用时域内弹性匹配概念的方式，对待识别的信号以及模板信号进行计算。　　（2）对于每个待识别汉字来说，其存储方式并不是以特征向量为主，而是采用态图的方式来实现。例如：aij代表由i态向j态转移的概率，而bi则代表i态输出的各特征概率，在具体学习的过程中，将会依照各训练语音特征对aij和bi进行估算，?俗际窃诟?定训练序列中，由原始态向最终态之间的转变，所得到的输出概率和为最大。当aij和bi的数值固定时，每一训练都能够得到相对应的输出概率，可以利用最优路由求法的方式进行解决，也可以根据实际情况，在最优路由的情况下，对计分算法进行设计。在此背景下，学习的主要意义是为了能够对各态模型中的aij和bi进行计算。在具体识别