基于人工智能下语音识别方法与装置及系统研究.docVIP

基于人工智能下语音识别方法与装置及系统研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于人工智能下语音识别方法与装置及系统研究

基于人工智能下语音识别方法与装置及系统研究   摘 要:随着科学技术的迅猛发展,信息技术水平显著提升,人工智能诞生并且在社会多个领域得到广泛应用,对人们的生产生活都产生了较大的影响。在信息化时代背景下,人工智能机器作为智能化技术的产物,凭借自身独特的特性得到人们高度关注。本文将对目前人工智能语言识别系统的研究现状进行分析,并对语言识别方式加以阐述。   关键词:人工智能 语音识别方法 装置系统   中图分类号:TP183 文献标识码:A 文章编号:1672-3791(2018)01(c)-0017-02   随着科学技术的不断进步,人类已经进入到“智能时代”,机器学习属于智能化领域中一个重点内容。现阶段,人类在语音识别、网络搜索等方面都获得了一定的成就。在人工智能的支持下,能够实现深度问答、自动驾驶等技术的使用,并且在发展过程中,已经超出了人类智能操作功能。在此背景下,应在人工智能基础上,加强对语言识别方式、装置以及系统等研究。   1 目前人工智能语言识别系统的研究现状   1956年,人工智能技术被发明出来,引领科学界开始了一场关于机器模拟智能的相关研讨浪潮,而人工智能也作为一门新兴学科,在社会多个领域中得到广泛应用,促进着社会经济的进步与发展,尤其是在语言识别系统的建设方面。   1.1 在理论研究方面   目前,随着科学技术的迅猛发展,以往传统的语音识别模式已经难以符合当代需求,虽然以往诸多智能设备中,都能够安装了语音识别软件,可以实现人机对话功能,但在算法以及其他方面,语音识别技术的发展已经进入了瓶颈期,难以得到很大的突破。深度学习模型则能够对人类大脑的学习和感知外界信息进行模拟,在理论研究层面较为丰富和完善。但是,在实际运用的过程中缺乏代表性产品。为了能够真正实现理论与实践的有机结合,使人们的现代化需求得到切实满足,在日后对此方面的研究过程中,应加强对语音信号产生、传播等多个方面进行综合分析,进而使此项技术得到全面发展。   1.2 在应用研究方面   近年来,互联网得到了显著的发展和壮大,使得我国社会开始从信息时代迈进智能时代,对于语言识别技术的研究将与时代的发展潮流充分符合,使人们能够从众多渠道和角度中获得原始语音信息。以往对此方面的研究都只是单纯地停留在算法方面,使得数据信息的作用难以得到充分发挥。深度学习理论将能够实现云计算与数据信息的有机结合,进而对数据信息进行直接识别,充分满足了人员对语言数据的应用需求,也使得语言识别系统得到更加良好的发展[1]。   2 人工智能基础上的语音识别方法   2.1 语音拾取及特征提取   在对语音数据的拾取方面主要包括采样和端点检测,其中,采样主要是指通过声卡的作用对语音信息进行收集,然后将其转变为数字化的形式。而端点检测主要是对语音的起点和终点进行确定,属于预处理中的关键内容。在对语音信息进行端点检测时,最常用的算法方式为能量与过零率相结合的方式。另外,在语音识别的过程中,一个十分重要的问题就是特征的选择,良好准确地对特征进行选取,能够使语言之间产生区别,进而对有用语音进行采集,将无用信息进行屏蔽。   2.2 模拟训练与语音识别   在此环节中主要包括两个部分:第一,训练,即选取一种恰当的识别方式,采用训练以及聚类的方式获得该汉字的语言参数,并且将其作为参考加以存储。在识别系统中,应对所有系统需要识别的汉字信息进行存储,进而构成一个参考模板库。第二,识别,将带识别文字与参考数据库中的模板进行对比分析之后,以最为相近的字为所识别汉字,主要包括以下3种方式。   (1)将训练语言所提取的结果作为模板进行直接存储,在进行识别的过程中,将语音信号输入到语音识别系统当中,其将会对汉字的特征进行提取,得到一个待识别字的向量数列,将该序列与模板进行逐一的对比,按照特定的计分或者距离计算出该模板的计分或者距离,并且选择出一个计分或者距离最小的汉字作为识别字。在对距离进行计算的过程中,应注意到训练模板中同一词的瞬时速度之间的差距,因此,应采用时域内弹性匹配概念的方式,对待识别的信号以及模板信号进行计算。   (2)对于每个待识别汉字来说,其存储方式并不是以特征向量为主,而是采用态图的方式来实现。例如:aij代表由i态向j态转移的概率,而bi则代表i态输出的各特征概率,在具体学习的过程中,将会依照各训练语音特征对aij和bi进行估算,?俗际窃诟?定训练序列中,由原始态向最终态之间的转变,所得到的输出概率和为最大。当aij和bi的数值固定时,每一训练都能够得到相对应的输出概率,可以利用最优路由求法的方式进行解决,也可以根据实际情况,在最优路由的情况下,对计分算法进行设计。在此背景下,学习的主要意义是为了能够对各态模型中的aij和bi进行计算。在具体识别

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档