神经网络语音识别的研究及进展.pdfVIP

下载本文档

15
0
约1.99万字
约 6页
2017-08-18 发布于江西
举报
版权申诉

神经网络语音识别的研究及进展.pdf

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

神经网络语音识别的研究及进展.pdf

维普资讯／一 A摘要论述了在语音识别中听觉神经网络模型、 BP同络、时延神经同络、自组织影射、学习矢量量化和神经I$,0．1N 络的优缺点及神经网络语音识别的发展动态。关键词匿童堡型芷丝旦垫哩堕堡兰 -rA／ i孚汇及20000词汇的识别率分别为97．1 和94．6 1 引言 INRS依赖于话者的系统，75000词汇的识别率为 80年代中期开始了神经网络的第二次研究高 89．5 。HMM 之所以在语音识别中应用较为成功，嘲，人工神经网络 (ANN)具有自适应性、并行性、非主要是它具有较强的对时间序列结构的建模能力。线性、鲁棒性、容错性和学习特性，近年来发展迅速，尽管如此，HMM 技术也存在缺点，它不同于人脑的并被用于语音识别领域，在结构和算法上都显示出处理理解方式，其自适应能力、鲁棒性都不理想，主实力。它可以联想模式对，将复杂的声学信号影射为要表现在对低层次的声学音素建模能力差，使声学不同级别的语音学和音韵学的表示．不必拘束于选上相似的词易混淆+对高层次语音理解或语义建模取特殊的语音参数．而对综合的输入模式进行训练能力差，这使它仅能接受有限状态或概率文法等简和识别，可把听觉模型融于同络模型之中。ANN用单应用场合由于～阶HMM 假设输出是相互独立于语音识别需要解决几个问题，一是如何使ANN 的，它很难直接用模型描述协同发音．另外HMM 具有一定的反应语音时变特性的能力；二是基本神需对状态的分布作先验假设+而它并不一定适宜于经网络的输入节点是固定的，而语音信号的时长变语音信号化都很大，两者之间的矛盾如何解决}三是ANN学 3 人工神经网络 (ANN)模型习时间太长+随着网络增大，该问题尤为突出；四是要考虑语音识别基元在语音流中的稳定性，识别基通常语音识别神经阿络可分为两大类，一类是元越小，计算量也越小，但同时带来的问题是怎样分神经网络或神经网络与传统的HMM、DP相结合的割和定位小基元所对应的语音段，另~b11,基元在转混合网络，另一类是根据人耳听觉生理学、心理学研换至音节、词和句子时，所需的规则很难描述。目前究成果建立听觉神经网络模型。主要从以下几个方的研究是找到对语音信号更强有力的神经网络面做工作： (NN)模型．更适宜的激活函数，更高速有效的学习 1)缩小建模单元，一般在音素上建模，通过提算法和更合理的结构。高音素的识别率来提高整个系统的正识率。 2)对声学模型、听觉模型、大脑运行机制进行 2 隐马尔可夫模型(HMM)和它的缺陷深入研究，对语音信号引进上下文信息，以减少语音大词汇量、连续语音的非特定人语音识别系统多变化的影响。大多数是基于 HMM 方法，它在语音识别中起着非 3)从语音信号中提取多种特征，采用混合网络常重要的作用．该方法已日臻成熟。如SPHINX语模型，并应用多种知识源(音素、词汇、句法、词意)进音识别系统。]，对997个词的连