基于元音长度调整及分组的中文孤立词识别.pdfVIP

下载本文档

6
0
约1.21万字
约 4页
2017-09-11 发布于安徽
举报
版权申诉

基于元音长度调整及分组的中文孤立词识别.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第37卷第4期信息化研究 V0l|37N0．4 2011年8月 Informatization Research Aug．2011 基于元音长度调整及分组的中文孤立词识别朱力，曾毓敏，汪育春，葛倩蓉 (南京师范大学物理科学与技术学院，南京，210046) 摘要：大量统计结果表明，语速的快慢，在一定程度上，会影响语音识别率。为了解决这个问题，在原有动态时间规整基础上，论文采用了元音长度调整算法，先找出元音部分的一个完整周期，再通过插入或者删除相似波形，以达到调整语速的效果。论文提出了元音分组算法，分别对元音按照类型、相似性以及长度进行分组。给不同的分组使用不同的阈值进行计算，以提高识别率。关键词：中文孤立词；动态时间规整；元音长度调整；语速调整；元音分组中图分类号：TN912．3 0 引言别范围内则进行调整，否则不进行调整。 (4)该算法流程图，如图2所示。调整完毕后，测当今社会中，语音识别系统的应用越来越广泛，试调整结果，确定元音调整后的长度，在可识别范围所以提高其识别率是发展它的一个重要途径。在识内，则结束调整过程。别过程中，由于人自身发音长短不同的问题，会导致识别率下降，本文想通过改善发音的长短问题，尽可能通过某种方法，将人们的发音调整为某一个范围之内，使得它能够配合语音识别系统，使其识别率得到大幅度的提高。 ’ 近年来，学术界对这一问题开展了广泛研究，提出了一些实现算法，归纳起来主要有：动态时间规整算法”、波形叠加压扩法 I、波形时长修正法。、音元的复制与抽取法。这些方法虽然在一定程度上，可以解决发音长短不同的问题，但对于识别率的提高并没有特别显著的效果。诸如波形叠加压扩法，容易使得语音波形失真，造成识别率下降。针对以上问题，本文研究了元音长度调整算法，并对该算法做了一些改进，同时提出了元音分组算法，分别对元音按照类型、相似性以及长度不同进行分组。通过给不同的元音分组，使用不同的阈值参数图1 语音语速调整流程图去计算，从而达到提高识别率的效果。 1．2 判断元音起止点 1 元音长度的调整算法原理从语音的第一个采样点开始，计算整个语音段的振幅阈值，STL(低振幅阈)及STU(高振幅阈)。具体 1．1 语音语速调整的基本思想的方法：将每个采样点的振幅值存入数组M，其中最本文中语速调整算法步骤如下：大值记为SMX，最小值记为SMN，通过公式： (1)首先输入待识别的语音。 fI1：kl(SMX—SMN)+SMN (1) (2)根据短时平均振幅分析语音数据的元音起止 1I2：k2*SMN (2) 点。 fSTL=MINfI1，I21 (3) (3)根据元音长度，