- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第37卷第4期 信 息 化 研 究 V0l|37N0.4
2011年8月 Informatization Research Aug.2011
基于元音长度调整及分组的中文孤立词识别
朱 力,曾毓敏,汪育春,葛倩蓉
(南京师范大学物理科学与技术学院,南京,210046)
摘 要:大量统计结果表 明,语速 的快慢,在一定程度上,会影响语音识别率。为了解决这个 问
题,在原有动态时间规整基础上,论文采用了元音长度调整算法,先找 出元音部分的一个完整周期,再
通过插入或者删除相似波形,以达到调整语速的效果。论文提 出了元音分组算法,分别对元音按照类
型、相似性以及长度进行分组。给不同的分组使用不同的阈值进行计算,以提高识别率。
关键词:中文孤立词;动态时间规整;元音长度调整;语速调整;元音分组
中图分类号:TN912.3
0 引 言 别范围内则进行调整,否则不进行调整。
(4)该算法流程 图,如图2所示 。调整完毕后 ,测
当今社会 中,语音识别系统的应用越来越广泛,
试调整结果 ,确定元音调整后的长度 ,在可识别范围
所以提高其识别率是发展它的一个重要途径。在识
内,则结束调整过程。
别过程 中,由于人 自身发音长短不同的问题 ,会导致
识别率下降,本文想通过改善发音的长短问题 ,尽可
能通过某种方法,将人们的发音调整为某一个范围之
内,使得它能够配合语音识别系统,使其识别率得到
大幅度的提高。 ’
近年来,学术界对这一 问题开展了广泛研究,提
出了一些实现算法,归纳起来主要有 :动态时间规整
算法”、波形叠加压扩法 I、波形时长修正法。、音元的
复制与抽取法 。这些方法虽然在一定程度上 ,可以
解决发音长短不同的问题,但对于识别率的提高并没
有特别显著的效果。诸如波形叠加压扩法,容易使得
语音波形失真,造成识别率下降。
针对 以上问题 ,本文研究了元音长度调整算法 ,
并对该算法做 了一些改进 ,同时提出了元音分组算
法 ,分别对元音按照类型、相似性 以及长度不同进行
分组 。通过给不同的元音分组,使用不同的阈值参数 图1 语音语速调整流程 图
去计算 ,从而达到提高识别率的效果。
1.2 判断元音起止点
1 元音长度的调整算法原理 从语音的第一个采样点开始,计算整个语音段的
振幅阈值 ,STL(低振幅阈)及STU(高振幅阈)。具体
1.1 语音语速调整的基本思想
的方法:将每个采样点的振幅值存入数组M,其中最
本文中语速调整算法步骤如下 :
大值记为SMX,最小值记为SMN,通过公式 :
(1)首先输入待识别的语音。
fI1:kl(SMX—SMN)+SMN (1)
(2)根据短时平均振幅分析语音数据的元音起止 1I2:k2*SMN (2)
点。
fSTL=MINfI1,I21 (3)
(3)根据元音长度,
文档评论(0)