发音质量自动评估算法地研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
发音质量自动评估算法的研究 董滨 赵庆卫 颜永红 (中国科学院声学研究所 北京 100080) Stu勿onAlgorithmofAutomaticAssessmentofPronunciationQuality DongBin,ZhaoQingwei,YanYonghong (InstituteofAcoustics,ChineseAcademyofSciences,Beijing100080) 1.引言 随着信息技术的发展,计算机辅助学习软件已经从最初的只能进行阅读、听力、简单的 输入等功能,发展到计算机可以给学习者反馈有关学习成果的信息。信息的反馈对于学习者 十分重要。尤其是语言学习软件,学习者如果能够得到自己发音质量优劣的反馈将十分有利 于初学者对语言的掌握。所以,对自动发音评估的方法进行研究,显得尤为重要,而且这个 课题对语言学习来说具有很高的实际意义。 发音质量评估算法作为计算机辅助语言学习的重要组成部分,包括对学习者发音正确性 的评估和对学习者发音韵律的评估。图1是发音质量评估系统的框图。学习者的语音首先通 过语音识别系统,得到相应的发音正确性的得分;同时,通过语音韵律分析系统,得到相应 的发音韵律的得分,两部分得分的综合便是对学习者当前语句发音质量的评估。 图I发音质量评估系统框图 2.发音正确性评估算法 对发音质量进行评估,首先是对发音正确性的评估,发音的正确性是对任何一门语言掌握 的基础。 我们使用的基于隐马尔可夫模型 (HMIM)的自动语音识别系统 (ASR),是与文本和说话人 无关的识别系统。如果假设识别系统的声学模型能够代表最正确的发音,从而作为参考发音, 那么学习者的发音通过识别系统的识别,在系统解码过程中所得到的最佳搜索路径中每个音 素的后验概率就可以表示它与参考发音的接近程度,即发音的正确程度。 发音的持续时间也是一个重要的参数,语速的快慢并不能代表发音质量的高低。我们所采 用的语音识别算法,不仅可以得到输入语音的语句发音持续时间,还可以得到每个音素和每 个词的发音持续时间。结合输入语音的每个音素的持续时间和最佳搜索路径中的相应音素的 后验概率,可以对学习者发音的正确性进行评估。发音持续时间在其中的作用是对音素的后 验概率进行规一化,以在一定程度上消除语速快慢对评估结果的影响。采用后验概率结合发 音持续时间进行打分的方法如下式所示: GGPOOPq((、);=卜d1.r,言ilogPq(;,、, (1) 其中 P(qj[Yt)=P(Yr}qr)p(q,) (2) I,(:1、,),(、,) 试是音素q;的发音持续时间。Yt是当前时刻的观测值。M是系统所使用的模型中音素的 个数 ·t,是音素qr出现的起始时间。 同时,我们可以根据每个词中的音素的个数和每个句子中的词的个数,以对音素的评估为 基础,在词和句子的级别上对学习者的发音进行评估。 3.发音韵律评估算法 语言学习者在学习自己母语以外的第二种语言时,首先是要学习字和词的发音,然后才能 是句子的发音。因为对句子的发音,不仅要对组成句子的每个词和字发音正确,还要掌握句 子的韵律特征。仅仅掌握字和词的发音,对于学习一种语言来说,是远远不够的。 对学习者的发音进行评估,韵律评估是不可缺少的,特别是对于中高级的学习者。语言的 韵律特征包括音调、重读、音长等。在我们的语音韵律分析系统中,使用基音频率和能量作 为特征,对学习者的发音韵律进行评估。 3.,语音的基音频率 语音的基音频率是反应语音韵律的重要特征。而学习语言的初学者特别是非母语国家的 学习者,在学习阶段一般只重视每个词的发音正确程度和发音方法,而往往忽视了对整个句 子发音韵律的掌握,以至于在发音韵律上把握不准。我们把语音的基音频率作为对发音质量 进行评估的重要特征之一。采用基频的平均变化率作为评估时使用的特征参数。基频的平均 变化率即各帧语音信号基频差分的绝对值的平均值,定义如下: 。

文档评论(0)

july77 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档