- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
Classified Index: TP391.42
U.D.C: 681.3
Dissertation for the Doctoral Degree in Engineering
RESEARCH ON AUTOMATIC EVALUATION
METHODS OF MANDARIN PRONUNCIATION
QUALITY
Candidate : Zhang Long
Supervisor : Prof. Li Haifeng
Academic Degree Applied for : Doctor of Engineering
Speciality : Computer Science and Technology
Affiliation : School of Computer Science and
Technology
Date of Defence : September, 2014
Degree-Conferring-Institution : Harbin Institute of Technology
万方数据
摘 要
摘 要
发音质量自动评测(以下简称“评测”)是计算机辅助语言学习及口语考
试中的核心技术问题,其研究成果对提高学习者学习的灵活性和满意度,减
少人工阅卷的主观性和不稳定性,降低投入成本,提高实效性,具有重要的
理论意义和科学价值,应用前景广阔。随着国内普通话的大力推广和普及,
以及国外汉语学习热潮的快速兴起,针对汉语普通话的评测技术实际需求强
劲,且更具特色和挑战性,有必要深入系统地研究。
汉语是一种单音节声调语言,每个音节包括声母、韵母和声调三部分,
音节间界限较分明,有鲜明的轻重音和儿化音。汉语音节的三元结构及音韵
特点与英语语音差异较大,需要结合汉语特点,在表征、建模和计算等方面
进行针对性研究和创造性方法改进。此外,现有主流评测方法在基本发音单
元(声韵母、声调等)评测上的准确性还不够理想,无法满足精细评测任务
和较高水平说话人评测任务的实际需求,需要在声学建模和置信度计算等方
面进行改进,以提高声学模型的精度和评测模型的准确度。
本文重点研究母语人群的汉语普通话评测方法。在声韵母评测方面,针
对当前主流的发音良好度(Goodness of pronunciation ,GOP )算法存在的切
分不准、计算精度低、模型间区分性差等问题,提出一种基于音素混淆概率
矩阵的评测方法。该方法通过计算音素混淆概率矩阵来构建每个音素的混淆
音素集合,一方面利用混淆音素集合建立音素混淆限制识别网络,提高音素
段切分的准确性;另一方面,引入音素混淆先验概率,把混淆音素集合作为
后验概率的计算空间,提高计算精度和模型间的区分性。为扩大发音的评测
范围,提高声学模型的覆盖范围,提出一种基于扩展发音空间的评测方法。
该方法利用错误发音样本数据,扩展标准发音空间,对标准发音的各类发音
错误进行精细建模,并在这个扩展后的发音空间内进行后验概率计算,计算
更加准确和有效。同时,针对包含错误发音的数据获取容易,但标注困难,
且工作量巨大的问题,设计对错误发音样本聚类的非监督学习方法,以及发
音模型的自动更新方法,来持续提高评测模型的准确性。鉴于上述方法都是
单维置信度计算加阈值判断还不够鲁棒,提出一种基于系统融合的多维置信
度的评测方法。该方法依次计算待评测语音段相对于其对应音素的混淆音
文档评论(0)