- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
精品文档,助力人生,欢迎关注小编!
基于微格矢量化编码与缺陷跟踪的汉语语音数据采集研究
打开文本图片集
摘要:本文以老挝留学生为例,阐述了采集其汉语语音数据的基本原则和基本过程,同时提出了一种使用微格VQF音频技术(Transform-domain WeightedI Nterleave Vector Quantization)和缺陷跟踪机制(Defect Tracking Mechanism)来采集数据的方法,避免了传统语音数据采集过程中的弊端,使采集到的语音数据准确、规范,从而提高老挝学生汉语语音习得的效率,为建立东南亚留学生汉语语音库奠定了坚实的数据基础。
Abstract: Depending on the Chinese pronunciation of Lao students,the article demonstrates the fundamental principals and process of data collecting on pronunciation performance, furthermore introduces a method which collects evaluation data through VQF technique in Micro Teaching and the defect-tracking mechanism. It has challenged the present process of data collecting of Chinese pronunciation. As a result, the collected data with accuracy and regularity will be gained and the efficiency of Lao′s pronunciation learning will be improved, and the data base of Chinese pronunciation for foreign students from southeast of Asia will be built.
关键词:矢量化编码;缺陷跟踪;语音;数据采集
Key words: VQF;defect-tracking mechanism;pronunciation;data collecting
中图分类号:O157.4 文献标识码:A 文章编号:1006-4311(2020)02-0149-03
0 引言
发音在留学生汉语学习及交流中起着举足轻重的作用,如何对汉语学习者的发音做出科学、有效的评价一直是语音评价研究的热点,而数字化的语音则是评价的主体和前提基础。近年来,国内对汉语语音识别、语音评价系统做了大量研究,主要成果如下:袁毅、吴晨[1]提出了柔性可扩展体系结构非特定人语音识别系统的框架模型,验证了在该模型指导下所开发出的语音识别系统的实用性和稳定性;施伟[2]提出了对外汉语教学中的发音自动评价系统,通过分析输入语音数据,提取语音特征并与参考标准进行匹配比较,由评分机制根据相似程度大小给出相应的评价;施剑等人[3]提出了一种基于USB2.0接口芯片ISP1581,并采用FPGA芯片EP1C3T144实现麦克风阵列语音数据采集的方法。就以上研究而言,大部分停留在理论和实验甚至停滞阶段,对语音数据的采集原则、方法都未做深入研究,目前还没有一套针对留学生的、稳定性、扩展性较好的汉语数据采集范程及对应的汉语语音数据采集系统。
另外一方面,在老挝,学习汉语者越来越多,汉语教学在老挝形成不断发展的态势[4]。本文作者提出的基于老挝留学生发音的汉语语音评价体系[5]是一个全方位衡量和评价老挝留学生汉语语音习得程度和质量高低并且反馈发音指导建议的智能化系统,可用来提高老挝留学生汉语发音正确率,使其能更好地掌握汉语发音方式、方法。虽然该体系提供了评价老挝留学生汉语语音的操作机制和基本方法,但未对语音数据采集做进一步研究,制约了语音评价系统的开发进程和老挝留学生的汉语语音学习和交流,本文就针对其汉语语音数据采集原则、过程、基本方法做了探索。
1 数据采集的基本原则
对于老挝留学生来说,汉语语音数据采集起来较为困难,它不同于其它领域中的数据采集。首先,老挝留学生汉语发音偏误类型繁多,偏误产生过程中带有较多的母语“负迁移”现象,难以数字化;其次,老挝留学生汉语发音动作,语声特性以及听感都各具特点。
基于以上原因,本文认为老挝留学生的汉语语音数据采集应当遵循以下原则:
1.1 科学性原则
科学性原则要求在采集与汉语语
文档评论(0)