关于发音特征汉语发音偏误自动标注.PDFVIP

关于发音特征汉语发音偏误自动标注.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于发音特征的汉语发音偏误自动标注 † 魏星 王玮 陈静萍 解焱陆 张劲松 北京语言大学信息科学学院,北京 100083; † 通讯作者, E-mail: xieyanlu@ 摘要 有标注的语料库对训练语音模型有着至关重要的作用,而人工标注语料库费时费力而且存在标注不 一致的问题。针对发音偏误检测系统的语音标注问题,本文基于发音特征构建偏误检测系统,给出 Top-N 的识别结果,通过praat 软件呈现机器初步标注文本,在此基础上进行人工二次标注。实验结果表明,相比 单纯的人工标注,本文的自动标注加人工二次标注的方法,在标注一致性上从80.7%提高到92.48%,平均 每个句子的标注时间从十分钟减少到三分钟。本文的方法有效的提高了人工标注的效率,可以在有限时间 内为识别系统提供更多的可靠的标注语料。 关键词 发音特征;发音偏误趋势;自动标注 中图分类号 A Study of Articulatory Features Based Detection of Mandrain Pronunciation Erroneous Tendency for Automatic Annotation † WEI Xing, WANG Wei, CHEN Jingping, XIE Yanlu , ZHANG Jinsong School of Information Science, Beijing Language and Culture University, Beijing, 100083; †Corresponding Author, E-mail: xieyanlu@ Abstract For the purpose of relieving the time cost and inconformity in annotation, this paper propose to use an articulatory features based mispronunciation detection system to give an Top-N feedback and use this feedback to assist manual annotation. As a result ,the consistency rate of phoneme labels in our system increase from 80.7% to 92.48%. In addition ,the time cost for annotating each sentence reduce from 10 minutes to 3 minutes. The results indicate that our automatic annotation system be practical, and there is also a room for further improvement. Key words Articulatory features(AFs); Pronunciation erroneous tendency(PET); Automatic annotation 近些年,随着机器学习和计算机硬件的发展,自动语音识别(ASR )等技术成为了当前 研究热点之一。有标注的语料库在语音合成、语音识别、语音分析等语音学研究领域发挥着 日益重要的作用。为大规模语音语料库添加标注是一项需要投入大量人力资源的任务,长时 间的连续工作不可避免地造成标注人的疲劳、厌倦,同时标注人所接受语音学专业训练水平、 [1] 对语音学知识的把握以及生理心理因素的共同影响,都会造成主观误差,影响标注结果 。 因此,发展语音自动标注系统是必须的。 语音语料库的标注方法一般有自动标注和人工标注两种,或两者相结合的方法,例如先

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档