基于决策树的英语焦点语音转换-清华大学.PDFVIP

  • 9
  • 0
  • 约3.38万字
  • 约 5页
  • 2018-08-18 发布于天津
  • 举报

基于决策树的英语焦点语音转换-清华大学.PDF

基于决策树的英语焦点语音转换-清华大学

基于决策树的英语焦点语音转换 1,2 1,2,3 2,3 1,2 1,2 孟凡博 , 吴志勇 , 蒙美玲 , 贾珈 , 蔡莲红 (1. 清华大学 计算机科学与技术系, 普适计算教育部重点实验室,清华信息科学与技术国家实验室, 北京 100084; 2. 清华大学 深圳研究生院, 清华大学-香港中文大学媒体科学、技术与系统联合研究中心, 深圳 518055; 3. 香港中文大学 系统工程与工程管理学系, 香港) 摘 要: 焦点是语言表达的重要方式,焦点重音是重要的韵 不仅能够表达文字所含的语义信息,还可以通过说 律特征,实现中性语音到焦点语音的转换可以提高语音的表 话者的说话方式如语气、焦点等表达出其他含义。 现力。该文提出了声学特征局部凸显度的表示方法,分析了 其中,焦点是语言表达所必要的。根据广泛认可的 由中性到焦点语音,焦点单词所属音节声学特征变化与中性 语音相应音节声学特征局部凸显度的相关性,提出了一种基 焦点-重音 (focus-to-accent )理论,在音高重音语言 于决策树的英语焦点语音的转换模型。该模型采用决策树对 (如英语)中,成为焦点的词或成分会以音高重音 [1] 训练语料进行聚类,所用上下文包括音节与焦点单词的相对 的形式在语音中表现出来,即形成焦点重音 。 位置以及音节在韵律结构中(韵律短语、韵律词)的位置。 焦点重音具有局部凸显性,声学特征高于临近 在此基础上,提出了一种基于局部凸显度的中性到焦点语音 [2] 音节的音节更容易被感知为重音 。一般的,与焦点 声学特征变化的预测算法。采用该算法后,客观实验中声学 重音感知相关的声学特征主要有基频、时长和能量 特征变化平均绝对值误差降低到0.08,主观实验表明,本文 [3] 。研究发现,焦点语音的声学表现受多种因素影响。 提出的模型的转换语音具有更好的焦点表达效果和自然度。 语句中焦点的声学表现与其在句中的位置是相关 关键词:语音转换;焦点语音;声学特征;韵律结构;局部 的。文[4]发现焦点的基频和时长变化随着所处韵律 凸显 层级 (如音节、韵律词、韵律短语和语调短语)的 中图分类号:TP391 文献标志码:A 增大而增大。焦点语音中音节的声学特征也与焦点 的相对位置有关。文[5]指出焦点会增大所在单词重 English emphatic speech conversion based on 读音节的基频范围,同时减小焦点之后音节的基频 decision tree 范围。焦点的声学特征(如基频、时长和能量)之 MENG Fanbo1,2, WU Zhiyong1,2,3, Helen Meng2,3

文档评论(0)

1亿VIP精品文档

相关文档