- 9
- 0
- 约3.38万字
- 约 5页
- 2018-08-18 发布于天津
- 举报
基于决策树的英语焦点语音转换-清华大学
基于决策树的英语焦点语音转换
1,2 1,2,3 2,3 1,2 1,2
孟凡博 , 吴志勇 , 蒙美玲 , 贾珈 , 蔡莲红
(1. 清华大学 计算机科学与技术系, 普适计算教育部重点实验室,清华信息科学与技术国家实验室, 北京 100084;
2. 清华大学 深圳研究生院, 清华大学-香港中文大学媒体科学、技术与系统联合研究中心, 深圳 518055;
3. 香港中文大学 系统工程与工程管理学系, 香港)
摘 要: 焦点是语言表达的重要方式,焦点重音是重要的韵 不仅能够表达文字所含的语义信息,还可以通过说
律特征,实现中性语音到焦点语音的转换可以提高语音的表 话者的说话方式如语气、焦点等表达出其他含义。
现力。该文提出了声学特征局部凸显度的表示方法,分析了 其中,焦点是语言表达所必要的。根据广泛认可的
由中性到焦点语音,焦点单词所属音节声学特征变化与中性
语音相应音节声学特征局部凸显度的相关性,提出了一种基 焦点-重音 (focus-to-accent )理论,在音高重音语言
于决策树的英语焦点语音的转换模型。该模型采用决策树对 (如英语)中,成为焦点的词或成分会以音高重音
[1]
训练语料进行聚类,所用上下文包括音节与焦点单词的相对 的形式在语音中表现出来,即形成焦点重音 。
位置以及音节在韵律结构中(韵律短语、韵律词)的位置。 焦点重音具有局部凸显性,声学特征高于临近
在此基础上,提出了一种基于局部凸显度的中性到焦点语音 [2]
音节的音节更容易被感知为重音 。一般的,与焦点
声学特征变化的预测算法。采用该算法后,客观实验中声学 重音感知相关的声学特征主要有基频、时长和能量
特征变化平均绝对值误差降低到0.08,主观实验表明,本文
[3] 。研究发现,焦点语音的声学表现受多种因素影响。
提出的模型的转换语音具有更好的焦点表达效果和自然度。
语句中焦点的声学表现与其在句中的位置是相关
关键词:语音转换;焦点语音;声学特征;韵律结构;局部 的。文[4]发现焦点的基频和时长变化随着所处韵律
凸显 层级 (如音节、韵律词、韵律短语和语调短语)的
中图分类号:TP391 文献标志码:A 增大而增大。焦点语音中音节的声学特征也与焦点
的相对位置有关。文[5]指出焦点会增大所在单词重
English emphatic speech conversion based on 读音节的基频范围,同时减小焦点之后音节的基频
decision tree 范围。焦点的声学特征(如基频、时长和能量)之
MENG Fanbo1,2, WU Zhiyong1,2,3, Helen Meng2,3
原创力文档

文档评论(0)