语音数据与语音合成594.pptVIP

下载本文档

8
0
约6.99千字
约 44页
2017-08-20 发布于北京
举报

语音数据与语音合成594.ppt

* HMM建模预测+单元挑选的结合创新：走自己的路 * * * * ARCTIC库，回头去录BTEC库随机挑选词覆盖率不到50%，经过应用选择和语料挑选后词覆盖率接近99% * 不是识别的办公室环境，越干净越好低平偏移失败例子，Terry前1000与后面…… * 五状态模型，至少得30ms，短于这个时间人也难以判断连续语流切分，多切到了停顿段，影响自然度 * 这些都是需要在文本分析的基础上修改的说不定什么时候就踩地雷了 * 当然个别错误未必会导致非常严重的错误，但精确的韵律标注的确能从建模开始到合成结束一系列的过程中帮助我们做的更好 * * * 大家偏向不同，会造成数据混乱无序 * 浊浊修正是老牌，借宝地强调一下沟通很重要，帮助我们认识这个音库和发音人，也许能省很多工作量 * * * 0.1分之间，几家欢喜几家愁 * 自然度对音质打分映像的影响难免 16K原始录音音质可打5分，一般统计得到4.5~4.8 16k原始分析合成可超过4分，一般统计得到4.0~4.3 波形拼接合成音质可到4分，一般统计得到3.8~4.5 参数合成系统音质在3分附件，一般统计得到2.8~3.5 * 音质对自然度打分映像的影响难免忍痛，樽 * 自然度对音质打分映像的影响难免 * * 敏感度比我们高，角度常与我们不同老外打0分，令人很无奈 * * * 数据制作与合成韵律标注与合成中文韵

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

语音数据与语音合成594.pptVIP