基于规则及N―gram模型的数字数据转换成哈萨克语读音文字的方法.docVIP

下载本文档

9
0
约2.73千字
约 5页
2018-04-07 发布于北京
举报

基于规则及N―gram模型的数字数据转换成哈萨克语读音文字的方法.doc

基于规则及N―gram模型的数字数据转换成哈萨克语读音文字的方法　　摘要：语音合成是哈萨克文信息处理技术的一个重要研究领域。哈萨克文本中的阿拉伯数字转换为其读音文本是语音合成中重要的预备工作。该文利用规则库和N-gram，实现了文本当中的各类数字正确的转换到读音，为哈萨克语语音合成研究，提供了高质量的数字读音文本。希望通过该文提供的方法来提高哈萨克文以及相似特性的其他语种的语音合成的质量。　　关键词：哈萨克语；数字读音；规则库；N-gram 　　中图分类号：TP391 文献标识码：A 文章编号：1009-3044（2017）14-0158-02 　　1概述　　哈萨克语属于阿尔泰语系突厥语族的克普恰克语支，拼音文字，中国的哈萨克文借用了阿拉伯语和部分波斯文字母。哈萨克文信息处理技术在近几年来国家的支持下已取得了很多的进步，但现有成果离真正实现中国语言文字信息处理的要求还有很大的距离。语音识别是哈萨克文信息处理技术的一个重要研究领域，在当今信息社会有着广泛的应用前景。把哈萨克文本中的阿拉伯数字转换为文本（下文均简称数字转文本）是哈萨克语语音合成当中不可缺少的前期工作，其转换质量直接影响到语音合成的合成效果。虽然到目前为止在语音合成方面的研究工作取得了很多成果，但是数字转文本方面还存在很多问题，并且影响到了语音合成的质量。本文把哈萨克阿拉伯文作为主要处理对象，把哈萨克文本

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于规则及N―gram模型的数字数据转换成哈萨克语读音文字的方法.docVIP