- 9
- 0
- 约2.73千字
- 约 5页
- 2018-04-07 发布于北京
- 举报
基于规则及N―gram模型的数字数据转换成哈萨克语读音文字的方法
摘要:语音合成是哈萨克文信息处理技术的一个重要研究领域。哈萨克文本中的阿拉伯数字转换为其读音文本是语音合成中重要的预备工作。该文利用规则库和N-gram,实现了文本当中的各类数字正确的转换到读音,为哈萨克语语音合成研究,提供了高质量的数字读音文本。希望通过该文提供的方法来提高哈萨克文以及相似特性的其他语种的语音合成的质量。
关键词:哈萨克语;数字读音;规则库;N-gram
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2017)14-0158-02
1概述
哈萨克语属于阿尔泰语系突厥语族的克普恰克语支,拼音文字,中国的哈萨克文借用了阿拉伯语和部分波斯文字母。哈萨克文信息处理技术在近几年来国家的支持下已取得了很多的进步,但现有成果离真正实现中国语言文字信息处理的要求还有很大的距离。语音识别是哈萨克文信息处理技术的一个重要研究领域,在当今信息社会有着广泛的应用前景。把哈萨克文本中的阿拉伯数字转换为文本(下文均简称数字转文本)是哈萨克语语音合成当中不可缺少的前期工作,其转换质量直接影响到语音合成的合成效果。虽然到目前为止在语音合成方面的研究工作取得了很多成果,但是数字转文本方面还存在很多问题,并且影响到了语音合成的质量。本文把哈萨克阿拉伯文作为主要处理对象,把哈萨克文本
您可能关注的文档
- 基于拜尔法生产氧化铝节能降耗分析.doc
- 基于半监督聚类的数字图书推荐模型.doc
- 基于残差网络人脸年龄估计.doc
- 基于产业结构生态化的重点项目建设探讨.doc
- 基于车联网MP2P技术的资源节点研究.doc
- 基于城镇化而转型的农民工适应情况.doc
- 基于抽水蓄能电站的机组与主变压器保护闭锁逻辑问题探究.doc
- 基于传递路径的车内轰鸣声解析与优化.doc
- 基于创新理论的叉车液压油箱呼吸器改进.doc
- 基于大规模网络环境下的组播通信技术.doc
- 专项十三 复合句(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项十四 There be句型和主谓一致(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项14 构词法 学案(含答案)2025年中考人教版英语语法专项复习.doc.docx
- 静脉肾盂造影结石梗阻评估.ppt
- 《假期实践活动》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 老年结石病合并慢病综合诊疗.ppt
- 鹿角形肾结石复杂手术治疗.ppt
- 经皮肾镜超声碎石清石术.ppt
- 《参观爱国主义教育基地》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 《生活中的大数:整理与复习》教案(2课时)-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
原创力文档

文档评论(0)