汉语多音字消歧双向TM方法研究.pdfVIP

  • 0
  • 0
  • 约4.75万字
  • 约 10页
  • 2026-05-11 发布于北京
  • 举报

用于汉语多音字消歧的双向LSTM方法

,,

大学计算机学院,,微软公司,蒙德,州,

98052,chshan,lxie@nwpu‑,kaisheny@.com

类似于英语中的音素转换(G2P),联合n‑gram模型可

汉语多音字消歧的目标是从多个候选发音中选择正确的发以用于多音字消歧。由于多音字的发音基数相对较小,即

音。它是诸如语音合成等人类语言技术中的一个重要组成两到四个,可以从训练集中可靠地获得n‑gram统计信息,

部分。由于大多数多音字的发音可以通过文本中的上下文从而实现合理的性能。这种n‑gram模型通常实现为加权

轻松确定,在本文中,多音字消歧问题视为一个序有限状态转换器(WFST)。多音字消歧可以被视为一个

列标注任务。具体来说,我们提出使用双向长短时记忆

文档评论(0)

1亿VIP精品文档

相关文档