基于关联度的汉藏多词单元等价对抽取方法.pdfVIP

  • 1
  • 0
  • 约 6页
  • 2017-09-12 发布于北京
  • 举报

基于关联度的汉藏多词单元等价对抽取方法.pdf

第 26卷 第 3期 中文信息学报 Vo1.26,NO.3 2O12年 5月 JOURNAL OFCHINESE INFORMATION PROCESSING M ay,2012 文章编号:1003—0077(2012)03~0098—06 基于关联度的汉藏多词单元等价对抽取方法 诺 明花 ,刘汇丹 ,吴 健 ,丁治明 (1.中国科学院 软件研究所 ,北京 100190;2.中国科学院 研究生院,北京 100049) 摘 要 :针对为汉藏辅助翻译系统建立汉藏 多词单元翻译词典这一任务 ,该文提 出了CMWEPM 模 型。该模型首 先依据关联度和结合度来确定汉语语料 中多词单元 的边界 ,然后根据词对齐信 息分别抽取严格和约束 多词单元等 价对 ,从而形成汉藏 多词单元等价对。CMwEPM 模 型根据不 同长度和频次对 多词单元进行分类,并为不 同类型 设定不同阈值 ,最终提高了汉藏 多词单元等价对的召回率 ,从而能够间接地提高汉藏辅助翻译系统 的翻

文档评论(0)

1亿VIP精品文档

相关文档