机器翻译原理.pptVIP

  • 152
  • 0
  • 约1.55万字
  • 约 64页
  • 2017-06-03 发布于北京
  • 举报
机器翻译原理 Part Ⅵ 双语语料库对齐及 翻译知识自动获取技术 MTLAB of HIT 主要内容 概述 为什么要自动地获取知识(Why ?) 获取什么知识 (What ?) 如何获取知识 (How ?) 双语语料库对齐加工 句子对齐 词汇对齐 结构对齐 翻译知识的获取 直接利用双语语料库获取翻译知识的研究 间接利用双语语料库获取翻译知识的研究 为什么要自动获取知识(Why ?) 什么是知识? 获取什么知识(What ?) 如何获取知识(How ?) 翻译知识获取 知识获取过程: 数据预处理? 知识挖掘 ? 知识评价 双语语料库对齐加工 翻译知识自动获取 双语语料库及其对齐技术(1) 语料库 语料库(Corpora)是按照一定的原则组织在一起的真实的自 然语言数据(包括书面语和口语)的集合,主要用于研究自 然语言的规律,特别是统计语言学模型的训练以及相关系 统的评价和评测 语料库语言学 语料库语言学是以语料库为基本知识源来研究自然语言规 律的学科,主要研究内容包括语料库加工的理论、方法和 工具以及基于语料库的知识获取。 单语语料库(Monolingual Corpus)和多语语 料库(Multilingual Corpora) 双语语料库及其对齐技术(2) 双语语料库

文档评论(0)

1亿VIP精品文档

相关文档