ChineseWordSegmentationMethodforDomain-Special.pptVIP

  • 1
  • 0
  • 约6.68千字
  • 约 23页
  • 2016-12-10 发布于北京
  • 举报
在小部分标注语料的基础上加入了大量的生语料特征,实现了一个具有领域适应能力的分词器 * 传统的做法只采用1-best结果,但是我们发现一些在1-best中错误的结果在排名较低的分词结果中是正确的。 * 接下来我们介绍第二个模块:双语引导的中文分词。他的基本想法是:英文句子中单词是有边界的,利用中英平行语料的单词对齐关系,它可以有效地指引中文分词。 * * * 为了确认我们提出的领域自适应方法的有效性,我们设计了实验。 * 一方面我们采用传统的评测方法,另方面是从我们的应用背景来进行评测 * * 最后我要对工作进行总结: * Chinese Word Segmentation Method for Domain-Special Machine Translation Su Chen; Zhang Yujie; Guo Zhen; Xu Jin’an Beijing Jiaotong University Outline Motivation Method of combining multiple segmentation results Experiment Evaluation Conclusion Motivation 1/2 Training data Test data F-measure News domain News domain 97.62% Science 8

文档评论(0)

1亿VIP精品文档

相关文档