- 1
- 0
- 约6.68千字
- 约 23页
- 2016-12-10 发布于北京
- 举报
在小部分标注语料的基础上加入了大量的生语料特征,实现了一个具有领域适应能力的分词器 * 传统的做法只采用1-best结果,但是我们发现一些在1-best中错误的结果在排名较低的分词结果中是正确的。 * 接下来我们介绍第二个模块:双语引导的中文分词。他的基本想法是:英文句子中单词是有边界的,利用中英平行语料的单词对齐关系,它可以有效地指引中文分词。 * * * 为了确认我们提出的领域自适应方法的有效性,我们设计了实验。 * 一方面我们采用传统的评测方法,另方面是从我们的应用背景来进行评测 * * 最后我要对工作进行总结: * Chinese Word Segmentation Method for Domain-Special Machine Translation Su Chen; Zhang Yujie; Guo Zhen; Xu Jin’an Beijing Jiaotong University Outline Motivation Method of combining multiple segmentation results Experiment Evaluation Conclusion Motivation 1/2 Training data Test data F-measure News domain News domain 97.62% Science 8
您可能关注的文档
最近下载
- 2025年春新人教版七年级下册历史全册课件.pptx
- 2025年浏阳社区专职工作人员招聘真题(附答案及解析).docx VIP
- 4.4.3输送血液的泵——心脏 课时作业 (含答案)七年级生物学人教版(2024)下册.docx VIP
- 2025年卫生事业管理考试试题及答案.docx VIP
- 2025年卫生事业管理考试试题及答案.docx VIP
- 卫生事业管理考试试题附答案.docx VIP
- XX初中劳动教育教师2026年春季学期“劳动周”活动设计与实施总结.docx VIP
- 吉利博瑞说明书.pdf VIP
- 卫生法律法规考试试题题库及答案 .pdf VIP
- 卫生法律法规考试试题题库及答案.docx VIP
原创力文档

文档评论(0)