第四届全国机器翻译研讨会CCID技术报告.pptVIP

  • 2
  • 0
  • 约1.23千字
  • 约 10页
  • 2017-02-28 发布于湖北
  • 举报

第四届全国机器翻译研讨会CCID技术报告.ppt

第四届全国机器翻译研讨会CCID技术报告

第四届全国机器翻译研讨会CCID技术报告 中国电子信息产业发展研究院 孙广范 引言 本文对中国电子信息产业发展研究院(CCID)参加第四届全国机器翻译研讨会评测的汉英和英汉机器翻译系统进行描述。参加的评测项目包括汉英新闻领域机器翻译、英汉新闻领域机器翻译、英汉科技领域机器翻译。其中,汉英机器翻译系统包括一个基于规则的系统和一个基于短语的统计机器翻译系统,英汉机器翻译系统是一个基于规则和模板的系统。 系统 系统1:基于规则和模板的汉英机器翻译系统 本系统是传统的基于规则的系统,其中融入了模板技术、统计技术,属于基于转换的机器翻译系统。其既有规则系统的适应面较宽的特点,也有规则方法固有的知识颗粒度粗的不足。另外,本系统面向新闻领域语料调试工作做得较少,也是其处理新闻语料效果不十分理想的原因之一。 系统 系统2:基于规则和模板的英汉机器翻译系统 本系统采用规则和模板相结合的技术,面向英语新闻领域进行了针对性调试,因此处理英语新闻语料效果较好。同时,由于针对科技领域语料调试量较少,所以针对科技语料的处理效果差些。 系统 系统3:基于短语的汉英统计机器翻译系统 本系统的训练语料包括400万句对的通用汉英平行语料,其中包括863评测提供的83万汉英平行语料。分词工具采用自己研制的分词工具,采用GIZA++、中科院计算所的Camel解码器。训练结果生成了1千万条的短语翻译表,语言模型是从

文档评论(0)

1亿VIP精品文档

相关文档