第九届全国机器翻译研讨会(CWMT2013)评测大纲资料.docVIP

下载本文档

2
0
约2.11万字
约 27页
2016-05-11 发布于湖北
举报
版权申诉

第九届全国机器翻译研讨会(CWMT2013)评测大纲资料.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第九届全国机器翻译研讨会（CWMT 2013）评测大纲中国科学院计算技术研究所 CWMT 2013机器翻译评测小组第九届全国机器翻译研讨会（CWMT 2013）将于2013年10月31日- 11月1日在昆明理工大学举行。根据惯例，本次研讨会将继续组织统一的机器翻译评测。 CWMT 2013机器翻译评测方案与往届评测相比有较大变化。首先，本次评测将采取全新的“灰箱评测（Gray-box Evaluation）”方式，即参评单位除了提交最终的翻译结果文件外，还需提交主系统的翻译关键步骤的中间结果文件。其次，评测组织方将提供所有评测项目的“基线系统（Baseline System）”及相应的关键步骤中间结果文件。此外，在传统自动评测的基础上，本次评测还将增加人工评测。希望通过这些新举措，CWMT 2013机器翻译评测能够为参评单位提供一个更加开放的平台，促进参评单位间的实质性交流和机器翻译研究及技术的发展。我们期待着更多的新人和成熟的研究团队能参加到这个评测中来。本次评测的组织信息如下（均以汉语拼音为序）：评测主办机构：中国中文信息学会评测组织单位：中国科学院计算技术研究所评测合作单位：东北大学哈尔滨工业大学内蒙古大学青海师范大学微软亚洲研究院厦门大学新疆大学中国科学技术信息研究所中国科学院自动化研究所评测资源提供单位：北京大学点通数据有限公司东北大学哈尔滨工业大学内蒙古大学青海师范大学西北民族大学西藏大学厦门大学新疆大学中国科学技术信息研究所中国科学院合肥智能机械研究所中国科学院计算技术研究所中国科学院新疆理化技术研究所中国科学院自动化研究所评测委员会主席：吕雅娟（中国科学院计算技术研究所）评测委员会委员： Antonio（）（）（）（）刘群（中国科学院计算技术研究所；都柏林城市大学）那顺乌日图（内蒙古大学）史晓东（厦门大学）孙乐（中国科学院软件研究所）吐尔根·伊布拉音（新疆大学）王惠临（中国科学技术信息研究所）张家俊（中国科学院自动化研究所）赵红梅（中国科学院计算技术研究所）朱靖波（东北大学）有关研讨会的更多信息请参见以下网址： /CWMT 2013/ 有关评测的更多信息请参见以下网址： /evalshow.php?id=2013 评测项目本次评测包含6个评测项目，我们将为各个评测项目的参评单位提供相应的训练语料和开发语料。具体项目设置如表1所示。表1 CWMT 2013 评测项目表序号项目代号评测项目名称语种领域 1 CE 汉英新闻领域机器翻译汉语(英语新闻领域 2 EC 英汉新闻领域机器翻译英语(汉语新闻领域 3 ES 英汉科技领域机器翻译英语(汉语科技领域 4 MC 蒙汉日常用语机器翻译蒙古语(汉语日常用语 5 TC 藏汉政府文献机器翻译藏语(汉语政府文献 6 UC 维汉新闻领域机器翻译维吾尔语(汉语新闻领域对于每个评测项目，参评单位可以自由选择所采用的机器翻译技术（如：基于规则的机器翻译技术、基于实例的机器翻译技术及统计机器翻译技术等）。参评单位也可以使用系统融合技术，但在系统描述中必须做出明确说明，并在技术报告中说明进行系统融合的各个单系统的性能。评测组织方在发布评测结果时，将对使用系统融合技术的系统进行标注说明。特别说明：若某一评测项目的报名参评单位少于3家，评测组织方将取消该评测项目。评测方法灰箱评测（Gray-box Evaluation）采用类似Gray-box testing）”的方法，我们称之为“灰箱评测”，即参评单位除了提交最终的结果文件外，还要提交评测组织方设定的关键步骤相关的中间文件（简称为“灰箱评测数据”），以方便参评单位对翻译结果进行比较和分析，促进参评单位间的实质性交流。关于参评单位需要提交的二。评测组织方将为每个评测项目提供一个或多个基线系统，包括基线系统的源代码和相应的灰箱评测数据。参评单位可以针对基线系统进行优化改进，藉此构建自己的机器翻译系统，也可以完全使用自己的系统。基线系统提供的数据和翻译结果可以作为参评单位参考和比较的基准。参评单位可以获得参评项目的基线系统和相关数据。评测组织方为参评单位提供基线系统的数据如下：源代码（若使用开源工具，则提供相关工具的下载地址及所使用的命令和参数）；训练部分相关的灰箱测试数据；解码部分相关的灰箱测试数据（发布最终评测结果时提供）；评测指标自动评测：自动评测是指利用自动评价工具对参评单位提交的最终翻译结果文件进行评价。本次评测中的自动评测采用多种自动评价标准，包括：BLEU-SBP、BLEU-NIST、TER、METEOR、NIST 、GTM 、mWER 、mPER、IC