藏汉翻译系统试验.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
藏汉翻译系统试验

藏汉翻译系统及系统融合实验 1 新旧语料的对比实验 新语料是评测以来一直不断修正过并且使用最新的前处理脚本的语料。旧语料是去年经过过滤的12月份语料。原则说,新语料效果更好,实验结果表明,旧语料更好一些。 系统Chiero 开发集(650) 测试集(517) 新语料 51.85 40.10 旧语料 52.80 41.12 2 新旧语言模型的对比实验 新语言模型是目前评测使用的语言模型,旧语言模型是去年12月份的语言模型。实验结果表明,可能由于分词等原因,两种语言模型效果差不多。 系统Chiero 开发集(650) 测试集(517) 新语言模型 48.38 39.38 旧语言模型 51.85 40.10 3 修正ICTCLAS分词工具EditSegmentor的实验 使用的语料是去年12月份的语料,下面是使用EditSegmentor的实验效果,结果表明,使用EditSegmentor会降低系统的性能。 系统Chiero 开发集(650) 测试集(517) 未使用 52.80 41.12 使用 50.66 39.34 4 不同对齐实验 使用的语料是去年12月份的语料,针对Mose-giza,berkeley对齐以及5月份采用的对齐工具进行对比实验,实验结果表明,Moses Giza的性能要更好一些,建议使用Moses Giza。 系统Chiero 开发集(650) 测试集(517) 目前采用 50.72 37.28 Berkeley对齐 52.85 40.31 Moses Giza 52.80 41.12 5 系统融合 1) 相关系统融合程序的bug修复。 2) 各个单系统的nbest处理程序的开发。 3) 词典文件格式处理程序的开发。 4) 系统融合训练以及测试的脚本开发。 注:相关工具的目录为: /home3/jwb/zhb/CWMT2013/tools ChieroNbest是处理Chiero的Nbest文件的程序。 MosesNbest是处理Moses系统的Nbest文件的程序。 6 藏汉系统融合实验 系统版本 开发集(650) 测试集(1000) Chiero 48.94 28.61 Moses-Phrase 50.90 29.29 Moses-Hierachy 53.21 31.82 系统融合(配置1) 56.13 31.16 系统融合(配置2) 56.13 31.22 系统融合(配置3) 56.51 31.46 系统融合(配置4) 56.62 31.55 实验结果表明,藏汉系统之后,开发集升了3.4个点左右,测试集反而相比最高的Moses-Hierachy系统降低了0.27个点左右。原因可能是开发集只是新闻语料的,而测试集是新闻语料以及口语语料的。在开发集上调参,而测试集的领域不对应,造成下降。如果测试集只是新闻,会有所提升。从维吾尔语的系统融合实验中就可以得知。 7 维汉口语系统融合实验 系统版本 开发集(650) 测试集(1000) Chiero 17.78 16.83 Moses-Phrase Moses-Hierachy 18.56 19.54 系统融合(配置1) 19.13 20.33 系统融合(配置2) 系统融合(配置3) 系统融合(配置4) 系统融合(配置5) 由于Moses-Phrase系统的性能仍未反馈给我,因此第二行为空,以待补充完整。系统融合的实验只有第一组跑完,其他组正在进行中,所以下面的几行为空。根据上面的数据,可以得知,系统融合后的性能开发集上升了0.6个点左右,测试集上升了0.8个点左右。因此,维汉口语的系统融合能提高翻译的性能。 8 维汉书面语系统融合实验 系统版本 开发集(650) 测试集(1000) Chiero 33.24 27.30 Moses-Phrase Moses-Hierachy 33.72 29.82 系统

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档