统计机器翻译简明教程.pptxVIP

  • 6
  • 0
  • 约1.99千字
  • 约 37页
  • 2020-04-18 发布于上海
  • 举报
统计机器翻译简明教程 兼谈相关工具的使用;提纲; 词语对齐;训练语料库;语料预处理;处理后训练语料库;词语对齐;;plain2snt:统计单词数,格式转换;mkcls:单词聚类;GIZA++:词语对齐;GIZA++对齐几点说明;词语对齐后处理;词语对齐后处理(续);添加句首句尾标记;短语抽取;短语抽取(续);短语表过滤;短语表过滤(续);语言模型训练;Confucius的解码 – 基于短语的解码器;[BPTABLE_LIMIT] 10 //短语表的剪枝参数 [NBEST_LIST] 1000 //每句话产生Nbest的个数 [MAX_STACK_SIZE] 100 //搜索栈的剪枝参数 [TT] bp/iwslt07-bpsmall.txt //短语表的路径 [POSTABLE*] bp/L_0612_pos_p.txt //用于相似度模型的文件路径 [LM] lm/english.m2.bo4.gz //语言模型1 [LM2] lm/iwslt.small.order5.lm.gz //语言模型2 [LMNGRAM] 3

文档评论(0)

1亿VIP精品文档

相关文档