用于扩充语料的方法和用于翻译模型的训练方法及产品.pdfVIP

  • 0
  • 0
  • 约2.49万字
  • 约 20页
  • 2023-06-17 发布于四川
  • 举报

用于扩充语料的方法和用于翻译模型的训练方法及产品.pdf

本发明的实施方式提供了一种用于扩充语料的方法和用于翻译模型的训练方法及产品。该方法包括:将平行语料中的源端文本与相应的目标端文本连接;在连接之前或者连接之后,对所述源端文本和/或所述目标端文本进行遮蔽处理,以生成包含遮蔽词的连接文本;以及基于掩码预测模型对所述连接文本进行预测,以获得所述遮蔽词的预测分布,其中所述预测分布用于扩充所述平行语料。根据本发明实施方式的方法,不仅能够扩充平行语料的数量,还能够保证扩充语料的质量,从而有利于提升对机器翻译模型的训练质量。

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113268996 A (43)申请公布日 2021.08.17 (21)申请号 202110615854.0 (22)申请日 2021.06.02 (71)申请人 网易有道信息技术(北京)有限公司

文档评论(0)

1亿VIP精品文档

相关文档