训练数据预处理方法、装置、电子设备及存储介质.pdfVIP

  • 0
  • 0
  • 约2.85万字
  • 约 21页
  • 2023-07-05 发布于四川
  • 举报

训练数据预处理方法、装置、电子设备及存储介质.pdf

本申请的实施方式提供了一种训练数据预处理方法、装置、电子设备及存储介质。该训练数据预处理方法包括:获取训练句对,训练句对包含源端句子以及目标端句子;基于源端句子以及目标端句子确定候选句对集;基于候选句对集确定源端句子的待删除句段和/或目标端句子中的待删除句段;基于待删除句段修复训练句对,得到目标训练句对。本申请提供的技术方案,能够在训练数据中检测未对齐的句对,并且能够对未对齐句对进行修复处理,提高训练数据的数据质量,有利于提升机器翻译的翻译效果,减少机器翻译的漏译情况,提升用户的使用体验感。

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116384413 A (43)申请公布日 2023.07.04 (21)申请号 202211636383.2 (22)申请日 2022.12.14 (71)申请人 网易有道信息技术(北京)有限公司

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档