一种合成语料库生成方法和装置.pdfVIP

  • 4
  • 0
  • 约1.67万字
  • 约 14页
  • 2023-05-13 发布于四川
  • 举报
本发明实施例提供了一种合成语料库生成方法和装置,可用于人工智能技术领域,所述方法包括:按照预设的种子数据集中的种子语句,对训练数据集中的候选语句进行质量评估,生成每个候选语句的质量评分;根据质量评分和预先计算的每个候选语句与种子语句的相关度评分,生成每个候选语句的综合评分;根据每个种子语句对应的每个候选语句的综合评分,生成合成语料库,能够获得具有较高文本质量和较高词汇多样性的合成语料库,从而大幅度提高NMT模型的翻译质量。

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114648033 A (43)申请公布日 2022.06.21 (21)申请号 202210282394.9 (22)申请日 2022.03.22 (71)申请人 中国工商银行股份有限公司 地址 1

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档