一种模型训练方法及相关设备.pdfVIP

  • 1
  • 0
  • 约6.24万字
  • 约 51页
  • 2023-05-14 发布于四川
  • 举报
本申请可以应用于人工智能领域,具体公开了一种模型训练方法,方法包括:获取用于输入到预训练语言模型中解码器的第二嵌入向量,第二嵌入向量对应于第二数据序列,第二数据序列包括第一子数据、被掩码的待预测数据单元以及第二子数据,第一子数据在第二数据序列中位于待预测数据单元的上文,第二子数据在第二数据序列中位于待预测数据单元的下文,根据第一嵌入向量,通过预训练语言模型PLM中的编码器,得到隐状态;根据第一子数据、第二子数据以及隐状态,通过PLM中的解码器以及解码器的输出层,对待预测数据单元进行预测。本申请不

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114676234 A (43)申请公布日 2022.06.28 (21)申请号 202210164992.6 (22)申请日 2022.02.22 (71)申请人 华为技术有限公司 地址 51812

文档评论(0)

1亿VIP精品文档

相关文档