领域语料生成方法、装置及设备.pdfVIP

  • 0
  • 0
  • 约1.34万字
  • 约 11页
  • 2023-04-24 发布于北京
  • 举报
本公开涉及一种领域语料生成方法、装置及设备,其中,方法包括:获取目标领域的至少一个初始关键词,并将至少一个初始关键词添加至目标领域词汇集合中;针对目标领域词汇集合中的每个词汇,确定对应的多个近义词;从多个近义词中确定与所述百科词条相匹配的目标近义词,并将目标近义词添加至目标领域词汇集合中;基于目标领域词汇集合中的词汇重复执行上述步骤,直至满足预设的停止条件时,将目标领域词汇集合中的词汇作为百科词条抽取对应的百科文本,作为目标领域的领域语料。根据本公开的技术方案,解决了领域NLP算法训练语料缺失的

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114020868 A (43)申请公布日 2022.02.08 (21)申请号 202111302097.8 (22)申请日 2021.11.04 (71)申请人 山东

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档