一种主题词提取方法、装置、设备及存储介质.pdfVIP

  • 4
  • 0
  • 约1.54万字
  • 约 15页
  • 2023-05-26 发布于四川
  • 举报

一种主题词提取方法、装置、设备及存储介质.pdf

本发明公开一种主题词提取方法、装置、设备及存储介质,方法包括:使用TF‑IDF模型对提取范围内各文章的词分别计算TF‑IDF分数,将TF‑IDF分数高于第一设定阈值的作为各文章的第一主题词,其中提取范围是指设定的包含多篇文章的文本集合;将各文章的所述第一主题词分别计算IDAYF分数,并与所述TF‑IDF分数相乘,获得TF‑IDF‑IDAYF分数,其中所述IDAYF分数是将所述第一主题词在历史语料中出现的时间段均值与所述第一主题词在当前时间段在提取范围中出现的次数的比值,所述历史语料是指在设定历史

(19)中华人民共和国国家知识产权局 (12)发明专利 (10)授权公告号 CN 112287682 B (45)授权公告日 2021.06.08 (21)申请号 202011573897.9 审查员 刘杉 (22)申请日 2020.12.28

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档