一种基于词义加权TF-IDF疾病表征词提取方法.pdfVIP

  • 2
  • 0
  • 约7.92千字
  • 约 7页
  • 2023-07-05 发布于四川
  • 举报

一种基于词义加权TF-IDF疾病表征词提取方法.pdf

本发明公开了一种基于词义加权TF‑IDF疾病表征词提取方法,包括以下步骤:(1)数据预处理;(2)结合电子病历特点,构建本地任务词库;(3)计算文本词义特征加权权重值;(4)统计词频,计算逆文档频率,形成TF‑IDF计算模型,并将词义权重引入模型;(5)模型运行,获取疾病表征词。该基于词义加权TF‑IDF疾病表征词提取方法与传统的TF‑IDF模型相比,本发明提出的技术方案引入了词义加权以提升关键语义信息词的“重要性”,通过词义加权的方式对文本的词频信息进行扰动,提高了模型对电子病历文本中疾病表征

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113807090 A (43)申请公布日 2021.12.17 (21)申请号 202110915839.8 (22)申请日 2021.08.10 (71)申请人 三峡

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档