一种网页主题相关度判别方法.pdfVIP

  • 7
  • 0
  • 约1.1万字
  • 约 7页
  • 2023-08-23 发布于四川
  • 举报
一种网页主题相关度判别方法,包括如下步骤;步骤1.训练词向量模型;步骤2.设置主题词,构建用户主题词集合;步骤3.去除待评估网页标签,得到仅包括标题和正文文字的文档;步骤4.提取文档的关键词,构建待评估网页的网页关键词集合;步骤5.生成词向量;步骤6.依次计算待评估网页关键词向量集合与用户主题词向量集合中词向量的余弦距离,选择其中最大值;步骤7.求出待评估网页所有关键词的平均值,作为待评估网页的主题相关度;步骤8.设定主题相关度阈值,判断是否主题相关。本发明通过使用预训练词向量模型对词进行处理,

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116628377 A (43)申请公布日 2023.08.22 (21)申请号 202310049639.8 G06F 40/30 (2020.01) (22)申请日 2023.02.

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档