网页分类方法及装置.pdfVIP

  • 8
  • 0
  • 约2.04万字
  • 约 17页
  • 2023-06-05 发布于四川
  • 举报
本发明提供了网页分类方法及装置,该方案在获得网页的具体页面之前,分析网页的HTTP请求信息得到该网页的页面类型。从待分类网页对应的HTTP请求信息中提取各个维度的属性信息,然后利用预先训练得到的分类模型分析各个维度的信息,得到该待分类网页所属的目标页面类型。由上述内容可知,该方案不需要获取具体的页面内容,只需要获得该页面对应的HTTP请求信息,而且,利用预先训练得到的分类模型分析HTTP请求信息,不需要人工梳理每个页面类型对应的规则,因此,能够适用于任何页面结构的网页,即该方案适用性高,进一步地

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 112749360 A (43)申请公布日 2021.05.04 (21)申请号 20191

文档评论(0)

1亿VIP精品文档

相关文档