包含广告过滤的网络爬虫系统及方法.pdfVIP

  • 2
  • 0
  • 约2.06万字
  • 约 18页
  • 2024-03-02 发布于四川
  • 举报

包含广告过滤的网络爬虫系统及方法.pdf

本申请公开了一种包含广告过滤的网络爬虫系统及方法。该系统中:调度器依据待爬取目标向多个爬取器分发爬取任务;每个爬取器执行对应的爬取任务,将爬取结果发送至内容解析器;内容解析器确定各个爬取结果中无需再次爬取的第一爬取结果和需再次爬取的第二爬取结果,解析第一爬取结果得到第一爬取内容,将第二爬取结果发送至静态规则过滤引擎;静态规则过滤引擎过滤第二爬取结果得到第三爬取结果,将该结果发送至机器学习过滤引擎;机器学习过滤引擎过滤第三爬取结果得到第二待爬取目标,将该目标反馈至调度器;结果处理器输出第一爬取内容

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN117633327A

(43)申请公布日2024.03.01

(21)申请号202311688107.5

(22)申请日2023.12.08

(71)申请人中国电信股份有限公司

地址10

文档评论(0)

1亿VIP精品文档

相关文档