武汉纺织大学《数据挖掘与商务智能》2023-2024学年第二学期期末试卷.docVIP

  • 1
  • 0
  • 约5.89千字
  • 约 7页
  • 2026-06-06 发布于重庆
  • 举报

武汉纺织大学《数据挖掘与商务智能》2023-2024学年第二学期期末试卷.doc

学校________________班级____________姓名____________考场____________准考证号

学校________________班级____________姓名____________考场____________准考证号

…………密…………封…………线…………内…………不…………要…………答…………题…………

第PAGE1页,共NUMPAGES3页

武汉纺织大学《数据挖掘与商务智能》

2023-2024学年第二学期期末试卷

题号

总分

得分

批阅人

一、单选题(本大题共30个小题,每小题1分,共30分.在每小题给出的四个选项中,只有一项是符合题目要求的.)

1、网络爬虫在处理网页中的链接时,需要进行筛选和过滤。假设要避免抓取一些无关或低质量的链接。以下关于链接筛选的描述,哪一项是错误的?()

A.根据链接的域名、路径和参数等信息,判断其是否与目标数据相关

B.利用正则表达式或规则引擎对链接进行匹配和过滤

C.所有的链接都应该被抓取,然后再进行筛选和处理,以免遗漏重要数据

D.可以参考网站的sitemap,获取重要页面的链接,优先抓取

2、在网络爬虫的反爬虫应对中,目标网站可能会采取多种手段来限制爬虫。假设一个网站通过检测访问者的行为模式来判断

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档