山东药品食品职业学院《数据挖掘导论》2023-2024学年第二学期期末试卷.docVIP

  • 0
  • 0
  • 约5.16千字
  • 约 7页
  • 2026-06-06 发布于重庆
  • 举报

山东药品食品职业学院《数据挖掘导论》2023-2024学年第二学期期末试卷.doc

学校________________班级____________姓名____________考场____________准考证号

学校________________班级____________姓名____________考场____________准考证号

…………密…………封…………线…………内…………不…………要…………答…………题…………

第PAGE1页,共NUMPAGES3页

山东药品食品职业学院《数据挖掘导论》

2023-2024学年第二学期期末试卷

题号

总分

得分

一、单选题(本大题共25个小题,每小题1分,共25分.在每小题给出的四个选项中,只有一项是符合题目要求的.)

1、当网络爬虫需要处理不同网站的robots.txt协议时,假设有的网站允许部分爬取,有的完全禁止。以下哪种做法是恰当的?()

A.严格遵守robots.txt的规定,只爬取允许的部分

B.完全无视robots.txt,按照自己的需求爬取

C.尝试解读robots.txt,但不完全遵守

D.只在第一次爬取时参考robots.txt,后续不再理会

2、在网络爬虫的工作过程中,需要遵循一定的规则和策略以避免对目标网站造成过大的负担或违反法律规定。假设我们要爬取一个大型电商网站的商品信

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档