浙江大学《数据预处理技术及应用》2023-2024学年第一学期期末试卷.docVIP

  • 0
  • 0
  • 约6.5千字
  • 约 8页
  • 2026-05-11 发布于重庆
  • 举报

浙江大学《数据预处理技术及应用》2023-2024学年第一学期期末试卷.doc

学校________________班级____________姓名____________考场____________准考证号

学校________________班级____________姓名____________考场____________准考证号

…………密…………封…………线…………内…………不…………要…………答…………题…………

第PAGE1页,共NUMPAGES3页

浙江大学

《数据预处理技术及应用》2023-2024学年第一学期期末试卷

题号

总分

得分

批阅人

一、单选题(本大题共35个小题,每小题1分,共35分.在每小题给出的四个选项中,只有一项是符合题目要求的.)

1、网络爬虫在爬取大量网页时,可能会遇到网站的robots.txt文件。如果爬虫程序违反了该文件的规定,可能会导致什么后果?()

A.被搜索引擎降权

B.获得更多的优质数据

C.提高网站对爬虫的信任度

D.没有任何影响

2、假设要开发一个能够检测和避免重复抓取同一网页的网络爬虫。以下哪种数据结构或算法可能用于实现这个功能?()

A.哈希表B.布隆过滤器C.二叉搜索树D.以上都是

3、当网络爬虫需要处理大量的并发请求,以提高抓取速度和效率时。以下哪种技术或框架可能有助于实现高效

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档