湖北工程学院《数据采集与网络爬虫》2023-2024学年期末试卷.docVIP

  • 0
  • 0
  • 约1.74千字
  • 约 4页
  • 2026-06-09 发布于重庆
  • 举报

湖北工程学院《数据采集与网络爬虫》2023-2024学年期末试卷.doc

自觉遵守考场纪律如考试作弊此答卷无效密

自觉遵守考场纪律如考试作弊此答卷无效

线

第PAGE1页,共NUMPAGES3页

湖北工程学院《数据采集与网络爬虫》2023-2024学年期末试卷

院(系)_______班级_______学号_______姓名_______

题号

总分

得分

批阅人

一、单选题(本大题共20个小题,每小题2分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.)

1、以下哪个不是爬虫中数据去重的方法?()

A.哈希去重

B.数据库去重

C.人工筛选

D.排序去重

2、以下哪个不是爬虫框架?()

A.Scrapy

B.PySpider

C.Django

D.Crawley

3、网络爬虫在抓取数据时,如何处理异常情况?()

A.记录日志

B.重试

C.跳过

D.以上都是

4、以下哪个不是爬虫中处理数据压缩的好处?()

A.节省存储空间

B.提高传输速度

C.加密数据

D.减少网络流量

5、在爬虫中,如何处理JavaScript生成的内容?()

A.执行JavaScript代码

B.分析页面源代码

C.以上都是

D.以上都不是

6、网络爬虫在抓取数据时,需要遵循的原则不包括()

A.不影响网站正常运行

B.遵守网站的使用条款

C.抓取所有数据

D.尊重隐私

7、在网络

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档