2026年高职大数据技术应用(数据采集与分析)试题及答案.docxVIP

  • 2
  • 0
  • 约7.26千字
  • 约 16页
  • 2026-03-30 发布于四川
  • 举报

2026年高职大数据技术应用(数据采集与分析)试题及答案.docx

2026年高职大数据技术应用(数据采集与分析)试题及答案

一、单项选择题(共10题,每题2分,共20分)

1.以下关于网络爬虫合法性的描述中,正确的是()。

A.只要不修改网站数据,爬虫行为均合法

B.爬取公开网页的非结构化数据无需遵守网站robots协议

C.爬取频率过高可能被网站封禁IP

D.爬取电商平台商品价格数据属于商业间谍行为

2.JSON格式与XML格式相比,最显著的优势是()。

A.支持注释

B.语法更严格

C.数据体积更小

D.支持嵌套结构

3.数据清洗中处理“年龄”字段时,若出现“200”这样的异常值,最合理的处理方式是()。

A.直接删除该记录

B.用字段均值替换

C.检查数据录入错误并修正

D.保留异常值用于特殊分析

4.在Python中使用Scrapy框架时,负责管理请求调度的组件是()。

A.Spider

B.ItemPipeline

C.Scheduler

D.Downloader

5.以下SQL语句中,用于查询“2025年1月销售额超过10000元”的正确写法是()。

A.SELECTFROMsalesWHEREdate=202501ANDamount10000

B.SELECTFRO

文档评论(0)

1亿VIP精品文档

相关文档