- 2
- 0
- 约7.26千字
- 约 16页
- 2026-03-30 发布于四川
- 举报
2026年高职大数据技术应用(数据采集与分析)试题及答案
一、单项选择题(共10题,每题2分,共20分)
1.以下关于网络爬虫合法性的描述中,正确的是()。
A.只要不修改网站数据,爬虫行为均合法
B.爬取公开网页的非结构化数据无需遵守网站robots协议
C.爬取频率过高可能被网站封禁IP
D.爬取电商平台商品价格数据属于商业间谍行为
2.JSON格式与XML格式相比,最显著的优势是()。
A.支持注释
B.语法更严格
C.数据体积更小
D.支持嵌套结构
3.数据清洗中处理“年龄”字段时,若出现“200”这样的异常值,最合理的处理方式是()。
A.直接删除该记录
B.用字段均值替换
C.检查数据录入错误并修正
D.保留异常值用于特殊分析
4.在Python中使用Scrapy框架时,负责管理请求调度的组件是()。
A.Spider
B.ItemPipeline
C.Scheduler
D.Downloader
5.以下SQL语句中,用于查询“2025年1月销售额超过10000元”的正确写法是()。
A.SELECTFROMsalesWHEREdate=202501ANDamount10000
B.SELECTFRO
原创力文档

文档评论(0)