南京信息工程大学《数据采集与预处理》2025-2026学年期末试卷及答案.docxVIP

  • 2
  • 0
  • 约3.67千字
  • 约 7页
  • 2026-06-27 发布于天津
  • 举报

南京信息工程大学《数据采集与预处理》2025-2026学年期末试卷及答案.docx

南京信息工程大学《数据采集与预处理》2025-2026学年期末试卷及答案

考试时间:______分钟总分:______分姓名:______

单项选择题(每题2分,共20分)

1.数据采集的合法性原则不包括()

A.取得用户明确同意

B.遵守相关法律法规

C.采集所有可用数据

D.遵循最小必要原则

2.下列属于主动数据采集方式的是()

A.用户注册时填写个人信息

B.网页爬虫抓取商品信息

C.数据库日志自动记录

D.第三方平台API返回数据

3.Scrapy框架中,用于解析HTML页面并提取数据的组件是()

A.ItemPipeline

B.Spider

C.Downloader

D.Scheduler

4.处理缺失值时,若数据量充足且缺失非随机,推荐使用的方法是()

A.直接删除含缺失值的记录

B.用均值填充

C.用KNN算法预测填充

D.用众数填充

5.RESTfulAPI中,用于获取数据的HTTP方法是()

A.POST

B.GET

C.PUT

D.DELETE

6.数据预处理中,数据变换的主要目的是()

A.删除冗余数据

B.调整数据格式

C

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档