2026年数据科学与技术知识点与题目精讲.docxVIP

  • 1
  • 0
  • 约4.13千字
  • 约 14页
  • 2026-05-27 发布于福建
  • 举报

2026年数据科学与技术知识点与题目精讲.docx

第PAGE页共NUMPAGES页

2026年数据科学与技术知识点与题目精讲

一、单选题(每题2分,共20题)

1.在Python中,用于从网络获取数据的库是?

A.Pandas

B.NumPy

C.Requests

D.Matplotlib

2.以下哪个不是大数据的4V特征?

A.容量(Volume)

B.速度(Velocity)

C.变异(Variety)

D.可靠性(Reliability)

3.决策树算法中,用于衡量节点分裂质量的指标是?

A.信息熵

B.决策规则

C.熵增益

D.聚类系数

4.在机器学习中,过拟合现象通常发生在?

A.数据量不足时

B.模型复杂度过高时

C.特征选择不当时

D.样本噪声较大时

5.以下哪种数据挖掘任务适用于发现数据中的隐藏模式?

A.分类

B.聚类

C.关联规则

D.回归

6.Hadoop生态系统中的HDFS主要用于?

A.数据存储

B.数据处理

C.数据可视化

D.数据传输

7.在Spark中,RDD的懒加载机制指的是?

A.数据分片

B.任务调度

C.透明计算

D.作业优化

8.K-means算法的缺点是?

A.计算效率高

B.对初始中心敏感

C.可处理任意形状簇

D.具有可扩展性

9.自然语言处理中,用于去除文本中无意义词的步骤是?

A.分

文档评论(0)

1亿VIP精品文档

相关文档