考研大数据试题及答案大全.docVIP

  • 1
  • 0
  • 约5.29千字
  • 约 13页
  • 2026-03-21 发布于山东
  • 举报

考研大数据试题及答案大全

一、填空题(每题2分,共20分)

1.数据挖掘的四个基本步骤是:数据准备、______、模型评估和______。

2.在大数据处理中,Hadoop的核心组件包括HDFS和______。

3.机器学习的三种主要学习方法包括监督学习、______和强化学习。

4.数据库的ACID特性指的是原子性、______、隔离性和持久性。

5.在数据预处理中,缺失值处理的方法主要有删除、______和______。

6.降维的主要目的是减少数据的______,同时保留数据的______。

7.在时间序列分析中,常用的模型有ARIMA模型、______和季节性分解模型。

8.在自然语言处理中,词嵌入技术主要包括Word2Vec和______。

9.在数据可视化中,常用的图表类型包括折线图、______和散点图。

10.大数据时代的三大特征是:______、______和______。

二、判断题(每题2分,共20分)

1.数据挖掘是从大量数据中发现潜在模式的过程。(√)

2.Hadoop是一个开源的分布式计算框架。(√)

3.决策树是一种常用的监督学习方法。(√)

4.数据库的隔离性是指事务的执行不会相互干扰。(×)

5.缺失值删除是一种常用的缺失值处理方法。(√)

6.主成分分析(PCA)是一种常用的降维方法。(√)

7.时间序列分析

文档评论(0)

1亿VIP精品文档

相关文档