考研大数据试题及答案解析.docVIP

  • 0
  • 0
  • 约4.55千字
  • 约 11页
  • 2026-03-24 发布于中国
  • 举报

考研大数据试题及答案解析

一、填空题(每题2分,共20分)

1.数据挖掘的四个基本步骤是:数据准备、______、模型评估和______。

2.在大数据处理中,Hadoop的核心组件包括HDFS和______。

3.机器学习的三种主要学习方法包括监督学习、______和强化学习。

4.数据库的ACID特性指的是原子性、______、隔离性和持久性。

5.在数据预处理中,______是一种常用的数据清洗技术,用于处理缺失值。

6.降维的主要目的是减少数据的______,同时保留重要的信息。

7.在时间序列分析中,ARIMA模型是一种常用的______模型。

8.在自然语言处理中,词嵌入技术如Word2Vec可以用于______。

9.在图数据库中,节点表示______,边表示节点之间的关系。

10.大数据时代的三大特征是:______、多样性和价值。

二、判断题(每题2分,共20分)

1.数据挖掘是从大量数据中发现潜在模式和规律的过程。(√)

2.Hadoop是一个开源的分布式计算框架。(√)

3.决策树是一种常用的监督学习方法。(√)

4.数据库的隔离性确保了事务的并发执行不会相互干扰。(√)

5.数据清洗是数据预处理的一个重要步骤。(√)

6.PCA(主成分分析)是一种常用的降维方法。(√)

7.ARIMA模型适用于具有季节性成分的时间序列数

文档评论(0)

1亿VIP精品文档

相关文档