- 18
- 0
- 约5.65千字
- 约 8页
- 2026-03-04 发布于河南
- 举报
大数据挖掘与数据仓库(HiveRedshift)模
拟试题集
考试时间:______分钟总分:______分姓名:______
一、选择题(每题2分,共20分。请将正确选项的代表字母填入括号内)
1.下列哪一项不是大数据的主要特征?()
A.海量性
B.速度性
C.多样性
D.预测性
2.数据仓库的核心思想是?()
A.数据挖掘
B.数据集成
C.数据分析
D.数据归档
3.Hive的主要应用场景是?()
A.实时数据流处理
B.大数据仓库
C.数据挖掘
D.小型数据库管理
4.Redshift是一种?()
A.关系型数据库管理系统
B.NoSQL数据库
C.数据仓库
D.数据挖掘工具
5.在数据仓库中,以下哪一项不是常用的数据模型?()
A.星型模型
B.螺旋模型
C.雪花模型
D.销售模型
6.HiveQL中,用于创建表的语句是?()
A.CREATEVIEW
B.CREATEINDEX
C.CREATETABLE
D.CREATEDATABASE
7.Redshift中的分布方式不包括?()
A.全局分布
B.分区分布
C.轮转分布
D.集中分布
8.Hive中,用于数据聚合的函数是?()
A.SUM
B.AVG
C.COUNT
D.ALL
9.数据挖掘中的分类算法不包括?()
A.决策树
B.聚类分析
C.逻辑回归
D.神经网络
10.下列哪一项不是Hive的优点?()
A.架构简单
B.支持SQL
C.性能高效
D.适用于实时数据处理
二、填空题(每题2分,共10分。请将答案填入横线上)
1.大数据的三大特征是______、______和______。
2.数据仓库的体系结构通常包括______、______和______三层。
3.Hive是一种基于______的分布式数据仓库工具。
4.Redshift的数据块大小默认为______。
5.数据挖掘的常用任务包括分类、聚类、关联规则挖掘和______。
三、判断题(每题2分,共10分。请将“正确”或“错误”填入括号内)
1.大数据挖掘和数据仓库是同一个概念。()
2.HiveQL和SQL语法基本相同。()
3.Redshift支持实时数据分析和处理。()
4.数据仓库中的数据是静态的,不会发生变化。()
5.数据挖掘算法的准确率越高,其应用价值就越大。()
四、简答题(每题10分,共30分)
原创力文档

文档评论(0)