- 13
- 0
- 约3.63千字
- 约 5页
- 2021-07-11 发布于河北
- 举报
PAGE
PAGE #
(2)组合连接L1
(2)组合连接L1中的各项目,产生 2-候选集C2,计算其支持度,取出支持度小于
supmin的项集,形成2-频繁集L2,如下表所示:
PAGE #
武汉大学计算机学院
2015 级研究生“数据仓库和数据挖掘”课程期末考试试题
要求: 所有的题目的解答均写在答题纸上,需写清楚题目的序号。每张答题纸都要写 上姓名和学号。
一、单项选择题(每小题 2分,共 20 分)
1、下面关于数据仓库的叙述中( B )是错误的。
OLAP 分为 ROLAP 、 MOLAP 和 HOLAP
星型模式下的维表是规范化的,而雪花模式下的不需要规范化
在查询效率方面,星型模式效率更高
在事实星座模式中有多个事实表,且它们共享相同的维表
2、下面关于维的叙述中( C)是错误的。
维是人们观察数据的特定角度
维的层次性是由观察数据细致程度不同造成的
C?“某年某月某日’是时间维的层次 错(“某年某月某日’是在时间维上位置的描述 )
D?“月、季、年”是时间维的层次 对(日、月、季、年是时间维的层次)
3、 可以对按季度汇总的销售数据进行( B),来观察按月汇总的数据。
上卷 B.下钻 C.切片 D.切块
4、 可以对按城市汇总的销售数据进行( A ),来观察按国家汇总的数据。
A.上卷 B.下钻 C.切片 D.切块
5、 将原始数据进行集成和变换等处理是在以下( C)步骤的任务。
A.频繁模式挖掘 B.分类和预测 C.数据预处理 D.数据流挖掘
6、 当不知道数据所带标签时,可以使用( B )技术促使带同类标签的数据与带其他 标签的数据相分离。
C.预测建模 D.寻找模式和规则A.分类 B?聚类 C.
C.预测建模 D.寻找模式和规则
7、建立一个模型, 掘的(C)任务。
通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖
A.根据内容检索 B.建模描述
8、利用信息增益方法作为属性选择度量建立决策树时, 已知某训练样本集的 4 个条件
属性的信息增益分别为: G(收入)=0.940位,G(职业)=0.151位,G(年龄)=0.780位,G(信 誉)=0.048 位,则应该选择( A )属性作为决策树的测试属性。 选信息增益最大的
A.收入 B.职业 C.年龄 D.信誉
9、以下关于前馈神经网络的叙述中正确的是( C)。
前馈神经网络只能有 3层错
前馈神经网络中存在反馈 错
前馈神经网络中每一层只接受来自前一层单元的输入
以上都是正确的
10、以下(A )不是影响聚类算法结果的主要因素。
A.已知类别的样本的质量 B.聚类结束条件
描述属性的选取 D.对象的相似性度量
二、 (20分)假定某大学教务部门已经建立有教务管理系统,现在要创建一个数据仓 库,至少包含以下分析功能:
(1) 分析全校各个专业各个省份学生的基础课程成绩为优秀的人数情况。
(2) 分析全校各个专业中年龄在 16岁以下学生的人数情况。
(3 )分析全校各个学院所有课程的不及格的人数情况。
完成如下任务:
(1) 根据你的思考设计该数据仓库的模式图,包含每个维表和事实表的结构。( 15 分)
(2) 指出你设计的数据仓库属于哪种模式。( 5分)
三、 (20分)某个食品连锁店每周的事务记录如表 1所示,每个事务表示在一项收款
机业务中卖出的商品项集,假定 min_sup=40%, min_conf=40%,使用 Apriori算法生成的
强关联规则。 见ppt 5章-例5.1 (即riori算法)
表1 一个事务记录表
事务
项集
1
面包、果冻、花生酱
2
面包、花生酱
3
面包、牛奶、花生酱
4
啤酒、面包
5
啤酒、牛奶
解:(1 )由1={面包、果冻、花生酱、牛奶、啤酒 }的所有项目直接产生 1-候选C1,
计算其支持度,取出支持度小于 supmin的项集,形成1-频繁集L1,如下表所示:
项集C1
支持度
项集L1
支持度
{面包}
4/5
{面包}
4/5
{花生酱}
3/5
{花生酱}
3/5
{牛奶}
2/5
{牛奶}
2/5
{啤酒}
2/5
{啤酒}
2/5
项集C2
支持度
项集L2
支持度
{面包、花生酱}
3/5
{面包、花生酱}
3/5
至此,所有频繁集都被找到,
算法结束,
所以,con fide nee ({面包}宀{花生酱}) = (4/5) / (3/5) =4/3 con fmin con fide nee ({花生酱}宀{面包}) = (3/5) / (4/5) =3/4 con fmin
所以,关联规则{面包} T {花生酱}、{花生酱} T {面包}均是强关联规则。
四、(20分)对于如表2所示的决策表(U, CU D), C={a, b, c, d} , D={ e },
原创力文档

文档评论(0)