武汉大学研究生课程-数据挖掘-2015级研究生试题.docxVIP

  • 13
  • 0
  • 约3.63千字
  • 约 5页
  • 2021-07-11 发布于河北
  • 举报

武汉大学研究生课程-数据挖掘-2015级研究生试题.docx

PAGE PAGE # (2)组合连接L1 (2)组合连接L1中的各项目,产生 2-候选集C2,计算其支持度,取出支持度小于 supmin的项集,形成2-频繁集L2,如下表所示: PAGE # 武汉大学计算机学院 2015 级研究生“数据仓库和数据挖掘”课程期末考试试题 要求: 所有的题目的解答均写在答题纸上,需写清楚题目的序号。每张答题纸都要写 上姓名和学号。 一、单项选择题(每小题 2分,共 20 分) 1、下面关于数据仓库的叙述中( B )是错误的。 OLAP 分为 ROLAP 、 MOLAP 和 HOLAP 星型模式下的维表是规范化的,而雪花模式下的不需要规范化 在查询效率方面,星型模式效率更高 在事实星座模式中有多个事实表,且它们共享相同的维表 2、下面关于维的叙述中( C)是错误的。 维是人们观察数据的特定角度 维的层次性是由观察数据细致程度不同造成的 C?“某年某月某日’是时间维的层次 错(“某年某月某日’是在时间维上位置的描述 ) D?“月、季、年”是时间维的层次 对(日、月、季、年是时间维的层次) 3、 可以对按季度汇总的销售数据进行( B),来观察按月汇总的数据。 上卷 B.下钻 C.切片 D.切块 4、 可以对按城市汇总的销售数据进行( A ),来观察按国家汇总的数据。 A.上卷 B.下钻 C.切片 D.切块 5、 将原始数据进行集成和变换等处理是在以下( C)步骤的任务。 A.频繁模式挖掘 B.分类和预测 C.数据预处理 D.数据流挖掘 6、 当不知道数据所带标签时,可以使用( B )技术促使带同类标签的数据与带其他 标签的数据相分离。 C.预测建模 D.寻找模式和规则A.分类 B?聚类 C. C.预测建模 D.寻找模式和规则 7、建立一个模型, 掘的(C)任务。 通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖 A.根据内容检索 B.建模描述 8、利用信息增益方法作为属性选择度量建立决策树时, 已知某训练样本集的 4 个条件 属性的信息增益分别为: G(收入)=0.940位,G(职业)=0.151位,G(年龄)=0.780位,G(信 誉)=0.048 位,则应该选择( A )属性作为决策树的测试属性。 选信息增益最大的 A.收入 B.职业 C.年龄 D.信誉 9、以下关于前馈神经网络的叙述中正确的是( C)。 前馈神经网络只能有 3层错 前馈神经网络中存在反馈 错 前馈神经网络中每一层只接受来自前一层单元的输入 以上都是正确的 10、以下(A )不是影响聚类算法结果的主要因素。 A.已知类别的样本的质量 B.聚类结束条件 描述属性的选取 D.对象的相似性度量 二、 (20分)假定某大学教务部门已经建立有教务管理系统,现在要创建一个数据仓 库,至少包含以下分析功能: (1) 分析全校各个专业各个省份学生的基础课程成绩为优秀的人数情况。 (2) 分析全校各个专业中年龄在 16岁以下学生的人数情况。 (3 )分析全校各个学院所有课程的不及格的人数情况。 完成如下任务: (1) 根据你的思考设计该数据仓库的模式图,包含每个维表和事实表的结构。( 15 分) (2) 指出你设计的数据仓库属于哪种模式。( 5分) 三、 (20分)某个食品连锁店每周的事务记录如表 1所示,每个事务表示在一项收款 机业务中卖出的商品项集,假定 min_sup=40%, min_conf=40%,使用 Apriori算法生成的 强关联规则。 见ppt 5章-例5.1 (即riori算法) 表1 一个事务记录表 事务 项集 1 面包、果冻、花生酱 2 面包、花生酱 3 面包、牛奶、花生酱 4 啤酒、面包 5 啤酒、牛奶 解:(1 )由1={面包、果冻、花生酱、牛奶、啤酒 }的所有项目直接产生 1-候选C1, 计算其支持度,取出支持度小于 supmin的项集,形成1-频繁集L1,如下表所示: 项集C1 支持度 项集L1 支持度 {面包} 4/5 {面包} 4/5 {花生酱} 3/5 {花生酱} 3/5 {牛奶} 2/5 {牛奶} 2/5 {啤酒} 2/5 {啤酒} 2/5 项集C2 支持度 项集L2 支持度 {面包、花生酱} 3/5 {面包、花生酱} 3/5 至此,所有频繁集都被找到, 算法结束, 所以,con fide nee ({面包}宀{花生酱}) = (4/5) / (3/5) =4/3 con fmin con fide nee ({花生酱}宀{面包}) = (3/5) / (4/5) =3/4 con fmin 所以,关联规则{面包} T {花生酱}、{花生酱} T {面包}均是强关联规则。 四、(20分)对于如表2所示的决策表(U, CU D), C={a, b, c, d} , D={ e },

文档评论(0)

1亿VIP精品文档

相关文档