数据仓库和数据挖掘作业(物联人141).pdfVIP

  • 10
  • 0
  • 约1.46万字
  • 约 13页
  • 2017-06-05 发布于湖北
  • 举报
贵州大学人武学院2014-2015 第2 学期 《数据仓库与数据挖掘技术》平时作业 学生学号: 学生姓名: 班 级: 任课教师: 《数据仓库与数据挖掘技术》作业一 成 绩: 教师签名: 基本概念部分 一.选择题 1. 数据挖掘技术包括三个主要的部分 ( ) A.数据、模型、技术 B.算法、技术、领域知识 C.数据、建模能力、算法与技术 D.建模能力、算法与技术、领域知识 2.关于基本数据的元数据是指: ( ) A.基本元数据与数据源,数据仓库,数据集市和应用程序等结构相关的信息; B.基本元数据包括与企业相关的管理方面的数据和信息; C.基本元数据包括日志文件和简历执行处理的时序调度信息; D.基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息。 3. 关于OLAP 和OLTP 的说法,下列不正确的是: ( ) A .OLAP 事务量大,但事务内容比较简单且重复率高 B.OLAP 的最终数据来源与OLTP 不一样 C .OLTP 面对的是决策人员和高层管理人员 D.OLTP 以应用为核心,是应用驱动的 4.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务? ( ) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘 5.下面哪种不属于数据预处理的方法? ( ) A.变量代换 B.离散化 C. 聚集 D. 估计遗漏值 6. 在ID3 算法中信息增益是指( ) A.信息的溢出程度 B.信息的增加效益 C.熵增加的程度最大 D.熵减少的程度最大 7. 以下哪个算法是基于规则的分类器 ( ) A. C4.5 B. KNN C. Bayes D. ANN 8. 以下哪项关于决策树的说法是错误的 ( ) A.冗余属性不会对决策树的准确率造成不利的影响 B.子树可能在决策树中重复多次 C.决策树算法对于噪声的干扰非常敏感 第2 页 D.寻找最佳决策树是NP 完全问题 9. 决策树中不包含一下哪种结点( ) A .根结点(root node) B .内部结点(internal node) C .外部结点(external node ) D.叶结点(leaf node) 10. 在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是: ( ) A.有放回的简单随机抽样 B.无放回的简单随机抽样 C.分层抽样 D.渐进抽样 11. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其 他标签的数据相分离?( ) A. 分类 B.聚类 C. 关联分析 D. 隐马尔可夫链 12. 以下关于人工神经网络(ANN)的描述错误的有(

文档评论(0)

1亿VIP精品文档

相关文档