- 10
- 0
- 约1.46万字
- 约 13页
- 2017-06-05 发布于湖北
- 举报
贵州大学人武学院2014-2015 第2 学期
《数据仓库与数据挖掘技术》平时作业
学生学号:
学生姓名:
班 级:
任课教师:
《数据仓库与数据挖掘技术》作业一
成 绩:
教师签名:
基本概念部分
一.选择题
1. 数据挖掘技术包括三个主要的部分 ( )
A.数据、模型、技术 B.算法、技术、领域知识
C.数据、建模能力、算法与技术 D.建模能力、算法与技术、领域知识
2.关于基本数据的元数据是指: ( )
A.基本元数据与数据源,数据仓库,数据集市和应用程序等结构相关的信息;
B.基本元数据包括与企业相关的管理方面的数据和信息;
C.基本元数据包括日志文件和简历执行处理的时序调度信息;
D.基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息。
3. 关于OLAP 和OLTP 的说法,下列不正确的是: ( )
A .OLAP 事务量大,但事务内容比较简单且重复率高
B.OLAP 的最终数据来源与OLTP 不一样
C .OLTP 面对的是决策人员和高层管理人员
D.OLTP 以应用为核心,是应用驱动的
4.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?
( )
A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘
5.下面哪种不属于数据预处理的方法? ( )
A.变量代换 B.离散化 C. 聚集 D. 估计遗漏值
6. 在ID3 算法中信息增益是指( )
A.信息的溢出程度 B.信息的增加效益
C.熵增加的程度最大 D.熵减少的程度最大
7. 以下哪个算法是基于规则的分类器 ( )
A. C4.5 B. KNN C. Bayes D. ANN
8. 以下哪项关于决策树的说法是错误的 ( )
A.冗余属性不会对决策树的准确率造成不利的影响
B.子树可能在决策树中重复多次
C.决策树算法对于噪声的干扰非常敏感
第2 页
D.寻找最佳决策树是NP 完全问题
9. 决策树中不包含一下哪种结点( )
A .根结点(root node) B .内部结点(internal node)
C .外部结点(external node ) D.叶结点(leaf node)
10. 在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是:
( )
A.有放回的简单随机抽样 B.无放回的简单随机抽样
C.分层抽样 D.渐进抽样
11. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其
他标签的数据相分离?( )
A. 分类 B.聚类 C. 关联分析 D. 隐马尔可夫链
12. 以下关于人工神经网络(ANN)的描述错误的有(
您可能关注的文档
最近下载
- Philips 飞利浦Series 1200 全自动浓缩咖啡机 EP1221 82产品支持与说明书 全自动浓缩咖啡机.pdf
- 2024年枣庄科技职业学院单招职业技能测试题库及答案解析.docx VIP
- 全髋置换术后护理查房 (2).pptx VIP
- 04-6 班子对照-高校党委领导班子2025年度民主生活会对照检查材料.docx VIP
- 纯碱,新生焕发,景气不减.pdf VIP
- 认知障碍自评表(AD8).docx VIP
- 2025枣庄科技职业学院单招《数学》试题及完整答案详解(有一套).docx VIP
- DHG9070A型电热鼓风干燥箱说明书.pdf VIP
- 【老照片】1966年-1967年的彩色中国.docx VIP
- 蒙特利尔认知评估量表.doc VIP
原创力文档

文档评论(0)