- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《数据挖掘》模拟卷
一、填空题(每格 1 分,共 20 分)
1、在数据挖掘中,常用的聚类算法包括: 划分方法、层次方法、基于密度的方法 、基于
网格的方法和基于模型的方法。
2、数据仓库的多维数据模型可以有三种不同的形式, 分别是: 星型模式、 雪花模式和事实
星座模式。
3 、从数据分析的角度看,数据挖掘可以分为两类: 描述性的数据挖掘和预测性的数据挖
掘。
4、给定基本方体,方体的物化有三种选择: 不物化、全物化和部分物化。
5、 当前的数据挖掘研究中,最主要的三个研究方向是: 数据库技术、统计学、机器学习。
6、概念分层有四种类型,分别是: 模式分层、集合分组分层、操作导出的分层和基于规
则的分层。
7、两种常用的大数据集的数据概化方法是: 数据立方体方法(或 OLAP)和面向属性的归
纳方法。
二、单选题(请选择一个正确答案填入括号内,每题 2 分,共 20 分)
1.下面哪种分类方法是属于神经网络学习算法?( )
A. 判定树归纳 B. 贝叶斯分类 C. 后向传播分类 D. 基于案例的推理
2.置信度 (confidence) 是衡量兴趣度度量( )的指标。
A 、简洁性 B 、确定性 C.、实用性 D 、新颖性
3.孤立点挖掘适用于下列哪种场合?
A 、目标市场分析 B 、购物篮分析 C、模式识别 D 、信用卡欺诈检测
4 .存放最低层汇总的方体称为:
A 、顶点方体 B 、方体的格 C、基本方体 D 、维
5.数据归约的目的是( )
A 、填补数据种的空缺值 B 、集成多个数据源的数据
C、得到数据集的压缩表示 D 、规范化数据
6.下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?
A. 数据清理 B. 数据集成 C.数据变换 D. 数据归约
7.( )通过将属性域划分为区间,从而减少给定连续值的个数。
A. 概念分层 B. 离散化 C.分箱 D. 直方图
8.下面的数据操作中, ( )操作不是多维数据模型上的 OLAP 操作。
A 、上卷 (roll-up) B 、选择 (select) C、切片 (slice) D 、转轴 (pivot)
9.假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数
据挖掘功能是( )
A. 关联分析 B. 分类和预测 C. 孤立点分析 D. 演变分析 E. 概念描述
10.下列哪个描述是正确的?( )
A 、分类和聚类都是有指导的学习
B 、分类和聚类都是无指导的学习
C、分类是有指导的学习,聚类是无指导的学习
D 、分类是无指导的学习,聚类是有指导的学习
三、多选题 (请选择两个或两个以上正确答案填入括号内, 每题 3 分,共 15 分)
1.根据关联分析中所涉及的数据维,可以将关联规则分类为: ( )
A 、布尔关联规则 B 、单维关联规则 C、多维关联规则 D 、多层关联规则
2.下列哪些是数据变换可能涉及的内容?
A 、数据压缩 B 、数据概化
文档评论(0)