东财《数据挖掘概论》复习题.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

一、单项选择题(下列每小题的备选答案中,只有一个正确答案)

1.假设12个销售价格记录组已排序如下:5,10,11,13,15,35,50,55,72,92,204,215,等频(等

深)划分时,15在第()个箱子内。

A.第一

B.第二

C.第三

D.第四

答案:B

2.在数据集成期间,当一个数据库的属性与另一个数据库的属性匹配时,必须特别注意()。

A.数据的规模

B.数据的结构

C.数据的传输速度

D.数据的价值

答案:B

3.()数据库中每个记录代表一个事务,如顾客的一次购物、一个航班订票等。

A.事务

B.关系

C.数据仓库

D.空间

答案:A

4.在决策树中,()表示该测试的一个输出。

A.根结点

B.分支

C.内部结点

D.树叶结点

答案:D

5.数量归约方法使用参数或非参数模型,下列选项中不属于非参数模型方法的是()。

A.对数线性模型

B.直方图

C.聚类

D.数据立方体聚集

答案:A

6.以下选项中,不属于数据预处理方法的是()。

A.变量代换

B.离散化

C.集成

D.估计遗漏值

答案:D

7.SVM通过搜索()来处理该问题。

A.最小边缘超平面

B.最大边缘超平面

C.横截面

D.支持向量

答案:B

8.使用簇内方差和关于簇数的曲线拐点来估计簇数的方法为()。

A.经验方法

B.肘方法

C.交叉验证

D.以上都不是

答案:B

9.数据挖掘是商务智能的核心,在现实生活中,()技术可以更好地理解每组顾客的特征,并开发定制顾客奖

励计划。

A.聚类

B.联机分析处理

C.特征挖掘

D.预测

答案:B

10.对于以下项集:{A,B};{A,C,D,E};{B,C,D,F};{A,B,C,D},{A,B,C,F}。其中,{A,C}→{A,B,C}的置信度为()。

A.2/5

B.3/5

C.3/2

D.2/3

答案:D

11.设X={1,2,3}是频繁项集,则可由X产生()个关联规则。

A.4

B.5

C.6

D.7

答案:C

12.KDD是指()。

A.数据挖掘与知识发现

B.领域知识发现

C.文档知识发现

D.动态知识发现

答案:A

13.霍普金斯统计量的值接近0.5,表明数据分布为()。

A.均匀分布

B.高度左倾斜

C.高度右倾斜

D.不确定

答案:A

14.因变量总的波动中不能通过回归模型解释的部分是()。

A.离差平方和

B.回归平方和

C.残差平方和

D.R2

答案:C

15.()属于一种数据仓库技术,具有汇总、合并和聚集以及从不同的角度观察信息的能力。

A.数据清理

B.数据集成

C.联机事务处理

D.联机分析处理

答案:D

16.()属性的值用固定、相等的单位测量。

A.标称

B.二元

C.区间标度

D.比率标度

答案:C

17.敏感度的公式为()。

A.(TP+TN)/(P+N)

B.(FP+FN)/(P+N)

C.TP/P

D.TN/N

答案:C

18.以下聚类算法不属于基于原型聚类方法的是()。

A.模糊c均值

B.EM算法

C.SOM

D.CLIQUE

答案:D

19.以下选项中,不能作为判断数据挖掘模式有趣的依据是()。

A.在某种确信度上,对于新的或检验数据是有效的

B.新颖

C.潜在有用

D.不易被人理解

答案:D

20.数据对象(1,2)和(3,5)之间的曼哈顿距离是()。

A.5

B.3.16

C.3

D.2

答案:A

21.现实生活中,顾客倾向于先购买相机,再购买内存卡,再购买其他配件,这样的模式就是一个()模式。

A.频繁子序列

B.频繁项集

C.频繁子结构

D.频繁规则

答案:A

22.假设属性income的最大最小值分别是12000元和98000元,利用最大最小规范化的方法将属性的值映射到

0至1的范围内,对属性income的73600元将转化为()。

A.0.821

B.1.224

C.1.458

D.0.716

答案:D

23.同时满足最小支持度阈值和最小置信度阈值的规则称为()。

A.强规则

B.弱规则

C.关联规则

D.频繁项集

答案:A

24.q-

文档评论(0)

135****8957 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档