数据挖掘考试测验题试卷.pdfVIP

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据挖掘考试题

一.选择题

1.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数

据相分离?()

A.分类B.聚类C.关联分析D.主成分分析

2.()将两个簇的邻近度定义为不同簇的所有点对邻近度的平均值,它是一种凝聚层次聚类

技术。

A.MIN(单链)B.MAX(全链)C.组平均D.Ward方法

3.数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了()数据挖掘方法。

A分类B预测C关联规则分析D聚类

4.关于K均值和DBSCAN的比较,以下说法不正确的是()

A.K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象。

B.K均值使用簇的基于原型的概念,DBSCAN使用基于密度的概念。

C.K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的

D.K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有

重叠的簇

5.下列关于Ward’sMethod说法错误的是:()

A.对噪声点和离群点敏感度比较小

B.擅长处理球状的簇

C.对于Ward方法,两个簇的邻近度定义为两个簇合并时导致的平方误差

D.当两个点之间的邻近度取它们之间距离的平方时,Ward方法与组平均非常相似

6.下列关于层次聚类存在的问题说法正确的是:()

A.具有全局优化目标函数

B.GroupAverage擅长处理球状的簇

C.可以处理不同大小簇的能力

D.Max对噪声点和离群点很敏感

7.下列关于凝聚层次聚类的说法中,说法错误的事:()

A.一旦两个簇合并,该操作就不能撤销

B.算法的终止条件是仅剩下一个簇



C.空间复杂度为Om2

D.具有全局优化目标函数

8.规则{牛奶,尿布}→{啤酒}的支持度和置信度分别为:()

TID项集

1{面包,牛奶}

2{面包,尿布,啤酒,鸡蛋}

3{牛奶,尿布,啤酒,可乐}

4{面包,牛奶,尿布,啤酒}

5{面包,牛奶,尿布,可乐}

A.0.4,0.4B.0.67,0.67C.0.4,0.67D.0.67,0.4

9.下列()是属于分裂层次聚类的方法。

A.MinB.MaxC.GroupAverageD.MST

10.对下图数据进行凝聚聚类操作,簇间相似度使用MAX计算,第二步是哪两个簇合并:()

A.在{3}和{l,2}合并B.{3}和{4,5}合并C.{2,3}和{4,5}合并

D.{2,3}和{4,5}形成簇和{3}合并

二.填空题:

1.属性包括的四种类型:、、、。

2.是两个簇的邻近度定义为不同簇的所有点对邻近度的平均值。

3.基本凝聚层次聚类算法空间复杂度,时间复杂度,如果某个簇到其他所

有簇的距离存放在一个有序表或堆中,层次聚类所需要的时间复杂度将为。

4.聚类中,定义簇间的相似度的方法有(写出四个):、、、。

5.层次聚类技术是第二类重要的聚类方法。两种层次聚类的基本方

法:、。

6.组平

您可能关注的文档

文档评论(0)

156****2818 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档