数据挖掘考试题目聚类.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘考试题目——聚类 一 、填空题 1、密度的基于中心的方法使得我们可以将点分类为:__________、________ 、_________。 2、DBSCAN算法在最坏的情况下,时间复杂度是__________、空间复杂度是__________。 3、DBSCAN算法的优点是_______、__________________________。 4、DBSCAN算法的缺点是处理_________________、_____________的数据效果不好。 5、DBSCAN算法的参数有:___________、____________。 6、簇的有效性的非监督度量常常可以分为两类:__________、__________,它常采用的指标为__________。 7、簇的有效性的监督度量通常称为___________,它度量簇标号与外部提供的标号的匹配程度主要借助____________。 8、在相似度矩阵评价的聚类中,如果有明显分离的簇,则相似度矩阵应当粗略地是__________。 9、DBSCAN算法的参数确定的基本方法是观察____________________的特性。 10、不引用附加的信息,评估聚类分析结果对数据拟合情况属于__________技术。 答案: 1、 核心点 边界点 噪声点 2、 O(n2) O(n) 3、 耐噪声 能够处理任意大小和形状的簇 4、 高维数据 变密度的 5、 EPS MinPts 6、 簇的凝聚性 簇的分离性 均方差(SSE) 7、 外部指标 监督指标的熵 8、 块对角的 9、 点到它的第K个最近邻的距离(K-距离) 10、非监督 二、选择题 1、DBSCAN算法的过程是(B)。 ① 删除噪声点。 ② 每组连通的核心点形成一个簇。 ③ 将所有点标记为核心点、边界点和噪声点。 ④ 将每个边界点指派到一个与之关联的核心点的簇中。 ⑤ 为距离在Eps之内的所有核心点之间赋予一条边。 A:①②④⑤③ B:③①⑤②④ C:③①②④⑤ D:①④⑤②③ 2、如果有m个点,DBSCAN在最坏的情况下的时间复杂度度为(C)。 A O(m) B O(mlogm) C O(m2) D O(logm) 3、在基本DBSCAN的参数选择方法中,点到它的K个最近邻的距离中的K选作为哪一个参数(B)。 A Eps B MinPts C 质心 D 边界 4、当采用K-距离的方法选择DBSCAN的Eps和MinPts参数时,如果设置的K的值太大,则小簇(尺寸小于K的簇)可能会被标记为(A)。 A 噪声 B 核心簇 C 边界簇 D以上都不对 5、如果处理以下形状的数据时,适宜采用DBSCAN的是(B) A 球形 B SS形 C 椭球形 D 方形 6、DBSCAN之所以难以有效处理高维数据,其主要原因是(D) A 数据的形状太复杂 B 簇的大小未知 C 噪声点过多 D 开销过大 7、簇评估能够做到(D) ①确定数据集的聚类趋势。 ②确定正确的簇个数。 ③比较两个簇集,确定那个更好。 ④不引用附加信息,评估聚类分析结果对数据拟合情况 A ①② B ②③④ C ①②③ D①②③④ 8、如果不考虑外部信息,聚类结构的有良性度量应当采用(A)。 A 均方差 B 方差 C 中位数 D 均值 9、比较不同的聚类或簇时,通常采用相对的簇评估度量,相对的簇评估以()来评价不同的聚类或簇。 A SSE或熵 B 簇的大小 C 簇的形状 D 簇的密度 10、对于DBSCAN,参数Eps固定,当MinPts取值较大时,会导致(B) A 能很好的区分各类簇 B 只有高密度的点的聚集区划为簇,其余划为噪声 C 低密度的点的聚集区划为簇,其余的划为噪声 D 无影响 三、判断题 1、DBSCAN的参数Eps固定时,MinPts的值越大越好。(错) 2、DBSCAN会把所有点划分到各自的簇中。(错) 3、在所有核心点的Eps半径邻域内的点数都不少于MinPts阈值。(对) 4、SSE在无监督的簇评估中能起到很好的作用。(对) 5、在通过相似度矩阵评估簇时,如果相似度矩阵是块对角的,说明具有

文档评论(0)

我思故我在 + 关注
实名认证
文档贡献者

部分用户下载打不开,可能是因为word版本过低,用wps打开,然后另存为一个新的,就可以用word打开了

1亿VIP精品文档

相关文档