- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘考试题目——聚类
一 、填空题
1、密度的基于中心的方法使得我们可以将点分类为:__________、________ 、_________。
2、DBSCAN算法在最坏的情况下,时间复杂度是__________、空间复杂度是__________。
3、DBSCAN算法的优点是_______、__________________________。
4、DBSCAN算法的缺点是处理_________________、_____________的数据效果不好。
5、DBSCAN算法的参数有:___________、____________。
6、簇的有效性的非监督度量常常可以分为两类:__________、__________,它常采用的指标为__________。
7、簇的有效性的监督度量通常称为___________,它度量簇标号与外部提供的标号的匹配程度主要借助____________。
8、在相似度矩阵评价的聚类中,如果有明显分离的簇,则相似度矩阵应当粗略地是__________。
9、DBSCAN算法的参数确定的基本方法是观察____________________的特性。
10、不引用附加的信息,评估聚类分析结果对数据拟合情况属于__________技术。
答案:
1、 核心点 边界点 噪声点
2、 O(n2) O(n)
3、 耐噪声 能够处理任意大小和形状的簇
4、 高维数据 变密度的
5、 EPS MinPts
6、 簇的凝聚性 簇的分离性 均方差(SSE)
7、 外部指标 监督指标的熵
8、 块对角的
9、 点到它的第K个最近邻的距离(K-距离)
10、非监督
二、选择题
1、DBSCAN算法的过程是(B)。
① 删除噪声点。
② 每组连通的核心点形成一个簇。
③ 将所有点标记为核心点、边界点和噪声点。
④ 将每个边界点指派到一个与之关联的核心点的簇中。
⑤ 为距离在Eps之内的所有核心点之间赋予一条边。
A:①②④⑤③
B:③①⑤②④
C:③①②④⑤
D:①④⑤②③
2、如果有m个点,DBSCAN在最坏的情况下的时间复杂度度为(C)。
A O(m) B O(mlogm) C O(m2) D O(logm)
3、在基本DBSCAN的参数选择方法中,点到它的K个最近邻的距离中的K选作为哪一个参数(B)。
A Eps B MinPts C 质心 D 边界
4、当采用K-距离的方法选择DBSCAN的Eps和MinPts参数时,如果设置的K的值太大,则小簇(尺寸小于K的簇)可能会被标记为(A)。
A 噪声 B 核心簇 C 边界簇 D以上都不对
5、如果处理以下形状的数据时,适宜采用DBSCAN的是(B)
A 球形 B SS形 C 椭球形 D 方形
6、DBSCAN之所以难以有效处理高维数据,其主要原因是(D)
A 数据的形状太复杂 B 簇的大小未知 C 噪声点过多 D 开销过大
7、簇评估能够做到(D)
①确定数据集的聚类趋势。
②确定正确的簇个数。
③比较两个簇集,确定那个更好。
④不引用附加信息,评估聚类分析结果对数据拟合情况
A ①② B ②③④ C ①②③ D①②③④
8、如果不考虑外部信息,聚类结构的有良性度量应当采用(A)。
A 均方差 B 方差 C 中位数 D 均值
9、比较不同的聚类或簇时,通常采用相对的簇评估度量,相对的簇评估以()来评价不同的聚类或簇。
A SSE或熵 B 簇的大小 C 簇的形状 D 簇的密度
10、对于DBSCAN,参数Eps固定,当MinPts取值较大时,会导致(B)
A 能很好的区分各类簇
B 只有高密度的点的聚集区划为簇,其余划为噪声
C 低密度的点的聚集区划为簇,其余的划为噪声
D 无影响
三、判断题
1、DBSCAN的参数Eps固定时,MinPts的值越大越好。(错)
2、DBSCAN会把所有点划分到各自的簇中。(错)
3、在所有核心点的Eps半径邻域内的点数都不少于MinPts阈值。(对)
4、SSE在无监督的簇评估中能起到很好的作用。(对)
5、在通过相似度矩阵评估簇时,如果相似度矩阵是块对角的,说明具有
您可能关注的文档
最近下载
- 不锈钢管道安装施工与方案.doc VIP
- 喜茶运营管理手册和员工操作管理手册.doc VIP
- 施工总包合同.docx VIP
- 土木专业英国规范NA to BS EN 1991-1-4_2005+A1_2010.pdf VIP
- 软件风险管理计划.docx VIP
- 2024年秋季人教版7年级上册数学全册教学课件(新教材).pptx
- 中山市八年级下期末考试数学试题(有答案)-精品 .pdf VIP
- Module10 Unit 2 Don’t shout please!(教案)外研版(三起)英语五年级上册1.docx VIP
- 顶格筹码峰与平均成本双线合一选股公式.docx VIP
- Module 10 Unit 2 Don’t shout, please! (教案)外研版(三起)英语五年级上册1.docx VIP
文档评论(0)