文件数据挖掘试题(单选)a.docx

下载文档

2
0
约2.26千字
约 2页
2022-09-11 发布于湖北
举报
版权申诉
保障服务

文件数据挖掘试题(单选)a.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

A, 无序规则 B，穷举规则 C，互斥规则 D，有序规则如果规则集中的规则按照优先级降序排列，则称规则集是 (D) A, 无序规则 B，穷举规则 C，互斥规则 D，有序规则如果允许一条记录触发多条分类规则，把每条被触发规则的后件看作是对相应类的一次投票，然后计票确定测试记录的类标号，称为（A） A, 无序规则 B，穷举规则 C，互斥规则 D，有序规则考虑两队之间的足球比赛：队0 和队 1。假设 65%的比赛队 0 胜出，剩余的比赛队 1 获胜。队 0 获胜的比赛中只有 30%是在队 1 的主场，而队 1 取胜的比赛中 75%是主场获胜。如果下一场比赛在队 1 的主场进行队 1 获胜的概率为 (C) A， B,0.35 C, D, 以下关于人工神经网络（ANN）的描述错误的有 (A) A，神经网络对训练数据中的噪声非常鲁棒 B，可以处理冗余特征 C，训练 ANN 是一个很耗时的过程 D，至少含有一个隐藏层的多层神经网络通过聚集多个分类器的预测来提高分类准确率的技术称为 (A) A,组合(ensemble) B,聚集(aggregate) C，合并(combination) D，投票(voting) 简单地将数据对象集划分成不重叠的子集，使得每个数据对象恰在一个子集中，这种聚类类型称作（ B ） A、层次聚类 B、划分聚类 C、非互斥聚类 D、模糊聚类在基本 K 均值算法里，当邻近度函数采用（ A ）的时候，合适的质心是簇中各点的中位数。 A、曼哈顿距离 B、平方欧几里德距离 C、余弦距离 D、Bregman 散度65.（ C ）是一个观测值，它与其他观测值的差别如此之大，以至于怀疑它是由不同的机制产生的。 A、边界点 B、质心 C、离群点 D、核心点 BIRCH 是一种（ B ）。 A、分类器 B、聚类算法 C、关联分析算法 D、特征选择算法检测一元正态分布中的离群点，属于异常检测中的基于（ A ）的离群点检测。 A、统计方法 B、邻近度 C、密度 D、聚类技术 68.（ C ）将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度，它是一种凝聚层次聚类技术。 A、MIN（单链） B、MAX（全链） C、组平均 D、Ward 方法 69.（ D ）将两个簇的邻近度定义为两个簇合并时导致的平方误差的增量，它是一种凝聚层次聚类技术。 A、MIN（单链） B、MAX（全链） C、组平均 D、Ward 方法 DBSCAN 在最坏情况下的时间复杂度是（ B ）。 A、O(m) B、O(m2) C、O(log m) D、O(m*log m) 在基于图的簇评估度量表里面，如果簇度量为proximity(Ci , C)，簇权值为 mi ，那么它的类型是（ C ）。 A、基于图的凝聚度 B、基于原型的凝聚度 C、基于原型的分离度 D、基于图的凝聚度和分离度关于K 均值和 DBSCAN 的比较，以下说法不正确的是（ A ）。 A、K 均值丢弃被它识别为噪声的对象，而DBSCAN 一般聚类所有对象。 B、K 均值使用簇的基于原型的概念，而DBSCAN 使用基于密度的概念。 C、K 均值很难处理非球形的簇和不同大小的簇，DBSCAN 可以处理不同大小和不同形状的簇。 D、K 均值可以发现不是明显分离的簇，即便簇有重叠也可以发现，但是DBSCAN 会合并有重叠的簇。以下是哪一个聚类算法的算法流程：①构造 k－最近邻图。②使用多层图划分算法划分图。③repeat：合并关于相对互连性和相对接近性而言，最好地保持簇的自相似性的簇。 ④until：不再有可以合并的簇。（ C ）。 A、MST B、OPOSSUM C、Chameleon D、Jarvis－Patrick（JP）考虑这么一种情况：一个对象碰巧与另一个对象相对接近，但属于不同的类，因为这两个对象一般不会共享许多近邻，所以应该选择（ D ）的相似度计算方法。 A、平方欧几里德距离 B、余弦距离 C、直接相似度 D、共享最近邻以下属于可伸缩聚类算法的是（ A ）。 A、CURE B、DENCLUE C、CLIQUE D、OPOSSUM 以下哪个聚类算法不是属于基于原型的聚类（ D ）。 A、模糊c 均值 B、EM 算法 C、SOM D、CLIQUE 关于混合模型聚类算法的优缺点，下面说法正确的是（ B ）。 A、当簇只包含少量数据点，或者数据点近似协线性时，混合模型也能很好地处理。 B、混合模型比K 均值或模糊c 均值更一般，因为它可以使用各种类型的分布。 C、混合模型很难发现不同大小和椭球形状的簇。D、混合模型在有噪声和离群点时不会存在问题。以下哪个聚类算法不属于基于网格的聚类算法（ D ）。 A、

您可能关注的文档

文档评论（0）

mph + 关注: 官方认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

认证主体上海谭台科技有限公司

IP属地湖北

统一社会信用代码/组织机构代码: 91310115MA7CY11Y3K

1亿VIP精品文档

更多 >

文件数据挖掘试题(单选)a.docx