文件数据挖掘试题(单选)a.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
A, 无序规则 B,穷举规则 C, 互斥规则 D,有序规则 如果规则集中的规则按照优先级降序排列,则称规则集是 (D) A, 无序规则 B,穷举规则 C, 互斥规则 D,有序规则 如果允许一条记录触发多条分类规则,把每条被触发规则的后件看作是对相应类的一次投票,然后计票确定测试记录的类标号,称为(A) A, 无序规则 B,穷举规则 C, 互斥规则 D,有序规则 考虑两队之间的足球比赛:队0 和队 1。假设 65%的比赛队 0 胜出,剩余的比赛队 1 获胜。队 0 获胜的比赛中只有 30%是在队 1 的主场,而队 1 取胜的比赛中 75%是主场获胜。如果下一场比赛在队 1 的主场进行队 1 获胜的概率为 (C) A, B,0.35 C, D, 以 下 关 于 人 工 神 经 网 络 (ANN) 的 描 述 错 误 的 有 (A) A,神经网络对训练数据中的噪声非常鲁棒 B,可以处理冗余特征 C,训练 ANN 是一个很耗时的过程 D,至少含有一个隐藏层的多层神经网络 通过聚集多个分类器的预测来提高分类准确率的技术称为 (A) A,组合(ensemble) B,聚集(aggregate) C,合并(combination) D,投票(voting) 简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( B ) A、层次聚类 B、划分聚类 C、非互斥聚类 D、模糊聚类 在基本 K 均值算法里,当邻近度函数采用( A )的时候,合适的质心是簇中各点的中位数。 A、曼哈顿距离 B、平方欧几里德距离 C、余弦距离 D、Bregman 散度65.( C )是一个观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不同的机制产生的。 A、边界点 B、质心 C、离群点 D、核心点 BIRCH 是一种( B )。 A、分类器 B、聚类算法 C、关联分析算法 D、特征选择算法 检测一元正态分布中的离群点,属于异常检测中的基于( A )的离群点检测。 A、统计方法 B、邻近度 C、密度 D、聚类技术 68.( C )将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度,它是一种凝聚层次聚类技术。 A、MIN(单链) B、MAX(全链) C、组平均 D、Ward 方法 69.( D )将两个簇的邻近度定义为两个簇合并时导致的平方误差的增量,它是一种凝聚层次聚类技术。 A、MIN(单链) B、MAX(全链) C、组平均 D、Ward 方法 DBSCAN 在最坏情况下的时间复杂度是( B )。 A、O(m) B、O(m2) C、O(log m) D、O(m*log m) 在基于图的簇评估度量表里面,如果簇度量为proximity(Ci , C),簇权值为 mi ,那么它的类型是( C )。 A、基于图的凝聚度 B、基于原型的凝聚度 C、基于原型的分离度 D、基于图的凝聚度和分离度 关于K 均值和 DBSCAN 的比较,以下说法不正确的是( A )。 A、K 均值丢弃被它识别为噪声的对象,而DBSCAN 一般聚类所有对象。 B、K 均值使用簇的基于原型的概念,而DBSCAN 使用基于密度的概念。 C、K 均值很难处理非球形的簇和不同大小的簇,DBSCAN 可以处理不同大小和不同形状 的簇。 D、K 均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN 会合并有重叠的簇。 以下是哪一个聚类算法的算法流程:①构造 k-最近邻图。②使用多层图划分算法划分图。③repeat:合并关于相对互连性和相对接近性而言,最好地保持簇的自相似性的簇。 ④until:不再有可以合并的簇。( C )。 A、MST B、OPOSSUM C、Chameleon D、Jarvis-Patrick(JP) 考虑这么一种情况:一个对象碰巧与另一个对象相对接近,但属于不同的类,因为这两个对象一般不会共享许多近邻,所以应该选择( D )的相似度计算方法。 A、平方欧几里德距离 B、余弦距离 C、直接相似度 D、共享最近邻 以下属于可伸缩聚类算法的是( A )。 A、CURE B、DENCLUE C、CLIQUE D、OPOSSUM 以下哪个聚类算法不是属于基于原型的聚类( D )。 A、模糊c 均值 B、EM 算法 C、SOM D、CLIQUE 关于混合模型聚类算法的优缺点,下面说法正确的是( B )。 A、当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理。 B、混合模型比K 均值或模糊c 均值更一般,因为它可以使用各种类型的分布。 C、混合模型很难发现不同大小和椭球形状的簇。D、混合模型在有噪声和离群点时不会存在问题。 以下哪个聚类算法不属于基于网格的聚类算法( D )。 A、

文档评论(0)

mph + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体上海谭台科技有限公司
IP属地湖北
统一社会信用代码/组织机构代码
91310115MA7CY11Y3K

1亿VIP精品文档

相关文档