2019年公需科目练习题之数据挖掘_.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘数 1、( 单选, 4 分) 以下哪项不属于知识发现的过程? ( ) A、数据清理 B、数据挖掘 C、知识可视化表达 D、数据测试 答案: D 2、( 单选, 4 分) 以下哪些不属于数据挖掘的内容?() A、分类 B、聚类 C、离群点检测 D、递归分析 答案: D 3、( 单选, 4 分) 以下哪个不是常见的属性类型?() A、标称属性 B、数值属性 C、高维属性 D、序数属性 答案: C 4、( 单选, 4 分) 以下哪个度量属于数据散度的描述?() A、均值 B、中位数 C、标准差 D、众数 答案: C 5、( 单选, 4 分) 以下哪个度量不属于数据中心趋势度描述?( D ) A、A.均值 B、中位数 C、众数 D、四分位数 答案: D 6、( 单选, 4 分) 对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务? ( ) A、频繁模式挖掘 B、分类和预测 C、数据预处理 D、噪声检测 答案: C 7、( 单选, 4 分) 聚类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法? ( ) A、K-Means B、DBSCAN C、SVM D、EM 答案: C 8、( 单选, 4 分) 建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数 据挖掘的哪一类任务? ( ) A、根据内容检索 B、建模描述 C、预测建模 D、寻找模式和规则 答案: C 9、( 单选, 4 分) 当不知道数据所带标签时 . 可以使用哪种技术促使带同类标签的数据与带其他 标签的数据相分离? ( ) A、分类 B、聚类 C、关联分析 D、隐马尔可夫链 10、( 单选, 4 分 ) 在构造决策树时,以下哪种不是选择属性的度量的方法? ( ) A、信息增益 B、信息增益率 C、基尼指数 D、距离 答案: D 11、( 单选, 4 分 ) 知识发现流程最核心的步骤是什么? ( ) A、数据挖掘 B、数据预处理 C、模式评估 D、知识表示 答案: A 12、( 单选, 4 分 ) 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务? ( ) A、频繁模式挖掘 B、分类和预测 C、数据预处理 D、数据流挖掘 答案: C 13、( 单选, 4 分 ) 以下哪个度量属于数据中心性的描述?() A、均值 B、极差 C、众数 D、标准差 答案: A 14、( 单选, 4 分 ) 聚类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法? ( ) A、K-Means B、DBSCAN C、KNN D、EM 答案: C 15、( 单选, 4 分 ) 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属 于数据挖掘的哪类问题? ( ) A、关联规则发现 B、聚类 C、分类 D、自然语言处理 答案: A 16、( 单选, 4 分 ) 以下哪些算法是分类算法? ( ) A、DBSCAN B、C4.5 C、K-Mean D、EM 答案: B 17、( 单选, 4 分 ) K-means算法的缺点不包括? ( ) A、K 必须是事先给定的 B、选择初始聚类中心 C、对于“噪声”和孤立点数据是敏感的 D、可伸缩、高效 答案: D 18、( 单选, 4 分 ) 机器学习中,下面哪些方法不可以避免分类中的过拟合问题?() A、增加样本数量 B、增加模型复杂度 C、去除噪声 D、正则化 答案: B 19、( 单选, 4 分 ) 下面那个不属于知识发现过程。() A、数据清理与集成 B、数据统计 C、数据挖掘 D、模式评估和知识表示 答案: B 20、( 单选, 4 分 ) 在构造决策树时,以下那个不属于选择属性的度量? ( ) A、信息增益 B、信息增益率 C、基尼指数 D、信息熵 答案: D 21、( 单选, 4 分 ) 关于频繁模式,下面哪一个陈述是正确的? ( ) A、K 项集频繁则 K-1 项则必定不频繁 B、K 项集频繁则 K-1 项则必定频繁 C、K 项集不频繁则 K-1 项则必定频繁 D、以上都不正确 答案: B 22、( 单选, 4 分 ) DBSCAN算法最大的挑战是? ( ) A、确定聚类个数 B、确定聚类形状 C、确定半径及 MINPTS D、确定评估指标 答案: C 23、( 单选, 4 分 ) 以下那个不属于分类算法? ( ) A、KNN B、朴素贝叶斯 C、K-MEANS D、SVM 答案: C 24、( 单选, 4 分 ) 以下哪些陈述是不正确的? ( ) A、聚类可以发现数据内部结构 B、聚类可以作为其他任务的预处理 C、聚类可以作为异常检测 D、聚类是一种监督学习方法 答案: D 25、( 单选, 4 分 ) SVM通过什么实现线性不可分问题? ( ) A、特征降维

您可能关注的文档

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档