2019年公需科目练习题之数据挖掘_.docVIP

下载本文档

5
0
约2.03千字
约 9页
2020-04-10 发布于湖北
举报
版权申诉

2019年公需科目练习题之数据挖掘_.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数据挖掘数 1、( 单选， 4 分) 以下哪项不属于知识发现的过程？ ( ) A、数据清理 B、数据挖掘 C、知识可视化表达 D、数据测试答案： D 2、( 单选， 4 分) 以下哪些不属于数据挖掘的内容？（） A、分类 B、聚类 C、离群点检测 D、递归分析答案： D 3、( 单选， 4 分) 以下哪个不是常见的属性类型？（） A、标称属性 B、数值属性 C、高维属性 D、序数属性答案： C 4、( 单选， 4 分) 以下哪个度量属于数据散度的描述？（） A、均值 B、中位数 C、标准差 D、众数答案： C 5、( 单选， 4 分) 以下哪个度量不属于数据中心趋势度描述？（ D ） A、A．均值 B、中位数 C、众数 D、四分位数答案： D 6、( 单选， 4 分) 对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务？ ( ) A、频繁模式挖掘 B、分类和预测 C、数据预处理 D、噪声检测答案： C 7、( 单选， 4 分) 聚类分析是数据挖掘的一种重要技术，以下哪个算法不属于聚类算法？ ( ) A、K-Means B、DBSCAN C、SVM D、EM 答案： C 8、( 单选， 4 分) 建立一个模型，通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务？ ( ) A、根据内容检索 B、建模描述 C、预测建模 D、寻找模式和规则答案： C 9、( 单选， 4 分) 当不知道数据所带标签时 . 可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离？ ( ) A、分类 B、聚类 C、关联分析 D、隐马尔可夫链 10、( 单选， 4 分 ) 在构造决策树时，以下哪种不是选择属性的度量的方法？ ( ) A、信息增益 B、信息增益率 C、基尼指数 D、距离答案： D 11、( 单选， 4 分 ) 知识发现流程最核心的步骤是什么？ ( ) A、数据挖掘 B、数据预处理 C、模式评估 D、知识表示答案： A 12、( 单选， 4 分 ) 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务？ ( ) A、频繁模式挖掘 B、分类和预测 C、数据预处理 D、数据流挖掘答案： C 13、( 单选， 4 分 ) 以下哪个度量属于数据中心性的描述？（） A、均值 B、极差 C、众数 D、标准差答案： A 14、( 单选， 4 分 ) 聚类分析是数据挖掘的一种重要技术，以下哪个算法不属于聚类算法？ ( ) A、K-Means B、DBSCAN C、KNN D、EM 答案： C 15、( 单选， 4 分 ) 某超市研究销售纪录数据后发现，买啤酒的人很大概率也会购买尿布，这种属于数据挖掘的哪类问题？ ( ) A、关联规则发现 B、聚类 C、分类 D、自然语言处理答案： A 16、( 单选， 4 分 ) 以下哪些算法是分类算法？ ( ) A、DBSCAN B、C4.5 C、K-Mean D、EM 答案： B 17、( 单选， 4 分 ) K-means算法的缺点不包括？ ( ) A、K 必须是事先给定的 B、选择初始聚类中心 C、对于“噪声”和孤立点数据是敏感的 D、可伸缩、高效答案： D 18、( 单选， 4 分 ) 机器学习中，下面哪些方法不可以避免分类中的过拟合问题？（） A、增加样本数量 B、增加模型复杂度 C、去除噪声 D、正则化答案： B 19、( 单选， 4 分 ) 下面那个不属于知识发现过程。（） A、数据清理与集成 B、数据统计 C、数据挖掘 D、模式评估和知识表示答案： B 20、( 单选， 4 分 ) 在构造决策树时，以下那个不属于选择属性的度量？ ( ) A、信息增益 B、信息增益率 C、基尼指数 D、信息熵答案： D 21、( 单选， 4 分 ) 关于频繁模式，下面哪一个陈述是正确的？ ( ) A、K 项集频繁则 K-1 项则必定不频繁 B、K 项集频繁则 K-1 项则必定频繁 C、K 项集不频繁则 K-1 项则必定频繁 D、以上都不正确答案： B 22、( 单选， 4 分 ) DBSCAN算法最大的挑战是？ ( ) A、确定聚类个数 B、确定聚类形状 C、确定半径及 MINPTS D、确定评估指标答案： C 23、( 单选， 4 分 ) 以下那个不属于分类算法？ ( ) A、KNN B、朴素贝叶斯 C、K-MEANS D、SVM 答案： C 24、( 单选， 4 分 ) 以下哪些陈述是不正确的？ ( ) A、聚类可以发现数据内部结构 B、聚类可以作为其他任务的预处理 C、聚类可以作为异常检测 D、聚类是一种监督学习方法答案： D 25、( 单选， 4 分 ) SVM通过什么实现线性不可分问题？ ( ) A、特征降维