《大数据时代下的数据挖掘》试题和答案及解析 .pdfVIP

《大数据时代下的数据挖掘》试题和答案及解析 .pdf

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

《⼤数据时代下的数据挖掘》试题和答案及解析

《海量数据挖掘技术及⼯程实践》题⽬

⼀、单选题(共80题)

1)(D)的⽬的缩⼩数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到

和原始数据相同的分析结果。

A.数据清洗

B.数据集成

C.数据变换

D.数据归约

2)某超市研究销售纪录数据后发现,买啤酒的⼈很⼤概率也会购买尿布,这种属于数据挖

掘的哪类问题?(A)

A.关联规则发现

B.聚类

C.分类

D.⾃然语⾔处理

3)以下两种描述分别对应哪两种对分类算法的评价标准?(A)

(a)警察抓⼩偷,描述警察抓的⼈中有多少个是⼩偷的标准。

(b)描述有多少⽐例的⼩偷给警察抓了的标准。

A.Precision,Recall

B.Recall,Precision

A.Precision,ROCD.Recall,ROC

4)将原始数据进⾏集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C)

A.频繁模式挖掘

B.分类和预测

C.数据预处理

D.数据流挖掘

5)当不知道数据所带标签时,可以使⽤哪种技术促使带同类标签的数据与带其他标签的数

据相分离?(B)

A.分类

B.聚类

C.关联分析

D.隐马尔可夫链

6)建⽴⼀个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的

哪⼀类任务?(C)

A.根据内容检索

B.建模描述

C.预测建模

D.寻找模式和规则

7)下⾯哪种不属于数据预处理的⽅法?(D)

A.变量代换

B.离散化

C.聚集

D.估计遗漏值

8)假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,

215使⽤如下每种⽅法将它们划分成四个箱。等频(等深)划分时,15在第⼏个箱⼦内?

(B)

A.第⼀个

B.第⼆个

C.第三个

D.第四个

9)下⾯哪个不属于数据的属性类型:(D)

A.标称

B.序数

C.区间

D.相异

10)只有⾮零值才重要的⼆元属性被称作:(C)

A.计数属性

B.离散属性

C.⾮对称的⼆元属性

D.对称属性

11)以下哪种⽅法不属于特征选择的标准⽅法:(D)

A.嵌⼊

B.过滤

C.包装

D.抽样

12)下⾯不属于创建新属性的相关⽅法的是:(B)

A.特征提取

B.特征修改

C.映射数据到新的空间

D.特征构造

13)下⾯哪个属于映射数据到新的空间的⽅法?(A)

A.傅⽴叶变换

B.特征加权

C.渐进抽样

D.维归约

14)假设属性income的最⼤最⼩值分别是12000元和98000元。利⽤最⼤最⼩规范化的⽅

法将属性的值映射到0⾄1的范围内。对属性income的73600元将被转化为:(D)

A.0.821

B.1.224

C.1.458

D.0.716

15)⼀所⼤学内的各年纪⼈数分别为:⼀年级200⼈,⼆年级160⼈,三年级130⼈,四年

级110⼈。则年级属性的众数是:(A)

A.⼀年级

B.⼆年级

C.三年级

D.四年级

16)下列哪个不是专门⽤于可视化时间空间数据的技术:(B)

A.等⾼线图

B.饼图

C.曲⾯图

D.⽮量场图

17)在抽样⽅法中,当合适的样本容量很难确定时,可以使⽤的抽样⽅法是:(D)

A.有放回的简单随机抽样

B.⽆放回的简单随机抽样

C.分层抽样

D渐进抽样

18)数据仓库是随着时间变化的,下⾯的描述不正确的是(C)

A.数据仓库随时间的变化不断增加新的数据内容

B.捕捉到的新数据会覆盖原来的快照

C.数据仓库随事件变化不断删去旧的数据内容

D.数据仓库中包含⼤量的综合数据,这些综合数据会随着时间的变化不断地进⾏重新综

19)下⾯关于数据粒度的描述不正确的是:(C)

A.粒度是指数据仓库⼩数据单元的详细程度和级别

B.数据越详细,粒度就越⼩,级别也就越⾼

C.数据综合度越⾼,粒度也就越⼤,级别也就越⾼

D.粒度的具体划分将直接影响数据仓库中的数据量以及查询质量

20)有关数据仓库的开发特点,不正确的描述是:(A)

A.数据仓库开发要从数据出发

B.数据仓库使⽤的需求在开发出去就要明确

C.数据仓库的开发是⼀个不断循环的过程,是启发式的开发

D.在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中

数据分析和处理更灵活,且没有固定的模式

21)关于OLAP的特性,下⾯正确的是:(D)

(1)快速性(2)可分析性(3)多维性

您可能关注的文档

文档评论(0)

精品文档 + 关注
实名认证
文档贡献者

从事一线教育多年 具有丰富的教学经验

1亿VIP精品文档

相关文档