- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
《大数据时代下的数据挖掘》试题及答案
《海量数据挖掘技术及工程实践》题目
一、单选题(共80题)
1)(D)的目的缩小数据的取值范围,使其更适合于数据挖掘算法
的需要,并且能够得到和
原始数据相同的分析结果。
A.数据清洗
B.数据集成
C.数据变换
D.数据归约
2)某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购
买尿布,这种属于数据挖
掘的哪类问题(A)
3)A.关联规则发现B.聚类
4)C.分类D.自然语言处理
5)以下两种描述分别对应哪两种对分类算法的评价标准(A)
6)(a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。
7)(b)描述有多少比例的小偷给警察抓了的标准。
8)A.Precision,RecallB.Recall,Precision
9)A.Precision,ROCD.Recall,ROC
10)将原始数据进行集成、变换、维度规约、数值规约是在以下哪
个步骤的任务(C)
11)A.频繁模式挖掘B.分类和预测
C.数据预处理
D.数据流挖掘
12)@
13)当不知道数据所带标签时,可以使用哪种技术促使带同类标签
的数据与带其他标签的数
据相分离(B)
14)A.分类B.聚类
C.关联分析
D.隐马尔可夫链
15)建立一个模型,通过这个模型根据已知的变量值来预测其他某
个变量值属于数据挖掘的
哪一类任务(C)
16)A.根据内容检索B.建模描述
17)C.预测建模D.寻找模式和规则
18)下面哪种不属于数据预处理的方法(D)
19)A.变量代换B.离散化
C.聚集
D.估计遗漏值
20)假设12个销售价格记录组已经排序如下:5,10,11,13,15,
35,50,55,72,92,204,215使
用如下每种方法将它们划分成四个箱。等频(等深)划分时,15
在第几个箱子内(B)
21)A.第一个B.第二个
C.第三个
D.第四个
22)下面哪个不属于数据的属性类型:(D)
23)A.标称B.序数
C.区间
D.相异
24)只有非零值才重要的二元属性被称作:(C)
25)A.计数属性B.离散属性
—
C.非对称的二元属性
D.对称属性
26)以下哪种方法不属于特征选择的标准方法:(D)
27)A.嵌入B.过滤
C.包装
D.抽样
28)下面不属于创建新属性的相关方法的是:(B)
29)A.特征提取B.特征修改
C.映射数据到新的空间
D.特征构造
30)下面哪个属于映射数据到新的空间的方法(A)
31)A.傅立叶变换B.特征加权
C.渐进抽样
D.维归约
32)假设属性income的最大最小值分别是12000元和98000元。
利用最大最小规范化的方
法将属性的值映射到0至1的范围内。对属性income的73600
元将被转化为:(D)33)
34)一所大学内的各年纪人数分别为:一年级200人,二年级160
人,三年级130人,四年
级110人。则年级属性的众数是:(A)
35)A.一年级B.二年级
*
C.三年级
D.四年级
36)下列哪个不是专门用于可视化时间空间数据的技术:(B)
37)A.等高线图B.饼图
C.曲面图
D.矢量场图
38)在抽样方法中,当合适的样本容量很难确定时,可以使用的抽
样方法是:(D)
39)A.
文档评论(0)