数据挖掘试题.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

单选题

1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖

掘的哪类问题?(A)

A.关联规则发现B。聚类

C.分类D。自然语言处理

3.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C)

A.频繁模式挖掘B。分类和预测C.数据预处理D。数据流挖掘

4。当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数

据相分离?(B)

A。分类B。聚类C.关联分析D.隐马尔可夫链

6.使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?(A)

A.探索性数据分析B.建模描述

C。预测建模D。寻找模式和规则

11。下面哪种不属于数据预处理的方法?(D)

A变量代换B离散化C聚集D估计遗漏值

12。假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,

215使用如下每种方法将它们划分成四个箱.等频(等深)划分时,15在第几个箱子内?(B)

A第一个B第二个C第三个D第四个

13.上题中,等宽划分时(宽度为50),15又在哪个箱子里?(A)

A第一个B第二个C第三个D第四个

16.只有非零值才重要的二元属性被称作:(C)

A计数属性B离散属性C非对称的二元属性D对称属性

17。以下哪种方法不属于特征选择的标准方法:(D)

A嵌入B过滤C包装D抽样

18。下面不属于创建新属性的相关方法的是:(B)

A特征提取B特征修改C映射数据到新的空间D特征构造

22.假设属性income的最大最小值分别是12000元和98000元.利用最大最小规范化的方法

将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:(D)

A0。821B1。224C1。458D0。716

23.假定用于分析的数据包含属性age.数据元组中age的值如下(按递增序):13,15,16,16,

19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用

按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:(A)

A18。3B22。6C26。8D27.9

28。数据仓库是随着时间变化的,下面的描述不正确的是(C)

A。数据仓库随时间的变化不断增加新的数据内容;

B.捕捉到的新数据会覆盖原来的快照;

C.数据仓库随事件变化不断删去旧的数据内容;

D.数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合。

29.关于基本数据的元数据是指:(D)

A.基本元数据与数据源,数据仓库,数据集市和应用程序等结构相关的信息;

B。基本元数据包括与企业相关的管理方面的数据和信息;

C。基本元数据包括日志文件和简历执行处理的时序调度信息;

D.基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息.

30。下面关于数据粒度的描述不正确的是:(C)

A.粒度是指数据仓库小数据单元的详细程度和级别;

B.数据越详细,粒度就越小,级别也就越高;

C。数据综合度越高,粒度也就越大,级别也就越高;

D。粒度的具体划分将直接影响数据仓库中的数据量以及查询质量。

33。OLAP技术的核心是:(D)

A。在线性;

B。对用户的快速响应;

C.互操作性。

D.多维分析;

34.关于OLAP的特性,下面正确的是:(D)

(1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性

A.(1)(2)(3)

B。(2)(3

文档评论(0)

洞察 + 关注
官方认证
文档贡献者

博士生

认证主体宁夏三科果农牧科技有限公司
IP属地宁夏
统一社会信用代码/组织机构代码
91640500MABW4P8P13

1亿VIP精品文档

相关文档