数据挖掘试题.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
For personal use only in study and research; not for commercial use 单选题 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖 掘的哪类问题? (A) 关联规则发现 B.聚类 分类 D.自然语言处理 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务? (C) 频繁模式挖掘 B.分类和预测 C.数据预处理 D.数据流挖掘 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数 据相分离? (B) 分类 B.聚类 C.关联分析 D.隐马尔可夫链 TOC \o 1-5 \h \z 6.使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务? ( A) 探索性数据分析 B.建模描述 C.预测建模 D.寻找模式和规则 下面哪种不属于数据预处理的方法? (D) A变量代换 B离散化 C聚集 D估计遗漏值 12?假设12个销售价格记录组已经排序如下: 5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215使 用如下每种方法将它们划分成四个箱。等频(等深)划分时, 15在第几个箱子内? (B) A第一个 B 第二个 C第三个 D第四个 13?上题中,等宽划分时(宽度为 50),15又在哪个箱子里? (A) A第一个 B 第二个 C第三个 D第四个 只有非零值才重要的二元属性被称作: (C ) A计数属性 B离散属性 C非对称的二元属性 D对称属性 以下哪种方法不属于特征选择的标准方法: (D) A嵌入 B过滤 C包装 D抽样 18?下面不属于创建新属性的相关方法的是: (B) A特征提取 B特征修改 C映射数据到新的空间 D特征构造 22?假设属性in come的最大最小值分别是 12000元和98000元。利用最大最小规范化的方 法将属性的值映射到 0至1的范围内。对属性in come的73600元将被转化为:(D) A 0.821 B 1.224 C 1.458 D 0.716 23?假定用于分析的数据包含属性 age。数据元组中age的值如下(按递增序):13,15,16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 30, 33, 33, 35, 35, 36, 40, 45, 46, 52, 70,问题:使用按箱平均值平滑方法对上述数据进行平滑, 箱的深度为3。第二个箱子值为: (A) A 18.3 B 22.6 C 26.8 D 27.9 TOC \o 1-5 \h \z 数据仓库是随着时间变化的,下面的描述不正确的是 (C) 数据仓库随时间的变化不断增加新的数据内容 ; 捕捉到的新数据会覆盖原来的快照 ; 数据仓库随事件变化不断删去旧的数据内容 ; 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合 . 关于基本数据的元数据是指:(D) 基本元数据与数据源,数据仓库,数据集市和应用程序等结构相关的信息 ; 基本元数据包括与企业相关的管理方面的数据和信息 ; 基本元数据包括日志文件和简历执行处理的时序调度信息 ; 基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息 ? 下面关于数据粒度的描述不正确的是 :(C) 粒度是指数据仓库小数据单元的详细程度和级别 ; 数据越详细,粒度就越小,级别也就越高; 数据综合度越高,粒度也就越大,级别也就越高; 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量 OLAP技术的核心是:(D) 在线性; 对用户的快速响应; 互操作性. 多维分析; 关于OLAP的特性,下面正确的是:(D) (1)快速性 ⑵可分析性(3)多维性(4)信息性 ⑸共享性 (1)⑵(3) ⑵⑶⑷ ⑴⑵⑶(4) (1)⑵⑶⑷⑸ 关于OLAP和OLTP的区别描述,不正确的是:(C) OLAP主要是关于如何理解聚集的大量不同的数据 ?它与OTAP应用程序不同. TOC \o 1-5 \h \z 与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务 . OLAP的特点在于事务量大,但事务内容比较简单且重复率高 ? OLAP是以数据仓库为基础的,但其最终数据来源与 OLTP —样均来自底层的数据库系统 , 两者面对的用户是相同的. 关于OLAP和OLTP的说法,下列不正确的是:(A) OLAP事务量大,但事务内容比较简单且重复率高 . OLAP的最终数据来源与 OLTP不一样. OLTP面对的是决策人员和高层管理人员 . OLTP以应用为核心,是应用驱动的. 设X={1,2,3}是频繁项集,则可由 X产生__(C)_个关联规则。 A、4 B、5 C、6 D、7 概

文档评论(0)

大宝&小宝 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档