数据挖掘练习题.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一、填空题 1、 数据预处理对于数据挖掘是一个重要问题,主要包括 、数 据集成、 和数据归约。 2、 多维数据模型的星形模式中,主要依靠事实表中 的与维表联系在 一起。 3、 允许从多个维对数据建模和观察,它由维和事实定义。 4、 数据集(5,10,11,13,15,15,35,50,55,72,92,204,215} 的中位数为 , 众数为 o 5、 在多个抽象层上挖掘数据产生的关联规则称为 。 6、 将物理或抽象对象的集合分成相似的对象类(或簇)的过程称 为 O 7、 分类和预测是两种数据分析形式,可以用来建立模型,预测数据未来的趋势, 其中 用来预测类别标号, 用来建立连续函数 模型。 8、 给定两个对象,分别表示为(22, 1, 42, 10) , (20, 0, 36,8),两个对象 之间的曼哈顿距离为 o 9、 通常数据仓库与OLAPT具是基于 模型进行设计的。 10、涉及两个或多个维的关联规则称为 o 二、单项选择题 1、SPSS乍为通用的统计软件包不仅被广泛地用于经济、管理、工业等领域的数据 统计处理,而且在( )中得到了应用。 A、数据挖掘领域 B、数据仓库领域 C、信息管理领域 D、系统 管理领域 2、 2、 下列度量中,哪一个度量不属于集中趋势度量:( A、中位数 B、中列数 C、众数D、极差 3、OLAP技术的核心是:( )。 A、在线性 B、对用户的快速响应 C、互操作性 D、多维分析 4、关于OLAP和OLTP的说法,下列不正确的是:( ) A、OLTP事务量大,但事务内容比较简单且重复率高 B、 OLAP的数据来源与OLTP不完全一样 C、 OLTP面对的是决策人员和高层管理人员 D、 OLTP以应用为核心,是应用驱动的 5、 下列哪种操作可以使用户更加直观地从不同角度观察数据立方体中不同维之间的关 系:()。 A、上卷 B、下钻 C、切片 D、旋转 6、 数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了哪种数据挖掘方法: ()O A、分类 B、预测 C、关联分析D、聚类 7、 利用信息增益方法作为属性选择度量建立决策树时,已知某训练样本集的四 个属性的信息增益分别为:Gain (收入)=0.940位,Gai n (职业)=0.151位,Gai n (年龄)=0.780位,Gain (信誉)=0.048位,则应该选择哪个属性作为决策树的 测试属性:()。 A、“收入”属性 B、“职业”属性 C、“年龄”属性 D、“信 誉”属性 8、 多维数据模型中,下列哪种模式不属于多维模式:( )。 A、星型模式 B、雪花模式 C、星座模式 D、网型模式 9、下列哪种数据挖掘方法是研究自变量与因变量之间关系的分析方法, 其冃的 在于根据自变量来预测因变量的值:( )o A、概念描述 B、关联分析 C、回归D、分类 10、下列哪种数据挖掘方法能够帮助市场分析人员根据购买模式从顾客数据库中发现 不同的顾客群:()。 A、分类 B、预测 C、关联分析 D、聚类 IS范化方法将属性income的值为73600规范后的结果为:If11、假设属性income的最大最小值分别是12000元和98000 IS 范化方法将属性income的值为73600规范后的结果为: If A、0.821 B、1.224C、1.458 D、0.716 12、 考 虑数据集{12 , 24, 33, 2, 4, 55, 68, 26},其四分位数极差是:()。 A、 31 B、 24 C、 55 D、 3 13、 TOC \o 1-5 \h \z 原始数据进行数据清洗、集成、变换、规约是以下哪个步骤的任务() 。 A、频繁模式挖掘B、分类和预测C、数据预处理D、数据流 挖掘 14、 数据仓库上的业务处理称作是:( )o A、联机事务处理(OLTP) B、联机分析处理(OLAP) C、联机查询处理 D、联机输入处理 15、 下列哪一种处理过程不是在数据清理阶段完成的( )。 A、空缺值处理 B、噪声数据 C、不一致数据处理 D、规范化处 理 三、多项选择题 1、下列四类数据挖掘功能中哪些是描述性功能() 。 A、分类B、回归C、关联分析D、聚类E、概念描述 2、 下面选项中,哪些是数据仓库的基本特征: ()。 A、 数据仓库是面向主题的 B、 数据仓库的数据是集成的 C、 数据仓库的数据是非易失的 D数据仓库的数据是时变的 E、数据仓库是面向事务的 3、 下面哪些操作是联机分析处理(OLAP操作()。 A、上卷B、切片C、旋转D、切块E、下钻 4、 4、 下列哪些度量常用来评价关联规则的相关度: HlA、提升度B、全置信度C、余弦D、支持度E、置信度 5 Hl A、K均值B、K中心点C、Apri

文档评论(0)

文档查询,农业合作 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体土默特左旗农特农机经销部
IP属地广西
统一社会信用代码/组织机构代码
92150121MA0R6LAH4P

1亿VIP精品文档

相关文档