《数据挖掘》练习题(第1章).pdfVIP

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

一、选择题

1、从海量数据中提取有用的信息,所面临的困难有()

A、数据量太大,无法使用传统的数据分析工具和技术处理它们;

B、数据本身不是非传统数据,不能使用传统的数据处理方法进行处理;

C、在某些情况下,面临的问题不能使用己有的数据分析技术来解决;

D、数据量太大,没有足够的存储空间。

2、下列任务中,属于数据挖掘技术在商务智能方面应用的是()

A、顾客分析B、定向营销C、商店分布D、欺诈检测

3、在地球的气候领域,数据挖掘开发的技术可以帮助地球科学家解决以下问题

A、干旱和飓风等生态系统扰动的频度和强度与全球变暖之间有何联系?

B、海洋表面温度对地表降水量和温度有何影响?

C、如何准确地预测一个地区的生长季节的开始和结束?

D、

4、下列任务中,属于数据挖掘范畴的是

A、预测一位新的顾客是否会在一家百货公司消费100美元以上。

B、使用数据库管理系统查找个别的记录

C、通过因特网的搜索引擎查找特定的Web页面

D、根据性别划分公司的顾客.

5、下列任务中,属于数据挖掘范畴的是

A、根据可赢利性划分公司的顾客.

B、计算公司的总销售额。

C、按学生的标识号对学生数据库排序.

D、监视病人心率的异常变化。

6、数据预处理涉及的步骤包括

A、融合来自多个数据源的数据,

B、清洗数据以消除噪声和重复的观测值,

C、选择与当前数据挖掘任务相关的记录和特征。

D、

7、下列数据挖掘任务中,属于分类任务的是

A、预测一个Web用户是否会在网上书店买书

B、预测某股票的未来价格

C、根据检查结果判断病人是否患有某种疾病.

D、

8、异常检测的应用包括

A、检测欺诈

B、网络攻击

C、疾病的不寻常模式

D、生态系统扰动

二、名词解释

1、交叉销售:指根据顾客的兴趣推荐或显示相关商品以增加销售机会。

2、提升销售:指尝试向曾经购买的顾客销售价格更高的商品。

3、数据挖掘:是在大型数据存储库中,自动地发现有用信息的过程。

4、数据挖掘技术:用来探查大型数据库,发现先前未知的有用模式.

5、数据预处理:将未加工的输入数据转换成适合分析的形式。

6、关联分析:用来发现描述数据中强关联特征的模式.

7、聚类分析:用来发现紧密相关的观测值组群,使得与属于不同簇的观测值相比,

属于同一簇的观测值相互之间尽可能类似.

三、简答题

1、简述数据库中知识发现的过程。

数据库中知识发现的过程是将未加工的数据转换为有用信息的整个过程,如

下图所示。该过程包括一系列转换步骤,从数据的预处理到数据挖掘结果的后处

理。

2、数据挖掘算法要解决的问题

(1)算法的可伸缩性

(2)高维性

(3)异种数据和复杂数据

(4)数据的所有权与分布

(5)非传统的分析

3、分布式数据挖掘算法面临的主要挑战包括:

(1)如何降低执行分布式计算所需的通信量?

(2)如何有效地统一从多个资源得到的数据挖掘结果?

(3)如何处理数据安全性问题?

4、数据挖掘任务分为哪两类?

数据挖掘任务分为下面两大类:

(1)预测任务.其目标是根据其他属性的值,预测特定属性的值。

(2)描述任务.其目标是导出概括数据中潜在联系的模式(相关、趋势、聚类、

轨迹和异常)。

5、预测建模任务有哪两类?它们的区别是什么?

预测建模任务分为分类和回归两类。它们的区别在于分类用于预测离散的目

标变量;而回归用于预测连续的目标变量。

文档评论(0)

1637142147337d1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档