2022年数据挖掘与数据仓库考试题.pdfVIP

  • 0
  • 0
  • 约1.76万字
  • 约 8页
  • 2026-02-04 发布于河北
  • 举报

精品文档

2022年数据挖掘与数据仓库考试题

1.(10分)讨论::下列每项活动是否是数据挖掘任务?单陈述你的理由。

(a)根据性别划分公司的顾客。

不是。数据挖掘是在大型数据存储库中,自动地发现实用信息的过程。数据挖掘技

术服务用来探查大型数据库,发现先前未知的实用模式。还可以预测未来观测结果,

例如,预测一位新的顾客是否会在一家百货公司消责100美元以上。但并非所有的

信息发现任务都被视为数据挖掘,数据挖掘与信息检索不同,使用数据库管理系统

查找个别的记录,或者通过因特网的搜索引擎直找特定的Web页面,则是信息检

索领城的任务,它们主要依赖传统的计算机科学技术和数据的明显特征来创建索

引结构,从而有效地组织和检索信息。数据挖掘的任务可分为两大类:预测任务

和描述任务。主要任务有四种:聚类分析,关联分析,异常检测,和预测建模。

其目的是根据其它属性的值,预测特定属性的值,或者导出概括数据中潜在联系的

模式,主要是预测某些信息。而根据性别划分公司的顾客,只是一种单的数

据库查询操作,并没有涉及预测分析。

(b)根据可嬴利性划分公司的顾客。

不是。根据可赢利性划分公司的顾客是使用阈值进行的一种统计计算。它仅仅是根

据消费结果统计将原有顾客进行划分,只是一种统计的结果,而没有根据这些结果

的特点预测一个新的顾客的赢利性,这种预测才是数据挖掘。

(c)预测投一对骰子的结果。

不是。因为骰子的六个数值浮现的可能性是相同的,这是一种概率计算,如果结果

浮现的可能性是不确定的,不相同的,则更像是数据挖掘的任务,但在很早以前利

用数学已经能够很好的解决这个问题了。所以预测投一对骰了•的结果不属于数据挖

掘的任务,不带有发现新信息的预测特点。

(d)使用历史记录预测某公司未来的股票价格。

这是数据挖掘的任务。可以通过对历史记录特点的分析来创建一种模型预测未来的

公司的股票价格,这是数据挖掘任务中预测建模的一个例子,预测建模涉及以说明

变量函数的方式为目标变量建立模型,有两类预测建模任务:分类,用于预测离散

的目标变量;PI月,用于预测连续的目标变量dmj预测某公司未来的股票价格则

是回归任务,因为价格具有连续值属性。

2.(10分)列举3种数据挖掘功能,对每种举2个实际应用的例子。

(1)支持商务智能应用。借助POS(销售点)数据采集技术,零售商可以在其商店

的收银台采集顾购物的最新数据。零售商可以利用这些信息,加之电子商务网站的H

志、电购中心的顾服务记录等其他的重要商务数据,更好地理解顾的需求,做出明

智的商务决策。数据挖掘技术可以用来支持广泛的商务智能应用,如顾分析、定向营

销、工作流管理、商店分布和欺诈检测等。商店可以根据顾的购物习惯来安排端口的

摆放位置,这是日常生活中数据挖掘最常见的一种应用。数据挖掘还能匡助零售商问答

一些重要的商务问题,如“谁是最有价值的顾?”“什么产品可以交叉销售或者提升

销售?”“公司明年的收入前景如何?”这些是数据挖掘任务中的关联分析通过商

品销售情况,来分析购买

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档