数据挖掘-概念与技术(第三版)部分习题答案.docVIP

  • 2
  • 0
  • 约1.21万字
  • 约 19页
  • 2024-04-15 发布于江西
  • 举报

数据挖掘-概念与技术(第三版)部分习题答案.doc

1、4数据仓库与数据库有何不同?有哪些相似之处?

答:区别:数据仓库就是面向主题得,集成得,不易更改且随时间变化得数据集合,用来支持管理人员得决策,数据库由一组内部相关得数据与一组管理与存取数据得软件程序组成,就是面向操作型得数据库,就是组成数据仓库得源数据。它用表组织数据,采用ER数据模型。

相似:它们都为数据挖掘提供了源数据,都就是数据得组合。

1、3定义下列数据挖掘功能:特征化、区分、关联与相关分析、预测聚类与演变分析.使用您熟悉得现实生活得数据库,给出每种数据挖掘功能得例子。

答:特征化就是一个目标类数据得一般特性或特性得汇总。例如,学生得特征可被提出,形成所有大学得计算机科学专业一年级学生得轮廓,这些特征包括作为一种高得年级平均成绩(GPA:Gradepointaversge)得信息,

还有所修得课程得最大数量.

??区分就是将目标类数据对象得一般特性与一个或多个对比类对象得一般特性进行比较。例如,具有高GPA得学生得一般特性可被用来与具有低GPA得一般特性比较.最终得描述可能就是学生得一个一般可比较得轮廓,就像具有高GPA得学生得75%就是四年级计算机科学专业得学生,而具有低GPA得学生得65%不就是。

??关联就是指发现关联规则,这些规则表示一起频繁发生在给定数据集得特征值得条件。例如,一个数据挖掘系统可能发现得关联规则为:major(X,“p

文档评论(0)

1亿VIP精品文档

相关文档