数据挖掘概念课后习题答案.docxVIP

  • 18
  • 0
  • 约1.11万字
  • 约 16页
  • 2021-09-13 发布于四川
  • 举报
(完整版)数据挖掘概念课后习题答案 - - - - - -精品可编辑word学习资料 gZ3N3V10E3J7 — — hM5N6Y2X6Z6 — — lF8U10V4P9A7 第 1 章 1.6 定义以下 数据挖掘功能: 特点化、区分、关 联和相关分析、 猜测 聚 类和演 变分析;使用你熟识的 现实 生活的数据 库,给出每种数据挖掘功 能的例子; . 特点化 是一个目 标类 数据的一般特性或特性的 汇总 ;例如, 同学的特点 可被提出,形成全部高校的 运算机科学 专业 一年 级同学的 轮廓, 这些特 征包括作 为一种高的年 级 平均成 绩 (GPA:Grade point aversge)的信息, 仍有所修的 课程的最大数量; . 区 分是将 目标 类数 据对 象的 一般 特性 与一个 或多 个对 比类 对象 的一 般 特性 进 行比较;例 如,具有高 GPA 的同学 的一般特性 可被用来与 具有 低 GPA 的一般 特性比 较; 最终的描述 可能是同学 的一个一般 可比较的 轮廓,就像具有高 GPA 的同学的 75% 是四年 级运算机科学 专业的同学 ,而具有低 GPA 的同学的 65% 不是; . 关联是指 发觉 关联规章 ,这些规章 表示一起 频繁发生在 给定数据集的特 征 值 的 条 件 ;例 如 , 一 个 数 据 挖 掘 系 统 可 能 发 现 的 关 联 规 就 为 : |精. |品. |可. |编. |辑. |学. |习. |资. |料. * | * | * | * | |欢. |迎. |下. |载.  major (X , “computing science”) . owns(X, “personalcomputer ”) [support =12%, confid ence=98% ] 其中, X 是一个表示同学的 变量; 这个规章指出正在学 习的同学, 12%(支持度) 主修运算机科学并且 拥有一台个人运算机;这个组一个同学 拥有一台个人 电脑的概率是 98%(置信度,或确定度); . 分类与猜测 不同,由于前者的作用是构造一系列能描述和区分数据 类型 或概念的 模型(或功能 ), 而后者 是建立一个模型 去猜测缺失的或无 效 的、并且通常是数字的数据 值;它们的相像性是他 们都是 猜测的工具 : 分类被用作 猜测目标数据的 类的标签 ,而猜测 典型的 应用是 猜测缺失的 数字型数据的 值; . 聚类分析 的数据 对象不考 虑已知的 类标 号;对象依据最大花蕾内部的相像性、 最小化 类之间的相像性的原 就进行聚类或分 组;形成的每一簇可 以被看作一个 对象类;聚类也便于分 类法组织形式, 将观测组织 成类分 层结构,把 类似的大事 组织 在一起; . 数据延边分析描述和模型化随 时间变 化的对象的规律或趋势 ,尽管 这可 能包括 时间 相关数据的特点化、 区分、关联和相关分析、 分类、或猜测 ,这种分析的明确特点包括 时间序列数据分析、序列或周期模式匹配、 和 基于相像性的数据分析 1.9 列举并描述 说明数据挖掘任 务的五种原 语;五种原 语是: . 任务相关数据 :这种原 语指明 给定挖掘所 处理的数据;它包括指明数据 库、数据库表、或数据 仓库 ,其中包括包含关系数据、 挑选 关系数据的 条件、用于探究的关系数据的属性或 维、关于修复的数据排序和分 组; . 挖掘的数据 类型 :这种原 语指明白所要 执行的特定数据挖掘功能 ,如特 征化、区分、 关联、分 类、聚 类、或演化分析;同 样,用 户的要求可能 更特别, 并可能供应所 发觉的模式必需匹配的模版; 这些模版或超模式(也被称 为超规章 )能被用来指 导发觉过 程; . 背景知 识:这种原 语答应用户指定已有的关于挖掘 领域的知 识;这样的 学问能被用来指 导学问发觉过 程,并且 评估发觉的模式; 关于数据中关 系的概念分 层和用 户信念是背景知 识的 形式; . 模式 爱好度度量 :这种原 语答应用户指定功能,用于从知 识中分割不感 爱好的模式, 并且被用来指 导挖掘过程,也可 评估发觉 的模式; 这样就 答应用户限制在挖掘 过程返回的不感 爱好的模式的数量, 由于一种数据 挖掘系 统可能 产生大量的模式; 爱好度 测量能被指定 为简 易性、确定性 、适用性、和新 颖性的特点; . 发觉模式的可 视化 :这种原 语述及发觉的模式 应当被显示出来 ;为了使 数据挖掘能有效地 将知 识传给 用户,数据挖掘系 统应当 能将 发觉 的各种 形式的模式展现出来,正如 规章、表格、 饼或条形 图、决策 树、立方体或其它 视觉 的表示; 1.4 1.13 描述以下数据挖掘系 统与数据 库或数据 仓库 集成方法的差 别:不耦 合、松散耦合、

文档评论(0)

1亿VIP精品文档

相关文档