- 18
- 0
- 约1.11万字
- 约 16页
- 2021-09-13 发布于四川
- 举报
(完整版)数据挖掘概念课后习题答案 - - - - - -精品可编辑word学习资料
gZ3N3V10E3J7 — — hM5N6Y2X6Z6 — — lF8U10V4P9A7
第 1 章
1.6 定义以下 数据挖掘功能: 特点化、区分、关 联和相关分析、 猜测 聚 类和演 变分析;使用你熟识的 现实 生活的数据 库,给出每种数据挖掘功 能的例子;
. 特点化 是一个目 标类 数据的一般特性或特性的 汇总 ;例如, 同学的特点 可被提出,形成全部高校的 运算机科学 专业 一年 级同学的 轮廓, 这些特 征包括作 为一种高的年 级 平均成 绩
(GPA:Grade point aversge)的信息, 仍有所修的 课程的最大数量;
. 区 分是将 目标 类数 据对 象的 一般 特性 与一个 或多 个对 比类 对象 的一 般 特性 进 行比较;例 如,具有高 GPA 的同学 的一般特性 可被用来与 具有 低 GPA 的一般 特性比 较; 最终的描述 可能是同学 的一个一般 可比较的 轮廓,就像具有高 GPA 的同学的 75% 是四年 级运算机科学 专业的同学 ,而具有低 GPA 的同学的 65% 不是;
. 关联是指 发觉 关联规章 ,这些规章 表示一起 频繁发生在 给定数据集的特 征 值 的 条 件 ;例 如 , 一 个 数 据 挖 掘 系 统 可 能 发 现 的 关 联 规 就 为 :
|精.
|品.
|可.
|编.
|辑.
|学.
|习.
|资.
|料.
*
|
*
|
*
|
*
|
|欢.
|迎.
|下.
|载.
major (X , “computing science”) . owns(X, “personalcomputer ”)
[support =12%, confid ence=98% ]
其中, X 是一个表示同学的 变量; 这个规章指出正在学 习的同学, 12%(支持度) 主修运算机科学并且 拥有一台个人运算机;这个组一个同学 拥有一台个人 电脑的概率是 98%(置信度,或确定度);
. 分类与猜测 不同,由于前者的作用是构造一系列能描述和区分数据 类型 或概念的 模型(或功能 ), 而后者 是建立一个模型 去猜测缺失的或无 效 的、并且通常是数字的数据 值;它们的相像性是他 们都是 猜测的工具 : 分类被用作 猜测目标数据的 类的标签 ,而猜测 典型的 应用是
猜测缺失的 数字型数据的 值;
. 聚类分析 的数据 对象不考 虑已知的 类标 号;对象依据最大花蕾内部的相像性、 最小化 类之间的相像性的原 就进行聚类或分 组;形成的每一簇可 以被看作一个 对象类;聚类也便于分 类法组织形式, 将观测组织 成类分 层结构,把 类似的大事 组织 在一起;
. 数据延边分析描述和模型化随 时间变 化的对象的规律或趋势 ,尽管 这可 能包括 时间 相关数据的特点化、 区分、关联和相关分析、 分类、或猜测 ,这种分析的明确特点包括 时间序列数据分析、序列或周期模式匹配、 和 基于相像性的数据分析
1.9 列举并描述 说明数据挖掘任 务的五种原 语;五种原 语是:
. 任务相关数据 :这种原 语指明 给定挖掘所 处理的数据;它包括指明数据 库、数据库表、或数据 仓库 ,其中包括包含关系数据、 挑选 关系数据的 条件、用于探究的关系数据的属性或
维、关于修复的数据排序和分 组;
. 挖掘的数据 类型 :这种原 语指明白所要 执行的特定数据挖掘功能 ,如特 征化、区分、 关联、分 类、聚 类、或演化分析;同 样,用 户的要求可能 更特别, 并可能供应所 发觉的模式必需匹配的模版; 这些模版或超模式(也被称 为超规章 )能被用来指 导发觉过 程;
. 背景知 识:这种原 语答应用户指定已有的关于挖掘 领域的知 识;这样的 学问能被用来指 导学问发觉过 程,并且 评估发觉的模式; 关于数据中关 系的概念分 层和用 户信念是背景知 识的
形式;
. 模式 爱好度度量 :这种原 语答应用户指定功能,用于从知 识中分割不感 爱好的模式, 并且被用来指 导挖掘过程,也可 评估发觉 的模式; 这样就 答应用户限制在挖掘 过程返回的不感 爱好的模式的数量, 由于一种数据 挖掘系 统可能 产生大量的模式; 爱好度 测量能被指定 为简 易性、确定性 、适用性、和新 颖性的特点;
. 发觉模式的可 视化 :这种原 语述及发觉的模式 应当被显示出来 ;为了使 数据挖掘能有效地
将知 识传给 用户,数据挖掘系 统应当 能将 发觉 的各种 形式的模式展现出来,正如 规章、表格、 饼或条形 图、决策 树、立方体或其它 视觉 的表示;
1.4 1.13 描述以下数据挖掘系 统与数据 库或数据 仓库 集成方法的差 别:不耦 合、松散耦合、
您可能关注的文档
- 【生物】2021届高三调研考试卷生物(四)(解析汇报附后).docx
- 【知识】2021年上半年中小学教师资格考试教育教学知识与能力(小学)真题及答案解析.docx
- 【地理】2021年四川省成都市高考地理三诊试卷.docx
- 【试题】2021年普通高等学校招生全国统一考试模拟试题理数试题(解析版).docx
- 【地理】2021年中学考试地理基础填图练习.docx
- 【化学】2021高考化学有机推断题总汇编.docx
- 2021年海南公务员考试行测真题及答案解析(B).docx
- 【数学】2021年四川省成都市中学考试数学试卷(含问题详解解析汇报版).docx
- 【数学】2021年山东省济宁市中考数学试卷解析.docx
- 【试题】2021年四川省南充市中考数学试题及解析.docx
最近下载
- 部编版语文五年级下册第一单元教材解读大单元集体备课.pptx VIP
- 车工 (数控车床)理论知识考核要素细目表四级.pdf VIP
- 本科课程《基础护理学》教案,第十二章给药.doc VIP
- 农村题材小品剧本村官.pdf VIP
- 小品剧本-小品《绰号》.docx VIP
- 小品剧本-小品《竞选》.docx VIP
- 本科课程基础护理学教给药教案(2025—2026学年).docx VIP
- LaserjetCP1025系列打印机打印质量故障排除手册.pdf VIP
- 年会小品剧本小品剧本:搞笑小品剧本《都是喝酒惹事》台词大全.docx VIP
- 2026年高考全国II卷文科综合真题试卷(新课标卷)(+答案).docx VIP
原创力文档

文档评论(0)