- 203
- 1
- 约1.21万字
- 约 20页
- 2018-10-15 发布于重庆
- 举报
数据挖掘概念与技术(第三版)部分习题答案
1.4 数据仓库和数据库有何不同?有哪些相似之处?
答:区别:数据仓库是面向主题的,集成的,不易更改且随时间变化的数据集合,用来支持管理人员的决策,数据库由一组内部相关的数据和一组管理和存取数据的软件程序组成,是面向操作型的数据库,是组成数据仓库的源数据。它用表组织数据,采用ER数据模型。
相似:它们都为数据挖掘提供了源数据,都是数据的组合。
1.3 定义下列数据挖掘功能:特征化、区分、关联和相关分析、预测聚类和演变分析。使用你熟悉的现实生活的数据库,给出每种数据挖掘功能的例子。
答:特征化是一个目标类数据的一般特性或特性的汇总。例如,学生的特征可被提出,形成所有大学的计算机科学专业一年级学生的轮廓,这些特征包括作为一种高的年级平均成绩(GPA:Grade point aversge)的信息,
还有所修的课程的最大数量。
?? 区分是将目标类数据对象的一般特性与一个或多个对比类对象的一般特性进行比较。例如,具有高GPA 的学生的一般特性可被用来与具有低GPA 的一般特性比较。最终的描述可能是学生的一个一般可比较的轮廓,就像具有高GPA 的学生的75%是四年级计算机科学专业的学生,而具有低GPA 的学生的65%不是。
?? 关联是指发现关联规则,这些规则表示一起频繁发生在给定数据集的特征值的条件。例如,一个数据挖掘系统可能发现的关联规则为:major(X, “computing
您可能关注的文档
- 1.3地球的运动教学设计教案.docx
- 15.1两种电荷知识点 练习题).doc
- 14串并联电路电流电压规律.doc
- 1碎石垫层施工方案.doc
- 2012新规程(毛石混凝土)单元工序施工质量验收评定表.doc
- 2011—2017年高考全国卷Ⅰ文科数学三角函数解三角形汇编.doc
- 2017年信息化项目节能评估报告.docx
- 2016 2017全国中考二次函数与等腰三角形压轴题.doc
- 2018年虹口区初三语文一模试卷(附答案).docx
- 2018春中考数学《图形规律题:针对演练》.doc
- 互换性与测量技术 第2版 课件 2.4 大尺寸孔轴公差与配合.pptx
- 互换性与测量技术 第2版 课件 7.1 尺寸链的基本概念.pptx
- 互换性与测量技术 第2版 课件 7.4 用极值法计算尺寸链-实例.pptx
- 体育产业概论 课件 第1--7章 导论、体育产业资源 ---体育旅游业.pptx
- 体育旅游(第二版)课件 第二章 体育旅游资源.pptx
- 体育旅游(第二版)课件 第三章 体育旅游者.pptx
- 体育产业概论 课件全套 曹可强 第1--14章 导论、体育产业资源 ---体育产业政策.pptx
- 互换性与测量技术 第2版 课件 1.5 标准更新说明.pptx
- 体育旅游(第二版)课件 第四章 体育旅游市场.pptx
- 体育旅游(第二版)课件 第五章 体育旅游目的地.pptx
最近下载
- 江苏省无锡市省锡中实验学校2024—2025学年下学期七年级数学期末卷(含部分答案).pdf VIP
- ITU-R P.1546-6-2019 国外国际标准.pdf
- 2025年居家养老行业服务创新服务投资风险评估报告.docx VIP
- 2024贵州数学中考试题.docx VIP
- 剑桥国际少儿英语KB4 Unit1-8 学生用书听力文本.pdf VIP
- TSXCAS 041-2025 预拌流态固化土应用技术标准.pdf VIP
- 深圳中学自招化学题目及答案.docx VIP
- 抖音短视频标题语言特点研究.docx VIP
- 【小升初语文】情境化命题综合测试卷(五)(1).pdf VIP
- 2025年广东省深圳市红岭中学化学自主招生试卷 .pdf VIP
原创力文档

文档评论(0)