- 31
- 0
- 约1.21万字
- 约 20页
- 2018-10-18 发布于安徽
- 举报
1.4 数据仓库和数据库有何不同?有哪些相似之处?
答:区别:数据仓库是面向主题的,集成的,不易更改且随时间变化的数据集合,用来支持管理人员的决策,数据库由一组内部相关的数据和一组管理和存取数据的软件程序组成,是面向操作型的数据库,是组成数据仓库的源数据。它用表组织数据,采用ER数据模型。
相似:它们都为数据挖掘提供了源数据,都是数据的组合。
1.3 定义下列数据挖掘功能:特征化、区分、关联和相关分析、预测聚类和演变分析。使用你熟悉的现实生活的数据库,给出每种数据挖掘功能的例子。
答:特征化是一个目标类数据的一般特性或特性的汇总。例如,学生的特征可被提出,形成所有大学的计算机科学专业一年级学生的轮廓,这些特征包括作为一种高的年级平均成绩(GPA:Grade point aversge)的信息,
还有所修的课程的最大数量。
?? 区分是将目标类数据对象的一般特性与一个或多个对比类对象的一般特性进行比较。例如,具有高GPA 的学生的一般特性可被用来与具有低GPA 的一般特性比较。最终的描述可能是学生的一个一般可比较的轮廓,就像具有高GPA 的学生的75%是四年级计算机科学专业的学生,而具有低GPA 的学生的65%不是。
?? 关联是指发现关联规则,这些规则表示一起频繁发生在给定数据集的特征值的条件。例如,一个数据挖掘系统可能发现的关联规则为:major(X, “comput
您可能关注的文档
- 深圳XXXX大厦充电桩建设方案设计.doc
- 人版高一必修一生物知识点整合.doc
- 功能关系练习题集.doc
- 2017年云南省高考理综试题(卷)无答案解析.doc
- 2017年中考物理试题(卷)分类汇编运动和力.doc
- 2017年中考物理试题(卷)分类汇编物态变化.doc
- 2018广东省佛山市中考数学试题和答案解析.doc
- 电阻应变片例题和练习题集.doc
- 2017年煤炭行业总结与2018煤炭行业预测.doc
- MikrotikRouterOS资料说明书与功能.doc
- 2022年重庆一中高考历史考前适应性试卷.pdf
- 深圳的生物多样性保护(2026)-深圳市生态环境局.pptx
- 2026年ASCO生物医学追踪数据监测医疗保健规划师 2026 Biomedtracker Datamonitor Healthcare ASCO Planner.pptx
- 模板安全设施设计专篇正文(初稿).pdf
- 北京市朝阳区2022-2023学年高三上学期期末生物试卷.pdf
- 北京市东城区2022-2023学年高三上学期期末语文试题.pdf
- 北京市平谷区2022-2023学年高二上学期期末语文试卷.pdf
- 北京市顺义区2022-2023学年高二上学期期末质量检测化学试题.pdf
- 北京市西城区2022-2023学年高三上学期期末语文试题.pdf
- 福建省福州第四中学2022-2023学年高二上学期期末考试化学试卷.pdf
最近下载
- 2024年新高考I卷数学试卷(含解析) .pdf VIP
- 全新版大学英语听说教程1原文及答案.doc VIP
- 水利拆除施工方案(3篇).docx VIP
- 深度解析(2026)《ISO 14055-12017 Environmental management — Guidelines for establishing good practices for combattin深度解析.pptx VIP
- CSC-163A-GCN [V1.00] [E985] 装置使用说明书.pdf
- 2026宁夏高校教师资格考试应知应会知识手册——高教心理学(205填空+68判断).docx VIP
- 人教版二年级下册语文期末考试-试卷-试题.pdf VIP
- 320T履带吊安装方案 9.4.doc VIP
- 2026宁夏高校教师资格考试应知应会知识手册——综合类知识测试应知应会(填空55题+判断10题.docx VIP
- 2025年养老护理员(五级)职业鉴定理论考试题库(含答案).docx VIP
原创力文档

文档评论(0)