华南理工大学《数据挖掘》复习资料.doc

华南理工大学《数据挖掘》复习资料 【英文缩写】 BI(商务智能): Business Intelligence OLAP(联机分析处理): Online Analytical Processing OLTP(联机事务处理): Online Transaction Processing ETL(提取/变换/装入): Extraction/Transformation/Loading KDD(数据中的知识发现): Knowledge Discovery in Databases Lecture 1. 【知识发现的主要过程】 数据清理(消除噪声和不一致的数据) 数据集成(多种数据源可以组合在一起) 数据选择(从数据库中提取与分析任务相关的数据) 数据变换(数据变换或同意成适合挖掘的形式,如通过汇总或聚集操作) 数据挖掘(基本步骤,使用只能方法提取数据模式) 模式评估(根据某种兴趣度度量,识别表示只是的真正有趣的模式) 知识表示(使用可视化和只是表示技术,向用户提供挖掘的知识) 【挖掘的知识类型】 概念描述:特征划与区分(概化、摘要、以及对比数据特征) 关联(相关性或者因果关系) 分类与预测:对类或概念构造模型或函数以便对未来数据进行预测 聚类分析:类标识符是未知的,把数据分成不同的新类,使得同一个类中的元素具有极大的相似性,不同类元素的相似性极小。 趋势与偏差分析:序

文档评论(0)

1亿VIP精品文档

相关文档