- 1、本文档共291页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘2014概述
数据挖掘;参考教材;第一章 引论;1、为什么进行数据挖掘;网络之后的下一个技术热点;数据爆炸但知识贫乏;支持数据挖掘技术的基础;从商业数据到商业信息的进化; 2、数据挖掘的基本概念和定义; 基本概念;数据挖掘定义;实施数据挖掘的目的;数据挖掘与其他科学的关系;数据挖掘的数据源与以前相比有了显著的改变;
数据是海量的;
数据有噪声;
数据可能是非结构化的;
传统的数据分析方法基于假设驱动的:一般都是先给出一个假设然后通过数据验证
数据挖掘在一定意义上是基于发现驱动的:模式都是通过大量的搜索工作从数据中自动提取出来 。即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。;3、挖掘何种类型的数据;空间数据库;时间数据库和时间序列数据库;流数据;多媒体数据库;面向对象数据库和对象-关系数据库;异构数据库和历史(legacy)数据库;文本数据库和万维网(WWW);4、数据挖掘主要功能;概念/类别描述(Concept/Class Description); 例2:对比移动电话费月消费额超出1000元的客户群与移动电话费月消费额低于100元的客户群。
利用数据挖掘可作出如下描述:移动电话月消费额超出1000元的客户80%以上年龄在35-50岁之间,且月收入5000元以上;而移动电话月消费额低于100元的客户60%以上要么年龄过大要么年龄过小,且月收入2000元以下。;关联分析(Association Analysis);关联规则示意;分类与估值(Classification and Estimation);分类问题例子;聚类分析(Clustering Analysis);聚类示意图;时间序列分析(Time-Series Analysis);时序挖掘示例;其它功能;5、数据挖掘的应用;典型应用案例;6、数据挖掘模型;CRISP-DM阶段和任务;业务理解(Business Understanding)阶段;数据理解(Data Understanding)阶段;数据准备(Data Preparation)阶段;建立模型(Modeling)阶段;模型评估(Evaluation)阶段;部署(Deployment)阶段;数据挖掘模型;数据挖掘的实现过程;数据准备;数据挖掘;模式的评估、解释;所有模式都是有趣的吗?;能够产生所有有趣模式并且仅产生有趣模式吗?;知???运用;8、 数据挖掘产品;第二章 认识数据;数据对象与属性类型;属性类型 ;属性值的特性 ;Attribute Type;Attribute Level
;离散和连续属性 ;数据集的类型 ;Record Data (记录数据);Data Matrix (数据矩阵);Document Data(文档数据);Transaction Data;Graph Data ;Chemical Data ;Ordered Data ;Ordered Data ;Ordered Data;2、Techniques Used In Data Exploration ;Iris Sample Data Set ;Summary Statistics;Frequency and Mode;Percentiles;Measures of Location: Mean and Median;Measures of Spread: Range and Variance;Visualization(可视化);Example: Sea Surface Temperature;Representation;Arrangement;Selection;Visualization Techniques: Histograms;Two-Dimensional Histograms;Visualization Techniques: Box Plots;Example of Box Plots ;Visualization Techniques: Scatter Plots;Scatter Plot Array of Iris Attributes;Visualization Techniques: Contour Plots;Contour Plot Example: SST Dec, 1998;Visualization Techniques: Matrix Plots;Visualization of the Iris Data Matrix;Visualization of the Iris Correlation Matrix;Vis
您可能关注的文档
最近下载
- 京剧的服装课件.ppt VIP
- 保证供货周期的组织方案和人力资源安排.doc VIP
- 乌有先生历险记(原文,练习,注释,翻译)解读.doc
- 红色经典故事PPT课件.pptx VIP
- (人教版2024)生物七上2.2.1 无脊椎动物(新教材).pptx
- 2023-2024学年江西省上饶市余干县八年级上期中物理试卷附答案解析.pdf
- 西北师范大学教育学理论与实践期末试卷.doc VIP
- 2023年成都信息工程大学数据科学与大数据技术专业《数据结构与算法》科目期末试卷B(有答案).docx VIP
- 河北省衡水中学2024-2025学年高三上学期第一次综合素养测评数学试题(原卷版).docx
- 数据结构(用面向对象方法与C++语言描述)第二版.pdf VIP
文档评论(0)