数据挖掘课件汇总精要.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘课件汇总精要.ppt

Chapter 5: 概念描述: Characterization and Comparison 什么是概念描述? Data generalization and summarization-based characterization数据概化和基于汇总的特征化 Analytical characterization: Analysis of attribute relevance Mining class comparisons: 区分不同的类 Mining descriptive statistical measures in large databases 挖掘描述统计度量 Discussion Summary What is Concept Description? Descriptive vs. predictive data mining 描述性数据挖掘: 以简洁概要的方式描述数据,并提供数据的有趣的一般性质。 预测挖掘: 分析数据,建立一个或一组模型,并试图高效能新数据集的行为。 Concept description: 产生数据的特征化和比较描述 Characterization(特征化): 提供给定数据集的简洁汇总 Comparison(比较): 提供两个或多个数据汇集的比较描述。 Concept Description vs. OLAP 概念描述与数据概化相关,类似于OLAP。 Concept description: 能够处理属性的复杂数据类型,如数值的、非数值的、空间的、文本的或图像的。 a more automated process OLAP: 维和度量的数据类型有限。少量维和度量类型,如维一般是非数值型数据,度量(count,sum,avg)用于数值数据。 user-controlled process:下钻、上卷、切块和切片 Chapter 5: Concept Description: Characterization and Comparison What is concept description? Data generalization and summarization-based characterization Analytical characterization: Analysis of attribute relevance Mining class comparisons: Discriminating between different classes Mining descriptive statistical measures in large databases Discussion Summary Data Generalization and Summarization-based Characterization Data generalization数据概化 是一个过程,将大的任务相关数据集从较低概念层抽象到较高概念层。 Approaches: Data cube approach(OLAP approach)(第2章) Attribute-oriented induction approach(面向属性的归纳) Characterization: Data Cube Approach Perform computations and store results in data cubes Strength 优点 An efficient implementation of data generalization Computation of various kinds of measures e.g., count( ), sum( ), average( ), max( ) Generalization and specialization can be performed on a data cube by roll-up and drill-down Limitations 局限 handle only dimensions of simple nonnumeric data and measures of simple aggregated numeric values. Lack of intelligent analysis, can’t tell which dimensions should be used and what levels should the generalization reach Attribute-Oriented Induction Not confined to categorical

文档评论(0)

love + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档