- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘课件汇总精要.ppt
Chapter 5: 概念描述: Characterization and Comparison 什么是概念描述? Data generalization and summarization-based characterization数据概化和基于汇总的特征化 Analytical characterization: Analysis of attribute relevance Mining class comparisons: 区分不同的类 Mining descriptive statistical measures in large databases 挖掘描述统计度量 Discussion Summary What is Concept Description? Descriptive vs. predictive data mining 描述性数据挖掘: 以简洁概要的方式描述数据,并提供数据的有趣的一般性质。 预测挖掘: 分析数据,建立一个或一组模型,并试图高效能新数据集的行为。 Concept description: 产生数据的特征化和比较描述 Characterization(特征化): 提供给定数据集的简洁汇总 Comparison(比较): 提供两个或多个数据汇集的比较描述。 Concept Description vs. OLAP 概念描述与数据概化相关,类似于OLAP。 Concept description: 能够处理属性的复杂数据类型,如数值的、非数值的、空间的、文本的或图像的。 a more automated process OLAP: 维和度量的数据类型有限。少量维和度量类型,如维一般是非数值型数据,度量(count,sum,avg)用于数值数据。 user-controlled process:下钻、上卷、切块和切片 Chapter 5: Concept Description: Characterization and Comparison What is concept description? Data generalization and summarization-based characterization Analytical characterization: Analysis of attribute relevance Mining class comparisons: Discriminating between different classes Mining descriptive statistical measures in large databases Discussion Summary Data Generalization and Summarization-based Characterization Data generalization数据概化 是一个过程,将大的任务相关数据集从较低概念层抽象到较高概念层。 Approaches: Data cube approach(OLAP approach)(第2章) Attribute-oriented induction approach(面向属性的归纳) Characterization: Data Cube Approach Perform computations and store results in data cubes Strength 优点 An efficient implementation of data generalization Computation of various kinds of measures e.g., count( ), sum( ), average( ), max( ) Generalization and specialization can be performed on a data cube by roll-up and drill-down Limitations 局限 handle only dimensions of simple nonnumeric data and measures of simple aggregated numeric values. Lack of intelligent analysis, can’t tell which dimensions should be used and what levels should the generalization reach Attribute-Oriented Induction Not confined to categorical
您可能关注的文档
- 数字电路课程设计——数字闹钟精要.ppt
- 数字电路课程设计任务书精要.ppt
- 数字电路课程设计精要.ppt
- 数字电路逻辑设计_第三章精要.ppt
- 数字电路逻辑设计第7章精要.ppt
- 数字电路逻辑设计第七章精要.ppt
- 数字电路逻辑设计第五章精要.ppt
- 数字电路逻辑设计第四章精要.ppt
- 数字电路逻辑设计第章精要.ppt
- 数字电路逻辑设计精要.ppt
- 内蒙古自治区鄂尔多斯市第一中学2025-2026学年第一学期高一年级学业诊断检测12月月考语文试卷含答案.pdf
- 四川省2025-2026学年高三上学期12月阶段性自测地理试卷含答案.pdf
- 林区蓄水池防火配套建设指南.ppt
- 四川省2025-2026学年高三上学期12月阶段性自测历史试卷含答案.pdf
- 云南省2025-2026学年高三上学期12月阶段性自测地理试卷含答案.pdf
- 火灾区域生态修复实施指南.ppt
- 云南省2025-2026学年高三上学期12月阶段性自测历史试卷含答案.pdf
- 云南省2025-2026学年高三上学期12月阶段性自测日语试卷含答案.pdf
- 2025年水产养殖科技合作协议(鱼苗).docx
- 2025年水产养殖苗种繁育合作协议协议.docx
最近下载
- 2025年专升本西藏大学语文考试真题及参考答案.docx VIP
- 2025年陕西国网二批考试题库及答案.doc VIP
- 人教版专题4.7 极值点偏移问题【2024年高考数学一轮复习题型突破】及试题解析.doc VIP
- 人教版高一英语必修一单词表.doc VIP
- 人教版(2024)新教材八年级地理上册第二章《中国的自然环境》单元测试卷及答案(含两套题).doc
- 2025年西藏大学语文专升本考试真题及参考答案.docx VIP
- 莜麦新品种介绍.doc VIP
- 中学数学概念课型及其教学设计高中版.ppt VIP
- 2026年高三班主任工作策略及班级管理交流 课件.pdf VIP
- 高一英语必修三译林版单词表.docx VIP
原创力文档


文档评论(0)