数据挖掘概述模板.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘系统 数据挖掘系统介绍 数据挖掘系统实施策略 数据挖掘系统接口 * 感谢你的观看 2019年5月18日 数据挖掘系统介绍 数据挖掘系统结构 数据挖掘系统进展 * 感谢你的观看 2019年5月18日 数据挖掘系统结构 数据仓库 数据清洗和集成 过滤 数据库 数据库或数据仓库服务器 数据挖掘引擎 模式评价 图形用户接口 知识库 * 感谢你的观看 2019年5月18日 数据库、数据仓库或其他信息库:这是一个或一组数据库、数据仓库、电子表格或其他类型的信息库。可以在数据上进行数据清理和集成。 数据库或数据仓库服务器:根据用户的数据挖掘请求,数据库或数据仓库服务器负责提取相关数据。 知识库:这是领域知识,用于指导搜索,或评估结果模式的兴趣度。 * 感谢你的观看 2019年5月18日 数据挖掘引擎:这是数据挖掘系统基本的部分,由一组功能模块组成,用于特征化、关联、分类、聚类分析以及演变和偏差分析。 模式评估模块:使用兴趣度度量,并与数据挖掘模块交互,以便将搜索聚焦在有趣的模式上。 图形用户界面:在用户和数据挖掘系统之间通信,允许用户与系统交互,指定数据挖掘具体任务。 * 感谢你的观看 2019年5月18日 数据挖掘系统进展 代 特征 数据挖掘算法 集成 分布计算模型 数据模型 第一代 数据挖掘作为一个独立的应用 支持一个或者多个算法 独立的系统 单个机器 向量数据 第二代 和数据库以及数据仓库集成 多个算法:能够挖掘一次不能放进内存的数据 数据管理系统,包括数据库和数据仓库 同质/局部区域的计算机群集 有些系统支持对象、文本、和连续的媒体数据 第三代 和预测模型系统集成 多个算法 数据管理和预测模型系统 intranet/extranet网络计算 支持半结构化数据和web数据 第四代 和移动数据/各种计算数据联合 多个算法 数据管理、预测模型、移动系统 移动和各种计算设备 普遍存在的计算模型 * 感谢你的观看 2019年5月18日 第一代数据挖掘系统 特点 支持一个或少数几个数据挖掘算法 挖掘向量数据(vector-valued data) 数据一般一次性调进内存进行处理 典型的系统如Salford Systems公司早期的CART系统() 缺陷 如果数据足够大,并且频繁的变化,这就需要利用数据库或者数据仓库技术进行管理,第一代系统显然不能满足需求。 * 感谢你的观看 2019年5月18日 CBA 新加坡国立大学。基于关联规则的分类算法,能从关系数据或者交易数据中挖掘关联规则,使用关联规则进行分类和预测 * 感谢你的观看 2019年5月18日 KDD过程(续) * 感谢你的观看 2019年5月18日 KDD过程(续) 1.数据准备:了解KDD应用领域的有关情况。包括熟悉相关的背景知识,搞清用户需求。 2.数据选取:数据选取的目的是确定目标数据,根据用户的需要从原始数据库中选取相关数据或样本。在此过程中,将利用一些数据库操作对数据库进行相关处理。 * 感谢你的观看 2019年5月18日 KDD过程(续) 3.数据预处理:对步骤2中选出的数据进行再处理,检查数据的完整性及数据一致性,消除噪声,滤除与数据挖掘无关的冗余数据,根据时间序列和已知的变化情况,利用统计等方法填充丢失的数据。 4.数据变换:根据知识发现的任务对经过预处理的数据进行再处理,主要是通过投影或利用数据库的其他操作减少数据量。 * 感谢你的观看 2019年5月18日 * 感谢你的观看 2019年5月18日 KDD过程(续) 5.确定KDD目标:根据用户的要求,确定KDD要发现的知识类型。因为对KDD的不同要求会在具体的知识发现过程中采用不同的知识发现算法。如分类、总结、关联规则、聚类等。 6.选择算法:根据确定的任务选择合适的知识发现算法,包括选取合适的模型和参数。 * 感谢你的观看 2019年5月18日 KDD过程(续) 7.数据挖掘:这是整个KDD过程中很重要的一个步骤。运用前面选择的算法,从数据库中提取用户感兴趣的知识,并以一定的方式表示出来(如产生式规则等)是数据挖掘的目的。 8.模式解释:对在数据挖掘步骤中发现的模式(知识)进行解释。经过用户或机器评估后,可能会发现这些模式中存在冗余或无关的模式,此时应该将其剔除。如果模式不能满足用户的要求,就需要返回到前面的某些处理步骤中反复提取。 * 感谢你的观看 2019年5月18日 KDD过程(续) 9.知识评价:将发现的知识以用户能了解的方式呈现给用户。 在上述步骤中,数据挖掘占据非常重要的地位,它主要是利用某些特定的知识发现算法,在一定的运算效率范围内,从数据中发现出有关知识,决定了整个KDD过程的效果与效率。 * 感谢你的观看 2019年5月18日 数

文档评论(0)

WUYH168 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档