- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘技术介绍PPT
二.数据挖掘工具介绍 1.IBM Intelligent Miner IBM Intelligent Miner是IBM公司研究开发的一个全面的、综合的数据挖掘工具集。它使用决策树、神经网络及聚类技术。还包括广范围的文本挖掘工具。其大部分算法都是并行的以利用其可伸缩性。用户可用GUI或API来建模。它只和DB2数据库一起使用。 二.数据挖掘工具介绍 2.MineSet MineSet是由SGI公司和美国Standford大学联合开发的多任务数据挖掘系统。MineSet集成多种数据挖掘算法和可视化工具,帮助用户直观的、实时的发掘、理解大量数据背后的知识。MineSet的特点有:MineSet以先进的可视化显示方法闻名于世:支持多种关系数据库;可以直接从Oracle、Informix、Sybase的表读取数据,也可以通过SQL命令执行查询;多种数据转换功能。在进行挖掘前,MineSet可以去除不必要的数据项,统计、集合、分组数据,转换数据类型,构造表达式由已有数据项生成新的数据项,对数据采样等;操作简单、支持国际字符、可以直接发布到Web。 二.数据挖掘工具介绍 3.DBMiner DBMiner是一种数据挖掘公用工具,是一种多策略工具,支持如自主发现式OLAP分析、聚类、关联规则、总结归纳和可视化之类的方法,DBMiner用Microsoft SQL Server系统并可运行于不同的Windows平台系统。 二.数据挖掘工具介绍 4.Clementine Clementine是一种全面的数据挖掘工具包,使用神经网络和规则简化方法。这个工具包含有数据操控和可视化能力。它运行在Windows和Unix下,可从Oracle、Sybase和Informix数据库中接受数据,提供顺序关联和Web数据的聚类分析。 数据挖掘工具选择指导原则 公司的数据挖掘需求是短期行为还是长期使用 公司的数据挖掘经验和水平 公司的数据状态 公司的预算 工具的性能 选择指 导原则 二.数据挖掘工具介绍 ----几种数据挖掘工具的比较 Intelligent Miner Clementine Enterprise Miner 数据存取 数据处理 模型算法 自动建模 可视化 其他系统要求 二.数据挖掘工具介绍 ----几种数据挖掘工具的比较 数据存取主要是考查数据挖掘工具或方案的数据访问能力。它通常包括文本文件、EXCEL文件、NATIVE接口和ODBC等。一般情况下,数据都存储在数据库里或文本文件中,所以相应的权值就比较高一些。对这几种工具的数据存取的比较结果如下图所示。 二.数据挖掘工具介绍 ----几种数据挖掘工具的比较 数据处理主要是考查数据挖掘工具的数据处理能力。它通常包括基本数学变化、连续变量的数据分段、数据整合(数据表格的合并)、数据过滤(数据的字段筛选或记录筛选)、数据转换(字符型数据转换成数字型等)、数据编码(无效数据编码或缺失数据编码等)、数据随机采样以及SQL支持等。对这几种工具的数据处理的比较结果如下图所示。 二.数据挖掘工具介绍 ----几种数据挖掘工具的比较 算法是数据挖掘工具的核心部份,算法主要包括:聚类分析、分类分析、统计分析、关联分析、相关分析、时间序列和值预测。对于数据挖掘来说,一般最常用的算法就是值预测(比如预测个人收入、客户贡献度等)、分类算法(比如用于风险评级、产品购买概率预测、客户流失预测等)以及聚类分析(比如用于内幕交易监测等)。对这几种工具的算法的比较结果如下图所示。 二.数据挖掘工具介绍 ----几种数据挖掘工具的比较 自动建模是考查数据挖掘工具是否能够自我优化,从而方便一般的用户使用。否则,用户必须很深刻地了解算法的优缺点才能手工地优化模型。为了方便具备一般数据挖掘技术背景的用户使用,数据挖掘工具最重要的是要提供灵活的参数设置及其帮助。同时,为了增强建模的效率,模型的并行运行和自我优化也是非常重要的。对这几种工具自动建模的比较结果如下图所示。 二.数据挖掘工具介绍 ----几种数据挖掘工具的比较 为了方便数据挖掘人员更好地了解数据的分布和建模的结果,需要数据挖掘工具提供较强的可视化功能,通常都采用Gain Lift图来了解。
文档评论(0)