数据挖掘软件Clementine介绍.ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘软件CLEMENTINE介绍 Clementine产品介绍 Clementine中的Data Mining 的方法 数据挖掘应用----业务建摸 Clementine面板 Clementine的使用 1打开一个流文件 2执行流文件中的某一流程 3得到结果 4浏览结果1 4浏览结果2 5浏览结果3 Clementine流文件的建立 1读取数据文件1 读取数据文件2 对数据进行处理 定义变量的方向 作分类处理 保存流文件 读取文本数据与查看数据 Clementine可以读入的数据文件 读取文本数据与查看数据 查看数据1 查看数据2 Clementine中的字段类 数据理解之数据质量 缺失值的检查:quality节点 Distribution节点----初步 理解字符型字段的分布 简单数据整理 Derive节点介绍 Filter节点介绍 数据理解之数据间简单关系 Web节点----研究字符型字段间关系1 Web节点----研究字符型字段间关系2 Statistics节点----研究连 续型字段间线性相关关系 2规则归纳模型 规则归纳模型 c5.0 3 crt决策树 4 kohonen聚类 5 k--means聚类 6 two step 聚类 7 apriori关联规则模型 * Clementine是ISL(Integral Solutions Limited)公司开发的数据挖掘工具平台。1999年SPSS公司收购了ISL公司, 对Clementine产品进行重新整合和开发,现在Clementine 已经成为SPSS公司的又一亮点。 作为一个数据挖掘平台, Clementine结合商业技术可以快速建立预测性模型,进而应用到商业活动中,帮助人们改进决策过程。 强大的数据挖掘功能和显著的投资回报率使得Clementine在业界久负盛誉。 同那些仅仅着重于模型的外在表现而忽略了数据挖掘在整个业务流程中的应用价值的其它数据挖掘工具相比,Clementine其功能强大的数据挖掘算法,使数据挖掘贯穿业务流程的始终,在缩短投资回报周期的同时极大提高了投资回报率。 Classification Clustering Estimation Prediction Market Basket Analysis Description 预测 和分类推估类似,不同在于是预測未來,將新资料带入既有资料建立的模型预见結果 銀行新申请信用卡的客戶要給多少额度 估计 和分类的不同在於目标变量为连续值,常和分类配合 用分类判断为会贷款客户后再推估会贷款的金額 聚类 非监督式,未知有几类,将性质类似的资料加以区分,把顾客资料分群对不同群体采用不同推销手法 购物篮分析 找出哪些事件会一起发生 超級市场发現男性客戶会一起购买啤酒跟尿布 描述 增进对于资料的认识,图形视觉化呈现,或规則、决策树等 相关技术 神经网络 决策树 (C5.0 CRT) Logistic 回归 等等 相关技术 K-Means 两步骤 Kohonen 等等 相关技术 分类跟估计的所有方法 相关技术 Apriori GRI 等等 相关技术 决策树规则 各类图表 等等 分类 目标变量(因变量、反应变量数)为类別的狀況 信用卡公司將既有资料分为「伪卡」「非伪卡」找出伪卡的模式 Debt10% of Income Debt=0% Good Credit Risks Bad Credit Risks Good Credit Risks Yes Yes Yes NO NO NO Income$40K Q Q Q Q I I 1 2 3 4 5 6 factor 1 factor 2 factor n 神经网络 Neural Networks 聚类分析 Clustering Open Accn’t Add New Product Decrease Usage ??? Time 序列分析 Sequence Analysis 决策树 Decision Trees 倾向性分析 客户保留 客户生命周期管理 目标市场 价格弹性分析 客户细分 市场细分 倾向性分析 客户保留 目标市场 欺诈检测 关联分析 Association 市场组合分析 套装产品分析 目录设计 交叉销售 在节点区,双击文件读入 节点,在流区出现其图标 再在流工作区,双击 文件读入节点,读入 所需数据文件。 1 2 4 5 6 去掉两个变量Na、K 3 增加新变量:Na_to_K=Na/K 在节点区双击Type节点, 使之在流区中出现 把Drug的 Direction 从in(输入) 改为out (输出) 文本格式数据 SPSS/SAS数据

文档评论(0)

zhuliyan1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档