数据挖掘与Clementine培训手册PPT.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘与Clementine培训手册PPT

9.6 模型评价----不同值的收益图 Gains Chart for the Good Risk Category Gains Chart for the Bad Loss Category 9.7 模型总结 C5.0使模型可以不用Web、Histogram等即可有效地理解模型 与Neural Net不同,没有Sensitivity Analysis,但同样可以辨别字段的重要性 决策树的优点 可以生成可以理解的规则 计算量相对来说不是很大 可以处理连续和种类字段 决策树可以清晰的显示哪些字段比较重要 决策树的缺点 对连续性的字段比较难预测 对有时间顺序的数据,需要很多预处理的工作 当类别太多时,错误可能就会增加的比较快(对分类变量重新划分,二分或者数据降维,spss聚类分析法) 一般的算法分类的时候,只是根据一个字段来分类(假设各字段间相关度不是很高) Chapter 10 模型比较 Chpater 10 模型比较 目的 掌握如何利用Analysis节点进行模型的评估 掌握如何利用验证数据集比较不同模型 内容 10.1 Analysis节点用于比较模型 10.2 Evaluation节点用于比较模型 10.3 利用验证数据集进行模型比较 数据 Risktrain.txt Riskvalidation.txt 10.1 Analysis节点用于比较模型 10.1 Analysis节点用于比较模型 评估多个模型 评估各模型结果的一致性 Train Validation 10.2 Evaluation节点用于比较模型 10.2 Evaluation节点用于比较模型 评估多个模型 评估各模型结果的一致性 Train Validation 10.3 利用验证数据集进行模型比较 第五讲主要内容 聚类分析模型技术 关联规则模型技术 序列探测模型技术 Chapter 11 Kohonen Networks Chpater 11 Kohonen Networks 目的 掌握Kohonen神经网络的建立、结果解释 掌握Kohonen节点 内容 11.1 Kohonen节点介绍 11.2 构建Kohonen Networks 11.3 结果解释 11.4 为每条记录产生类别字段 11.5 结果理解 数据 Shopping.txt Kohonen网络结构 输入数据被展示在输入层中,其数据值被传送到输出层。然后每个输出层神经元都做出回应。回应最强烈的输出层神经元称为嬴家,它的回应就做为输入数据的结果。 11.1 Kohonen节点介绍 聚类分析 发现数据的总体结构及相互关系 类间差别,类内相似 11.2 构建Kohonen Networks Kohonen节点 字段方向设置: 购买产品与否----In 其它----None / Out / Both 反馈图:红色越深,记录越多 指定类别数:长*宽 11.3 结果解释 Kohonen结果 X-轴 Y-轴 11.4 为每条记录产生类别字段 $KX----Kohonen $KY----Kohonen Cluster=$KX----Kohonen$KY----Kohonen 11.5 结果理解 各Cluster人群多少----条图 各Cluster人群的一般特征 年龄----条图 性别----条图 购买产品----Web图 孩子 婚姻状态 工作状态 各Cluster人群总述 各种聚类方法比较 聚类分析之我见 聚类分析的优势在于:它能够在我们对数据了解很少时,提供一种了解数据的方法。发现个体与变量间的综合关系。 例如:根据各省市的各种经济指数将所有的省市分为几个等级。 例如:根据各种指数的取值范围,将模式相近的指数的聚为一类。 聚类分析的缺陷在于:各类之间均值等可能有差别,但每个个体划归哪类更多地依赖于数字,解释起来比较困难。 Chapter 12 关联规则 Chpater 12 关联规则 目的 掌握关联规则在Clementine中的建立、结果解释 掌握Apriori节点 无监督的探索性模型 内容 12.1 关联规则简介 12.2 Apriori节点及结果解释 12.3 产生特定结果的规则集 12.4 特定结果规则集应用于各记录 数据 Shopping.txt 12.1 关联规则简介 解决问题?考虑的是关联,得到的是规则,处理变量之间的相关,而非客户之间) 买香烟的人是否倾向于也买巧克力或啤酒 高血脂的人是否也常伴有高血压 买车险的人是否也倾向于买房险 节点 GRI----Numeric字段可作为输入字段,可用于连续型变量 Apriori----只接受Symbolic字段(只能用字符型输入)作为输入字段 特殊之处:产生的模型不能直接加入数据流 12.2 Apriori节点及结果解

文档评论(0)

djdjix + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档