数据挖掘与Clementine培训手册PPT.ppt

下载文档

2
0
约2.04万字
约 302页
2018-01-26 发布于江苏
举报
版权申诉
保障服务

数据挖掘与Clementine培训手册PPT.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

数据挖掘与Clementine培训手册PPT

9.6 模型评价----不同值的收益图 Gains Chart for the Good Risk Category Gains Chart for the Bad Loss Category 9.7 模型总结 C5.0使模型可以不用Web、Histogram等即可有效地理解模型与Neural Net不同，没有Sensitivity Analysis，但同样可以辨别字段的重要性决策树的优点可以生成可以理解的规则计算量相对来说不是很大可以处理连续和种类字段决策树可以清晰的显示哪些字段比较重要决策树的缺点对连续性的字段比较难预测对有时间顺序的数据，需要很多预处理的工作当类别太多时，错误可能就会增加的比较快（对分类变量重新划分，二分或者数据降维，spss聚类分析法）一般的算法分类的时候，只是根据一个字段来分类（假设各字段间相关度不是很高） Chapter 10 模型比较 Chpater 10 模型比较目的掌握如何利用Analysis节点进行模型的评估掌握如何利用验证数据集比较不同模型内容 10.1 Analysis节点用于比较模型 10.2 Evaluation节点用于比较模型 10.3 利用验证数据集进行模型比较数据 Risktrain.txt Riskvalidation.txt 10.1 Analysis节点用于比较模型 10.1 Analysis节点用于比较模型评估多个模型评估各模型结果的一致性 Train Validation 10.2 Evaluation节点用于比较模型 10.2 Evaluation节点用于比较模型评估多个模型评估各模型结果的一致性 Train Validation 10.3 利用验证数据集进行模型比较第五讲主要内容聚类分析模型技术关联规则模型技术序列探测模型技术 Chapter 11 Kohonen Networks Chpater 11 Kohonen Networks 目的掌握Kohonen神经网络的建立、结果解释掌握Kohonen节点内容 11.1 Kohonen节点介绍 11.2 构建Kohonen Networks 11.3 结果解释 11.4 为每条记录产生类别字段 11.5 结果理解数据 Shopping.txt Kohonen网络结构输入数据被展示在输入层中，其数据值被传送到输出层。然后每个输出层神经元都做出回应。回应最强烈的输出层神经元称为嬴家，它的回应就做为输入数据的结果。 11.1 Kohonen节点介绍聚类分析发现数据的总体结构及相互关系类间差别，类内相似 11.2 构建Kohonen Networks Kohonen节点字段方向设置：购买产品与否----In 其它----None / Out / Both 反馈图：红色越深，记录越多指定类别数：长*宽 11.3 结果解释 Kohonen结果 X-轴 Y-轴 11.4 为每条记录产生类别字段＄KX----Kohonen ＄KY----Kohonen Cluster=＄KX----Kohonen＄KY----Kohonen 11.5 结果理解各Cluster人群多少----条图各Cluster人群的一般特征年龄----条图性别----条图购买产品----Web图孩子婚姻状态工作状态各Cluster人群总述各种聚类方法比较聚类分析之我见聚类分析的优势在于：它能够在我们对数据了解很少时，提供一种了解数据的方法。发现个体与变量间的综合关系。例如：根据各省市的各种经济指数将所有的省市分为几个等级。例如：根据各种指数的取值范围，将模式相近的指数的聚为一类。聚类分析的缺陷在于：各类之间均值等可能有差别，但每个个体划归哪类更多地依赖于数字，解释起来比较困难。 Chapter 12 关联规则 Chpater 12 关联规则目的掌握关联规则在Clementine中的建立、结果解释掌握Apriori节点无监督的探索性模型内容 12.1 关联规则简介 12.2 Apriori节点及结果解释 12.3 产生特定结果的规则集 12.4 特定结果规则集应用于各记录数据 Shopping.txt 12.1 关联规则简介解决问题?考虑的是关联，得到的是规则，处理变量之间的相关，而非客户之间）买香烟的人是否倾向于也买巧克力或啤酒高血脂的人是否也常伴有高血压买车险的人是否也倾向于买房险节点 GRI----Numeric字段可作为输入字段，可用于连续型变量 Apriori----只接受Symbolic字段（只能用字符型输入）作为输入字段特殊之处：产生的模型不能直接加入数据流 12.2 Apriori节点及结果解