数据挖掘第三次.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘第三次.ppt

第3章 Clementine变量的管理 变量说明 变量的重新计算 变量类别值的调整 生成新变量 3.1 变量说明 取值范围和缺失值说明(使用类型节点) (1)缺失值通常包括两类:系统缺失值用$null$表示,还包括空格或空白等。另一类是用户缺失值,即取值不合理的数据。 例1:对变量的取值加标签 ; 修正变量的取值区间,对超出取值范围的不合理数据或系统缺失值进行修正。 3.2 变量值的重新计算 变量值重新计算(导出节点) 利用导出节点可以导出新的变量,里面有导出公式。 例2:变量值的重新计算。 3.3 变量类别值的调整 变量值类别值的调整(重新分类节点):可以使得数据取值一致 3.4 生成新变量 变量值重新计算(导出节点) 利用导出节点可以导出新的变量,里面有导出公式。 例3:生成新变量。 第4章 Clementine样本的管理 样本的排序 样本的条件筛选 样本的随机抽样 * 3.5 变量值的离散化处理 4.1 样本的排序 样本的排序(使用记录选项当中的排序节点) ◎ 4.2 样本的条件筛选 样本的筛选(使用记录选项当中的选择节点) 4.3 样本的随机抽样 样本的随机抽样(使用记录选项当中的抽样节点) 4.4 样本的分类汇总 样本的分类汇总(使用记录选项当中的汇总节点) *

文档评论(0)

zhoubingchina + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档