1.4 Clementine 软件基本操作解析.ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.4 Clementine软件基本操作 1 数据挖掘的一般流程及数据挖掘软件在数据挖掘过程中的地位 数据挖掘方法论——项目顺利实施的保证 2 Clementine发展历程 Clementine是ISL (Integral Solutions Limited)公司开发的数据挖掘工具平台 1998年SPSS公司收购了ISL公司,对Clementine产品进行重新整合和开发,现在Clementine已经成为SPSS公司的又一亮点 3 Clementine 面板 数据挖掘要求的数据格式 4 Clementine的界面和设计思路 可视化界面 四个区域分别是建模区、结点区、模型描述区、项目管理区 通过连接结点构成数据流建立模型 Clementine通过6类结点的连接完成数据挖掘工作,它们是: Source(源结点):Database、Var. Files等 Record Ops (记录处理结点):Select、Sample等` Field Ops(字段处理结点):Type、Filter等 Graphs(图形结点):Plot、Distribute等 Modeling(模型结点):Neural Net、C5.0等 Output(输出结点):Table、Matrix等 5 Clementine操作基本知识 鼠标应用 三键与双键鼠标 左键 选择节点或图标置于建模区 右键 激活浮动菜单 中键 连接或断开两个节点 帮助 5 Clementine操作基本知识 节点的增加,以 为例 Click “Sources”,Click ,Click “流区域” Click “Sources”,Double Click Click “Sources”,Drag to “流区域” 节点的删除 Click , Delete Right Click ,Click “Delete” 节点的移动:Drag 5 Clementine操作基本知识 节点的编辑 Double Click Right Click ,Click “Edit” 节点的重命名和解释 Right Click ,Click “Edit”,Click “Annotations” Double Click ,Click “Annotations” Right Click ,Click “Rename and Annotations” 5 Clementine操作基本知识 构建流时节点的连接 Highlight ,Add to the Canvas Right Click ,Click “Connect”,Click Drag the middle mutton from to 构建流时节点连接的删除 Right Click or , Click “Disconnect” Right Click “Connection”,Click “Delete Connection” Double Click or 5 Clementine操作基本知识 流的执行 Highlight “Stream”,Click Right Click ,Click “Execute” In the Edit Window of the , Click “Execute” 流的保存 帮助 Help Menu Dialogue Window 6 Clementine可读取的数据文件 读取文本数据与查看数据 7 变量的类型 根据数据的不同,可以把变量分为以下一些类型 数值型变量 定类变量 例如:客户编号、性别、邮编等 不能比较大小 定序变量 产品等级、信用级别、客户收入水平分类等 可以比较大小、不能进行加减运算 定距变量 出生日期、温度等 可以进行加减运算、不能进行乘除运算 定比变量 收入、长度等 可以进行乘除运算 7 变量的类型 进一步细分 连续性变量(Range) 例如:年龄 离散型变量(Discrete) 例如:人口数 二分类型(Flag) 例如:性别 多分类型(Set) 例如:职业 定序型(Ordered Sets) 例如:学历、收入水平 缺省型(Default) 7 变量的类型 从存储角度可分为 整数型(Interger) 实数型(Real) 字符串型(String) 时间型(Time) 日期型(Date) 8 各类变量尺度比较 9 描述性统计量 描述统计量(summary statistic),也称汇总统计量或概括统计量 用少量数字概括大量数据的技术 离散变量的描述性统计 频数 累

文档评论(0)

此项为空 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档