Clementine1(基础).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Clementine 基础 School of Economics and Management 李向东 河北工业大学 内容索引 CRISP-DM 过程模型 Clementine用户界面 节点基本操作 数据流的基本管理和执行 示例(NC.str) CRISP-DM 过程模型 跨行业数据挖掘标准过程(CRISP-DM) 定位是面向行业、工具导向、面向应用 适用于大型工业和商业实践的一般标准 六个阶段: 商业理解 数据理解 数据准备 建模 模型评估 结果发布 Clementine用户界面 选项板(卡)区 源节点——将数据读入 Clementine 中 选项板区 管理选项板 数据流,输出和模型管理窗口 在流选项卡中新建、打开、关闭、保存数据流。当前数据流呈现蓝色背景。(*.str) 输出选项卡存放执行数据流后生成的各种数据表,可对其进行管理操作。(*.cou) 模型选项卡存放执行数据流后生成的各种模型计算结果,可对其进行管理操作。(*.gm) 项目管理窗口 多条数据流组成一个数据挖掘项目(*.cpj) 将流管理窗口的数据流分别存放到不同目录中,分别对应于数据挖掘的各阶段,以形成一个完整的数据挖掘项目。 加粗黑色显示为当前目录。 客户端和服务器端 Clementine 可运行在 客户端和服务器端两种模式下 默认模式:客户端 在菜单 “工具” 中选择 “服务器登录” 注意 Clementine 客户端和服务器端版本必须匹配 节点基本操作 增加节点 移动节点 编辑节点 重新命名节点 复制节点 删除节点 注解节点 保存节点 重新载入节点 连接节点 删除节点连接 获得帮助 增加节点 双击选项板上节点,自动放置节点到数据流区域 注意:它会自动地连接到“当前”节点( “当前”节点:外带虚线框,或节点成蓝色), 从选项板拖放节点到数据流区域中 在选项板上点击一个节点,然后在数据流区域中点击一下 选中节点,变成淡蓝色 编辑节点 鼠标右击节点,点击 “编辑” 在菜单上还可以选择连接、断开连接、重命名并注释、复制节点、删除、载入节点、保存等操作 删除节点之间连接 在连接箭头上按下鼠标右键,选择“删除连接” 节点调整 节点A-B间插入节点C 鼠标拖动A、B之间的有向线段到节点C 已建节点连接A-B-C,绕开节点B直连节点C(拖动A、B之间的有向线段到节点C) 指定节点A为当前节点,按住Alt键同时拖动A、B之间的有向线段到节点C(结果同上) 关于源节点 源节点是连接到初始数据源的节点 源节点只能发送数据,不能从其他节点连接到一个源节点 关于输出节点 输出节点是生成输出、图形、表格和模型的节点 不能从输出(终端)节点连接到任何节点 帮助菜单 帮助主题 CRISP-DM 帮助 应用程序示例 软件使用 辅助选项帮助 键盘代替鼠标操作 这是什么 数据流的基本管理和执行 数据流中的节点主要实现功能: 读入数据 预处理数据 用表格显示内容 数据分布特征分析和展示 筛选数据参与后续分析 数据建模 模型评价,选择最优模型 数据流的操作步骤 选择和管理节点 见前面:选项卡区 节点连接和节点调整 见前面:节点基本操作 设置节点参数——难点 鼠标右击节点,选择“编辑”。 节点不同,参数不同 需要知道节点功能,数据分析方法原理。 执行数据流 主菜单:工具——执行,执行整个数据流 右击一个节点,选择:从这里执行,表示从当前节点开始执行。 注意:源选项卡节点,后面没有相连节点,则不能被执行 数据流的其他管理 缓冲(Cache)节点 数据缓冲作用 在一个节点上建立数据缓冲区,存放数据流执行至此的中间结果,可保存到文件中。下次执行可从该节点执行。 源节点和预处理节点可做缓冲节点。 缓冲节点 启用(enable)缓冲:出现白色文本图标。 执行数据流成功。 保存缓冲:为.SAV文件。 下载(load)缓冲:可将.SAV缓冲文件重新装入缓冲区。 刷新(flush):清空缓冲节点缓冲区的数据。文本图标显示为白色。 禁用(disable):撤销缓冲。 超节点 多个节点集成在一个节点。 左侧无连接(对应输入节点) 两侧有连接 右侧无连接(对应输出节点) 查看(放大): 返回:zoom in 取消(expand)(右键,弹出菜单)扩展 节点映射 数据流具有通用性,则用新数据替换当前数据流中原有数据,实现对新数据同样的分析和处理。 例如:用B节点替换A节点,使得B连接C。 节点映射 选中新数据源节点B。右击:数据映射——映射到——选中要连接的后续节点C,弹出新老数据(A,B节点)对应窗口,系统匹配或用户指定,实现映射。 节点映射结果 节点映射 选择其他节点(B节点)替换此节点(A节点)。实现B、C连接。 选中旧数据源节点A。右击:数据映射——选择替换节点——

文档评论(0)

js1180 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档