练习用clementine读取数据文件-课程中心0.pptVIP

练习用clementine读取数据文件-课程中心0.ppt

  1. 1、本文档共79页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
练习用clementine读取数据文件-课程中心0

? 2006 SPSS Inc. SPSS Inc. Copyright 2006 SPSS Inc. Clementine基础培训 第一部分 介绍Clementine数据挖掘软件的基本操作和环境,学习如何使用Clementine读取、处理数据 培训内容 第一章 数据挖掘简介 第二章 Clementine简介 第三章 读取数据文件 第四章 数据质量 第五章 数据处理 第六章 寻找数据之间的关系 第一章 数据挖掘简介 第一章 数据挖掘简介 内容 介绍数据挖掘概念 介绍CRISP-DM (跨行业数据挖掘标准流程) 概述课程计划 目的 介绍数据挖掘过程,理解数据挖掘中的术语和关键概念,以及如何使用 CRISP-DM 过程模型管理一个数据挖掘项目 什么是数据挖掘? 利用各种技术发现数据的隐含关系(知识) 使用历史数据预测、分类,并且预测未来 常用技术:人工智能、机器学习、决策树 一个交互、反复的过程 Clementine 中对数据挖掘的支持 主动支持: 计算机使用各种算法在数据中识别规则和关系 被动支持: 使用者处理并且浏览数据来寻找可疑的关系 数据 数据是可以得到的吗? 数据包含所需要了解的属性吗? 数据是否有噪声? 数据量足够吗? 可以获得关于数据的专家知识吗? 数据挖掘的策略(计划性) 主要想解决什么样的问题? 可以得到什么样的数据来源,并且与当前问题相关的是哪部分数据? 在挖掘数据前,需要做什么样的数据预整理和数据清洗? 将会使用什么样的数据挖掘技巧? 将会如何评估数据挖掘的分析结果? CRISP-DM 过程模型 跨行业数据挖掘标准过程(CRISP-DM) 定位是面向行业、工具导向、面向应用 适用于大型工业和商业实践的一般标准 六个阶段: 商业理解 数据理解 数据准备 建模 模型评估 结果发布 课程计划 数据挖掘及数据挖掘软件 数据理解: 从数据源抽取数据 用表格图形技术透视数据 处理缺失值 数据准备: 针对记录的数据准备,如选择记录、对记录排序 针对字段的数据准备,如生成新的字段 针对文件的数据准备,如合并文件 课程计划 建模技术: 监督学习技术, 神经网络、归纳规则(决策树)、线性回归、Logistic 回归 非监督学习技术, Kohonen 网络、两步聚类、 K-means 聚类 关联规则、时序探测 模型评估 如何应用 CRISP-DM 流程研究数据挖掘问题 第二章 Clementine简介 Clementine 简介 内容 熟悉 Clementine 中的工具和面板 介绍可视化编程的思想 目的 初步了解 Clementine 的功能 数据 课程的数据文件存放在目录“C:\培训\基础培训1”中 Clementine用户界面 可视化编程 节点 一个图标代表在 Clementine 中进行的一个操作 工作流 一系列连接在一起的节点 选项板 包含一系列不同功能的图标 选项板 源节点 用来将数据读入 Clementine 中 记录选项节点 在记录上进行操作 一条记录是一种“情形”或一“行”数据 字段选项节点 在字段上进行操作 一个字段是一个变量 图形节点 在建模之前和之后用来可视化数据 建模节点代表有效建模算法 注意:建模算法产生生成的模型 在下面一部分…举例: 增加一个节点 移动一个节点 编辑一个节点 重新命名一个节点 复制一个节点 删除一个节点 注释一个节点 保存一个节点 重新载入一个节点 连接节点 删除节点连接 获得帮助 增加一个节点 在选项板上双击节点,自动放置节点到数据流区域注意:它会自动地连接到“中心”节点 将节点从选项板拖放到数据流区域中 在选项板上点击一个节点,然后在数据流区域中点击一下 当节点在选项板中被选中后,会变成淡蓝色 编辑一个节点 在节点上右击,展开一个节点 点击 “编辑” 在菜单上还可以选择连接、断开连接、重命名、注释、复制、删除、载入、保存等操作 连接节点 使用鼠标中键来连接节点 在数据流区域上,把一个节点连接到另一个上,可以通过鼠标中间键点击和拖放来完成(如果您的鼠标没有中间键,可以通过按住“Alt”键来模拟这个过程) 通过双击来连接节点 双击选项板上的节点,自动把新节点连接到数据流区域中的“中心”节点上 删除节点之间的连接 在连接箭头的头部按住鼠标右键 选择“删除连接” 关于连接节点:源节点 源节点是连接到初始数据源的节点 源节点只能发送数据 不能连接到一个源节点 关于连接节点:终端节点 终端节点是生成输出、图形、表格和模型的节点 不能从终端节点连接到任何节点 设置目录 为了方便地存取数据文件或流,您可以将目录设定为自己文件的位置 只在本次操作中起作用 通过选择菜单“文件”中 “设置目录”选项,然后输入或选择工作目录 Clementine 客户端和服务器端 Clemen

文档评论(0)

sunhongz + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档