- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关于连接节点
Clementine基础培训第一部分
介绍Clementine数据挖掘软件的基本操作和环境,学习如何使用Clementine读取、处理数据
培训内容
第一章 数据挖掘简介
第二章 Clementine简介
第三章 读取数据文件
第四章 数据质量
第五章 数据处理
第六章 寻找数据之间的关系
第一章 数据挖掘简介
第一章 数据挖掘简介
内容
介绍数据挖掘概念
介绍CRISP-DM (跨行业数据挖掘标准流程)
概述课程计划
目的
介绍数据挖掘过程,理解数据挖掘中的术语和关键概念,以及如何使用 CRISP-DM 过程模型管理一个数据挖掘项目
什么是数据挖掘?
利用各种技术发现数据的隐含关系(知识)
使用历史数据预测、分类,并且预测未来
常用技术:人工智能、机器学习、决策树
一个交互、反复的过程
Clementine 中对数据挖掘的支持
主动支持:
计算机使用各种算法在数据中识别规则和关系
被动支持:
使用者处理并且浏览数据来寻找可疑的关系
数据
数据是可以得到的吗?
数据包含所需要了解的属性吗?
数据是否有噪声?
数据量足够吗?
可以获得关于数据的专家知识吗?
数据挖掘的策略(计划性)
主要想解决什么样的问题?
可以得到什么样的数据来源,并且与当前问题相关的是哪部分数据?
在挖掘数据前,需要做什么样的数据预整理和数据清洗?
将会使用什么样的数据挖掘技巧?
将会如何评估数据挖掘的分析结果?
CRISP-DM 过程模型
跨行业数据挖掘标准过程(CRISP-DM)
定位是面向行业、工具导向、面向应用
适用于大型工业和商业实践的一般标准
六个阶段:
商业理解
数据理解
数据准备
建模
模型评估
结果发布
课程计划
数据挖掘及数据挖掘软件
数据理解:
从数据源抽取数据
用表格图形技术透视数据
处理缺失值
数据准备:
针对记录的数据准备,如选择记录、对记录排序
针对字段的数据准备,如生成新的字段
针对文件的数据准备,如合并文件
课程计划
建模技术:
监督学习技术,
神经网络、归纳规则(决策树)、线性回归、Logistic 回归
非监督学习技术,
Kohonen 网络、两步聚类、 K-means 聚类
关联规则、时序探测
模型评估
如何应用 CRISP-DM 流程研究数据挖掘问题
第二章 Clementine简介
Clementine 简介
内容
熟悉 Clementine 中的工具和面板
介绍可视化编程的思想
目的
初步了解 Clementine 的功能
数据
课程的数据文件存放在目录“C:\培训\基础培训1”中
Clementine用户界面
数据流区域
数据流,
输出和模型
管理器
项目窗口
可视化编程
节点
一个图标代表在 Clementine 中进行的一个操作
工作流
一系列连接在一起的节点
选项板
包含一系列不同功能的图标
选项板
源节点
用来将数据读入 Clementine 中
记录选项节点
在记录上进行操作
一条记录是一种“情形”或一“行”数据
字段选项节点
在字段上进行操作
一个字段是一个变量
图形节点
在建模之前和之后用来可视化数据
建模节点代表有效建模算法
注意:建模算法产生生成的模型
在下面一部分…举例:
增加一个节点
移动一个节点
编辑一个节点
重新命名一个节点
复制一个节点
删除一个节点
注释一个节点
保存一个节点
重新载入一个节点
连接节点
删除节点连接
获得帮助
增加一个节点
在选项板上双击节点,自动放置节点到数据流区域注意:它会自动地连接到“中心”节点
将节点从选项板拖放到数据流区域中
在选项板上点击一个节点,然后在数据流区域中点击一下
未选择
选择
当节点在选项板中被选中后,会变成淡蓝色
编辑一个节点
在节点上右击,展开一个节点
点击 “编辑”
在菜单上还可以选择连接、断开连接、重命名、注释、复制、删除、载入、保存等操作
连接节点
使用鼠标中键来连接节点
在数据流区域上,把一个节点连接到另一个上,可以通过鼠标中间键点击和拖放来完成(如果您的鼠标没有中间键,可以通过按住“Alt”键来模拟这个过程)
通过双击来连接节点
双击选项板上的节点,自动把新节点连接到数据流区域中的“中心”节点上
未选中的节点(灰白色)
被选中的节点(淡蓝色)
删除节点之间的连接
在连接箭头的头部按住鼠标右键
选择“删除连接”
关于连接节点:源节点
源节点是连接到初始数据源的节点
源节点只能发送数据
不能连接到一个源节点
关于连接节点:终端节点
终端节点是生成输出、图形、表格和模型的节点
不能从终端节点连接到任何节点
设置目录
为了方便地存取数据文件或流,您可以将目录设定为自己文件的位置
只在本次操作中起作用
通过选择菜单“文件”中 “设置目录”选项,然后输入或选择工作目录
Clementine 客户端和服务器端
Clementine 可
文档评论(0)