- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Clementine 教程
1. 概要
资料采矿使用 Clementine 系统主要关注通过一系列节点来执行资料的过程,这被称作一个数据流(stream )。这
一系列的节点代表了将在资料上执行的操作,而在这些节点之间的联系表明了数据流(stream )的方向。 使用者的
数据流包括四个节点:
一个变量文件节点,用来从资料源读取资料。
一个导出节点,向资料集中增加新的,通过计算得到的字段。
一个选择节点,用来建立选择标准,从数据流中去除记录。
一个表节点,用来显示使用者操作后得到的结果。
2.建立数据流
使用者可以使用下列步骤来建立一个数据流:
●向数据流区域中增加节点
●连接节点形成一个数据流
●指明任一节点或数据流的选项
●执行这个数据流
图2-1 在数据流区域上的一个完整数据流
2.1 节点的操作
工作区域中的各种节点代表了不同的目标和操作。把节点连接成数据流,当使用者执行的时候,让使用者可以
看到它们之间的联系并得出结论。数据流(stream )就像脚本(scripts ),使用者能够保存它们,还可以在不同的数据
文件中使用它们。
节点选项板(palette )
在 Clementine 系统窗口底部的选项板 (palette )中包含了用来建立数据流的所有可能的节点。
图2 -2 在节点选项板上的记录选项项目(Record Ops tab )
每一个项目(tab )包含了一系列相关的节点用于一个数据流(stream)操作的不同阶段,例如:
●来源(Sources)。用来将资料读进系统的节点。
●记录选项(Record Ops )。用来在资料记录上进行操作的节点,例如选择、合并和增加。
●字段选项(Field ops )。用来在数据域位上进行操作的节点,例如过滤、导出新字段和确定给出字段的数据类型。
●图。在建模之前和之后用来可视化资料的节点。图包括点图、直方图、Web 节点和评估图表。
1
●建模。在 Clementine 系统中可用的代表有效建模算法的节点,例如类神经网络、决策树、聚类算法和资料排序。
定制常用项
在节点选项板(palette )上的Favorites 项目能够被定义成包含使用者对 Clementine 系统的习惯用法。例如,如
果使用者经常分析一个数据库中的时间序列资料,就可能想确保数据库来源节点和序列建模节点这两个都可以从
Favorites 项目中获得。
向数据流中增加数据流节点
从节点选项板中向数据流增加节点有三种方式:
●在选项板上双击一个节点。注意:双击一个节点会自动的将它连接到目前的数据流上。更多的信息参看下面的“在
数据流中连接节点”。
●将一个节点从选项板拖放到数据流区域中。
●在选项板上点击一个节点,然后在数据流区域中点击一下。
删除节点
为了从数据流中删除一个节点,点击它并按删除。或者,单击鼠标右键并且从菜单中选择删除。
在数据流中连接节点
首先选择这个节点,然后在选项板双击另一个节点,比如一个生成节点。这个操作自动的把这个生成节点连接
到目前的数据库节点。
图2 -4 在选项板上双击节点建立一个数据流
通过鼠标中间键点击和拖放来完成。(如果你的鼠标没有中间键,使用者可以通过按住“Alt”键来模拟这个过程。)
表 2 -5 使用鼠标的中间键来连接节点
手工连接节点
●选择一个节点并且单击鼠标右键打开内容菜单。
●从菜单中选择“connect” 。
●一个连接符号将同时出现在开始节点上和游标上,点击数据流区域上的第二个节点将两个节点连接在一起。
图2 -6 使用菜单上的连接选项来连接节点 图2 -7 被连接的节点
文档评论(0)