网站大量收购独家精品文档,联系QQ:2885784924

构建资料流程.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
构建资料流程

第四章 構建資料流程 資料採礦使用Clementine系統主要關注通過一系列節點來執行資料的過程,這被稱作一個資料流程(stream)。這一系列的節點代表了將在資料上執行的操作,而在這些節點之間的聯繫表明了資料流程(stream)的方向。 使用者的資料流程包括四個節點: 一個變數文件節點,用來從資料源讀取資料。 一個導出節點,向資料集中增加新的,通過計算得到的欄位。 一個選擇節點,用來建立選擇標準,從資料流程中去除記錄。 一個表節點,用來顯示使用者操作後得到的結果。 4.2建立資料流程 (Building Data Stream) 使用者可以使用下列步驟來建立一個資料流程: ?向資料流程區域中增加節點 ?連接節點形成一個資料流程 ?指明任一節點或資料流程的選項 ?執行這個資料流程 4.2.1節點的操作 工作區域中的各種節點代表了不同的目標和操作。把節點連接成資料流程,當使用者執行的時候,讓使用者可以看到它們之間的聯繫並得出結論。資料流程(stream)就像腳本(scripts),使用者能夠保存它們,還可以在不同的資料檔案中使用它們。 節點選項板(palette) 在Clementine系統視窗底部的選項板(palette)中包含了用來建立資料流程的所有可能的節點。 ? 圖4-2 在節點選項板上的記錄選項項目(Record Ops tab) 每一個項目(tab)包含了一系列相關的節點用於一個資料流程(sream)操作的不同階段,例如: ? 來源(Sources)。用來將資料讀進Clementine系統的節點。 ? 記錄選項(Record Ops)。用來在資料記錄上進行操作的節點,例如選擇、合併和增加。 ? 欄位選項(Field ops)。用來在資料欄位上進行操作的節點,例如過濾、導出新欄位和確定給出欄位的資料類型。 ? 圖。在建模之前和之後用來視覺化資料的節點。圖包括點圖、直方圖、Web節點和評估圖表。 ? 建模。在Clementine系統中可用的代表有效建模演算法的節點,例如類神經網路、決策樹、聚類演算法和資料排序。 定制常用項 在節點選項板(palette)上的Favorites項目能夠被定義成包含使用者對Clementine系統的習慣用法。例如,如果使用者經常分析一個資料庫中的時間序列資料,就可能想確保資料庫來源節點和序列建模節點這兩個都可以從Favorites項目中獲得。 圖4-3 向Favorites項目中加入所選節點 向資料流程中增加資料流程節點 從節點選項板中向資料流程增加節點有三種方式: ? 在選項板上雙擊一個節點。注意:雙擊一個節點會自動的將它連接到目前的資料流程上。更多的資訊參看下面的“在資料流程中連接節點”。 ? 將一個節點從選項板拖放到資料流程區域中。 ? 在選項板上點擊一個節點,然後在資料流程區域中點擊一下。 刪除節點 爲了從資料流程中刪除一個節點,點擊它並按刪除。或者,單擊滑鼠右鍵並且從功能表中選擇刪除。 在資料流程中連接節點 首先選擇這個節點,然後在選項板雙擊另一個節點,比如一個生成節點。這個操作自動的把這個生成節點連接到目前的資料庫節點。 圖4-4 在選項板上雙擊節點建立一個資料流程 通過滑鼠中間鍵點擊和拖放來完成。(如果你的滑鼠沒有中間鍵,使用者可以通過按住“Alt”鍵來類比這個過程。) 表4-5 使用滑鼠的中間鍵來連接節點 手工連接節點 1.選擇一個節點並且單擊滑鼠右鍵打開內容功能表。 2.從功能表中選擇“connect”。 3.一個連接符號將同時出現在開始節點上和遊標上,點擊資料流程區域上的第二個節點將兩個節點連接在一起。 圖4-6 使用功能表上的連接選項來連接節點 圖4-7 被連接的節點 當連接節點的時候,必須遵循以下幾個指導方針。如果使用者試圖做下列任何類型的連接,將會收到一個錯誤資訊: ???????? ?導向一個來源節點的連接。 ??????? ?從一個最終節點導出的連接。 ??????? ?一個超過它的輸入連接最大值的節點。 ??????? ?連接兩個已經被連接的節點 ??????? ?迴圈(資料返回一個它已經經過的節點)。 在一個資料流程中繞過節點 在資料流程區域上,使用滑鼠的中間鍵來雙擊想要繞開的那個節點,也可以按住Alt鍵後雙擊滑鼠左鍵來完成。 注意:通過編輯功能表中的撤銷選項或者按Ctrl+Z鍵可以撤銷這個操作。

文档评论(0)

f8r9t5c + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档