將鳶尾花資料視為多維度陣列.pptVIP

  • 2
  • 0
  • 约4.06千字
  • 约 39页
  • 2016-11-10 发布于天津
  • 举报
將鳶尾花資料視為多維度陣列

(C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 (C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 什麼是資料的探索? 資料探索的主要目的在於 幫助選擇適當的前處理方式以及資料探勘的技術 協助解決資料探勘的問題 人們可以利用視覺化的方式來發現樣式以及進行結果的解釋 與探索性的資料分析(Exploratory Data Analysis,EDA)領域相關 由John Tukey所發展的統計方法 資料探索使用的技術 Tukey 所發展的EDA 強調視覺化 將分群分析和異常偵測皆視為資料探索技術 分群分析和異常偵測是資料探勘的重要研究領域,而非僅視為資料探索 本章將資料探索的重點放在 統計彙總 視覺化 線上分析處理(OLAP) 鳶尾花(Iris )資料集 有許多的資料探索技術是利用鳶尾花資料集進行說明 有三種主要的類別: Setosa Virginica Versicolour 有四種屬性 萼長 萼寬 花瓣長 花瓣寬 彙總統計 彙總統計屬於量化的資料 包括資料的次數、資料的落點和資料的分佈 範例:資料的落點 - 平均數 資料的分佈 - 標準差

文档评论(0)

1亿VIP精品文档

相关文档