和等深分割法.pptVIP

  • 23
  • 0
  • 约8.81千字
  • 约 57页
  • 2016-12-01 发布于天津
  • 举报
和等深分割法

第三章 資料前置處理 第三章 資料前置處理 簡介 資料前置處理的主要工作 遺缺填補法 雜訊去除法 資料正規化 資料形式轉換* 資料型態轉換* 資料模糊化** 總結 資料未經處理的問題 資料不完整 (data incomplete) 資料中某些屬性值有遺缺 缺少某些分析時需要用到的屬性,Ex:性別 資料有雜訊 (noise) 資料有錯誤或是特例(outlier)造成 資料不一致 (data inconsistency) 由不同來源整合而得所產生 商品在台灣是以台幣,在美國則是美金計價 ★有高品質的資料,才有高品質的探勘結果 第三章 資料前置處理 簡介 資料前置處理的主要工作 遺缺填補法 雜訊去除法 資料正規化 資料形式轉換* 資料型態轉換* 資料模糊化** 總結 前置處理的主要工作 資料整合 資料整合 (data integration) 解決多重資料來源的整合問題 主要工作 消除資料不一致 數值不一致 (data value conflict),Ex :單位不一 綱目不一致 (schema conflict),Ex:屬性名稱不一,會員姓名和顧客姓名 消除資料重複性 數值重複,Ex:A和B資料表有同一會員資料 綱目重複,Ex:生日和年齡 資料清理 (1) 確認資料正確性、完整性 常見的資料正確性問題 資料清理 (2) 確認資料完整性 常見的資料完整性問題: 資料清

文档评论(0)

1亿VIP精品文档

相关文档