资料探勘-.3-资料前置处理.pptVIP

  • 1
  • 0
  • 约5.56千字
  • 约 39页
  • 2018-08-02 发布于江苏
  • 举报
第三章 資料前置處理 第三章 資料前置處理 簡介 資料前置處理的主要工作 遺缺填補法 雜訊去除法 資料正規化 資料形式轉換* 資料型態轉換* 資料模糊化** 總結 資料未經處理的問題 資料不完整 (data incomplete) 資料中某些屬性值有遺缺 資料有雜訊 (noise) 資料有錯誤或是特例(outlier)造成 資料不一致 (data inconsistency) 商品在台灣是以台幣,在美國則是美金計價 有高品質的資料,才有高品質的探勘結果 第三章 資料前置處理 簡介 資料前置處理的主要工作 遺缺填補法 雜訊去除法 資料正規化 資料形式轉換* 資料型態轉換* 資料模糊化** 總結 前置處理的主要工作 資料整合 資料整合 (data integration) 解決多重資料來源的整合問題 主要工作 消除資料不一致 數值不一致 (data value conflict) 綱目不一致 (schema conflict) 消除資料重複性 數值重複 綱目重複 資料清理 (1) 確認資料正確性、完整性 常見的資料正確性問題 資料清理 (2) 確認資料完整性 常見的資料完整性問題: 資料清理 (3) 其它清理工作 遺缺填補:人工填補或自動填補 雜訊消除:雜訊使探勘結果有相當大的偏差,必須將雜訊移除或將資料做平緩化處理 (smoothing) 資料轉換 資料統整(dat

文档评论(0)

1亿VIP精品文档

相关文档