第五章資料分類法
第五章 資料分類法 第五章 資料分類法 簡介 以決策樹為基礎之分類法 非決策樹為基礎之分類法 何謂分類 根據已知資料及其分類屬性值,建立資料的分類模型,接著利用此分類模型預測新資料的類別 範例:顧客是否會購買筆記型電腦的分類模型 分類法的特性與分類演算法 分類法特性 屬於機器學習(machine learning) 一種監督式的學習法(supervised learning) 常用的分類演算法 以決策樹為基礎的分類法 包括ID3, PRISM, 以及Gini索引 非決策樹為基礎的分類法 貝氏分類法、記憶基礎推論法、類神經分類法 分類的目的與應用 分類目的 分析影響資料歸類的因素 預測資料所屬的類別 (class label) 分類應用 信用額度核准(credit approval) 例如:根據預測的信用等級決定核卡額度 目標行銷(target marketing) 例如:找出會購買筆記型電腦的顧客屬性 醫療診斷(medical diagnosis) 例如:依病人的症狀判斷是否罹患SARS ... 分類所需的資料前置處理 資料一般化 將連續性資料離散化,資料的數值分布精簡化 避免分類的品質不佳 特徵屬性選取(feature selection) 找出具有關鍵影響的屬性,將無關屬性去除 提高分類的精準度 注意 每筆建立分類模型的資料樣本,一定要
原创力文档

文档评论(0)