Clementine12理论基础(全).docVIP

  • 15
  • 0
  • 约2.41万字
  • 约 41页
  • 2016-08-09 发布于江西
  • 举报
Clementine12理论基础(全).doc

Automated Binary Classifier() 應用於二元分類的方法有以下四種: 神經網路:類比人腦處理資訊的原理,將輸入變數不斷進行分解與組合從而最終與目標變數(二元變數)產生關係。 決策樹:自上而下的建立樹形的分類從而對目標變數嘗試最優的分割。每個節點根據二叉或者多叉的不同又可以分為幾種方法。 羅吉斯回歸:根據輸入變數和目標變數樣本資料建立起回歸模型來達到預測目標變數的目的。 決策表:根據樣本值建立決策的邏輯運算式,同時也可以根據直觀的認識修改邏輯運算式中的參數。 Clementine可透過五種不同的方法來選擇好的模型: Overall accuracy:利用模型進行準確預測出的記錄數占全部記錄的百分比。 Area under the ROC curve:ROC曲線下方的面積。 Profit:總收益 Lift:提升度 Number of variables:所用變數個數 Numeric Predictor (數值預測) 當我們在配適模型時,可將變數分為目標變數(應變數)以及預測變數(自變數),而根據目標變數與預測變數的資料類型不同,能適用的模型種類也就隨之而改變。舉例來說,針對目標變數而言,可將其分為數值型態以及二元類型的資料,其中線性迴歸分析(Linear Regression Analysis)就只能適用於目標變數為數值類型的資料,相

文档评论(0)

1亿VIP精品文档

相关文档