非常符合本章的决策树C50演算法来练习.pptVIP

  • 9
  • 0
  • 约2.28千字
  • 约 46页
  • 2019-05-22 发布于江苏
  • 举报

非常符合本章的决策树C50演算法来练习.ppt

資料分類範例三 節點【C5.0】檔案 RiskNew.xlsx 12470 records 10 fields 模型的部署 部署(deployment)就是將模型運用在新資料上,亦即先訓練舊資料再以新資料預測 舊資料檔Risk有4117 筆資料,已有分類好的RISK欄位,某欄名storecar,loan範圍0-3 新資料檔RiskNew有12470筆資料,但沒有RISK欄位,storecards需改名成storecar ,又如果有一筆資料loan=5? 因為新資料檔沒有RISK欄位,因此產生的模型就無法產生混淆矩陣和正確率分析的結果 訓練Risk後再以RiskNew預測模型 所產生模型的表格 模型的分配圖 模型的直方圖 資料分類範例四 節點【CRT】檔案wdbc.txt 569 records 32 fields 分類迴歸樹基本概念 分類迴歸樹(CR Tree, Classification and Regression Tree)由Breiman在1984年提出 CR Tree以反覆運算的方式,由根部開始反覆建立二元分支樹,直到樹節點中的同質性達到某個標準,或觸發反覆運算終止條件為止 CR Tree的輸出欄位既可以是數值型資料,也可以是類別型資料 乳腺癌醫學診斷應用 本範例檔wdbc.txt的乳腺癌(Breast Cancer Diagnostic)的診斷資料,取自美國加州大學

文档评论(0)

1亿VIP精品文档

相关文档