决策树讲义叶连祺编.DOC

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
决策树讲义叶连祺编

PAGE PAGE 1 決策樹 講義 葉連祺 編 使用軟體 可使用 SPSS的answer tree軟體繪製(目前為3.1版),讀取SPSS的*.sav檔格式資料,再勾選選項即可進行分析。 分析程序(分析新資料)(以2.1版為主) 建立SPSS的資料檔(*.sav) 進行answer tree,建立新方案(new project) 建立樹狀結構之雛型 選用分析方法 可有CHAID(卡方自動互動檢視法)、窮盡式CHAID、CRT和QUEST四種方法,最後一種僅適用於依變項性質為二分類的名義變項(即只分成二個類別的名義變項,如性別)。選用何法,主要依據資料變項的性質和分析目的而定。 設定自變項(predictors)和依變項(target) 採拖曳方式(即滑鼠指標停在變項上,再按右鍵不動,拉著變項到target或predictors等空格內)設定變項,自變項可有全選(all others)和自由設定(custom),後者係自已設定某些變項,要拖曳變項到predictors欄內,前者乃自動全選,不必設定。 進行跨樣本效度檢驗(適用於樣本大時,如大於500) 分析方法有二: 分成兩個樣本 係分成training sample和testing sample,乃依設定兩者的比例,將現有樣本分成兩群。 分成多個樣本 乃將樣本切割成多個樣本,要設定切割樣本數(sample folds)。 設定更多分析參數(options,此處僅介紹CHAID部分) 此步驟宜設定。建議將parent node設定為5,child設定為2,即設定較小為佳,以免過於嚴苛,無法繼續分析。 正式進行分析 選擇 grow tree ,分析全部的樹狀結構。 存檔或列印分析結果 可選export 功能存檔,以*.bmp檔案格式存檔,再以其他繪圖程式,轉換成*.jpg檔。 解讀分析結果 原始資料檔有四個變項,Y為購書支出,X1為年齡,X2為所得,X3為教育程度,X1至X3為二分間斷變項,編碼為0和1,0是較低者,1為較高者,Y為連續變項,整個資料是取自黃俊英(民87)多變量分析(第六版),第105頁。 1、樹狀結構圖 2、解釋 第一次分析結果 X1分成兩組,表示購書支出會因年齡而有異。 第二次分析結果 X1的低分組(即年齡低者,X1=0)可再分成教育程度低(X3=0)和教育程度高(X3=1)兩組。此結果顯示:年齡低和教育程度在購書支出有關聯性,故就行銷而言,要重視年紀輕且教育程度高的族群(其M=48.09,高於年紀輕且教育程度低的族群,其M=34.45)。 第三次分析結果 X1的高分組(即年齡高者,X1=1)可再分成所得低(X2=0)和所得高(X2=1)兩組。此結果顯示:年齡高和所得在購書支出有關聯性,故就行銷而言,要重視年紀大且所得多的族群(其M=92.88,高於年紀大且所得少的族群,其M=48.89)。 總結 可發現購書支出會因年齡和教育程度及所得而有差異,年紀輕且教育程度高的族群和年紀大且所得多的族群均為應注意的行銷對象。 建議讀物 1.黃俊英(民87)多變量分析(第六版)。臺北:中國經濟企業研究所。 2.賴世培(民85)。族群分析──民意調查的統計分析新技術之探討。空大行政學報,6。 3.賴世培(民88)。Answer tree之應用。空大行政學報,9。

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档