- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
共变异矩阵相等
區別分析 多變量分析—管理上的應用 * 區別分析原理 優、劣公司之財務績效表現 如下圖,先計算兩組樣本的平均數,再以兩組平均數的中點為分界,可以將樣本分為兩組 多變量分析—管理上的應用 * 選擇區別變數(1) 以EBIT及ROE為兩軸,繪出各個資料點在座標平面上所在的位置,而Z軸則為與EBIT軸夾角θ的新軸 圖中樣本點P投影至Z軸之投影長度為ZP,其計算的公式為,其中,w1、w2可視為在兩個變數的線性組合中的權重 多變量分析—管理上的應用 * 選擇區別變數(2) 圖8-3中,有4個財務比率變數X1、X2、X3、X4,我們由兩個群組中抽樣,圖中的曲線為各組樣本在個別變數的分配。由其中可以看出,變數X1和X2區別兩組樣本的效果,優於變數X3和X4 多變量分析—管理上的應用 * 界定區別規則 組間均方誤(SSB)對組內均方誤(SSW)的比值λ會隨著夾角θ而變動,當λ值愈大,表示其對應的Z軸上,各投影點的組間均方誤和組內均方誤的差異愈大,也就是該軸線區別各組的能力愈佳。因此,決定區別方程式的基本原則,就是「找出極大化λ值的夾角θ」 多變量分析—管理上的應用 * 常用的區別規則 多變量分析—管理上的應用 * 主成分析析 vs. 區別分析 主成份分析和區別分析都是要找出一個最適的、所有變數的線性組合,但是,它們選擇最適線性組合的標準並不相同 主成份分析的目的是要找出能夠涵蓋最大變異的線性組合,來削減變數個數,因此其選擇的標準為能夠「極大化SST」的方程式 區別分析的目的則是在找出一個最能夠區別出各群組的線性組合 多變量分析—管理上的應用 * 分類(1) 在區別分析中往往必須同時考慮成本和機率,以決定最適合的區別規則,設 如果x是來自Π1,則U的分配為N(0.5δ,δ);如果x是來自Π2,則U的分配為N(-0.5δ,δ),其中 當兩分群的誤判成本相同時,我們可以把x來自兩個不同母體的情況下,U的分配繪成下圖 P(1∣2)為x屬於母體2的情況下,將x誤判為來自母體1的機率 P(2∣1) 則為x屬於母體1之下,將x誤判為來自母體2的機率 多變量分析—管理上的應用 * 分類(2) 當兩群組的誤判成本不相等時,我們可以藉著調整區別規則來改變誤判的機率,但當其中一群組的誤判率下降時,必定會造成另一群組的誤判率提高 將區別規則改為「若Uu,則判定為Π1」,其中,u為一非0之實數常數 如果我們希望將P(1∣2),即誤判群體2之樣本為群體1的機率,控制在α以下,則依據Π2的分配,可以將臨界值設為 多變量分析—管理上的應用 * 區別規則(1) 一般化的區別規則應該是將誤判的成本函數及先驗機率同時納入考慮,以獲得能夠極小化總誤判成本的區別規則 基本假設 假設各群體的機率密度函數已知,群體Π1的機率密度函數為f1 (x; θ1),群體Π2的機率密度函數為f2 (x; θ2),則選定的區別規則應該能夠把p維(p個區別變數)的樣本空間切割為R1與R2。當x落在R1,將之判定為Π1;落在R2,則判定為Π2 令C(i│j)表示將某一屬於Πj的樣本誤判為Πi的成本,而P(i│j)表示上述情況發生的機率 多變量分析—管理上的應用 * 區別規則(2) 區別規則的產生 各群體之變異-共變異矩陣相等 極小化對隨機樣本誤判成本的方法為「貝氏法則」(Bayes rule) 如果兩群體發生的先驗機率相等(p1= p2=0.5)貝氏法則可表示為 在兩群體誤判成本相等,且變異-共變異矩陣相等的情況下,我們可以將第i個群體之「區別函數」(classification function)定義為 將樣本值(x)代入各群之區別函數計算其值,並以區別函數值最大之那一群做為該樣本歸屬的群體 多變量分析—管理上的應用 * 區別規則(3) 區別規則的產生 各群體之變異-共變異矩陣不等 貝氏法則可表示如下 在兩群體誤判成本相等的情況下 多變量分析—管理上的應用 * 區別規則(4) 錯誤分類成本不同之情況 我們可以利用對先驗機率的設定,來進行誤判成本不同之下的區別分析,令 在 的情況下,若且唯若 使得 進行誤判成本不相等的分析情況,我們可以將兩群體的先驗機率設為p1*及p2*,再以電腦軟體進行區別分析 多變量分析—管理上的應用 * 區別規則(5) 多於兩群體之分析 計算觀測樣本和各群體平均數之間的馬氏距離,將觀測樣本歸到最接近的群體 計算觀測樣本歸屬於各群體的事後機率,並將觀測樣本歸到事後機率最大的群體 計算各群體的區別函數值,並將觀測樣本歸到區別函數值最大的群體 多變量分析—管理上的應用 * 變數選擇程序 向前選擇程序 向前選擇程序主要是希望依序在所有變數之中,找出區別效果最佳的變數 向後
文档评论(0)