- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
下載-輔仁大學
【統計教室】
(一)—主成份分析
謝邦昌
(輔仁大學統計資訊學系教授)
壹、前言
每當學年要結束時,, a1 , a2 , a3 , a4
a1×國語+a2×算術+a3×自然+a4×社會科;
這樣一來即是加權過後總合的成績。接著吾人須決定的是加權的比重,這就是主成份分析,上述的加權比重的1次式亦即其主成份(Principal Component)。
(PCA)?
PCA。
實際上主成份分析之主要目的乃是希望用較少的變數去解釋原來資料中的大部分變異,亦即期望能將我們手中許多相關性很高的變數轉化成彼此互相獨立的變數,,,,
而為什麼要用解釋變異之能力來尋找主成份呢?,,,,?,,,,,,,,PCA來找出主成份,,,,,,,,,(即每個變數的加權程度都同)。
參、模式
PC(1) = a11X1 + a12X2 + 。。。。。 + a1pXp
PC(2) = a21X1 + a22X2 + 。。。。。 + a2pXp
。
。
。
PC(m) = am1X1 + am2X2 + 。。。。。 + ampXp
PC(1),PC(2),。。。,PC(m)1主成份,2主成份,。。。 m主成份, 1次式的係數,ai1,。。。,aip
其中在選擇加權數,a11。。。,a1pPC(1)得到最大解釋變異能力,PC(1)能得到最大之變異數,PC(2)則是能對原始資料中尚未被PC(1)解釋的變異部分擁有最大解釋能力,,m個PC出來*(m≦p),
Xj , j = 1, 2 ,。。。。, P
PC(m) = am1X1 + am2X2 + 。。。。。 + ampXp
Y = β1X1 +β2X2 + 。。。。。+pXp 來表示。
(*)通常原始資料有P個X變數時,,m個出來,P個PC(m ≦ P),,80%以上。除此之外,PPC與原來的P個變數X,,,P個PC則為彼此獨立之新變數。
肆、SAS中之主成份分析:PROC PRINCOMP
在行為科學研究的試探階段,我們常碰到必須處理許多彼此可能有相關存在的變數的情境。若將變數個數減少,並使其改變為少數幾個互相獨立的線性組合變數{亦即潛在變量或假定的成份(COMPONENTS) },我們便可以使用主成份分析來表達以上這幾個目的。即將較少數幾個變數予以線性組合,使經由線性組合而得的成份之變異數為最大,使觀察值在這些成份方面顯出最大的差別來。
PROC PRINCOMP 的分析結果包括未經標準化及標準化後之主成份值。這些主成份值可以代替原變數的值,進一步進行其他分析,如迴歸分析,集群分析或繪圖等。
PROC PRINCOMP options選項中,若選擇OUT-STAT-SASdataset,則資料組SASdataset內將包含以下各統計量:平均數(MEAN),標準差(STD),(CORR),(COV),(EIGENVALUE),(SCORE),(SUMGWT)。
PROC PRINCOMP 選項串:
:
DATA = ,
OUT = 輸出資料檔名稱,
OUTSTAT = 輸出資料檔名稱,:
代號(_TYPE_) 定 義
-------------------------- ----------------------------
MEAN 每一變項的平均數
STD 每一變項的標準差
N 觀察體的總個數
CORR 相關係數
COV 變異數/共變數矩陣
EIGENVAL 特性根
SCORE 特性向量
SUMWGE 加權值的總和
NOINT(無常數項)
COVARIENCE(或COV) --要求以變異數/共變數矩陣為分析的數據
N = 正整數--界定成主成份的總數
STANDARD(或STD) --要求OUT=輸出資料檔中含標準化的主成份值
PREFIX = 主成份的名字--為主成份命名
NOPRINT --不印出分析結果
VAR 變項名稱串:--
PRATIAL 變項名稱:--,
FREQ 變項名稱:--
WEIGHT 變項名稱:--
BY 變項名稱串:--
伍、結語
主成份分析(principal component analysis)首由K. Pearson於1901年提出,Hotelling(1933)加以發展的一種統計方法。其主要目的是在於將許多變項予以減少,(
您可能关注的文档
最近下载
- 水泥厂余热锅炉调试报告.pdf VIP
- 2024-2025年中国铁氧体软磁材料行业市场调查研究及投资前景预测报告.docx
- 2025秋统编版(2024)小学道德与法治三年级上册(全册)课时练习及答案(附目录).docx
- 我眼中的中国平安.docx VIP
- 公路工程沥青新旧试验规程差异对比解读-JTG 3410-2025.pdf VIP
- 《气体传感器简介》课件.pptx VIP
- 自治区矿产资源开发利用与生态保护修复方案编制提纲(试行).doc VIP
- 粘贴钢板加固施工方案.docx VIP
- 碳排放权交易有关会计处理暂行规定(2025).docx VIP
- Fisher阀门结构与维护.ppt VIP
文档评论(0)