(一)相关分析的意义.pptVIP

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(一) 相關分析的意義 統計學上稱各種變量相互關係為相關(correlation) 兩變量間的相互關係,稱為簡單相關;若兩變量的關係可用直線方程式來表示的,稱為直線相關,若可用曲線方程式表示的,稱為曲線相關或非直線相關 依兩種變量的變動趨向,直線相關又可分為正相關、負相關(或反相關)及零相關三種。當兩種變量同時增加或同時減少,即變動趨向一致時,稱為正相關 當兩種變量一為增加另一為減少,或一為減少另一為增加,即變動趨向相反時,稱為負相關或反相關 當兩種變量沒有特殊的關係,即其相關程度是零時,稱為零相關 為了較容易看出兩個變量的相關情形,我們經常將兩個變量的變化數列描繪到座標圖中,此稱為散佈圖(Scatter diagram),其製作步驟如下: (1) 指定兩條相互垂直的橫、縱軸為座標平面上的x軸及y軸,讓其各代表一種變量。 (2) 每一對的變量資料可看成座標平面上的一個點,然後將其描繪在座標平面上。 在直線相關中,若散佈圖中的各點,大概可作出一條左下到右上的直線,即斜率為正的直線,則此兩種變量為正相關,若各點大概可作出一條左上到右下的直線,即斜率為負的直線,則此兩種變量為負相關 1. 完全相關: 若各點完全散佈於一曲線上或非垂直非水平的一直線上,則此兩變量間的相關程度達到最高,即為完全相關,如圖6-2及圖6-3所示。 2. 中度相關或低度相關: 若各點的散布趨勢像一條曲線或非垂直、非水平的直線,而當大多數的點散布於線兩旁的範圍愈狹窄,則兩變量的相關程度就愈高,如圖6-4所示為中度相關,圖6-5所示為低度相關。 3. 零相關: 若各點的散布到處都有,沒有向上或向下的趨勢,則兩變量之間毫無關係,即為零相關,如圖6-6所示。或各點完全散布於一條平行或垂直x軸的直線上,即表示一變量的變化對另一變量不產生影響,所以兩變量亦為零相關,如圖6-7所示。 (二) 相關係數 相關係數(Correlation coefficient)是兩組變量間相關程度的數字表現形式,作為母體間相互關係程度的母數,一般以? 表示,作為樣本間的統計量數,就常用r表示。 設(X1,Y1),(X2,Y2),……,(Xn,Yn)為一組來自共同母體的樣本資料,則計算積差相關係數的公式如下: 其中標準差 至於式中 的稱為共變數(covariance)。 共變數可以用來測量兩組變量的一致性程度。 相關係數(r)實為X, Y兩變數各以其標準差為單位的離均差之乘積的算術平均數。 (一) 迴歸分析的意義 迴歸分析(Regression analysis)分為下列兩類: 1. 簡單迴歸(Simple Regression):   如果兩個變數X、Y有相關,且X的變動會影響到Y,則我們可以透過兩個變數間的關係,找到代表此關係的方程式,再藉X及該方程式來預測Y,如此方法即稱為迴歸分析 簡單迴歸又分為: (1)直線迴歸(Linear Regression):當兩個變數之間為直線關係,迴歸方程式呈線性,且僅有一個自變數。 (2)非直線迴歸(NonLinear Regression):當兩個變數之間為曲線關係。 2. 複迴歸(Multiple Regression)或多元迴歸: 研究多個變數間的關係,且其中之一的變數Y(因變數)會受其他變數(自變數)的影響 在直線迴歸中,變數X稱為自變數(Independent variable)或預測變數(Predictor variable),變數Y稱為因變數(Dependent variable)或反應變數(Response valiable)。 假若二變數為一直線相關,我們可以用一直線方程式來表示二者的關係,其中為Y的預測值,?為Y截距,? 為斜率 在統計上我們是採用最小平方法(Least squares method)又稱最小二乘法來估計參數?、?。所謂最小平方法須符合下列兩個條件: (1) 。即估計值()的誤差的代數和等於零。 (2) 為極小值。即估計值的誤差的平方和為最小值。 設定一個X值,得到的預測(或估計)值 ,不見得等於實驗值Y Y與 的差即為估計誤差(Error of estimate),或殘差(residual) 定義Y對X的估計標準誤(Standard error of estimate)為 由SYX的定義,首先必須先求出所有估計值 ,才能算出SYX,頗為不便,因此我們將導出Y對X的估計標準誤SYX之另一個公式(證明在下一節),即 決定係數(Coefficient of determination)為迴歸平方和與

您可能关注的文档

文档评论(0)

yurixiang1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档