网站大量收购独家精品文档,联系QQ:2885784924

第九章簡單迴歸分析.doc

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九章簡單迴歸分析

簡單迴歸分析 1.簡單迴歸分析 當討論兩變數的資料時,我們會問兩個問題,第一個問題是這兩個變數間有無關係,如有關係,它的關係有多大(相關係數)。另一個問題是一變數對另一變數有何影響(迴歸分析)。迴歸的目的就是要找出變數間的關係式,即找函數f,使應變數y(Dependent Variable,或稱準則變數)與獨立變數x(Independent Variable或稱預測變數)間有: y=f(x) 的關係式,最簡單的函數f是線性函數,即 f(x)= 我們稱這種線性關係式 y= 為簡單線性迴歸模式(Simple Linear Regression Model),其中稱為迴歸係數(Regression Coefficient,表示直線斜率),表示截距(Intercept,表示迴歸線與y軸交點的縱座標)。當收集到一組資料後,迴歸第一步驟就是估計,(後面將介紹最小平方法求,的估計),然後再利用殘差圖評估模式是否合適,如不合適則做修正,直到修正模式評估合適為止,模式修正好後,就能利用建立的迴歸模式做預測、解釋及控制等用途。 1.1 散佈圖 通常迴歸模式是未知的!一般是由已有的資料 ( x1 , y1 ),…, ( xn , yn )之散佈圖得知其輪廓。所謂散佈圖(Scatter Diagram)通常畫在二度空間上,y軸表示應變數,x軸代表獨立變數,散佈圖是相關與迴歸分析最基本的工具,如果散佈圖上的點愈接近形成一直線,表示這兩個變數的關係愈密切。反之,如果散佈圖呈圓形,表示這兩個變數沒有什麼關係,也就是說獨立變數對應變數沒有什麼影響力,因之預測能力就很差。以下舉幾個例子說明散佈圖的畫法。 例1:某汽車公司想了解廣告費x對銷售費y的影響,收集過去12年的資料如下: 表1 某汽車公司過去12年新車銷售量與廣告費資料 年代T 廣告費x(萬元) 銷售量y(輛) 73 510 1000 74 550 1100 75 600 1250 76 580 1280 77 700 1360 78 750 1480 79 860 1500 80 930 1720 81 1050 1800 82 1030 1890 83 1200 2100 84 1320 2200 圖1中(700,1360)是77年的資料,由圖上看出這12年的資料隱約的在一直線附近,將這條直線畫出如下圖,這條“最靠近”這些點的直線,就稱為“代表線”或稱“迴歸線”。 繪製其散佈圖如下: 圖1 銷售量對廣告費的散佈圖 圖2 銷售量對廣告費的迴歸線 1.2 簡單線性迴歸分析簡介 迴歸分析(Regression Analysis)是一種統計分析方法,它利用一組預測變數(或稱獨立變數)的數值,對某一準則變數(或稱應變數)做預測,它也可以做為評估預測變數對準則變數的影響程度。很不幸地,迴歸(Regression)的名字取得不理想,從字面上並不能表現出這種方法的重要性及其應用,取名實際上來自於1885年高登(Galton)所寫的論文“Regression Toward Mediocrity in Heredity Stature”。大致來說,其意義為:如果一些未知的獨立變數之影響程度消失,其應變異數應些一迴歸線。 迴歸的主要目的是做預測,目標是發展一種能以一個或多個預測變數的數值來做為應變數預測的方法。本單元將探討“簡單”線性迴歸模式,也就是只用一個獨立變數x去預測應變數y的模式。 我們常問像下面的兩個問題:能不能由學生的IQ成績預測其大學聯考成績?是否能由大學聯考成績預測大一微積分成績? 統計學主要應用之一是做預測,一般預測需要先收集資料,然後建立模式,再由給定的預測變數值,求出對應的準則變數值是多少?迴歸分析就是找出變數間的關係式。我們將變數分成兩類,一類變數是做為預測提供者,稱為獨立變數(Independent Variable)或稱為預測變數(Predictor Variable),以x表示,另一類是我們真是關心的被想預測者,稱為應變數(Dependent Variable )或準則變數(Response Variable),以y很示。所謂建立模式,就是找出y與x的函數關係式,即找函數f滿足 y=f(x) 最常用的函數f是線性函數,即 f(x)= 而y=稱為簡單線性迴歸(Simple Linear Regression)模式 例如森林農場關心明年的木材總收成是多少?當然等到砍伐就能算出收成的總體積,但如能在未砍伐前能做預測,則有很多行銷方面的好處,如何做收成的預估,方法當然有很多種,例如: 可根據過去幾年收成資料做下年度的預測(時間數列)。 可根據過去幾年砍伐面積與收成的木材體積做下一年的預測(簡單線性迴歸)。 可根據樹木的棵數,及每棵樹的高度

您可能关注的文档

文档评论(0)

75986597 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档