的预测区间估计值.ppt

  1. 1、本文档共88页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
的预测区间估计值

Microsoft SQL Server 2005 Data Mining 演算法 -- Regression 謝邦昌 輔仁大學統計資訊學系 教授 中華資料採礦協會? 理事長 何謂「迴歸」? 某公司業務部經理想要了解該公司影響銷售業績(y)之主要因素並希望能建立一預測模式。 案子交由市調部門做市場調查,發現有許多似乎都是很主要之變項因素(例如:廣告費、交際費、銷售員佣金…等)。如果該業務經理只想找出一個或數個重要的相關之變項因素(X1,X2,…,Xp),如何尋找出?並如何建立預測模式? 迴歸分析 迴歸分析 建立變數關係的數學方程式之統計程序 是將研究的變數區分為因變數與自變數,並建立因變數為自變數之函數模型 主要目的是用來解釋資料過去的現象及由自變數來預測因變數未來可能產生之數值。 自變數(Independent variable) 由數學方程式預測的變數。 因變數(Dependent variable) 據以預測因變數的值之變數。 迴歸分析 簡單線性迴歸(Simple Linear Regression) 僅有一自變數與一因變數,且其關係大致上可用一直線表示。 複迴歸(Multiple Regression) 兩個以上自變數的迴歸。 多變量迴歸(Multi-Variable Regression) 用多個自變項預測數個因變數,建立之迴歸關係。 相關分析 不以數學方程式描述自變數與因變數的關係,而是在於判定其線性關聯的程度,並提供相關性的測度。 不可藉迴歸或相關分析建立「因果關係」 相關分析 是利用來衡量兩個隨機變數之間”直線關係”的方向與強弱程度 。 在某些狀況下,決策制定者對二變數之關係的方程式的關切,可能不如其對二變數之關係程度的關切。在這種情形下,我們可以使用相關分析來決定二變數之間關係的強度。 相關分析 相關係數(correlation coefficient) : 表示兩隨機變數變動方向與程度大小稱為相關係數。 相關係數的值恆介於-1與+1之間。 完全正向線性相關 :相關係數?+1 完全負向線性相關 :相關係數?-1 無線性關係 :相關係數的值非常接近零 相關係數 皮爾森積矩相關係數(Pearson Product Moment correlation coefficient) 樣本資料 其中 =樣本相關係數 =樣本共變異數 =X的樣本標準差 =Y的樣本標準差 替代公式 迴歸分析結果決定樣本相關係數 假設最小平方估計迴歸方程式為 ,則可利用下述二公式之一計算樣本相關係數: 其中 =估計迴歸方程式的斜率 =X的樣本標準差 =Y的樣本標準差 顯著性檢定 樣本相關係數是母體相關係數的點估計式,以 代表母體相關係數,則可進行下述的假設檢定: 以檢定X與Y之間的線性關係之顯著性可證明檢定上述假設與檢定迴歸方程式的斜率之 顯著性為相同的。 統計結果證明,若 為真則 的值為自由度為n-2的t分配。 最小平方法 最小平方法(least squares method) : 提供描述自變數與因變數關係的最佳近似之直線。 估計迴歸線(estimated regression line) 或估計迴歸方程式(estimated regression equation) :

文档评论(0)

2752433145 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档