- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
線性迴歸節點
迴歸分析 迴歸分析可用來找出兩個或兩個以上計量變數間的關係,並進而從一群變數中可以預測資料趨勢 Ex:若某人知道廣告費用和銷售之關係,則他可以藉迴歸分析從廣告費用中預測銷售。 在迴歸分析中最簡單的模型是二變數的直線迴歸關係式,即所謂的簡單線性迴歸模型 Simple Linear Regression Model。 設X為自變數(獨立變數或解釋變數),Y為因變數(相關變數或被解釋變數),在一特定X值下重複實驗或觀察,則Y觀測值可構成一條件機率分配這兩變數的函數關係可以數學公式表示。 若x是自變數,y是因變數,則函數關係可表示為: y = f(x) 因此若巳知x之值,可由函數關係中計算出y之預測值。 Ex:若產品銷售額 y 與銷售單位 x 之關係為:一單位產品可銷售20元,則其相互關係得:y = 20x 函數 線性迴歸分析 研究某變數對其他變數的影響情況 模型:設自變數X:? 與因變數Y: ,where 第i個觀測值的因變數 第i個觀測值的自變數 誤差項 迴歸係數 模型的基本假設: 線性迴歸節點 該模型根據輸入欄位估計預測輸出欄位的最佳線性方程。迴歸方程代表一條直線或者平面,其預測值與真實輸出值的離差最小。這是一種非常常用的用於綜括資料並作出預測的統計方法。 要求:(1)只有數值型欄位可用於迴歸模型。 (2)必須只有一個“Out”欄位和一個以上的“In”欄位 (3)欄位方向爲“Both”或者“None”的欄位將被忽略, 同樣被忽略的還有非數值型欄位。 優點:迴歸模型相對簡單,並爲生成的預測給出易於解釋的數學方程。由於迴歸建模是一個比較成熟的統計方法,迴歸模型的特性容易理解。而且,迴歸模型訓練起來也非常快。線性迴歸節點提供自動選擇欄位的方法以刪除方程中的不顯著的輸入欄位。 線性迴歸節點模型選項 進入法(Enter):將所有的欄位直接選進方程。 逐步篩選法(Stepwise): 選擇方法一步一步建立方程。初始模型是最可能簡單的模型,方程中沒有一個輸入欄位。在每一步,對未進入方程的所有欄位進行評估,如果這些欄位中最好的欄位能顯著增強模型的預測效果,則添加該欄位進入方程。此外,已經存在於方程中的欄位將被重新評估,以決定其是否可被從方程中除去而不顯著減損方程效果。如果可以,則將被除去。隨後,重複進行該進程,添加或除去其他欄位。在沒有欄位可添加到方程以改進方程,也沒有欄位可被除去而不顯著減損方程時,生成最終模型。 後退法(Backwards): 後退法欄位選擇與逐步迴歸欄位選擇的相似之處在於都是逐步建立模型。但是,這種方法下最初的模型包括所有的輸入欄位作爲預測欄位,欄位只能被剔除出模型而不能被添加到模型。對模型幾乎沒有貢獻的輸入欄位被一個一個的剔除出模型,直至剩下的每一個欄位都顯著影響模型預測效果,此時生成最終的模型。 前進法(Forwards): 前進法本質上與後退法相反。這種方法下最初的模型是沒有任何輸入欄位的最簡化模型,欄位只能被添加到模型中而不能被剔除。在每一步,檢驗尚未進入模型的輸入欄位對模型的改進程度,對模型改進最大的欄位進入模型。在沒有欄位可添加到模型或者最好的備選欄位對模型沒有多大改進時,生成最終模型。 方程中包括常數(Include constant in equation): 該選項決定是否在最終方程中包含常數項。在大多數情況下,應該選擇該選項。如果使用者有先驗知識,只要預測欄位爲零時輸出欄位總是爲零,則該選項很有用。 線性迴歸節點高級選項(Expert) 加權最小平方(Weighted Least Square): 選擇以某個欄位來做加權,注意此欄位必須是數值型的欄位。 Stepping Criteria and Tolerance: 這些選項允許控制逐步篩選法、前進法、後退法中欄位進入和剔除的準則。 線性迴歸節點單步選項(Stepping Criteria and Tolerance) Use probability of F(即p-value): (1) p值 Entry值,則欄位會添加到模型 (2) p值 Removal值,則欄
文档评论(0)