- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
案例2 统计回归模型(残差法检验,0-1变量的使用)
第十章 统计回归模型 10.2 软件开发人员的薪金 10.2 软件开发人员的薪金 资历~ 从事专业工作的年数;管理~ 1=管理人员,0=非管理人员;教育~ 1=中学,2=大学,3=更高程度 建立模型研究薪金与资历、管理责任、教育程度的关系 分析人事策略的合理性,作为新聘用人员薪金的参考 编号 薪金 资历 管理 教育 01 13876 1 1 1 02 11608 1 0 3 03 18701 1 1 3 04 11283 1 0 2 ? ? ? ? 编号 薪金 资历 管理 教育 42 27837 16 1 2 43 18838 16 0 2 44 17483 16 0 1 45 19207 17 0 2 46 19346 20 0 1 46名软件开发人员的档案资料 ? 分析与假设 y~ 薪金,x1 ~资历(年) x2 = 1~ 管理人员,x2 = 0~ 非管理人员 1=中学2=大学3=更高 资历每加一年薪金的增长是常数; 管理、教育、资历之间无交互作用 教育 线性回归模型 a0, a1, …, a4是待估计的回归系数,?是随机误差 中学:x3=1, x4=0 ;大学:x3=0, x4=1; 更高:x3=0, x4=0 0-1变量的应用 模型求解 参数 参数估计值 置信区间 a0 11032 [ 10258 11807 ] a1 546 [ 484 608 ] a2 6883 [ 6248 7517 ] a3 -2994 [ -3826 -2162 ] a4 148 [ -636 931 ] R2=0.957 F=226 p=0.000 R2,F, p? 模型整体上可用 资历增加1年薪金增长546 管理人员薪金多6883 中学程度薪金比更高的少2994 大学程度薪金比更高的多148 a4置信区间包含零点,解释不可靠! 中学:x3=1, x4=0;大学:x3=0, x4=1; 更高:x3=0, x4=0. x2 = 1~ 管理,x2 = 0~ 非管理 x1~资历(年) 残差分析方法 结果分析 残差 e 与资历x1的关系 e与管理—教育组合的关系 残差全为正,或全为负,管理—教育组合处理不当 残差大概分成3个水平, 6种管理—教育组合混在一起,未正确反映 。 应在模型中增加管理x2与教育x3, x4的交互项 组合 1 2 3 4 5 6 管理 0 1 0 1 0 1 教育 1 1 2 2 3 3 管理与教育的组合 利用残差分析来做改进模型 进一步的模型 增加管理x2与教育x3, x4的交互项 参数 参数估计值 置信区间 a0 11204 [11044 11363] a1 497 [486 508] a2 7048 [6841 7255] a3 -1727 [-1939 -1514] a4 -348 [-545 –152] a5 -3071 [-3372 -2769] a6 1836 [1571 2101] R2=0.999 F=554 p=0.000 R2,F有改进,所有回归系数置信区间都不含零点,模型完全可用 消除了不正常现象 异常数据(33号)应去掉 e ~ x1 e ~组合 去掉异常数据后的结果 参数 参数估计值 置信区间 a0 11200 [11139 11261] a1 498 [494 503] a2 7041 [6962 7120] a3 -1737 [-1818 -1656] a4 -356 [-431 –281] a5 -3056 [-3171 –2942] a6 1997 [1894 2100] R2= 0.9998 F=36701 p=0.0000 e ~ x1 e ~组合 R2: 0.957 ? 0.999 ? 0.9998 F: 226 ? 554 ? 36701 置信区间长度更短 残差图十分正常 最终模型的结果可以应用
文档评论(0)