- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[理学]第7讲 统计回归模型
统计模型 如果由于客观事物内部规律的复杂性及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的模型,那么通常要搜集大量的数据,基于对数据的统计分析建立模型,这就是本章还要讨论的用途非常广泛的一类随机模型—统计回归模型。 案例1 软件开发人员的薪金 【问题】一家高技术公司人事部门为研究软件开发人员的薪金与他们的 资历、管理责任、教育程度等因素之间的关系,要建立一个数学模型, 以便分析公司人士策略的合理性,并作为新聘用人员工资的参考。他们 认为目前公司人员的薪金总体上是合理的,可以作为建模的依据,于是 调查了46名开发人员的档案资料,如表。其中资历一列指从事专业工作 的年数,管理一列中1表示管理人员,0表示非管理人员,教育一列中1表 示中学程度,2表示大学程度,3表示更高程度(研究生). 分析与假设 按照常识,薪金自然按照资历(年)的增长而增加,管理 人员的薪金高于非管理人员,教育程度越高薪金越高。 (1)为了简单起见,我们假定资历(年)对薪金的作用是线性的,即资历每加一年,薪金的增长是常数; 结果分析: 从表中, 进一步讨论: 的置信区间包含零点,说明上述基本模型存在缺点。为了寻找改进 为了对残差进行分析,下图给出 以上分析提示我们,应在基本模型中增加管理 2、模型改进 从上图,还可以发现一个异常点:具有10年资历、大学程度的管理人员(编号33)的实际薪金明显低于模型的估计值,也明显低于与他有类似经历的其他人的薪金。这可能是由我们未知的原因造成的。 做该模型(2)的两个残差分析图,可以看出,已经消除了不正常 现象,这也说明了模型的适用性。 * * 第7讲 统计回归模型 软件开发人员的薪金 农作物施肥效果分析 2 0 10 15942 31 3 1 4 20263 15 1 0 10 14467 30 1 0 4 11417 14 1 0 8 13548 29 3 1 3 19800 13 3 1 8 22184 28 2 1 3 21371 12 3 1 10 23174 32 3 0 4 13231 16 1 1 8 17404 27 1 1 3 14975 11 2 0 8 14803 26 2 0 3 12313 10 1 1 7 16978 25 3 0 2 12195 09 2 1 6 22884 24 1 0 2 10535 08 2 0 6 13839 23 2 0 2 11772 07 3 1 6 21352 22 2 1 2 20872 06 1 0 6 12366 21 3 0 1 11767 05 1 1 5 15965 20 2 0 1 11283 04 3 0 5 13677 19 3 1 1 18701 03 2 0 5 13245 18 3 0 1 11608 02 2 0 4 12844 17 1 1 1 13876 01 教育 管理 资历 薪金 编号 教育 管理 资历 薪金 编号 1 0 20 19346 46 2 0 17 19207 45 1 0 16 17483 44 2 0 16 18838 43 2 1 16 27837 42 3 1 15 25685 41 2 0 14 17949 40 2 1 13 26330 39 1 0 13 15990 38 3 1 12 24170 37 2 0 12 16882 36 35 34 33 编号 14861 25410 23780 薪金 11 11 10 资历 0 1 1 管理 1 2 2 教育 开发人员的薪金与其资历 、管理责任 、教育程度 薪金记作 ,资历(年)记作 为了表示是否为管理人员,作如下定义: 1,管理人员 0,非管理人员 为了表示三种教育程度,定义 1,中学 0,其它 1,大学 0,其它 这样,中学用 表示,大学用 表示, 研究生则用 表示。 建立薪金 与资历 ,管理责任 ,教育程度 之间的 多元线性回归模型: 其中, 是待估计的回归系数, 是随机误差。 利用MATLAB的系统工具箱可以得到回归系数及其置信区间(置信水平 )、检验统计量 的结果,见表。 (2)管理责任、教育程度、资历诸因素之间没有交互作用,建立线性回归 模型。 模型的进一步假设: 模型建立与求解 1.基本模型 [-636 931] 148 [-3826 -2162] -2994 [6248 7517] 6883 [484 608] 546 [10258 11807] 11032 置信区间 参数估计值 参数 ,即因变量(薪金)的95.7%可由模型确定, 值超过 检验的临界值, 远小于 ,因而模型从整体来看时可 用的。比如,利用模型可以估计(或估计)一个大学毕业
文档评论(0)