- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
0002题目
中学教师薪金的研究
摘要
本题中的教师的薪金影响因素题目中列举出了工作时间,性别,是否单身,是否结婚,学历,受雇学校等等因素,但是其中肯定有一些因素是和教师的薪金是没有太大关系的,所以本题关键是要找出无关的项使结果更可靠。可以明显的看出本题是一个统计回归的问题。
对于本题的第一问,建立两个模型,首先建立模型Ⅰ,可以用Excel中的函数求出相关系数然后发现薪金Z与,和有较大关系,与其他的无明显的关系,然后可以对起回归分析和残差分析去除一些异常点后最后得到模型:
,,,可以看出该模型有87.39%的可靠性。对于模型Ⅱ则要找出无关的项,首先对薪金取对数,可以使数据更易处理,可以通过Matlab中的统计工具箱进行逐步回归可以发现薪金与工作时间和学历有关系,而其他的关系不大,即与题目中的和有关,与性别和婚姻状况上的差异没有明显的关系,可以对其做残差图,可以发现5个异常点,然后再做残差图,逐步残差最后统计回归可以得到下面的表达式:, ,可以看出该模型对薪金的说明有89.79%的可靠性。比模型Ⅰ的可靠性和F值都有所提升,所以模型Ⅱ更加合适。
对于本题的第二问,引出交互项和平方项使模型更加准确,使其的说明能力更好,由于交互项过于复杂,所以我们先引入平方项,经过逐步回归得到Z与,,,,,有关,但是,,对的影响不大,可以去掉,然后对,,做两次残差分析,去掉一些异常点后,最后可以得到表达式:,,,可以看出该模型有97.05%的可靠性,比模型1的89.79%更高,而且的值也有较大提升,可靠度已经比较高了。
该模型最大的特点是通过逐步求残差使模型的可靠度更高,而且做了合理的假设和推论,比如明显可以推出薪金与性别的关系不大。而该模型也有一定的不足,毕竟现实中还有更多的因素要考虑,所以该模型只是简单的说明而已。
关键字:逐步回归 残差分析 可靠度 统计回归 相关系数
问题提出
某地人事部门为研究中学教师的薪金与他们的资历、性别、教育程度及培训情况等因素之间的关系,要建立一个数学模型,分析人事策略的合理性,特别是考察女教师是否收到不公正的待遇,以及她们的婚姻状况是否会影响收入。为此,从当地教师中随机选了3414位进行观察,然后从中保留了90个观察对象,得到了下表给出的相关数据。尽管这些数据具有一定的代表性,但是仍有统计分析的必要。现将表中数据的符号介绍如下:
Z~月薪(元);X1~工作时间(月);X2=1~男性,X2=0~女性;X3=1~男性或单身女性,X3=0~已婚女性;X4~学历(取值0~6,值越大代表学历越高);X5=1~受雇于重点中学,X5=0~其它;X6=1~受过培训的毕业生,X6=0~未受过培训的毕业生或受过培训的肄业生;X7=1~已两年以上未从事教学工作,X7=0~其它。注意组合(X2,X3)=(1,1),(0,1),(0,0)的含义。
(1)进行变量选择,建立变量X1~X7与Z的回归模型(不一定包括每一个自变量),说明教师的薪金与那些变量的关系密切,是否存在性别和婚姻状况上的差异。为了数据处理上的方便,建议对薪金取对数后作为自变量。
(2)除了变量X1~X7本身之外,尝试将它们的平方项或交互项加入到模型中,建立更好的模型。
二、基本假设
1.假设没有任何重大的突发的自然灾害,导致工资异常的;
2.假设所有的样本人员都身体健康,不会有突然的疾病导致工作的变动;
3.没有大的经济危机的发生导致薪金变动。
三、符号说明
影响薪金的各种可能因素 教师的薪金 第种因素前的系数 回归方程的决定系数 统计量值 与统计量对应的概率值 四、问题分析
4.1问题(1)的分析:
建立两个模型,首先建立模型Ⅰ,可以用Excel中的函数求出相关系数然后再来回归计算以及进行残差分析 对于模型Ⅱ可以看出需要将薪金Z与变量之间的关系找出来,需要对其进行逐步回归然后可以找出相关的几项,可以通过Matlab中统计工具箱中的stepwise进行逐步回归然后可以找出与薪金有密切关系的项,然后可以用regress函数找出,F的一系列的相关的系数,然后可以用rcoplot函数做残差图可以舍去一些异常点是结果的可靠度更加的高,然后逐步残差可以求出可靠度比较高的模型。
4.1问题(2)的分析:
对于本题的第二问题目中提出引入的平方项或交互项来使模型更加的可靠,由于交互项比较多和比较复杂,我们可以先只引入平方项看模型的可靠度,如果比较低的话再引入交互项,如果比较可靠的话就不必再为模型增加难度了。求解的过程和问题(1)的过程大体相同,只是参数的个数变化。
五、模型的建立与求解
5.1问题(1)模型建立与求解:
模型Ⅰ的建立与求解:
对于该问题我们要建立薪金Z与之间的关系,我们可以通过Excel中的函数对其求出薪金Z与各种因素的相关系
文档评论(0)