网站大量收购独家精品文档,联系QQ:2885784924

[数学建模]数学建模与数学实验 回归分析.ppt

[数学建模]数学建模与数学实验 回归分析.ppt

  1. 1、本文档共80页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[数学建模]数学建模与数学实验 回归分析.ppt

四 软件开发人员的薪金 问题: 一家高技术公司人事部门为研究软件开发人员的薪金与他们 的资历、管理责任、教育程度等因素之间的关系,要建立一 个数学模型,以便分析公司人士策略的合理性,并作为新聘 用人员工资的参考。他们认为目前公司人员的薪金总体上是 合理的,可以作为建模的依据,于是调查了46名开发人员的 档案资料,如表。其中资历一列指从事专业工作的年数,管 理一列中1表示管理人员,0表示非管理人员,教育一列中1 表示中学程度,2表示大学程度,3表示更高程度(研究生) 分析与假设: 按照常识,薪金自然按照资历(年)的增长而增加,管理人 员的薪金高于非管理人员,教育程度越高薪金越高。 为了简单起见,我们假定资历(年)对薪金的作用是线性的,即资历每加一年,薪金的增长是常数;管理责任、教育程度、资历诸因素之间没有交互作用,建立线性回归模型。 基本模型: 结果分析: 从表中, 进一步讨论: 的置信区间包含零点,说明上述基本模型存在缺点。为了 为了对残差进行分析,下图给出 以上分析提示我们,应在基本模型中增加管理 更好的模型: 由上表可知,这个模型的 做该模型的两个残差分析图,可以看出,已经消除了不正常 现象,这也说明了模型的适用性。 从上图,还可以发现一个异常点:具有10年资历、大学程度的管理人员(编号33)的实际薪金明显低于模型的估计值,也明显低于与他有类似经历的其他人的薪金。这可能是由我们未知的原因造成的。为了使个别数据不致影响整个模型,应该将这个异常数据去掉,对模型重新估计回归系数,得到的结果如表。残差分析见图。可以看到,去掉异常数据后结果又有改善。 可以看出,大学程度的管理人员薪金比研究生程度管理人员 薪金高,而大学程度的非管理人员薪金比研究生程度非管理 人员薪金略低。当然,这是根据这家公司实际数据建立的模 型得到的结果,并不具普遍性。 评注: 五 教学评估 为了考评教师的教学质量,教学研究部门设计了一个教学评 估表,对学生进行一次问卷调查,要求学生对12位教师的15 门课程(其中3为教师有两门课程)按以下7项内容打分,分 值为1—5分(5分最好,1分最差): 收回问卷调查表后,得到了学生对12为教师、15门课程各项评分的平均值,见表。 逐步回归的基本思路是,先确定一个包含若干自变量的初始集合,然后每次从集合外的变量中引入一个对因变量影响最大的, 再对集合中的变量进行检验,从变得不显著的变量中移出一个 影响最小的,依次进行,直到不能引入和移出为止。引入和移 出都以给定的显著性水平为标准。 终得到的模型为 在最终模型里回归变量只有 变量 如果初步看来影响因变量的因素较多,并得到了大量的数据。 为了建立一个有效的、便于应用的模型,可以利用逐步回归只 选择那些影响显著的变量“入围”。 如果怀疑原有变量的平方项、交叉项等也会对变量有显著影响 也可以将这些项作为新的自变量加入到候选行列,用逐步回归 来处理。 练习: 下表给出了某工厂产品的生产批量与单位成本(元)的数据, 从散点图,可以明显的发现,生产批量在500以内时,单位成 本对生产批量服从一种线性关系,生产批量超过500时服从另 一种线性关系,此时单位成本明显下降。希望你构造一个合适 的回归模型全面地描述生产批量与单位成本的关系。 与教育 的交互项,建立新的回归模型。 增加 与 的交互项后,模型记作 利用MATLAB的统计工具箱得到的结果如表: [1571 2101] 1836 [-3372 -2769] -3071 [-545 -152] -348 [-1939 -1514] -1727 [6841 7255] 7048 [486 508] 497 [11044 11363] 11204 置信区间 参数估计值 参数 和 值都比上一个模型有所改进, 并且所有回归系数的置信区间都不含零点,表明这个模型完全 可用。 与 的关系 与 组合的关系 [1894 2100] 1997 [-3171 -2942] -3056 [-431 -281] -356 [-1818 -1656] -1737 [6962 7120] 7041 [494 503] 498 [11139 11261] 11200 置信区间 参数估计值 参数 与 的关系 与 组合的关系 模型的应用: 对于第二个模型,用去掉异常数据(33号)后估计出的系数 得到的结果是满意的。模型的应用之一,可以用来“制订”6 种管理—教育组合人员的“基础”薪金(即资历为零的薪金), 这是平均意义上的。利用第二个模型和去掉异常数据后得到的 回归系数,可以得到如下结果: 18241 3 1 6 11200 3 0 5 19882 2 1 4 10844 2 0

文档评论(0)

jz6501 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档