十讲回归分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
十讲回归分析

回归分析预测法 基本思路来源于数学分析中数理统计的回归分析方法,将因素之间的规律(利用已知统计资料)设为按一定数学模型变化的运动轨迹,并假定: 未来的变化仍然是在已知的条件下进行,运动轨迹将不会发生畸变。 一、 回归分析的基本概念 一.基本概念 1.回归分析的来由: 20世纪初,英统计学家 F.Golden 研究父子身高的遗传统计,高个子父母下一代比父亲更高的概率小于比他矮的概率,而矮个子父亲下一代比父亲高的概率大于比他矮的概率;且这两种高度父辈的后代,高度有向两种父辈平均身高靠拢的趋势,这种现象称为“回归”——是一种自然界现象规律的提取。 研究变量之间的互相关系,把其中一些因素作为控制的变量,而把另一些随机变量作为因变量,利用适当的数学模型尽可能趋向于趋势变化的均值描述它们的关系的分析,称为回归分析。 即假定 y 与 x 相关,应有 y = f ( x ) 若 x1,x2, ‥‥‥ xn个变量影响y,应有 y = f (x1,x2, ‥‥‥xn) 显然,有一些问题必须解决 ①因素分析 现代社会中,任何一件事物与多个因素相关,如何选取主要因素,忽略次要因素,使建立的数学模型不因变量太多而复杂,又能较好的抓住主要矛盾。 解决方法是求相关系数R ②运动轨迹的模型 主要利用已知统计数据在图上打点进行观察分析,寻求一条最佳线路。采用最小二乘法,即在满足该条线路的模拟值与真值总平方误差∑ei2为最小的条件下,来求出模拟数学模型各参数。(为Gauss--Markov最佳线性与无偏估计量 ) ③相关性检验 目的是鉴别所求出的模型是否可靠, 方法:利用相关性检验准则进行检验 ④精确度:即讨论在一定置信度条件下的置信区间 ⑤预测 :前面的问题已解决,数学模型已经建立且可靠, 精度问题也已解决,利用延续性原则代入需预测的数据,并求出结果。 软件开发人员的薪金 问题: 一家高技术公司人事部门为研究软件开发人员的薪金与他们 的资历、管理责任、教育程度等因素之间的关系,要建立一 个数学模型,以便分析公司人士策略的合理性,并作为新聘 用人员工资的参考。他们认为目前公司人员的薪金总体上是 合理的,可以作为建模的依据,于是调查了46名开发人员的 档案资料,如表。其中资历一列指从事专业工作的年数,管 理一列中1表示管理人员,0表示非管理人员,教育一列中1 表示中学程度,2表示大学程度,3表示更高程度(研究生) 分析与假设: 按照常识,薪金自然按照资历(年)的增长而增加,管理人 员的薪金高于非管理人员,教育程度越高薪金越高。 为了简单起见,我们假定资历(年)对薪金的作用是线性的,即资历每加一年,薪金的增长是常数;管理责任、教育程度、资历诸因素之间没有交互作用,建立线性回归模型。 基本模型: 结果分析: 从表中, 进一步讨论: 的置信区间包含零点,说明上述基本模型存在缺点。为了 为了对残差进行分析,下图给出 以上分析提示我们,应在基本模型中增加管理 更好的模型: 由上表可知,这个模型的 做该模型的两个残差分析图,可以看出,已经消除了不正常 现象,这也说明了模型的适用性。 从上图,还可以发现一个异常点:具有10年资历、大学程度的管理人员(编号33)的实际薪金明显低于模型的估计值,也明显低于与他有类似经历的其他人的薪金。这可能是由我们未知的原因造成的。为了使个别数据不致影响整个模型,应该将这个异常数据去掉,对模型重新估计回归系数,得到的结果如表。残差分析见图。可以看到,去掉异常数据后结果又有改善。 可以看出,大学程度的管理人员薪金比研究生程度管理人员 薪金高,而大学程度的非管理人员薪金比研究生程度非管理 人员薪金略低。当然,这是根据这家公司实际数据建立的模 型得到的结果,并不具普遍性。 评注: 五 教学评估 为了考评教师的教学质量,教学研究部门设计了一个教学评 估表,对学生进行一次问卷调查,要求学生对12位教师的15 门课程(其中3为教师有两门课程)按以下7项内容打分,分 值为1—5分(5分最好,1分最差): 收回问卷调查表后,得到了学生对12为教师、15门课程各项评分的平均值,见表。 逐步回归的基本思路是,先确定一个包含若干自变量的初始集合,然后每次从集合外的变量中引入一个对因变量

文档评论(0)

ctuorn0371 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档