07相关和回归分析.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学统计学 ─从数据到结论从数据到结论 第七七章相关关和回归归分析 §§7.1 问题的提出问题的提出 对于现实世界,不仅要知其然,而且 要知其所以然要知其所以然。顾客对商品和服务的顾客对商品和服务的 反映对于企业是至关重要的, 但是仅仅有满意顾客的比例是不够的; 商家希望了解什么是影响顾客观点的商家希望了解什么是影响顾客观点的 因素,及这些因素如何起作用。 类似地类似地,医疗卫生部门不能仅仅知道医疗卫生部门不能仅仅知道 某流行病的发病率,而且想知道什么 变量影响发病率变量影响发病率,以及如何影响以及如何影响。 §§7.1 问题的提出问题的提出 发现变量之间的统计关系,并且 用此规律来帮助我们进行决策才用此规律来帮助我们进行决策才 是统计实践的最终目的是统计实践的最终目的。 一般来说,统计可以根据目前所 拥有的信息拥有的信息 ((数据数据))来建立人们来建立人们 所关心的变量和其他有关变量的所关心的变量和其他有关变量的 关系。这种关系一般称为模型 ((modelmodel ))。 §§7.1 问题的提出问题的提出 假如用Y表示感兴趣的变量,用X 表示 其他可能与其他可能与YY有关的变量有关的变量 ((XX 也可能是也可能是 若干变量组成的向量)。则所需要的 是建立是建立一个函数关系个函数关系YY=ff ((XX)) 。 这里这里YY称为称为因变量因变量或或响应变量响应变量(dependent(dependent variable, response variable) ,而X 称为自 变量变量,也称为也称为解释变量或协变量解释变量或协变量 (independent variable, explanatory variable, covariate)covariate) 。建立这种关系的过程就叫做建立这种关系的过程就叫做 回归(regression) 。 §§7.1 问题的提出问题的提出 一旦建立了回归模型,除了对变量的 关系有了进关系有了进一步的定量理解之外步的定量理解之外,还还 可以利用该模型(函数)通过自变量 对因变量做对因变量做预测预测 ((predidictiion ))。 这里所说的预测这里所说的预测,,是用已知的自变量是用已知的自变量 的值通过模型对未知的因变量值进行 估计估计;;它并不它并不一定涉及时间先后定涉及时间先后。 先看几个后面还要讨论的数值例子。 §§7.1 问题的提出问题的提出 例7.1 有50个从初中升到高中的学 生生。为了比较初三的成绩是否和高为了比较初三的成绩是否和高 中的成绩相关中的成绩相关,,得到了他们在初三得到了他们在初三 和高一的各科平均成绩( 数据在 highschoolhighschool.txt)txt) 。这两个成绩的散点图这两个成绩的散点图 展示在图7.1中。 50名同学初三和高一成绩的散点图 100 有个上升趋势有个上升趋势;即初三时成绩相对较高即初三时成绩相对较高 的学生,在高一时的成绩也较高。 9090 80 70 60 高高 一 成 绩 50 但对于具体个人来说但对于具体个人来说,,大约有大约有一半的学生的半的学生的 高一平均成绩比初三时下降,而另一半没有 40 40 50 60 70 80 90 100 110 变化或有进步变化或有进步 初三成绩 §§7.1 问题的提出问题的提出 目前的问题是怎么判断这两目前的问题是怎么判断这两 个变量是否相关、如何相关 及如何度量相关及如何度量相关?? 能否以初三成绩为自变量能否以初三成绩为自变量, 高高一成绩为因变量来建立成绩为因变

文档评论(0)

吉吉文档 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档