网站大量收购独家精品文档,联系QQ:2885784924

第四节 分析数据间的相关性.ppt

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
下课了。。。 追求 休息一会儿。。。 * * * * 分母 N多的人结婚前 是 两代人一套房,少数人是一个人住两套房子,这是不正常现象要剔除 分子 结婚后两个人住一个房子,有N多的人来祝贺, 生活一段时间后,感情不和离婚了,两人各住一套房子,自然也没有N的人来祝贺了 * * * * * * * * * * 实践 实验内容 (一)随机抽取由10名大学生组成的样本,研究他们在高中与大学的英语成绩得出下表结果:(单位:分) 试测定其相关程度。 (二)下面是几家百货商店销售额和利润率的资料: 1.以纵轴表示利润率,横轴表示每人月平均销售额,画出散点图,观察并说明两变量之间存在何种关系。 2.计算每人月平均销售额与利润率之间的相关系数,并说明其相关的密切程度。 3.检验每人月平均销售额与利润率之间的相关程度,显著性水平取0.01 4.5数据的线性回归分析 回归效应 1887年生物统计学家高尔顿在研究豌豆和人体的身高遗传规律时,首先提出“回归”的思想 。1888年他又引入“相关”(Correlation)的概念。原来,他在研究人类身高的遗传时发现,不管祖先的身高是高还是低,成年后代的身高总有向一般人口的平均身高回归的倾向。 高尔顿由此的出结论,人的生理结构是稳定的,所有有机组织都趋于标准状态,这种效应叫回归效应 人均收入是否会显著影响人均食品消费支出; 贷款余额是否会影响到不良贷款; 航班正点率是否对顾客投诉次数有显著影响; 广告费用支出是否对销售额有显著影响; 一元回归的例子 回归分析的概念 因变量与自变量之间的关系用一条线性方程来表示; 因变量(dependent variable):被预测或被解释的变量,用y表示。 自变量(independent variable):预测或解释因变量的一个或多个变量,用x表示 。 涉及一个自变量的回归为一元回归分析 回归分析的步骤 实例分析 为便于控制某产品的生产成本,需要研究该产品产量与生产成本之间的数量变化关系,并预算当产量达到一定水平时的成本是多少。 第一:确定自变量和因变量 第二:确定回归方程 根据收集的数据确定自变量与因变量之间的数学关系式,一元线性回归中估计的回归方程为: 其中: 是估计的回归直线在 y 轴上的截距, 是直线的斜率,它表示对于一个给定的 x 的值, 是 y 的估计值,也表示 x 每变动一个单位时, y 的平均变动值 。 使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即 用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小 x y (xn , yn) (x1 , y1) ? ? ? ? ? ? ? ? ? (x2 , y2) (xi , yi) } ei = yi-yi ^ ? 根据最小二乘法的要求,可得求解 和 的公式如下 在Excel中,用Intercept(known_y’s,known_x’s)函数用来计算回归方程的截距 用Slope(known_y’s,known_x’s)函数来计算回归方程的回归系数 因此,得到该数据的一元线性回归方程为: y=124.15+0.42x 在散点图中,选中数据点,单击右键,选择“添加趋势线”-“线性”,并在选项标签中要求给出公式和相关系数等,可以得到拟合的直线,如下图所示。 第三:对线性回归方程的统计检验 对回归方程检验的内容 (1)回归方程的拟合优度检验 回归方程的拟合优度检验就是要检验样本数据点聚集在回归直线周围的密集程度,从而评价回归方程对样本数据的代表程度。 1.判定系数 因变量的各个观测值之间的差异主要由两个方面的原因造成的,一是由自变量的不同值造成的,二是其他因素造成的。 某一个观测值的变差的分解 x y y { } } ? 总平方和(SST) 反映因变量的 n 个观察值与其均值的总离差; 回归平方和(SSR) 反映自变量 x 的变化对因变量 y 取值变化的影响,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和; 残差平方和(SSE) 反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和; 离差平方和的分解 SST = SSR + SSE 总平方和 (SST) { 回归平方和 (SSR) 残差平方和 (SSE) { { 回归平方和占总离差平方和的比例 反映回归方程的拟合程度; 取值范围在 [ 0 , 1 ] 之间; R2 ?1,说明回归方程拟合的越好;R2?0,说明回归方程拟合的越差 一元线性回归中,判定系数等于y和x相关系数的平方,

文档评论(0)

00625 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档