- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
7相关分析与回归分析要点
最小二乘估计 对例题中的两个变量的数据进行线性回归,就是要找到一条直线来适当地代表图中的那些点的趋势。首先需要确定选择这条直线的标准。 最小二乘回归法(least squares regression),寻找一条直线,使得所有点到该直线的垂直距离的平方和最小。用数据寻找一条直线的过程也叫做拟合一条直线。 最小二乘估计 例题 为研究美国软饮料公司的广告费用与销售数量的关系,分析七种主要品牌的软饮料公司的相关数据,见下表: 品牌 广告费用(百万美元) 销售数量(百万箱) Coca-Cola 131.3 1929.2 Pepsi-Cola 92.4 1384.6 Diet-Coke 60.4 811.4 Sprite 55.7 541.5 Dr.Pepper 40.2 546.9 Moutain Dew 29.0 535.6 7-Up 11.6 219.5 例题 请问广告费用和销售数量之间是否存在显著的相关关系?试计算总体的一元线性回归模型;并估计广告费用为100万美元时的销售量。 1). 计算相关系数,r=0.978148, 两者的线性相关程度较高。显著性检验略。 2). 一元线性回归方程为:y=-12.7785+14.4035x 3). 当广告费用为100万时,销售量为1427箱。 例题 品牌 广告费用(百万美元) 销售数量(百万箱) x2 xy Coca-Cola 131.3 1929.2 17239.69 253303.96 Pepsi-Cola 92.4 1384.6 8537.76 127937.04 Diet-Coke 60.4 811.4 3648.16 49008.56 Sprite 55.7 541.5 3102.49 30161.55 Dr.Pepper 40.2 546.9 1616.04 21985.38 Moutain Dew 29 535.6 841 15532.4 7-Up 11.6 219.5 134.56 2546.2 求和 420.6 5968.7 35119.7 500475.1 因果的问题 即使两个变量之间有很强的相关性,也不一定说明一个变量的改变会导致另一个改变。(看电视能延年益寿?) 两个变量间的相关性,常受到潜在背景中的变量影响;(胖妈妈和胖女儿) 建立因果关系最好的证据,来自于随机化比较实验。 胖妈妈和胖女儿 – “交叉”的问题 在一项对92个美国女孩子的研究中,度量了她们和各自的妈妈的体脂肪健康指数BMI(Body Mass Index,体重相对于身高的一种量度),BMI过高的人被认为过重或肥胖。研究度量了看电视的时间长短、体力活动的时间长短,以及数种食物的摄取量。 女孩子的BMI与体力活动只有弱相关(r=- 0.18)与食物及电视也是弱相关 最强的相关(r=0.506)出现在女儿BMI和妈妈BMI之间。 葡萄酒和心脏病的例子 19个发达国家一年的葡萄酒消耗量(平均每人喝葡萄酒摄取酒精的升数) 一年中因心脏病死亡的人数(每10万人的死亡数) 散点图 求回归方程 预测:摄取1升酒精,心脏病的死亡率? 相关分析与回归分析的总结 相关分析:分析某现象中的两个变量是否存在相关关系抽取样本,首先选择好自变量 x 和因变量 y ;做散点图,观察;计算相关系数 r,并对其进行显著性检验; 回归分析:根据样本数据的相关性,计算 a 和 b ;求得 x 和 y 的数学关系式;进行回归预测和估计。 7 相关分析与回归分析 相关分析 回归分析 一元线性回归分析 关于SAT考试分数的例子 SAT(Scholastic Assessment Test),学术能力评估测试,“美国高考”。成绩最好的州Iowa,成绩最差South Carolina。 另外一种考试是ACT(American College Test) 主办SAT考试的大学委员会说:只依照SAT分数来给各州做比较或排序,是没有意义的。 为什么呢? SAT成绩的直方图 ? SAT成绩的散点图(scatterplot) 亚拉巴马州有8%的毕业生考了SAT 数学平均分是558 参加考试的学生越多,平均分就越低 画出正确的图很重要! 相关分析的概念 社会经济现象中,一些现象与另一些现象之间往往存在着依存关系,当我们用变量来反映这些现象的的特征时,便表现为变量之间的依存关系。 现象之间的相互关系,可以概括为两种不同的类型:函数关系和相关关系。 相关分析:借助于图形和若干分析指标(如相关系数、相关指数等)对变量之间的依存关系的密切程度进行测定的过程。 相关分析的概念 函数关系:变量之间存在着确定性依存关系。即当一个或一组变量每取一个值时,相应的另一个变量必然有一个确定值与之对应 。 相关
文档评论(0)