第四章分析数据间的相关性.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(二)下面是几家百货商店销售额和利润率的资料:第30页,共61页,星期日,2025年,2月5日1.以纵轴表示利润率,横轴表示每人月平均销售额,画出散点图,观察并说明两变量之间存在何种关系。2.计算每人月平均销售额与利润率之间的相关系数,并说明其相关的密切程度。3.检验每人月平均销售额与利润率之间的相关程度,显著性水平取0.01第31页,共61页,星期日,2025年,2月5日4.5数据的线性回归分析回归效应1887年生物统计学家高尔顿在研究豌豆和人体的身高遗传规律时,首先提出“回归”的思想。1888年他又引入“相关”(Correlation)的概念。原来,他在研究人类身高的遗传时发现,不管祖先的身高是高还是低,成年后代的身高总有向一般人口的平均身高回归的倾向。高尔顿由此的出结论,人的生理结构是稳定的,所有有机组织都趋于标准状态,这种效应叫回归效应第32页,共61页,星期日,2025年,2月5日人均收入是否会显著影响人均食品消费支出;贷款余额是否会影响到不良贷款;航班正点率是否对顾客投诉次数有显著影响;广告费用支出是否对销售额有显著影响;一元回归的例子第33页,共61页,星期日,2025年,2月5日回归分析的概念因变量与自变量之间的关系用一条线性方程来表示;因变量(dependentvariable):被预测或被解释的变量,用y表示。自变量(independentvariable):预测或解释因变量的一个或多个变量,用x表示。涉及一个自变量的回归为一元回归分析第34页,共61页,星期日,2025年,2月5日回归分析的步骤第35页,共61页,星期日,2025年,2月5日实例分析为便于控制某产品的生产成本,需要研究该产品产量与生产成本之间的数量变化关系,并预算当产量达到一定水平时的成本是多少。第36页,共61页,星期日,2025年,2月5日第一:确定自变量和因变量第37页,共61页,星期日,2025年,2月5日第二:确定回归方程根据收集的数据确定自变量与因变量之间的数学关系式,一元线性回归中估计的回归方程为:其中:是估计的回归直线在y轴上的截距,是直线的斜率,它表示对于一个给定的x的值,是y的估计值,也表示x每变动一个单位时,y的平均变动值。第38页,共61页,星期日,2025年,2月5日使因变量的观察值与估计值之间的离差平方和达到最小来求得和的方法。即用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小第39页,共61页,星期日,2025年,2月5日xy(xn,yn)(x1,y1)?????????(x2,y2)(xi,yi)}ei=yi-yi^第40页,共61页,星期日,2025年,2月5日?根据最小二乘法的要求,可得求解和的公式如下第41页,共61页,星期日,2025年,2月5日在Excel中,用Intercept(known_y’s,known_x’s)函数用来计算回归方程的截距用Slope(known_y’s,known_x’s)函数来计算回归方程的回归系数第42页,共61页,星期日,2025年,2月5日因此,得到该数据的一元线性回归方程为:y=124.15+0.42x第43页,共61页,星期日,2025年,2月5日第四章分析数据间的相关性第1页,共61页,星期日,2025年,2月5日第四章分析数据间的相关性世间万物总是存在不同程度的联系函数关系统计关系例:正方形体积与边长,年龄与身高,父母身高与孩子身高,身高与体重,考试成绩与学习时间,学历与收入,收入与幸福感,物品价格与质量第2页,共61页,星期日,2025年,2月5日线性相关XY正线性相关负线性相关第3页,共61页,星期日,2025年,2月5日XY非线性相关第4页,共61页,星期日,2025年,2月5日4.2两数值型数据间的相关性(1)图形分析法散点图是统计关系分析中最常用的图形工具,它将数据以点的形式画在直角平面上,它将一组数据作为纵轴,将另一组数据作为纵轴,事物对象的每个个体以点的形式出现。第5页,共61页,星期日,2025年,2月5日第6页,共61页,星期日,2025年,2月5日(1)若所有点落在一条直线上,说明数据间是线性相关,是函数关系,不是统计关系。(2)所有点杂乱无章,从形态上看不出任何特征和规律,表明数据间不相关(3)图

文档评论(0)

xiaolan118 + 关注
实名认证
文档贡献者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档