- 1、本文档共81页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
八、判断回归方程拟合程度的指标说明回归直线的拟合程度的指标。是对回归直线的代表性大小的衡量。实际观察值与回归估计值离差平方和的均方根。反映实际观察值在回归直线周围的分散状况。如果所有的点都落在直线上说明观测值与预测值之间没有差异,所以估计不存在误差,显然这种精确估计是不可能的,所以需要一个指标来反映根据X得到的Y预测值的精确程度,即估计标准误差,用于度量相对于回归直线的离散程度4.计算公式为由样本资料计算(一)回归估计标准误差第63页,共81页,星期日,2025年,2月5日计算例子下表是有关15个地区某种食物需求量和地区人口增加量的资料。第64页,共81页,星期日,2025年,2月5日3.回归估计标准误的简化计算公式(利用可推导出上述公式)第65页,共81页,星期日,2025年,2月5日(二)判定系数(回归模型拟合程度的评价)
(一)离差平方和(总变差)的分解因变量y的取值是不同的,y取值的这种波动称为总变差。变差来源于两个方面:由于自变量x的取值不同造成的;除x以外的其他随机因素的影响。对一个具体的观测值来说,总变差的大小可以通过该实际观测值与其均值之差来表示。判定系数是从另一角度说明回归直线拟合程度的又一度量值。它的引入是从离差平方和的分解入手的。第66页,共81页,星期日,2025年,2月5日xyy{}}?总变差构成图解:第67页,共81页,星期日,2025年,2月5日例如:某企业某种产品产量与单位成本的资料如下:计算直线相关系数产量(千件)单位成本(元/件)273372471373469568理论上可以先通过定性判断、画散点图等确定两个变量间是否有关系,在此基础上可以直接用公式计算相关系数。公式的选择可以根据实际的资料和计算条件来确定。注意:在计算相关系数时,无需确定自变量和因变量,所以x,y的确定是任意的。第31页,共81页,星期日,2025年,2月5日相关系数计算表产量x(千件)单位成本y(元/件)xyx2y2273146453293722169518447128416504137321995329469276164761568340254624合计2135514817930268r=-0.9091即单位成本与产量间存在着高度的线性负相关关系。第32页,共81页,星期日,2025年,2月5日[解]答:即账单消费额与小费之间存在着高度的正线性相关关系。第33页,共81页,星期日,2025年,2月5日关于相关系数的解释
1、相关系数为0,不一定不相关,只能说明不存在线性相关。2、基于平均数进行相关分析与基于个体数据进行相关分析,其相关程度不一样。如:一项研究中,关于个人收入和教育的成对数据产生了一个0.4的线性相关系数,但当使用区域平均时,线性相关系数变为0.7。3、相关系数具有对称性。第34页,共81页,星期日,2025年,2月5日注意事项:(1)注意实际意义进行相关回归分析要有实际意义,不可把毫无关系的两个事物或现象用来作相关回归分析。例如,有人说,孩子长,公园里的小树也在长。求孩子和小树之间的相关关系就毫无意义,用孩子的身高推测小树的高度则更加荒谬。(2)注意虚假相关两个事物间能计算出相关系数,并不一定能证明事物间有内在联系,例如,有人发现,对于在校儿童,鞋的大小与阅读技能有很强的相关关系。然而,学会新词并不能使脚变大,而是涉及到第三个因素??年龄。当儿童长大一些,他们的阅读能力会提高而且由于长大也穿不下原来的鞋。第35页,共81页,星期日,2025年,2月5日(3)利用散点图对于性质不明确的两组数据,可先做散点图,在图上看它们有无关系、关系的密切程度、是正相关还是负相关,是直线相关还是曲线相关,然后再进行相关分析。(4)注意变量范围相关分析和回归方程仅适用于产生样本的原始数据范围之内,出了这个范围,两变量的相关关系和回归关系不能就此得到说明。第36页,共81页,星期日,2025年,2月5日4、相关系数的显著性检验一般情况下,总体相关系数是未知的,通常有样本相关系数r作为近似的估计值。样本不同,r的值不同,是随机变量,能否用r说明总体的相关程度,就需要考察样本r的可靠程度,也就是进行显著性检验。如r的抽样分布服从正态分布的假设成立,用正态分布
您可能关注的文档
- 正项级数的判别法.ppt
- 麻醉手术中常见心率失常 (2).ppt
- 膀胱冲洗并发症预防和处理.ppt
- 用途广泛的花边.ppt
- 药物动力学双室模型.ppt
- 煤气安全培训.ppt
- 气管切开患者病情评估及护理新进展.ppt
- 职业生涯规划之房地产经纪人.ppt
- 高一数学含参数的一元二次不等式2.ppt
- 艺术高考动员.ppt
- 五位一体教案教学教案设计.docx
- 思修与法基-教学教案分享.pptx
- 大学军事之《中国国防》题库分享.docx
- 2023版毛泽东思想和中国特色社会主义理论体系概论第五章-中国特色社会主义理论体系的形成发展.pdf
- 思修与法基 教学全案分享.docx
- 大学军事之《军事思想》题库分享.docx
- 《经济思想史》全套课件-国家级精品课程教案课件讲义分享.pdf
- 厦门大学国际金融全套资料(国家级精品课程)--全套课件.pdf
- 2023版毛泽东思想和中国特色社会主义理论体系概论第五章-中国特色社会主义理论体系的形成发展.docx
- 2023版毛泽东思想和中国特色社会主义理论体系概论第五章中国特色社会主义理论体系的形成发展分享.pdf
文档评论(0)