- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
双变量回归与相关 现实生活中,许多现象之间有相互联系,然而并不像函数那样是确定性关系。例如:身高与体重、体温与脉搏、年龄与医疗费用等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。有些变量间关系密切,有些不密切;有些是因果关系;但是,有的现象之间因果不清,只是伴随关系。 为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。 回归方程 直线回归的任务就是要找出因变量随自变量变化的直线方程,我们把这个直线方程叫做直线回归方程。 最小二乘法(least square method, LS):使各散点到直线的纵向距离的平方和最小。 求偏导数得正规方程组 回归直线的描绘 根据求得的回归方程,可以在自变量X的实测范围内任取两个值,代入方程中,求得相应的Y估计值,以这两对数据找出对应的两个坐标点,将两点连接为一条直线,就是该方程的回归直线。 回归直线一定经过 。这两点可以用来核对图线绘制是否正确。 直线回归方程是从样本资料计算而得的,a、b同样存在着抽样误差问题。所以,需要对样本的回归系数b进行假设检验,以判断b是否从回归系数为零的总体中抽得。为了判断抽样误差的影响,需对回归系数进行假设检验。 总体的回归系数用β表示。 回归系数的假设检验 H0:β=0 H1:β≠0 α=0.05 选择合适的假设检验方法(方法有二),计算检验统计量 (1)方差分析 (2)t检验 判断P值 做出推论:统计学结论和专业结论 SS剩的求法 b的检验-方差分析 b的检验-t检验 剩余(残差)标准差 SY.X 斜率b的假设检验 H0: ? = 0 H1: ? ? 0 ? ? .05 自由度 ? 8 - 2 = 6 查t界值表: 回归方程的参数估计(了解) (一) 个体Y值的预测区间(注:不属于参数估计范畴) (二) 的区间估计(注:属于参数 估计) 95% 的置信区间与 个体 Y 的预测区间 95% 的可信区间与 个体 Y 的预测区间图 直线回归的应用 ?描述两变量之间的依存关系:通过回归系数的假设检验,若认为两变量之间存在直线回归关系,则可用直线回归方程来描述。 ?利用回归方程进行预测 :把自变量代入回归方程,对应变量进行估计,可求出应变量的波动范围。 1)个体Y值的预测区间(prediction interval, PI),若对所有X估计对应Y的预测区间,并将上限、下限分别相联,得Y值的预测带(prediction band). 2) 的可信区间(confidence interval,CI) ?利用回归方程进行统计控制—预测的逆过程。 ?与ANOVA结合,协方差分析。 图9-6 相关系数示意图 图9-6 相关系数示意图 一、 相关系数概念 相关系数(correlation coefficient),又称积差相关系数(coefficient of product – moment correlation),或 Pearson’s corr. Coeff. (软件中常用此名称) 用以说明两变量间相互关系的密切程度和方向的指标。 二、 相关系数的计算 实例 相关系数的假设检验 上例中的相关系数r 等于0.8818,说明了8例样本中儿童年龄与尿肌酐之间存在相关关系。 但是,这8例只是总体中的一个样本,由此得到的相关系数会存在抽样误差。因为,即使总体相关系数(?)为零时,由于抽样误差,从总体抽出的8例,其r 可能不等于零。 所以,要判断该样本的r是否有意义,需与总体相关系数?=0进行比较,看两者的差别有无统计学意义。这就要对r进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。 三、直线相关的应用 前面我们已经讲过,相关是研究两个变量间的相互关系,而且这种相互关系是用相关系数反映的。在存在相关关系的前提下(P0.05),如果r的绝对值越大,说明两个变量之间的关联程度越强;如果r绝对值越小,则说明两个变量之间的关系越弱。 一般说来,当样本量较大,并对r进行假设检验,有统
您可能关注的文档
最近下载
- 第五单元草原牧歌——《父亲的草原母亲的河》课件2024-2025学年人音版(2024)初中音乐七年级上册.pptx VIP
- (2025秋新版)部编版八年级上册道德与法治《第三课共建网络美好家园》ppt课件.pptx
- NB-T11409-2023水电工程费用构成及概(估)算费用标准.pdf VIP
- 养鸡技术大全技术详略 - 畜牧.docx VIP
- 苏教版六年级上册《科学》全套教学课件(共531页PPT).pptx
- 湘科版2017版小学科学六年级【上册】全册教案详解.pdf VIP
- 宗教事务条例培训.pptx
- 慢性痛风性关节炎伴多发性痛风石一例并文献复习.pdf VIP
- 5.1 认识大数据 课件 粤教版(2019)高中信息技术必修1.pptx VIP
- 23J916-1 住宅排气道(一)图集.pdf VIP
文档评论(0)