- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 1.要求相应的变量呈双变量正态分布,这里并非简单要求x和y各自服从正态分布,而是要求服从一个联合的双变量正态分布。 2.样本中存在极端值要慎重考虑和处理,必要时可以对其进行剔除或进行变量变换。需要注意,有时分别观察每个变量的极端值并不明显,但是联合观察两个变量时变会突显出来。 * 正态性:所以如果固定X,Y 服从正态分布,其散点图呈直线带状分布 * * * * * * * 由图可见,随着年龄的增加,身高也增加,但呈曲线变化趋势,15~16岁后,增加趋势逐渐趋于平缓。因此适合于拟合曲线回归方程。 (2)选择曲线类型,进行统计分析,几种曲线方程拟合结果如下。 结果摘要: (1)模型参数估计 Dependent Variable: 男孩身高 The independent variable is 年龄 (3)选择合理的模型,列出回归方程。 (4)统计预测。 案例辨析二:贫血患者的血清转铁蛋白的研究 为研究某种新药治疗贫血患者的效果,将20名贫血患者随机分成两组,一组用新药,另一组用常规药物治疗,测得血红蛋白增加量(g/L)见表6-1。问新药与常规药治疗贫血患者后的血红蛋白增加量有无差别? ,t=4.137。 王医生认为可以作线性回归分析。在该数据中涉及了两个变量,一是观察效应变量(连续性),即血红蛋白增加量,将之作为回归分析中的因变量;另外一个变量为处理因素(二分类变量),即影响因素,将之作为自变量,其中新药组=1,常规药组=0。数据转换为双变量资料形式,经分析得回归方程, ,t=4.137。 请考虑: (1)王医生的分析方法对不对? (2)回归分析能代行两样本均数t检验的任务吗? (3)通过这个案例的实践,你得到哪些启发? 答案: 王医生的分析方法是对的; 回归分析能代行两样本均数t检验的任务。 思考题: 1. 应用直线回归和相关分析时应注意哪些问题? 2. 简述线性回归分析与线性相关的区别与联系。 3. 举例说明如何利用回归方程进行统计预测和控制。 4. 回归分析时怎样确定因变量与自变量? THANK YOU! * * 即:高个子父代的子代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平;而矮个子父代的子代的平均身高不是更矮,而是稍高于其父代水平。 * 1.“回归”已成为表示变量之间某种数量依存关系的统计学术语,2.变量间关系不是函数关系;一个变量的取值不能由另一个变量唯一确定。 * 1.“回归”已成为表示变量之间某种数量依存关系的统计学术语,2.变量间关系不是函数关系;一个变量的取值不能由另一个变量唯一确定。 * * 回归一般是用一个容易测量的指标去预测另一个较难测量的指标,比如用身高去预测体表面积,那么这两个变量就有了主次之分,被预测的指标叫应变量,因变量,即一个指标变化时,另1个发生了反应,响应号召。 解释变量用来解释Y为什么会改变。 * * 1.看是否存在线性趋势,2.是否存在异常点 3.散点图显示车流量与与空气中NO浓度几乎在一条直线上,略有些偏离直线的点可以理解为样本均数的抽样误差所致,因此可以假定二者的关系可能是直线关系,即有: * * 最小二乘法原则的文字描述:直线回归分析的关键就是求出回归方程中、两个常数。由数学知识可知,两点决定一条直线。将容量为的样本标在坐标平面上,可得到个点。个点可确定许多直线,到底以哪条线作为回归线呢?直线回归的主要应用是统计预测,即根据实测的估算,当然是希望估算的(称为)与实测之间的差值(-)越小越好。故由样本资料决定回归线时,往往用数学上的最小二乘法(least square method)原理求解和两个系数(和的点估计值),即在所有直线中找出(残差平方和,记为)达最小值时所对应的直线作为回归线。 * 因变量 y 的取值是不同的,y 取值的这种波动称为变异。变异来源:1.因自变量 x 的取值不同造成的;2.除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响。对一个具体的观测值来说,变异的大小可以通过该实际观测值与其均值之差 来表示 * 如果总体中自变量X对因变量Y没有贡献,则由样本所得的回归均方与残差均方应相近; 反之,如果总体中自变量X对因变量Y有贡献,回归平方和反应的就不仅仅是随机误差,即回归均方必然要远大于残差均方; 依此,可计算检验统计量F值作出判断 * * 种错误的理解认为,回归系数越大,则X对Y的影响越大。回归系数大小与X与Y两个变量的单位或大小有关,回归系数大只能说明Y随X变化的速度快,并不完全表明影响大。为表明这种影响的大小,引入决定系数 * * 因变量 y 的取值是不同的,y 取值的这种波动称为变异。变异来源:1.
您可能关注的文档
最近下载
- GAT1399.1-2017 公安视频图像分析系统 第1部分:通用技术要求.pdf VIP
- MSDS双氧水 _原创精品文档.pdf VIP
- 【求阴影部分面积】人教版五年级上册数学求阴影部分面积35题.docx VIP
- 【阴影面积拔高题】五年级上册数学求阴影部分面积拔高题2023.8.9.docx VIP
- 《GB/T 46344.5-2025公共安全视频图像分析系统 第5部分:检验规范》.pdf
- (2026年)脐带血临床输注专家共识解读PPT课件.pptx VIP
- 《企业会计准则第33号——合并财务报表》应用指南.pdf VIP
- 2025年农业概论考试题库及答案.doc VIP
- 《城镇化进程》课件.ppt
- 人教版二年级数学上册应用题专项练习.pdf VIP
原创力文档


文档评论(0)