- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(三)μy/x 和单个y观测值置信区间图示 正比 反比 愈靠近 x ,对y总体平均值或单个y的估计值就愈精确,而增大样本含量,扩大x的取值范围亦可提高精确度。 作回归分析时要有实际意义。 直线回归注意问题 不能把毫无关联的两种现象勉强作回归分析,即便有回归关系也不一定是因果关系,还必须对两种现象的内在联系有所认识,即能从专业理论上作出合理解释或有所依据。 进行直线回归分析之前,绘制散点图。 直线回归注意问题 当观察点的分布有直线趋势时,才适宜作直线回归分析。 散点图还能提示资料有无异常值,即对应于残差绝对值特别大的观测数据。异常点的存在往往对回归方程中的a和b的估计产生较大的影响。因此,需要复查此异常点的值。 直线回归的适应范围一般以自变量的取值为限。 直线回归注意问题 在自变量范围内求出的估计值,一般称为内插(interpolation);超过自变量取值范围所计算出的估计值,称为外延(extrapolation)。 若无充分理由证明超过自变量取值范围还是直线,应该避免外延。 描述两变量间的依存关系。 直线回归的应用 利用回归关系进行预测(forecast)。 直线回归的应用 将自变量作为预报回子,代入方程对预报量进行估计,其波动范围可按个体y值容许区间方法计算。 回归方程进行统计控制(statistical control). 直线回归的应用 NO2浓度 Y(NO2浓度,mg/m3)= -0.064866+0.000133x(车流量,辆/小时) ^ 第三节:直线相关 Linear Correlation 一、相关系数和决定系数 二、相关系数的假设检验 三、相关系数的区间估计 一、相关系数和决定系数 x y 线性关系 了解x和y相关以及相关的性质 相关系数 相关类型 正相关 负相关 零相关 I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV 直线相关的两个变量的相关程度和性质 乘积和 互变量 (1)单位问题 (2)x与y本身的变异不影响x与y之间的相关性 ? n r 两个变量的变异程度 两个变量的度量单位 两个变量的个数 r可以用来比较不同双变量的相关程度和性质。 样本 总体 两个变量在相关系数计算中的地位是平等的,没有自变量和依变量之分 相关 回归 区 别 联系 决定系数 coefficient of determination 变量x引起y变异的回归平方和占y总变异平方和的比率 当SSy固定时,回归平方和U的大小取决于r2。 回归平方和U是由于引入了相关变量而使总平方和SSy减少的部分。 说明引入相关的效果好 用 y 可以准确预测y值 x与y完全相关。 完全正相关 完全负相关 散点图上所有点必在一条直线上。 回归一点作用也没有,即用x的线性函数完全不能预测y值的变化。 x与y之间不存在直线相关关系,这时散点图分布紊乱,没有直线的趋势,但可能存在非线性关系。 I II III IV x的线性函数对预测y值的变化有一定作用,但不能准确预测,说明y还受其他因素(包括随机误差)的影响。 相关系数(r) 和决定系数(r2) 的区别 (1) 除去 r =1和0的情况外,r 2 r,这样可以防止对相关系数所表示的相关程度作夸张的解释。 (2)r可正可负,r2取正, r2一般只用于表示相关程度而不表示相关性质。 温度 天数 黏虫孵化历期平均温度与历期天数成负相关。 x和y的变异有93.74%可用二者之间的线性关系来解释。 ρ=0 x y (x1,y1) (x2,y2) (x3,y3) (xn,yn) P ? 误差因素引起的平方和,反映了除去x与y的直线回归关系以外的其余因素使y引起变化的大小。 反映x对y的线性影响之外的一切因素对y的变异的作用,也就是在总平方和中无法用x解释的部分。 离回归平方和 误差平方和,剩余平方和 (residual sum of squares) Q 在散点图上,各实测点离回归直线越近,Q值越小,说明直线回归的估计误差越小。 依变量 y的平方和,总平方和,SSy,SS总 回归平方和 U 离回归平方和 Q 直线回归分析中,回归自由度等于自变量的个数,只涉及到1个自变量 df回归=1 df总=n-1 df离回归=n-2 Q/n-2 离回归标准差 回归估计标准误 剩余标准差 离回归方差 总体回归截踞 总体回归系数 随机误差 α:它是y的本底水平,即x对y没有任何作用时,y的数量表现。 βx:它描述了因变量y的取值改变中,由y与自变量x的线性关系所引起的部分,即可以由x直接估计的部分。 误差:它描述了因变量y的取值改变由x以外的可能与y有关的随机和非随机因素共同引起的部分,即不能由x
文档评论(0)