回归分析与相关分析.pptxVIP

回归分析与相关分析.pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

课程安排

回归模型与相关分析

方差分析

属性数据分析

生存数据分析

实验设计

全基因组关联分析;第1,2,3,5次

ExperimentalDesignandDataAnalysisforBiologists

GerryP.QuinnandMichaelJ.Keough

CambridgeUniversityPress,Cambridge,2002.

2. BiostatisticalDesignandAnalysisUsingR:APracticalGuide

MurrayLogan

Wiley-Blackwell,Chichester,WestSussex,2010.

第4次

3.SurvivalAnalysis:ASelf-LearningText,2ndedition

DavidG.KleinbaumandMitchelKlein,Springer,2005

第6次

ABELtutorial

YuriiAulchenko,2011;回归分析和相关分析

生物统计学研究所张洪

线性回归

1.1 回归直线

1.2 参数估计方法:最小二乘估计

1.3 参数推断:F-检验、t-检验、区间估计

1.4 回归模型的诊断:残差分析

1.5 多重线性回归

1.6 Box-Cox变换

2.相关分析

2.1 Pearson相关系数

2.2 相关系数的统计推断:z-检验、区间估计

2.3 偏相关系数

2.4 秩相关与多重相关

3实例分析;与函数关系的区别:

同一身高可以体重不同,

体重随身高增加的关系

不是严格成立,

只是有这种趋势;;问题:

如何估计参数?

X能解释Y的比例是多少?

假设检验问题:

线性模型是否适用?

如果模型不适用,如何修正?

;;观测值:

残差:;t检验:回归系数的显著性检验

零假设:回归系数等于0;F检验(方差分析):模型选择,比显著性检验应用范围更广,

但不同模型选择需要分别做模型拟合。

t检验(显著性检验):一次拟合可以给出多个系数的检验结果;区间估计;1.4 回归模型的诊断:残差分析;强影响点;残差散点图

残差Q-Q图

位置(拟合值)

-尺度图

4. Cook距离与

杠杆图

Cook距离1

leverage2p/n

为强影响点;稳健回归法:最小一乘估计(最小绝对偏差,LAD);;1.5多重线性回归;X1;X1;1.6Box-Cox变换;2. 相关分析;X与Y的Pearson相关系数;2.2相关系数的统计推断;2.3偏相关系数;2.4秩相关、多重相关;R代码

mul.fit=lm(c~a+b);

cor.mul=cor.test(c,fitted(mul.fit));;3实例分析;初步的分析:两两相关分析---散点图;dat-read.csv(paruelo.csv);

require(car);

scatterplot.matrix(~C3+MAP+MAT+JJAMAP+DJFMAP+LONG+LAT,

data=dat,diag=boxplot);;scatterplot.matrix(~log10(C3+0.1)+MAP+MAT+JJAMAP+DJFMAP+LONG+LAT,data=dat,diag=boxplot);;变换过后的因变量分布

更接近正态分布

自变量之间有大的

相关性---共线性性,

共线性性对多变量线性

回归分析影响很大;print(cor(dat[,3:8]));

MAPMATJJAMAPDJFMAPLONGLAT

MAP1.00000000.3550907660-0.404512409-0-0MAT0.35509081.000000000-00.001478037-0-0JJAMAP0.1122590-0.0807713071-0.791540381-0

文档评论(0)

a105776456 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档