- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4回归分析
回归分析
1.两变量线性相关系数的计算
总体相关系数
为变量x的总体方差,为变量y的总体方差,为变量x与变量y的总体协方差。相关系数没有单位,在-1~+1范围内波动,其绝对值越接近1,两变量间的直线相关越密切;越接近0,相关越不密切。
样本线性相关系数(Pearson相关系数)
是变量x的样本方差,是变量y的样本方差,是变量x与变量y的样本协方差,为x的离均差平方和,为y的离均差平方和,为x与y的离均差乘积之和,简称离均差积和,其值可正可负。实际计算时可按下式化简:
例:(身高体重的例子)
x=c(171,175,159,155,152,158,154,164,168,166,159,164)
y=c(57,64,41,38,35,44,41,51,57,49,47,46)
plot(x,y)
相关系数计算函数cor(x,y=NULL,method=c(“pearson”,”kendall”,”spearman”))
x为数值向量、矩阵或数据框
y为空或数值向量、矩阵或数据框
method为计算方法,包括“pearson”,”kendall”,”spearman”三种,默认为“pearson”
例:
cor(x,y)
[1] 0.9593031
2.相关系数的假设检验
n=length(x)
r-cor(x,y)
tr=r/sqrt((1-r^2)/(n-2))
tr
[1] 10.74298
相关系数检验函数
cor.test(x,y,alternative=c(”two.sided”,”less”,”greater”),method=c(“pearson”,”kendall”,”spearman”),….)
x,y为数据向量(长度相同)
alternative为备择假设,分别表示双侧,左侧,右侧
method为计算方法,包括“pearson”,”kendall”,”spearman”三种
例:
cor.test(x,y)
Pearsons product-moment correlation
data: x and y
t = 10.743, df = 10, p-value = 8.21e-07
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.8574875 0.9888163
sample estimates:
cor
0.9593031
由于p-value = 8.21e-070.05,于是在显著水平0.05上拒绝原假设,接受相关系数不为0,即该人群身高与体重呈现正的线性关系。
注:不能只看相关系数的大小来判断显著性。还需看其样本量大小。
二、一元线性回归分析
步骤:
建立回归模型;
求解回归模型中的参数;
对回归模型进行检验。
例:d4.3
财政收入与税收有密切的依存依存关系。d4.3给出我们1978年改革开放以来到2008年共31年的税收(x,百亿元)和财政收入(y,百亿元)数据,试分析税收与财政收入之间的依存关系。
步骤:
(1)读入数据
##在d4.3中选取B1:C32区域,然后拷贝
yx=read.table(clipboard,header=T)
(2)拟合模型
fm=lm(yx$y~ yx$x)
fm
Call:
lm(formula = yx$y ~ yx$ x)
Coefficients:
(Intercept) yx$x
-1.197 1.116
于是得到回归方程:
(3)作回归直线
plot(yx$x, yx$y)
abline(fm)
(4)回归方程的假设检验
1)模型的方差分析
anova(fm)
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(F)
x 1 712077 712077 27428 2.2e-16 ***
Residuals 29 753 26
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
由于p0.05,于是在0.05水平处拒绝原假设,即本例回归系数有统计学意义,x与y间存在直线回归关系。
2)回归系数的显著性检验
summary(fm)
Call:
您可能关注的文档
最近下载
- 美国fda生产过程(工艺)验证总则指南中英文版.doc VIP
- 成都理工大学2020-2021学年第2学期《环境监测》期末考试试卷及标准答案.docx
- 2024年江苏省无锡市中考英语真题卷(含答案与解析).docx VIP
- 年产水性油墨、凹版塑料环保油墨4500 吨、水性涂料500吨建设项目环评(2021年新版环评)环境影响报告表.pdf VIP
- fda美国食品药物管理局工艺验证指南英文版).doc VIP
- 金属非金属露天矿山建设项目安全设施竣工验收表.pdf VIP
- 单位员工网络安全培训.pptx VIP
- PQE试用期述职报告.pptx VIP
- 《GBT 30130-2023胶版印刷纸》最新解读.pptx
- GJB9001C:2017研发一整套资料模板(共348页).pdf VIP
文档评论(0)