algae上海藻例子.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
algae上海藻例子

首都经济贸易大学 32009122125 * library(leaps) lm2leaps-regsubsets(a1~factor(season)+factor(size)+factor(speed)+mxPH+mnO2+Cl+NO3+NH4+oPO4+PO4+Chla,data=clean.algae, nbest=1, nvmax=15,really.big=TRUE) ##方程中不含常数项共有15 个自变量,所以nvmax=15,而nbest 为相同个数的自变量的最佳组合排列的方程个数。系统默认为1,即取最好的,因为我要找出所有变量组合中最好的模型,所以为了计算简便,就取系统默认的,因为运算量较大,really.big=TRUE,系统默认really.big=FALSE)。 lm2leaps.sum-summary(lm2leaps) names(lm2leaps.sum) [1] which rsq rss adjr2 cp bic outmat obj # 建立仅有截距项的模型,即规模为0 的模型 lm2leapsdum-lm(a1~1, data=clean.algae) lm2leapsdum.sum-summary(lm2leapsdum) names(lm2leapsdum.sum) [1] call terms residuals coefficients aliased sigma df [8] adj.r.squared r.squared cov.unscaled lm2leapsdum.sum$adj [1] 0 ##这说明方程中仅含有常数项的方程比按最佳子集回归得到的15 个方程都差,可舍弃 ##下面我们来看看按最佳子集回归得到的15 个方程的拟合效果的比较 * lm2leaps.sum$rss ##15 个方程的残差平方和比较 par(mfrow=c(2,2)) plot(1:15,lm2leaps.sum$rss,type=b,xlab=# subsets,ylab=RSS) lm2leaps.sum$adjr2##15 个方程的调整R 方比较 plot(1:15,lm2leaps.sum$adjr2,type=b, xlab=# subsets, ylab=ADJRSquare) lm2leaps.sum$cp ##15 个方程的cp 比较 plot(1:15,lm2leaps.sum$cp,type=b, xlab=# subsets, ylab=CP) lm2leaps.sum$bic plot(1:15,lm2leaps.sum$bic,type=b, xlab=# subsets, ylab=BIC) * * ##综合上面的信息,我们可以发现子集容量在3 以后,调整R 方上升的幅度很小; 同时,cp 值在3 以后下降的幅度也很小,而BIC 信息准则在3 处正好达到最优, 也正证实了我的猜想,即当子集容量为3 时,方程拟合精度最高。即方程中含四 自变量(加常数项)的最好。 lm2leaps.sum$which[3,] * final.lm2leaps-lm(a1~factor(size)+NO3+PO4, data=clean.algae) summary(final.lm2leaps) * shapiro.test(final.lm2leaps$residuals) AIC(final.lm2leaps) 建立回归方程并不合适 * 其他方法 * 从用逐步回归建立的模型的方差膨胀因子或容忍度分析,我们有理由怀疑自变量之间存在着多重共线性的影响,实际上,在前面从变量之间的相关程度图中,我们可以发现绝大部分变量之间相关程度不高,但变量NH4和NO3、变量PO4、oPO4 之间相关程度很大,尤其是变量PO4、oPO4 之间相关程度达到91.2%。这说明变量间从直观上也可以看出有可能存在着多重共线性的影 响。对于多重共线性的处理,最经典的处理方法有四种:principal components regression, ridge estimation, shrinkage estimatiors and partial least squares。下面我将从岭回归、lasso regression 两种方法来建模 * 岭回归(MASS) * * library(MASS) ridgelm-lm.ridge(a1~factor(season)+factor(size)+factor(speed)+mxPH+mnO2+Cl+NO3+NH4+oPO4

文档评论(0)

181****7126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档