- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS生物統计分析示例6-相关与回归
SPSS统计分析示例6
(相关与回归分析)
例一:简单相关与回归分析
对小麦栽培观察测量数据如下:
株高cm 147 128 115 103 142 140 106 112 101 124 穗长cm 47 38 35 41 36 46 46 38 44 44 穗重g 1.9 1.5 1.1 1.4 1.2 1.8 1.7 1.3 1.7 1.8 株高cm 102 98 86 97 95 88 102 94 98 104 穗长cm 35 35 40 50 20 25 44 48 43 44 穗重g 1.2 1.4 1.6 2.0 0.6 0.7 1.7 1.9 1.6 1.8
(一)对株高、穗重、穗长两两间做相关分析:
Analyze ?Correlate ? Bivariate…
穗长、穗重(n=20)
(相关系数r=0.972,P0.01)
穗长、株高(n=20)
(相关系数=0.238,P=0.3120.05)
穗重、株高(n=20)
(相关系数=0.219,P=0.3540.05)
结论:两两之间,只有穗长、穗重相关关系极显著(相关系数r=0.972,P0.01),穗长、株高之间及穗重、株高之间线性关系不明显。
(二)控制株高,对穗重、穗长之间做偏相关分析:
Analyze ?Correlate ? Partial…
输出如下:
控制株高,穗长、穗重间仍表现出显著的线性相关,偏相关系数r偏=0.970 与两两相关系数r=0.972 相差无几。这说明株高因素对穗长、穗重潜在影响可以忽略,这从株高-穗长,株高-穗重的相关系数也可映证。
(三)对穗长、穗重建立直线回归方程并作图:
Graphs ? Interactive ? Scatterplot…
结果输出:
穗重(g)
例二:Logistic回归分析
某研究人员在探讨肾细胞癌转移的有关临床病理因素研究中,收集了一批行根治性肾切除术患者的肾癌标本资料,现从中抽取26例资料(kidneycaner-logistc.sav)进行logistic回归分析。
? i: 标本序号
? x1:确诊时患者的年龄(岁)
? x2:肾细胞癌血管内皮生长因子(VEGF),其阳性表述由低到高共3个等级
? x3:肾细胞癌组织内微血管数(MVC)
? x4:肾癌细胞核组织学分级,由低到高共4级
? x5:肾细胞癌分期,由低到高共4期
? y: 肾细胞癌转移情况(有转移y=1; 无转移y=0)。
Analyze ?Regression ? Binary logistic…
“转移情况Y”为“Dependent”应变量(二元分类变量);X1-5为自变量,放入“Covariates”选框中。变量筛选方法“Method”选择“Forward:Conditional”,再在“Options…”选框中勾选一些模型诊断方法,如“Iteration history (迭代记录)”、“Correlations of estimates (估计变量的相关分析)”、“Classification plots (分类作图)”。其他选择默认设置,点“OK”运行程序。
结果显示中部分重要表格解读如下:
Step 0拟合的是只有常数的无效模型,上表为分类预测表,可见在17例观察值为0的记录中,共有17例被预测为0,9例1也都被预测为0,总预测准确率为65.4%,这是不纳入任何解释变量时的预测准确率,相当于比较基线。
Step 1、2用前进法依次加入解释变量,上表为每一步的预测情况汇总,可见准确率由的65%上升到了Step 184%,最后达到96%,效果,最终只出现了一例错判。.172。
注:Exp(B)即通常所说的Odd Ratio
上表将这些变量移出方程,方程的改变统计学意义Sig. of the change值可见都是有统计学意义的,因此X2应当保留在方程中。
X1、X3、X5,根据上表可见其对回归的影响均不显著(Sig.0.05),因此从最终的方程中被剔除。
再看看诊断分析结果:
1)Iteration history (迭代记录)
迭代记录无论是似然值,还是三个系数值,均是从迭代开始就向着一个方向发展,最终达到收敛,这说明整个迭代过程是健康的,问题不大;如果中途出现波折,尤其是当引入新变量后变化方向改变了,则提示要好好研究。Correlations of estimates (估计变量的相关分析)
上表为方程中变量的相关矩阵,可见X2和常数项相关性较强,当引入X4后仍然如此,提示要关注这一现象,以防因自变量间的共线性导致方程系数不稳(此时迭代记录多半也会有波动)。当然
文档评论(0)