一项研究要分析的变量Y为符合正态分布的连续变量多-易侕学院.PDF

一项研究要分析的变量Y为符合正态分布的连续变量多-易侕学院.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一项研究要分析的变量Y为符合正态分布的连续变量多-易侕学院

系统化的分析流程 一、案例介绍: 一项研究要分析的变量(Y )为符合正态分布的连续变量,多种因素对它有影响,研 究对象分为四组(用X 表示,X=0 、1、2 、3 分别表示四组),组间年龄(AGE )、体质 指数(BMI )、血压(BP )等均有显著差异。分析目的是要比较四组之间有没有差异, 但要考虑到组间AGE 、BMI、BP 等不同对Y 的影响。 做数据分析好比打乒乓球,多数人是自己摸索,没有专业教练指导,接、发球等动作 是自己摸索出来一套野路子,常常一个球打好了,也不知道是怎么打好的,下一个就打不 出来了,不能重复,因为不知道什么是规范的动作要领,打到一定水平后也无法再提高。 而那些从小就经过专业训练的则完全不一样,因为动作规范,所以技术水平提高快。象上 面这个案例,就有业余选手与专业选手两种打法。 业余选手的通常打法: 1)先做方差分析看四组之间差别有没有显著性,如果有显著性,接着做组间比较, 看是哪两组间有显著差别。 2 )考虑其它因素的影响,用逐步回归的方法建立一个多元模型,初始模型为: Y=X+AGE+BMI+BP+… ,最后出来一个最终模型,如 Y=X+BMI ,最后结论是 X 的组间 差别有意义,另外BMI 也是Y 的一个危险因素。 3 )业余段位高一点的会根据X 生成4 个指示变量,用X0 表示X=0 ;X1 表示X=1 ; X 表示X=2 ;X 表示X=3 。然后以X=0 组为参照,把X 、X 、X 放入模型中,这样初始 2 3 1 2 3 模型变为:Y=X +X +X +AGE+BMI+BP+… ,最后出来一个模型可能是 Y=X +X +BMI 。 1 2 3 2 3 结论是X=2 与X=3 组与X=0 组差别有意义,另外BMI 也是Y 的一个危险因素。 二、系统化的分析流程 专业选手的打法:首先专业选手使用的球拍就比较讲究,要具备必要的功能并且顺手。 易侕统计软件(EmpowerStats )是按分析思路设计的软件,可以说是最好用的球拍,下面 用易侕软件演示一下对这个案例的分析思路与操作规范: 第一步数据整理 数据文件中变量名要用英文的,数据要数字化,如 X 编码成 0、1、2 、3 ;性别编码 为:0=男,1=女。数据整理好后存成制表符分隔的文本文件。 第二步创建分析项目 打开易侕统计,给出数据文件名,易侕读取数据文件后自动给出变量清单与每个变量 的分布,如下图示,这时候你就可以非常方便地查看每个变量的分布了,如 Y 、AGE 、 BMI 、BP 等连续性变量的分布形态、最大值、最小值、常用的几个百分位数、均数、标 准差等,X 等分类型变量每组的观察数及其百分比,这些基本信息一下子就尽收眼底了。 可以看出“易侕” 自动识别变量类型(分类型或连续性),根据变量类型做相应的统计 描述,并将其分布用非常简明的方式呈现出来。 第三步扫描关联关系 用“数据分析”菜单下的“扫描关联关系”模块,把Y 拖入 (或双击)结果变量框内,如 图所示: 易侕自动扫描数据中哪些变量与Y 有关,给出如下图的图表结果。 这个时候做的是单因素分析,看每个变量与Y 的关系,没有考虑其它因素的影响,如 果你确定哪个(或几个)变量,如AGE ,对Y 有影响,你可以把AGE 放到调整变量里, 这就是看在调整了AGE 的情况下,其余每个变量对Y 有没有影响。 易侕在分析连续性变量如BMI 与Y 有没有关系时,会自动考虑到BMI 与Y 的关系可 能不是线性的变化关系,因此在做了直线回归分析的同时,还会自动做平滑曲线拟合,以 展现Y 随BMI 的变化曲线,帮助我们判断两者之间是什么样的关系。 在分析分类变量如X 与Y 的关系时,自动生成指示变量放入模型,把X=1 、2 、3 组 与0 组比较,呈现三个回归系数及其95%可信区间与P 值。这个回归系数的大小很重要, 可以帮助我们判断是否可以进行组间合并,X=0 组是参照组,相当于其回归系数是 0 ,如 果X=1 的回归系数与0 接近且不显著,也就是说X=1 组与X=0 组没有差别,后面的分析 就可以考

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档