第六讲现场调查数据分析.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六讲现场调查数据分析;课程安排;现场调查数据的处理分析 Survey Data Analysis;主要内容;研究设计; Epi Info SAS STATA SPSS EpiCalc ……;SAS;SAS系统全称为Statistics Analysis System,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。 在英美等国,能熟练使用SAS进行统计分析是许多公司和科研机构选材的条件之一。 缺点:高昂的价格 、不太友好的界面、非统计学专业人员不容易上手! ;STATA;Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件,由美国计算机资源中心(Computer Resource Center)研制。从1985至1998的十四年时间里,已连续推出1.1,1.2,1.3,1.4,1.5,……及2.0,2.1,3.0,3.1,4.0,5.0,6.0等多个版本,通过不断更新和扩充,内容日趋完善。它同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程??语言的特点,又在许多方面别具一格。Stata融汇了上述程序的优点,克服了各自的缺点,使其功能更加强大,操作更加灵活、简单,易学易用,越来越受到人们的重视和欢迎。 Stata的突出特点是只占用很少的磁盘空间,输出结果简洁,所选方法先进,内容较齐全,制作的图形十分精美,可直接被图形处理软件或字处理软件如WORD等直接调用。;SPSS;SPSS是软件英文名称的首字母缩写,原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。最近,伴随SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已决定将之英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向正在作出重大调整。 ?20世纪60年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS,同时成立了SPSS公司,并于1975年在芝加哥组建了SPSS总部。 缺点:SPSS采用VB编制,计算速度也远远慢于其他统计软件;其输出结果虽然漂亮,但不能和WORD等常用文字处理软件直接兼容。这些都可以说是SPSS的致命伤。多水平统计模型等问题方面存在一定问题;Epi Info v3.3;开发: (1)WHO的AIDS病全球控制小组 (2)CDC流行病学室 免费获得 (2) 最新版??: Epi InfoTM Version3.3 ;基本流程;第十六页,共三十九页,2022年,8月28日;;;第十九页,共三十九页,2022年,8月28日;;;选择合适的数据管理与分析软件 SAS、SPSS、Epi-Info、STATA 录入后数据的检查 错误,遗漏的研究变量取值 采取补救措施 更改,再次询问,查阅档案,重新检测 ;数据的检查与核对 检查数据的结构 观测数,变量名称、数量 检查各变量的取值情况 取值范围 数值变量 最小值(minimum), 最大值(maximum) 均值(mean),中位数( median),发现异常值( outlier) 分类变量 其它发现异常的方法:图示法,回归诊断等;数据的整理 数据的分组 分类变量/有序变量 按照实际的类别进行分组 若有必要和合理,可将性质相近的类别合并 数值变量 按照实际的生理,病理,临床和公共卫生意义分组 分位数分组 四分位数(quartiles),五分位数(quintiles) 使用的方便程度/专业惯例分组 例:年龄在某一适宜范围内每5或10岁一组 ;数据的转换 非正态数据的变量转换 正态性(normality)检验 Univariate过程 Q-Q plot 对数、平方根和倒数变换 分类变量转换为哑变量 ;确定拟分析的自变量和因变量 研究设计阶段有助于选择拟研究的变量,指导问卷设计;普查数据分析思路;抽样调查数据???析思路 ;Logistic回归 ;Y:反应变量(response variable) X: 协变量(covariate),解释(explanatory)变量,伴随变量等,X可以呈现二值变量的形式,也可以计量的或等级的指标。 logistic回归是一种概率模型。设P为Y呈现反应值为1的概率,P=P(Y=1),则Q=1-P,为呈现非反应值的概率,Q=P(Y=2)。 P与各协变量Xi之间的关系可用下式表示。 ;发病的概率:  P=[exp(b0+b1x1+…+bmxm)]/[1+exp(b0+b1x1+…+bmxm)] 不发病的概率:  Q=1-P=1/[1+exp

文档评论(0)

lanlingling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档