- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第10章现场调查资料的数据分析与表达
第10章现场调查资料的数据分析与表达摘要:统计分析的对象是统计资料,一般分定性资料和定量资料,不同的资料类型有不同的统计分析方法。计量资料通常可采用平均数、标准差等指标进行描述,数据符合正态分布用t检验、u检验、方差分析、相关与回归分析等方法进行统计推断,若不符合正态分布,则可采用非参数检验方法,如秩和检验,秩相关和秩回归等方法进行统计推断;计数资料可采用频数表、统计图以及率、构成比、危险度等指标进行描述。用χ2检验、Fisher精确概率法、秩和检验、二项分布和Poisson 分布、相关与回归分析等进行统计推断;等级资料用率或构成比来描述,用秩和检验、符号检验和Ridit分析等方法进行统计推断。第1节现场调查的数据类型和呈现形式一、调查数据的资料类型统计分析的对象是统计资料,正确识别统计资料类型是合理选用统计分析方法的首要前提。一般说来,统计资料具有两个要素或三个要素,两要素是指属性和具体取值,如某人的性别为男性、某人的血型为O型等;三要素是除具有上述两要素外还有度量衡单位,如某人的舒张压为80mmHg、某人的年龄为35岁、某人的血红蛋白含量为135.2g/L等。仅具有两个要素的统计资料称为“定性资料”,必须具有三个要素的统计资料被称为“定量资料”。具体分类见图10-1。图10-1 统计资料分类示意图1、定量资料测量每个观察单位某项指标量的大小,所得到的资料为定量资料,也称为数值资料。定量资料又可根据取值的“缝隙”分为计量资料和计数资料。计量资料:在定量资料中,如果测量指标在某范围内的取值没有“缝隙”,即观测值可能取任何连续的数值,这种资料称为计量资料。如测得试验大鼠的体重、某人的身高等。计数资料:在定量资料中,如果测定指标不可以带小数,即观测值只能取整数,并且通常为正整数,这种资料称为计数资料。如测得的大鼠的淋巴细胞数、EOS计数等资料。2、定性资料观测每个观察单位某项指标质的状况,所得到的资料称为定性资料,也称为分类资料。定性资料可根据指标是否有等级关系,分为名义资料和等级资料;根据分类的多少可分为二分类资料和多分类资料。有序资料:在定性资料中,若观测全体的属性有等级之分,称为有序资料。如哮喘患者的病情分为间歇发作、轻度持续、中度持续和高度持续4个属性。名义变量:在定性资料中,若观测全体的属性无等级之分,称为名义资料。如某单位全体员工按ABO血型系统可分为A型、B型、AB型和O型。二分类资料:在定性资料中,只有两种分类属性的资料,称为二分类资料。如性别属性只有男性和女性。多分类资料:在定性资料中,有两种以上(不含两种)分类属性的资料,称为多分类资料。如某病的疗效可划分为治愈、显效、好转、无效和死亡,该资料也可称为多分类有序资料。综合以上划分方法,定性资料可归纳为以下三种主要资料类型:二值资料、多值名义资料和多值有序资料。3、数据转换根据研究需要,有时可以进行定量资料和定性资料的互相转换。一般说来,定量资料包含的信息较定性资料丰富,而定性资料较定量资料的描述更简洁;定量资料通常可以转换为定性资料,而定性资料在没有原始资料的情况下通常不能转换为定量资料。所以研究者应保留原始数据,根据需要,以合适的类型来呈现资料,以合适的统计方法来处理资料。二、调查数据的呈现形式1、数据库形式数据分析一般通过统计软件(如SAS、SPSS、STATA等)来完成,通常整理成二维结构数据库(见表10-1)。其特点是:每一行表示一个记录(record),或一个观察单位(observational unit)、调查对象(case);每一列代表一个变量(variable),用以表示调查变量、项目或观察指标等。如表10-1记录的是有关中小学生体质健康现场调查的原始数据,是一个由200个观察单位和10个变量组成的数据库结构。表10-1 中小学生体质健康调查结果学生编号性别年龄(岁)身高(cm)体重(kg)收缩压(mmHg)舒张压(mmHg)龋齿沙眼贫血1男161645511876有无无2女111334012070有无有3男151575011668无有无4男91293813272无无无┆┆┆┆┆┆┆┆┆┆200女8953312471有无无以这种形式呈现统计资料的最大优点是信息非常详细和具体,而且特别便于调查数据的录入、整理和统计分析;缺点是占用的篇幅或空间很大。2、列联表形式在表10-1中,若研究者仅关心“性别、龋齿、沙眼、贫血”这些列所对应的统计资料,仍用数据库形式来呈现统计资料就不便于直观了解其内在关系了,改用列联表形式呈现统计资料,就使变量之间的内在关系清晰多了。表10-2 性别与是否患龋齿的调查结果性别龋齿合计有无男7248120女413980合这种形式呈现统计资料的最大优点是简单明了,便于阐明因素与结果的关联关系,适用于调查数据的
文档评论(0)