卫统第一讲 绪论.ppt

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
四、统计学中的几个基本概念 1、观察单位与变量 2、同质和变异 3、总体与样本 4、随机误差与系统误差 5、频率与概率 6、参数与统计量 7、小概率事件与小概率原理 观察单位——指被观察或测量对象的最基本单位,也称个体,可以是一个人、一只鼠、一个样品、一个地区等。 变量——研究者对每个观察单位的某项特征进行观察或测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值或测量值),也称为资料。 资料根据性质可分为:计量资料、计数资料和等级资料。其中,计量资料也称为定量资料或测量资料,计数资料也称为定性资料或分类资料,等级资料也称为有序资料。 观察单位(observation unit)与变量(variable) 例如,一项研究内容是了解某地区2岁以下儿童的卡介苗接种情况,检查了该地区200名2岁以下儿童的卡疤,这个例子中观察单位为一名2岁以下儿童,变量为卡疤,变量值为“+”或“-”。 变量的类型 按变量值的性质可将变量分为:数值型变量、分类变量和顺序变量。 数值型变量也称为定量变量;分类变量和顺序变量也称为定性变量。 不同类型的变量需要选用不同的统计指标和统计方法进行分析。 根据分析需要,不同类型变量之间可进行转换,但通常是由高级向低级转换。 数值变量(numerical variable) 通过测定每个观察单位的某项特征的大小所得到的数据,称为数值变量,其变量值是以数值表示的,通常有度量衡单位。 例如,调查某地2岁男孩的生长发育情况,这是一个2岁男孩是一个观察单位,测量指标,如身高,体重、血红蛋白牙齿数就是数值变量。 描述数值变量常用的统计指标有平均数、标准差等,统计分析方法有t检验、Z检验、直线相关和回归、方差分析等。 数值型变量按取值的不同,可分为:离散型变量和连续性变量。 离散型变量是只能取确切值的变量,取值往往是有限多个或可列无限多个。 连续型变量是可以在一个或多个区间中取任何值的变量,取值是连续不断的,不能一一列出, 分类变量(categorical variable) 通过确定每个观察单位的某项特征的性质或类别得到的数据,称为分类变量,其取值是分类数据,表现为互不相容的类别或属性,没有度量衡单位。例如,血型分为A、O、B、AB。 描述分类变量通常用到的统计指标有比率、速率,统计分析方法有Z检验、卡方检验。 顺序变量(rank variable) 是说明事物有序类别的一个名称,其取值是顺序数据。 特点是其变量值是多项分类且各类之间有程度的差别。例如,文化程度可分为:没上过学、小学、初中、高中、大专级以上等;疗效可分为治愈、显效、有效、无效。 针对这类变量的统计分析方法有秩和检验和等级相关分析等。 * 变量类型的判断 病例号 年龄 (岁) 性别 身高 (cm) 血型 心电图 尿WBC 职业 RBC 1012/L 1 35 女 1.65 A 正常 - 教师 4.67 2 44 男 1.74 B 正常 - 工人 5.21 3 26 男 1.80 O 正常 + 职员 4.10 4 25 女 1.61 AB 正常 + 农民 3.92 5 41 男 1.71 A 异常 ++ 工人 3.49 6 45 女 1.58 B 正常 ++ 工人 5.48 7 50 女 1.60 O 异常 ++ 干部 6.78 8 28 男 1.76 AB 正常 +++ 干部 7.10 9 31 女 1.62 O 正常 + 军人 5.24 * 不同类型变量间关系 根据分析需要,数值变量可转换为分类变量。 将一种类型的变量转化为另一种类型 变量只能由高级向低级转化:   连续型→有序→分类→二值 * 例:一组20?40岁成年人的血压 以12kPa为界分为正常与异常两组 8 低血压 8? 正常血压 12? 轻度高血压 15? 中度高血压 17? 重度高血压 定量变量 等级变量 定性变量 * 很多情况下,为了分析的方便,对分类变量可以进行赋值,例如,男女分别赋值为1和2,这种赋值仅是一种“数据代码”,这些变量的本质还是分类变量,应该按分类变量进行统计分析。 * 总体——根据研究目的确定的所有个体某指标实际值的集合,即指该项变量值的全体。由于在实际研究中,往往需要观察或测量多个指标,为了叙述方便,往往简单地称总体为根据研究目的所确定的所有观察对象的全体。总体又分为有限总体和无限总体。 例如,研究某地2005年活产婴儿的出生体重,该地2005年所有活产婴儿的出生体重值就构成一个总体。 样本——总体中有代表性的一部分个体的研究指标的测量值构成的集合。由于在实际研究中,往往需要观察或测量多个指标,为了叙述方便,往往简单地称样本是由一部分个体构成的。 总体与样本(

文档评论(0)

187****5045 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档