数值变量资料的如统计分析.ppt

  1. 1、本文档共128页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数值变量资料的如统计分析

第九章 数值变量资料的统计分析 第一节 数值变量资料的统计描述 第二节 正态分布及其应用和统计图表 第三节 数值变量资料的统计推断 第一节 数值变量资料的统计描述 数值变量资料的频数分布 集中趋势的描述 离散趋势的描述 数值变量资料的分类 离散型资料(discrete data) 连续型资料(continuity data) 一、数值变量资料的频数分布 (一)编制频数分布表和绘制频数分布图 频数分布表:常用于样本量较大资料的统计描述 频数分布图:用图示的方法描述频数分布的特点,比频数表更直观、形象 编制频数表的步骤如下: 1.计算极差 R=6.55-2.10=4.45(mmol/L ) 2.确定组数、组段和组距 3.确定各组段的上下限 4.列出频数表 图9-1 140名健康成年男性血清BUN浓度频数分布图 揭示了频数分布的两个重要特征: 集中趋势 离散趋势 频数分布类型有两种: 对称分布 偏态分布 正偏态 负偏态 (二)频数分布表和频数分布图的用途 1.将原来相对复杂的数据以相对直观、有序的表格或图形的形式描述,便于进一步分析 2.便于观察数据频数分布的类型,以便根据资料分布类型选择恰当的统计分析方法 3.用于描述频数分布的特征 4.便于发现资料中一些特大或特小的可疑值,以便进一步检查和核对 二、集中趋势的描述 算术均数(arithmetic mean) 几何均数(geometric) 中位数(median)与百分位数(percentile) (一)算术均数(arithmetic mean) 适于描述正态分布或近似正态分布资料的集中趋势 方法 直接法 加权法 直接法 加权法 (二)几何均数(geometric) 观察值呈倍数关系或其频数分布明显偏态,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描述其集中趋势。 方法 直接法 加权法 直接法 加权法 例9-3 有8份血清的某种抗体效价分别为1:200、1:25、1:400、1:800、1:50、1:100、1:50、1:25,求平均抗体效价。 例9-4 某地对120名儿童接种疫苗一个月后,测定了各儿童血清抗体的滴度,结果如下表9-4第(1)、(2)栏。试求平均滴度。 112名儿童接种疫苗后血清抗体平均滴度为1:48. (三)中位数(median,M)和百分位数(percentile,Px) 中位数 :将一组观察值按大小顺序排列后,位于中间位置的观察值称中位数。全部观察值中,大于和小于中位数的观察值个数相等。中位数可用于各种分布的资料,在实际工作中主要用于偏态分布资料、两端无确切值或分布不明确的资料。 方法 直接法 频数表法 直接法 n为奇数时 n为偶数时 频数表法 百分位数 将观察值从小到大排列后,等分成100份,位于第x百分位置上的数值称第百分之x位数,记为Px。对于样本含量过小的资料不宜计算百分位数。一个百分位数Px将全部数据分为两个部分,有x%的数据比Px小,有(100~X)%的数据比Px大,故百分位数是一个位置指标。 计算 例9-7 为了了解本地儿童体内铅负荷的现状,某市儿保所2006年以随机抽样的方法调查了该市340名7岁以下儿童的血铅含量,结果编制成频数表如表9-5,试计算该资料中位数及P25,P75,P95。 三、离散趋势的描述 全距(range,R) 四分位数间距(quartile range,Q) 方差(variance) 标准差(standard deviation,SD) 变异系数 (coefficient of variation,CV) (一)全距(range,R) 极差亦称全距,即一组观察值中最大值与最小值之差。极差大,说明变异度大;反之,说明变异度小 极差可用于反映各种分布资料的变异程度,简单明了,但也存在缺点 只涉及最大值和最小值,不能反映组内其他数据的变异程度 样本较大时,抽样误差大,因此抽到最大值和最小值的可能性也越大,故样本例数相差较大时,不宜比较其极差 (二)四分位数间距(quartile range,Q) P25 -P75 四分位数间距常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度,其值越大,表示观察值分布的离散程度越大,反之越小。 四分位数间距与极差相比,相对比较稳定,但它只反映了居中间的50%数

文档评论(0)

132****6080 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档