第03章 统计描述.ppt

  1. 1、本文档共79页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第03章 统计描述

第三章 统计描述 第一节 频数分布 第二节 数值变量的统计描述 第三节 正态分布及其应用 第四节 分类变量的统计描述 第五节 例题和SPSS电脑实验 第一节 频数分布 频数:是将研究对象按某属性进行分组,数出的各组中观察值个数。 分布:指随机变量的频率变化的规律性。 频数分布:指观察值按大小分组,各个组段内观察值的频数分布。 一、频数分布的特征与类型 二、频数表和频数图 一、数值变量资料的分布特征与类型 1.数值变量资料的频数分布特征 集中趋势:指一组变量值的集中倾向或中心位置。 离散趋势:即一组变量值的离散倾向。 集中趋势和离散趋势是数值变量资料频数分布的两个重要特征,是揭示数据分布的类型和正确进行统计描述与统计推断的前提。 2.数值变量资料频数分布的类型 ⑴对称分布(symmetric distribution) 正态分布(normal distribution) 非正态分布(non-normal distribution) ⑵非对称分布(dissymmetric distribution) 正偏态(positive skewness) 负偏态(negative skewness) 单峰分布 双峰或多峰分布 二、频数表和频数图 频数表:是观察值或某些类别及其相应的频数按一定顺序排列的表格。 频数图:是在频数表基础上,以直方的面积大小表示频数的多少,以直方面积在总面积中的比例表示频率大小的图形。 主要用于描述或探察数据潜在分布类型特征。 1.分类变量频数表的类型 ⑴一维频数表:是用分类变量的分类水平为组段,通过分类计数而得。 1.分类变量频数表的类型 ⑵二维频数表:是按分类变量的分类水平特征组合成的表,不同二维表名称。 1.分类变量频数表的类型 ⑶配对设计分类变量的频数表:可用行数与列数相同的表归纳其频数分布。 2.数值变量频数表与频数分布图 ⑴数值变量频数表: ⑵频数分布图 3.频数分布表/图的作用 描述频数分布的集中趋势与离散趋势,直观地揭示数据的分布特征和分布类型。 便于发现资料中的特大或特小的可疑值。 便于进一步计算统计指标和进行统计分析。 第二节 数值变量的统计描述 例:某市2007年100名18岁男大学生身高(cm)资料如下,请对资料进行描述。 编制频数表的步骤 1.求极差:也称全距(Range) R=最大值-最小值=183.5-162.9=20.6(cm) 2.确定组段数(取10-15组)和组距: 组距(i)=全距∕组段数=20.6∕10=2.6≈2 3.写出组段: 起始组段取小于或等于最小值的数,最后组段包含最大值。L≤X<U。 4.分组划计并统计频数。 表2-1 某市100名18岁男大学生身高的频数分布 一、集中趋势的描述 平均数(average):是描述一组同质观测值集中趋势的指标。 主要作用: ①作为一组观察值的代表值,表明该组观察值集中趋势的特征; ②便于对同类研究对象进行对比分析。 常用的平均数: 算术平均数(arithmetic mean, 总体均数为μ、样本均数为 ) 几何平均数(geometric mean,G) 中位数(median,M) 1.算术均数(arithmetic mean) 均数(mean):一组性质相同的观察值在数量上的平均水平。 ?(总体) (样本) 计算:直接法、加权法 适用条件:对称分布特别是正态分布或近似正态分布。 2.几何均数(geometric mean) 几何均数G:n个数值的乘积开n次方。 计算:直接计算法 加权法 适用条件:等比资料、对数正态分布。例如抗体滴度。 注意:观察值不能为0、不能同时有正有负,同一资料算得的几何均数小于算术均数。 3.中位数(median) 中位数M:将一组观察值从小到大排序后,位置居中的那个变量值(n为奇数)或位置居中的两个变量值的均值(n为偶数)。 适用条件:任意类型的资料,特别是偏态资料,开口资料,分布情况不明的资料。 用途:疾病的潜伏期、发汞、尿铅等 百分位数(percentile) 百分位数:将一组观察值从小到大排序,分成100等份,各等份含1%的观察值,分割界限上的数值即为第X百分位数,是一个界值。PX 常用的百分位数:P5 P25 P75 P95 用途:百分位数常用于估计医学参考值范围 表 某传染性疾病的潜伏期中位数和百分位数计算表 二、离散趋势的描述 离散趋势(dispersion):描述一组同质观察值的变异程度大小(数据的均匀性)的综合指标。 常用的变异性指标: 极差(range,R) 四分位数间距(quartile range ,QR

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档