02定量资料的统计描述.ppt.ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
02定量资料的统计描述.ppt

计量资料的统计描述 计量资料的统计描述 统计图表 频数表 频数/频率图 统计指标 集中趋势 离散趋势 频数表 某市1995年110名7岁男童身高资料 频数表 频数表的制作 确定组数:不宜过多或过少,一般10组 确定组距: 可等可不等; 一般等组距=极差/组数; 本例组距=(134.5-110.2)/10=2.43 频数表 频数表的制作 确定各组上下限(每个组段的起点和终点): 第一组包含最小值 组段不能重叠 每一组段都为半开半闭区间 最后一组应为闭区间 离散型资料的组段通常为一个取值 表2.1 110名7岁男童身高频数分布 频数分布图 连续变量 以直方顶点的纵坐标(等距分组)或直方的面积大小(不等距分组)表示频数的多少 离散变量 以各直条的长短表示频数的多少 频数分布图 连续变量 等距分组:横轴表示观察变量,纵轴表示每个横轴组段的频数。 频数分布图 连续变量 不等距分组:横轴表示观察变量,纵轴表示每个横轴单位的频数。 频数表/图的用途 揭示资料分布类型:频数图较频数表更直观 描述频数分布的重要特征: 集中趋势与离散趋势 便于发现特大与特小的可疑值 便于进一步计算统计指标和做统计处理 统计指标描述---集中趋势 算术均数:简称均数 总体均数μ,样本均数 当数据对称分布时,位于分布的中心,是频数分布最集中的位置 直接法: 加权法: 统计指标描述---集中趋势 几何均数G: 适用于经对数转换后呈对称分布的数据,如医学上的滴度资料 统计指标描述---集中趋势 中位数 将一组观察值从小到大排列位置居中的数 适用于 任何分布的定量数据 不完全资料(开口资料):没有确切最大值或最小值的资料 当n为偶数时 当n为奇数时 统计指标描述---集中趋势 中位数计算 离散型变量:直接法 连续型变量:借助频数分布表 以组中值代替公式中的X 计算公式 LM中位数所在组下限;iM中位数所在组的组距;fM中位数所在组的频数; 中位数所在组前一组的累积频数 离散程度的描述---极差和四分位间距 极差(range):最大值-最小值 优点:简单明了 缺点:不能反映其它数据的变异 样本量较大时极差也较大 不宜比较 离散程度的描述---极差和四分位间距 百分位数(percentile):位置指标 第x百分位数Px:将所有数据从小到大排列后,处于第x百分位置的数值。中位数 P50 连续型变量 离散程度的描述---极差和四分位间距 上下四分位数(QU、QL): 第25百分位数和第75百分位数 四分位间距P75-P25: 上下四分位数之间的距离,包括了一半的数据,越大表明离散程度越高 描述了50%数据的分布宽度 比极差稳定 离散程度的描述---极差和四分位间距 四分位数范围P25~P75(inter-quartile range) 描述了50%数据分布的宽度 反映分布的位置特征 离散程度的描述---方差和标准差 方差variance :适用于对称分布的资料 总体方差 样本方差 离均差平方和:描述每个数据X相对于 分布的集中程度;与样本含量n有关,样本含量不同时不宜直接比较 离散程度的描述---方差和标准差 方差:相当于平均每个数据的离均差的平方;可用于不同样本含量数据离散度的比较。 自由度(degree of freedom):当 选定时n个X中能自由变动的X的个数 离散程度的描述---方差和标准差 标准差(standard deviation) 离散程度的描述 变异系数coefficiedt of variatlion CV=标准差/均数×100% 描述了数据的变异相对其平均水平的大小 描述的是相对离散度 无单位量纲 比较度量衡单位不同资料的变异度 比较均数相差悬殊资料的变异度 离散程度的描述---分布形状 偏度系数g1:定量描述分布的偏态; 是两个同样单位的比,无量纲; 系数的绝对值描述分布的偏斜程度 g1=0,分布对称; g1>0 分布正偏;g1<0分布负偏 峰度系数g2:描述分布的尖峭程度 是两个同样单位的比,无量纲; g 2=0 ,正态峰;G2>0尖峭峰;G2<0平阔峰 小 结 集中趋势指标:不同分布情况下,描述指标的选择 离散趋势指标:各个指标的应用和特点 如何从集中趋势和离散趋势两个角度对数据进行合理的描述 STATA命令 等距分组频数图(例2.1) use 光盘符:\例题\ex2-1 打开数据库文件ex2-1.dta gen f=int((x-110)/2)*2+110 产生用以作频数表的新变量“f” tab f 对变量“f”作频数表 graph f,bi

文档评论(0)

cynthia_h + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档