统计描述与假设检验.pptx

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 统计描述;第一节 频数分布;一、计量资料的频数分布表 例1 某年某市120名12岁健康男孩身高测量资料;找出全距 即最大值与最小值之差。 全距(R)= 160.9-125.9 = 35 确定组距 为相邻两组段最小值之差。通常以R的1/10进行估计。 组距(i)= 全距(R)/10 = 35/10 = 3.5 可取i =4。 划分组段 每个组段应有一个起始值作为组下限和一个终止值作为组上限; 第一个组段应包括最小值,最后一个组段应包括最大值; 组段数一般取8~15个; 为避免相邻两组段界限互相包含,除最末一个组???外,其余组段只写下限。 整理频数分布 计算各组段频数、累计频数和累计频率。;组 段;;二、计数资料和等级资料的频数分布表 1、计数资料的频数分布表 表2 100名大学生性别的频数分布表;2、等级资料的频数分布表 表3 100名大学生性别的频数分布表;三、频数分布表的作用 1、揭示资料的频数分布特征与类型 (1)频数分布的特征 集中趋势 反映变量值平均的数量水平。 离散趋势 反映变量值相互之间变异的程度。 (2)频数分布的类型 对称分布 集中位置居中,左右两侧的频数基本一致。 非对称分布 集中位置偏向一侧,左右两侧频数不一致。 2、观察离群值 便于发现一些特大、特小的可疑值。 ;第二节 计量资料的统计描述;一、集中趋势的描述 含义 集中趋势是指计量资料中,所有观察值的中心位置。反映一组同质变量值的平均数量水平。 常用指标 算术平均数、几何平均数、中位数;1、算术均数(arithmetic mean) 简称均数(mean),用x及μ表示。 适用范围 变量值呈对称分布,尤其是正态分布的计量资料 计算方法 直接法 变量值个数不多,直接相加除以变量值个数。 加权法 变量值较多或频数表资料。;组 段;2、几何均数(geometric mean, G) 适用范围 变量值呈对数对称分布 等比级数资料 计算方法 直接法 变量值个数不多,直接将其乘积开n次方。 加权法 变量值较多或频数表资料。;抗体滴度;3、中位数(median, M) 一组按大小顺序排列的变量值,位次居中的数值即中位数。 适用范围 变量值呈偏态分布 分布类型不清 变量值的一端(或两端)无确定数值—开口型资料 计算方法 直接法 变量值个数不多。 频数表法 变量值个数较多,先整理频数表。;二、离散趋势的描述 含义 离散趋势是指计量资料所有观察值偏离中心位置的程度,反映一组同质变量值相互之间参差不齐的程度,即离散度或变异度。 常用指标 全距、方差、标准差、变异系数。; 1、全距(range, R) 又称极差,是一组变量值中最大值与最小值的差。 优点 计算简单 缺点 仅考虑了资料的最大值和最小值,不能反映组内其它数据的变异程度。; 2、百分位数(percentile) 含义 又是一个位置指标,用Xp%。它表示在按照升序排列的数列中,其左侧(即小于Xp%侧)的观察值个数在整个样本中所占百分比为p%,其右侧(即大于Xp%侧)的观察值个数在整个样本中所占百分比为(100-p)% 计算 式中:是百分位数,L是所在组段的下限,i是该组段的组距,fp是该组段的频数,n是总频数,∑fl是该组段以前的各组段的累计频数。; 四分位数(quartile) 四分位间距(quartile range, Q) 含义 统计学将3个特殊的分位数X25%、 X50%、 X75%统称为四分位数。 X25%:记为Q1,称作第一四分位数; X50% :记为Q2,称作第二四分位数; X75% :记为Q3,称作第三四分位数; 并且将与差值称为四分位间距(quartile range, Q) 计算 Q= Q3﹣ Q1; 3、方差(variance) 用σ2和s2表示。 离均差的和 离均差的平方和 方差 方差反映变量值变异程度的大小,方差越大,说明变量值的变异程度越大;方差越小,说明变异程度越小。 优点 全面考虑了一组变量值中的每一个数据。 缺点 将变量值的单位进行了平方。;4、标准差(standard deviation, SD) 用σ和s表示。 计算方法 直接法 加权法 标准差反映变量值变异程度的大小,。; 标准差的应用 表示一组变量值变异程度 标准差越大,说明变量值的变异程度越大,即变量值围绕均数的分布较离散,均数的代表性

文档评论(0)

文单招、专升本试卷定制 + 关注
官方认证
服务提供商

专注于研究生产单招、专升本试卷,可定制

版权声明书
用户编号:8005017062000015
认证主体莲池区远卓互联网技术工作室
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0G1JGM00

1亿VIP精品文档

相关文档