- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 定量资料的统计描述 第一节 频数与频数分布(frequency distribution) 频数分布表,又称频数表,是对样本量较大的资料进行统计描述的常用方法。 通过频数表可以显示数据分布的范围与形态。 直方图 频数分布的类型 对称分布 偏态分布 正偏态: 负偏态: 第二节 集中趋势指标 集中趋势指标用于描述一组同质计量资料的集中趋势或反映一组观察值的平均水平。常用的平均数有算术均数、几何均数及中位数三种。 一、算术均数(mean) 算术均数简称平均数或均数。 X表示变量X的样本均数,?(希腊字母)表示总体均数。 均数适用于对称分布资料,正态或近似正态分布资料。 计算方法 直接法:当样本含量n较小时,可选用此法。设有n个观察值,分别为X1,X2 ……,Xn,均数的计算公式为: 例 1.10名12岁男孩身高(cm)分别为125.5,126.0,127.0,128.5,147.0,131.0,132.0,141.5.122.5,140.0。求平均数。 加权法:当样本含量n较大时,一般将观察值分组,列出频数表,再用加权法计算均数。其计算公式为: 二、几何均数(geometric mean,G) 几何均数用G表示。适用于对数正态分布资料或等比资料,例如抗体的平均滴度和平均效价。 计算方法: 直接法:样本含量n较小时,选用此法。有n个观察值X1, X2,……Xn,几何均数的计算公式为: 上式计算时需作连乘,还要开n次方,比较麻烦,一般采用对数形式计算。 例.6份血清抗体滴度为:1:2,1:4,1:8,1:8,1:16,1:32,求平均数。 102名健康人的钩端螺旋体血清抗体平均滴度 三、中位数(median,M) 将一组观察值从小到大按顺序排列,位次居中的观察值就称中位数。用M表示。 中位数适用于任何一种分布的计量数据,一般多用于描述偏态分布或数据一端无界资料的集中趋势。 计算方法 直接法:样本含量n较小时,可根据下式计算: 某病患者5人潜伏期分别为2,4,6,7,20,求中位数。本例n=5,为奇数 频数表法:样本含量n较大时计算中位数可用频数表法。将观察资料归纳成频数表,计算累计频数,按下式计算。 107名正常人尿铅含量分布 附:百分位数(PX) 百分位数是一种位置指标,用PX表示。对总体来说,它表示总体中数值小于PX的个体恰有X%;对样本来说,它表示按照升序排列的数列里小于PX的个体恰占X% 百分位数是一个有序数列百等分的分割值。第50百分位数(P50)也就是中位数,中位数是一个特定的百分位数。 计算公式: 第三节 离散趋势指标 两组计量数据如下,分析其分布特征。 甲组:98,99,100,101,102 乙组:80,90,100,110,120 两组数据的均数都是100,说明集中趋势相同。但两组数据的分布特征不尽相同,5个数据间的参差不齐的程度不一样。甲组数据的变化范围较小,而乙组数据的变化范围较大,即两组的离散度不同,离散度是一个非常重要的统计指标。 一、全距(range,R) 亦称极差,用R表示,是一组观察值中最大值与最小值之差,反映个体差异的范围。全距大,说明变异度大;反之,说明变异度小。如上例中甲组全距为4,乙组全距为40,表明乙组变异度大。 但全距除了最大值和最小值之外,不能反映组内其它数据的变异度;易受个别数据的影响,稳定性较差,抽样误差较大,而且还受n大小的影响,平均起来,n越大,全距越大。 二、四分位数间距(quartile range,Q) 四分位数间距是两个特定的百分位数之差,用Q表示 Q=QU-QL=P75-P25 适用于任何分布的计量资料,尤其适用于偏态分布的资料(不宜用标准差表示离散度) 四分位数间距比全距稳定,但仍然未考虑到每个观察值的变异。 三、方差与标准差 方差(variance) 为了消除观察值的总个数N的影响,将离均差平方和除以N,这就是总体方差,用σ2表示。 方差的单位是原度量单位 (如kg)的平方,把总体方差开平方,这就是总体标准差,度量单位与原始观察值一致,即 实际工作中经常得到的是样本资料,总体均数?是未知的,只能用样本均数X代替?。这样用 代替 ,用样本含量n代替N,所得的结果比σ偏小。英国统计学家W.S.Gosset提出用n-1代替n,求得样本标准差更接近总体标准差σ,样本标准差用S表示,公式为: 计算两组数据的标准差 甲组:n=5, ΣX=98+99+100+101+102 =500 ΣX2=982+992+1002+1012+1022=50010 乙组:n=5,ΣX=500,ΣX2 =51000 加权法 已知Σf=110,ΣfX=19000,需要在该表中增加fx2栏,由第(3)、(4)栏
您可能关注的文档
最近下载
- 基坑支护内支撑梁拆除施工方案.docx VIP
- 最新人教版一年级上册《数学游戏》课件(整套)教学PPT(2024年秋-新教材).pptx VIP
- 最新人教版一年级数学上册《数学游戏》教学课件(整套)PPT(2024秋-新教材).pptx VIP
- GBT6058-2005 纤维缠绕压力容器制备和内压试验方法.pdf
- GB╱T 23711.1-2009 氟塑料衬里压力容器电火花试验方法.pdf
- 7m焦炉推焦车的结构特征.pdf
- 研发领料单模板.docx VIP
- 辽宁省技工学校审批表.doc VIP
- GB 26501--2011 氟塑料衬里压力容器 通用技术条件.pdf
- 施工放样报验单.doc VIP
文档评论(0)