- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
 - 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
 - 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
 
                        查看更多
                        
                    
                第一讲-2-统计资料的整理与描述7.14分析
                    描述离散趋势的指标:四分位数间距 四分位数间距(inter-quartile range)      QU  - QL   =  P75 - P25      即中间一半观察值的极差。 	四分位数(quartile)是两个特定的百分位数:第25%分位数P25,和第75%分位数P75,分别记为QL和QU。      四分位数间距较全距稳定,常与中位数一起,描述不对称分布资料的特征。  * 25% 25% 25% 25% 排序数据:按从小到大顺序排列 M QL QU inter-quartile range Q2 Q1 Q3 * 描述离散趋势的指标:方差 方差(variance)                            * 描述离散趋势的指标:标准差 标准差(standard deviation, sd)                 “离均差平方之和 平均后的方根”     “均方根” n-1 称为自由度 (degree of freedom) ,即“可以自由变异的程度” 因为任一离均差均可以用另外n-1个离均差表示,所以“只有n-1个独立的离均差”。 * 标准差 标准差大:分布分散、不整齐、波动大; 标准差小:分布集中、整齐、波动较小。  * 三组同性别、同年龄儿童的体重(kg) 甲组   26   29   30   31   34      乙组   24   27   30   33   36      丙组   26   28   30   32   34                  极差         方差       标准差 甲组      8 	          8.50 	     2.92 乙组     12          22.50	     4.74 丙组      8           10.00	     3.16 * 描述离散趋势的指标:变异系数 变异系数(coefficient of variation, CV)  排除了平均水平的影响,并取消了单位。因此变异系数常用于:  比较度量衡单位不同的两组或多组资料的变异度 比较均数相差悬殊的两组或多组资料的变异度  * 不同指标间变异度的比较 * 正确应用(1) 算数均数:适用于单峰对称分布资料; 几何均数:适合于作对数变换后单峰对称分布资料; 中位数和百分位数:适用于任何分布的资料; 中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定; 中位数在抗极端值的影响方面,比均数具有较好的稳定性,但不如均数精确。 因此,当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。 不同质的资料应考虑分别计算平均数。 * 正确应用(2) 极差不稳定,不灵敏 标准差的基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、总结地、平均地描述了变量值的离散程度。 在同质的前提下,标准差大表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;反之,标准差小表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。 变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并消除了单位。 * 平均数与变异度 均数±标准差 中位数±四分位数间距 变异度小,则均数代表性好! 变异度大,数据分散,则均数代表性差! 平均数所表示的集中性与变异度所表示的离散性,从两个不同的角度阐明定量资料的特征! * 总     结 每个观察指标均有其特定的变异规律; 描述变异: 图形描述 统计量描述 平均数:均数、几何均数、中位数和百分位数 变异度:极差、方差、标准差、四分位数间距、变异系数  不同分布的指标,用不同的统计量描述; 用平均数与变异度共同描述。 * 集中趋势的描述指标小结 * 离散程度的描述指标小结 * 239人发汞含量的频数分布 70     3   5   7   9   11   13   15   17   19   21   10   20   30   40   50   60   0   1   发汞含量(?mol/kg) 人 数 * 某市892名老年人生存质量自评分频数分布  0   10   20   30   40   50   60   70   80   90   100   100   200   300   0   400   自评分 人 数 *  102名黑色素瘤患者的生存时间频数分布  0   5   10   15   20   25   30   35   40   45   0           1 0 2 0 3 0 4 0   生存时间(月)  人 数 * 某地某年10000例死亡者年龄分布  死亡年龄(岁) 人 数 0   10   20   30   40   50   6
                
原创力文档
                        

文档评论(0)