- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 统计描述统计分析统计描述计算描述数据特征的指标来反映数据的规律统计图、统计表反映数据规律是统计推断的基础统计推断用样本信息来推论总体信息第一节 频数分布数据分析的第一步是:了解数据分布范围、集中位置、分布形态等特征频数:某个测量值的个(例)数。频数分布表(frequency distribution table): 又称频数表,是将原始数据进行适当分组后得到各组的频数而形成的表格。 编制方法:手工、软件(如SAS、SPSS等)一、计量资料的频数分布 例4-1 1998年某山区96名孕妇产前检查次数资料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…,4,7等共96个数值制作要点:分别清点每一种取值的个数;也可以将尾部的多个取值作为一个组进行计数。本例编制频数表如下:表4-1 1998年某地96名妇女产前检查次数分布检查次数频数频率(%)累计频数累计频率(%)(1)(2)(3)(4)(5)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.551212.596100.0合计96100 例4-2 抽样调查某地120名18岁~35岁健康男性居民血清铁含量(μmol/L),数据如下:7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.52手工编制频数表步骤:(1)找出最小值和最大值(2)计算最大值与最小值之差 R = 最大值-最小值 = 29.64-7.42 =22.22(μmol/L)(3)确定组段数与组距: 组段数一般可在10~15之间选择。 组距= R /预计的组段数。 本例如果预计取12个组段,则组距长度约为22.22/12=1.85,取整数2。(4)列表划记 列出组段,要求第一组包括最小值,最后一组包括最大值;各组段不能重叠,故每一组段均为半开半闭区间。6~表示[6,8)。最后一组应写出上限和下限。最终经过整理的频数表用图形表示—直方图(histogram)二、计数资料及等级资料的频数分布表直接清点每种类别或属性的频数,整理成表格如:100名大学生性别的频数分布性别频数频率(%)男8040.0女12060.0合计200100.0三、频数表的用途1、陈述资料的重要形式2、揭示资料的分布类型3、描述集中位置和离散程度4、发现数据中的离群值四、频数分布特征及类型1、频数分布的两个特征:集中趋势离散趋势2、频数分布的类型: 对称分布 偏态分布: 集中位置偏向小的一侧叫正偏态,反之叫负偏态第二节 计量资料的统计描述 请问:以下两组同学的成绩是否相同?甲组5060708090乙组6065707580从集中位置和离散程度(变异大小)两个方面进行描述一、描述集中趋势的统计指标通常以集中位置来描述集中趋势,也称为位置度量指标(measures of location);常用的位置度量指标有: 算术均数 几何均数 中位数 表示符号: ?(mu,总体) (x-bar,样本)1、算术均数(arithmetic mean,简称均数,mean)适用范围:适合描述对称分布资料的集中位置(也称为平均水平)。 计算公式:(1)直接法:例4-3 测得8只正常大鼠血清总酸性磷酸酶(TACP)含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其
文档评论(0)