第二章 数值变量的描述性统计..pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 数值变量的描述性统计 对于数值变量资料,一般从集中趋势、离散趋势两个方面进行统计描述。而集中趋势和离散趋势又各有许多统计指标。研究资料的频数分布类型是选择合适的统计指标进行统计描述的基础。 第一节 频数分布 一、频数分布表 对一个变量进行重复观察,其中在某取值下出现的次数称作频数(frequency),频数在总的观察例数中所占的比例称作相对频数(relative frequency)。若将频数累积,得到累积频数(cumulative frequency),再计算它在总例数中的比例,即可得到相对累积频数(relative cumulative frequency)。 频数分布表(frequency distribution table)常用来反映各变量取值及其相应频数之间的关系。下面以例2-1的数据说明频数分布表的制作步骤和上述几个频数指标的计算。 例2-l 测得130健康成年男子脉搏资料(次/分)如下,试编制频数表和观察频数分布情况。     75 76 72 69 66 72 57 68 71 72 69 72 73    82 80 82 67 69 73 64 74 58 70 64 60 77    66 77 64 67 76 75 75 71 65 62 76 72 71    60 67 75 75 73 79 66 69 79 78 70 72 70    72 78 72 67 72 80 68 70 61 70 73 72 71    81 70 66 75 71 63 77 74 76 68 65 77 69    77 75 79 64 79 73 76 61 80 64 69 70 73   69 68 65 70 69 66 81 63 64 80 74 78 76   84 66 70 73 60 76 82 73 64 65 73 73 63   80 68 76 70 79 77 64 70 66 69 73 78 76  制作频数表的步骤为:  1.计算极差 观察值中的最大值和最小值之差称为极差或全距(range),常用R表示。本例中最大值为 84(次/分),最小值为 57(次/分),极差 R=84-57=27(次/分)。  2.决定组数、组段和组距 根据研究目的及观察例数确定组段数。若为计算用,组数可适当增多,以减少计算误差;若为显示分布特征,则组段数不宜太多或太少。相邻两组段下限值之差称为组距(class interval)。一般都用等距,且用“极差/组段数”之商最接近的整数值作为组距。本例若分 10个组段,则组距=极差/组段数,即组距为 27/10 ==2.7(次/分),取整数为3,该样本可分为10组。第一个组段的下限应略小于最小值,即取56,最末组的上限要略大于最大值,即取85。 3.列表划记 组段确定后,将原始数据用划记法或计算机计算频数,得到各个组段的频数,见表2-l。 通过对频数分布表的观察,可以看出频数的分布有两个重要的特征:其一为集中趋势(central tendency),脉搏的测量值虽然高低不等,但向中间集中,脉搏次数为中等的人数最多,所占的比例较大;其二为离散趋势(tendency of dispersion)或变异性(variability),即随着脉搏次数逐渐变大或变小,人数越来越少,所占的比例越来越小。利用频数分布表可以全面地了解所研究事物的分布情况。 表2-1 130名健康成年男子脉搏(次/分)的频数分布表 频数分布类型 对称分布(大多为正态分布) 偏态分布(正偏态、负偏态) 其他分布 第二节 集中趋势 平均数(average)是一类用于描述数值变量资料集中趋势的指标。这类指标不但能给人一个简明概括的印象,而且还便于进行事物间的分析比较。统计上的平均数一般包括5种,即算术平均数、几何平均数、中位数、众数以及调和均数。在医学研究上较常用的一般为前3种。通常是根据资料的分布类型选择某种指标反映资料的集中趋势。下面分别介绍常用的集中趋势指标、适用条件和计算方法。 一、算术平均数 算术平均数(arithmetic mean)一般简称为均数,它是一组已知性质相同的数值之和除以数值个数所得的商。总体均数用希腊字母μ(读作/mju:/)表示,样本均数用表示。适用于呈正态或近似

文档评论(0)

wyjy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档