统计研究生1定量资料的统计描述.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数值变量的统计描述 频数分布 集中趋势描述 离散趋势描述 频数分布 频数表 频数表(frequency table) : 相同观察值或观察结果出现的次数称为频数 观察值及其相应的频数按一定顺序排列的表格即频数表 可用手工和计算机软件(如SAS、SPSS等)方便制作频数表。 离散型数值变量的频数分布 例3-1 1998年某山区96名孕妇产前检查次数资料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…,4,7等共96个数值 1998年某地96名妇女产前检查次数分布 频数分布图(frequency graph) 图3-1 连续型定量变量的频数分布 例3-2 从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇( )的测量结果如下,试编制频数分布表。 频数表编制步骤 1. 求极差 : 极差(range)也称全距,即最大值和最小值之差,记作R。 本例: 2. 定组数: 以原始资料变量值个数组段数来确定组数,当n100时,一般定8~10个组,当n≥100时,通常取10~15组,不宜过粗或过细。本例n=100,可将原始资料分为10组。 3. 确定组距(i) : 组距=全距/组数,一般等距分组。 本例组距 4.写组段: 组下限(L):每个组段的起点 组上限(U):每个组段的终点 组 段 2.30~ 2.60~ 2.90~ 3.20~ … 5.60~5.90 5.分组段划记并统计频数 频数表的用途 揭示资料的分布类型和分布特征,为选择适当的统计方法提供依据。频数表不仅便于观察资料频数分布的规律性,而且可根据它绘成直方图(连续变量时)、条图(离散变量时)及计算平均数、标准差等统计量。 展示资料,便于发现某些极大或极小的可疑值。例如,如果在频数表的两端,连续出现几个组段的频数为0后,又出现一个极大值或极小值,这种数值称为可疑值。需要进一步检查和核对,必要时通过统计判断决定取舍。 当样本含量足够大时,频率可以作为概率的估计值。 频数分布图 将各观察值及其相应的频数绘制成图,称为频数分布图(frequency graph)。频数分布图表可以直观地揭示资料的分布特征和分布类型,适用于观察值个数较多的大样本资料。 为直观反映数值连续变量资料的频数表,可利用直角坐标系绘制直方图(histogram),横轴表示观察变量,纵轴表示频数或频率。直方图可以更直观地揭示资料的分布类型和分布特征,为选择适当的统计分析方法提供依据。 频数分布图 频数分布类型 资料的分布类型有对称分布(symmetric distribution)和偏态分布(skew distribution)两种。 如果频数分布集中位置在中间,左右两侧频数大体对称,称为对称分布。. 如果频数分布不对称,集中位置偏向一侧,则称为偏态分布,若集中位置偏向数值小的一侧,称为正偏态分布,又称右偏态; 集中位置偏向数值大的一侧,称为负偏态分布,又称左偏态。 频数分布特征 频数分布有两个重要特征: 一是集中趋势(central tendency),反映一组观察值的中心位置或平均水平; 二是离散趋势(tendency of dispersion),反映观察值之间参差不齐的程度。 集中趋势 (central tendency)的描述 统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平,具有一组变量值的代表值的意义。 常用的平均数有: 算术平均数(arithmetic mean),简称均数 (mean) 几何均数(geometric mean) 中位数 (median) 众数(mode) 一、算术平均数 算术平均数:简称均数(mean) 可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。 1、计算方法 (1)直接计算法(原始资料) 公式 : 式中x1,x2和xn为所有观察值,n为样本含量,∑(希腊字母,读作sigma)为求和的符号。 用直接法计算例2-1某单位101名正常成年女子的血清总胆固醇的均数。 (2)加权法(频数表资料) 公式 : 计算4,4,4,6,6,8,8,8,10的均数? 式中k表示频数表的组段数, 及 分别表示各组段的频数和组中值,第1个组段的组中值为, 余类推,见表的第(3)栏。在这里,频数起到了“权”(weight)的作用,即某个组段频数多,权数就大,其组中值对均数的影响也大;

文档评论(0)

好文精选 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档