- 1、本文档共91页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二讲 定量资料的统计描述 主要内容 频数分布表和频数分布图 集中位置的描述 离散程度的描述 正态分布及其应用 频数与频数分布 频数与频数分布 频数:某个测量值的个(例)数。 频数分布表(frequency distribution table):又称频数表。是将原始数据值适当分组后得到各组的频数,如表4-1频数分布表。 适用样本量较大的资料进行统计描述的常用方法。通过频数表可以显示数据分布的范围与形态。 可用手工和计算机软件(如SAS、SPSS等)方便制作频数表。 表4-3 某地150名正常成年男子红细胞数(1012/L) 1. 频数表的编制步骤 频数与频数分布 离散型定量变量的频数表 某市2005年进行学生体质评价,抽样调查了102名高中男生引体向上完成次数的情况,根据该资料制作频数表。 本次调查资料“引体向上完成次数”是离散型定量变量,所以按变量的取值(次数)为单位分组,再列出各组的频数,如表4.1的第(1),(2)栏,就能得到相应的频数表。将各组的频数除以总频数所得的值称为频率,见第(3)栏。某组的累计频数是该组与前面各组频数之和,见第(4)栏。显然,第一组的累计频数等于其频数,最后一组的累计频数等于总例数;累计频数除以总频数所得的值称为累计频率,见第(5)栏。 频数与频数分布 频数与频数分布 频数与频数分布 手工编制表4.2步骤。 (1)计算全距(range,R),也称为极差 (2)确定组段数与组距:组段数一般可在10~15之间选择。一般当观察值的个数n 在50以下时可分5到8组,n在50以上时可分9到15组,实际运用时应根据分析的要求,灵活确定组数。本例n为120,拟分11组。组距=上限-下限=R/(预计的组段数)。本例如果预计取11个组段,则组距长度可取0.130。两端的组段应分别包含最小值或最大值; (3)列表 做出如表4.2的表格,将选好的组段顺序地列在 (1)列。按照“下限≤x<上限” 的原则确定每一例数据x应归属的组段。 频数与频数分布 频数分布图:在表4.2的基础上,可以绘制出图4.1,称为直方图(频率直方图)。 横轴:男孩的肺活量 纵轴:频率密度,即频率/组距(直条面积等于相应组段的频率)。 在组距相等时,直方图中矩形直条的高度与相应组段的频率成正比。 频数与频数分布 频数与频数分布 对称分布:频数最多的组段在中央,图4.1 正偏峰分布:峰向左侧偏移的分布,右侧的组段数多于左侧,为右偏峰分布。图4.2 负偏峰分布:峰向右侧偏移的分布,左侧的组段数多于右侧,称为左偏峰分布。 图4.3 频数分布表和频数分布图的主要用途 1. 揭示频数分布的特征 两个重要特征:集中趋势(central tendency)和离散趋势(dispersion tendency)。集中趋势是指一组数据向某一个位置聚集或集中的倾向,离散程度则反映的是一组数据的分散性或变异度 2. 揭示频数分布的类型 两种类型:对称型和不对称型 偏态分布:正偏态(positive skew),负偏态(negative skew), 用频数分布表和频数分布图揭示频数分布的类型和特征,便于选用适当的统计方法。 计量资料的常用统计指标 集中位置(central tendency)的描述 平均数(average)是描述定量变量集中位置的特征值,用来说明数据的平均水平,它反映了一组资料的“一般”、“大多数”、“平常”等情况。平均数是一类统计指标的统称,在医学领域中常用的平均数有算术均数(arithmetic mean) 、几何均数(geometric mean)和中位数(median)算术均数:适合描述对称分布资料的集中位置(也称为平均水平)。其计算公式为 计量资料的常用统计指标 1)直接计算法:计算公式为 式中X1,X2和Xn为所有观察值,n为样本含量,∑(希腊字母,读作sigma)为求和的符号。例4.3 利用例4.2的120名9岁男孩的肺活量资料,用直接法计算平均肺活量。 计量资料的常用统计指标 测得8只正常大鼠血清总酸性磷酸酶(TACP)含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其算术均数。 算术均数=(4.20+6.43+2.08+3.45+2.26+4.04+5.42+3.38)/8=3.9075 (U/L) 计量资料的常用统计指标 2)加权频数表法:计算公式为 加权均数 直接法均数=1.672(L) 均数的特性 各观察值与均数之差(离均差)的总和等于零。 各
文档评论(0)