- 1、本文档共53页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
02定量资料的统计描述课件
定量资料的统计描述 Descriptive of Quantitative Data 定量资料的统计分析 例:100名HIV阳性男子的年龄(岁) 内 容 一、频数分布表与频数分布图 二、集中趋势的描述 三、离散趋势的描述 四、描述分布形态的特征数 1. 频数表的概念 频数(frequency):将资料的观察值按组段分组,各组段所包括的变量值个数。 频数表(frequency table):描述各组段及相应频数分布的统计表称为频数分布表,简称频数表。 2. 频数表的编制 求极差 R=Xmax-Xmin 划分组段 统计各组段内的数据频数 频率与累计频率 表1. 100名HIV阳性男子年龄的频数分布表 3.频数分布图 连续型变量的频数分布常用直方图(histogram)表示,以直方的面积表示频数大小。常用的直方图分为: 等距分组 不等距分组 图1. 100名HIV阳性男子年龄的频数分布图 3.频数表的用途 揭示频数分布特征 集中趋势 离散趋势 揭示资料的分布类型 二、定量变量的特征数(集中趋势与离散趋势) (一)集中趋势 算术均数 几何均数 中位数 众数 调和均数 1.算术均数(均数)Mean 计算: 直接法(小样本): 算术均数 当资料呈正态分布时,均数位于分布的中心。 每个观察值都加一个常数a,则均数为原均数加常数a;每个观察值都乘以一个常数b,则均数为原均数的b倍。 2.几何均数:Geometric mean 计算 直接法: 几何均数的应用 等比资料的统计 对数正态分布资料 注意: 观察值不能为0 观察值不能同时包含正、负值 例:某村某年的家庭总收入分布图 3.中位数 Median 定义:将一组观察值从小到大排序后居于中间位置的那个数值 计算: 离散型变量 当n为偶数时: 连续型变量: 中位数的应用 中位数可用于描述任何分布类型计量的集中趋势,但对于正态分布或近似正态分布的资料,中位数不利于进一步的统计分析,故对正态分布或近似正态分布资料应首选均数描述其集中趋势。 中位数适用于描述偏态分布资料、一端或两端无确定数据的资料和分布不明资料的集中趋势。 百分位数 percentiles 4.众数 Mode 出现次数最多的数值。 适用范围: 非连续性 连续性 三、离散趋势的描述 1、极差:Range 极差=最大值-最小值 优缺点: a. 计算简便,易于理解。 b. 除最大值和最小值外,不能反映组内其它数据的变异度。 c. 样本例数悬殊时不宜比较其极差。 d. 极差的抽样误差较大,不够稳定。 2. 四分位数间距 Interquartile range 四分位数间距: (Q)=QU(P75)-QL(P25) 优缺点: 包括了全部变量值中居于中间水平的一半,比极差稳定。 仍未考虑到每个观察值的变异度。 极差与四分位数间距的应用 极差与四分位数间距可用于描述计量资料的离散程度,但都比较粗略。 四分位数间距较极差稳定。 极差和四分位数间距用于描述偏态分布资料。 3、方差和标准差 variance and standard deviation 方差是每个观察值与总体均数离差的平方的平均值,可以较全面的反映该组资料的变异情况,方差的单位是原始数据单位的平方。 将方差开方即得标准差。标准差与原始数据的单位相同,描述了个体值间的变异。 样本方差与总体方差分别用S2和σ2表示。 标准差:Standard Deviation 标准差的计算: 直接法: 标准差的应用 a:表示观察值的变异程度 b: 结合均数描述正态分布特征 c: 结合均数计算变异系数 d: 结合样本含量计算标准误等 标准差的特性 标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。 如果各观测值加上或减去一个常数a,标准差不变。 当每个观测值乘以或除以一个常数b,则标准差是原标准差的b倍或1/b倍。 4、变异系数Coefficient of variation CV 公式: 表2:描述指标的选择 四、描述分布形态的特征数 偏度系数: 理论上总体偏度系数为0时,分布是对称的; 取正值时,分布为负偏峰; 取负值时,分布为正偏峰; 峰度系数(coefficient of kurtosis,KURT) 理论上,正态分布的总体峰度系数为0; 取负值时,为平阔峰; 取正值时,为尖峭峰。 常用统计图表 统计表的结构:一个完整的统计表由四个部分组成:标题、标目、线条和数字。有时还有文字说明和备注。 统计表的种类:统计表可分为简单表(simple table)和组合表(combinat
文档评论(0)