网站大量收购独家精品文档,联系QQ:2885784924

绪论定量资料描述.pptVIP

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
绪论定量资料描述

3.方差(variance):是标准差的平方,表示一组变量值的平均离散程度。方差越大,离散程度越大。 方差是最常用的指标 4.变异系数(coefficient of variation, CV ) CV: 单位不同,均数相差悬殊 S : 单位相同,均数相近才能用标准差比较 例子,体重和身高相比较,单位不一样,标准差的大小也变了,所以单位不一样,没有可比性,比如身高单位是米,厘米。毫米。比较结果是不一样的 例子二,婴儿和成人的体重的比较,用标准差的话,本来二者均数就不在一个水平线上,即均数不一样,就算单位相同也没有可比性,用变异系数的话,除以了均数,抵消了它的区别。 5.四分位数间距(quartile interval,Q):P75、P25分别表示第75百分位数和第25百分位数。 P75为上四分位数,%75的数比他小,%25的数比他大 Q= P75-P25(反应的是中间%50数据的变异程度,中间这部分数据是 稳定的,所以适合描述偏态分布资料) 注:主要用于偏态分布资料离散程度的描述。最适合的就是四分位数间距 概论 1.总体:总体是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种变量值的集合。 2.样本:样本是从总体中随机抽取部分观察单位,其实测值的集合。所谓随机抽取亦就是总体中每一个观察单位都有同等可能性被抽到,随机抽样的目的是为了减少偏性,使样本对总体有代表性 。在实际工作中经常从总体中抽取样本,目的是用样本信息来推断总体特征(即统计推断)。 3.概率:概率是描述随机事件发生的可能性大小的数值,常用P表示。所谓随机事件,亦就是在一定条件下,可能发生也可能不发生的事件。随机事件的概率在0与1之间,即0≤P≤1,常用小数或百分数表示。P越接近1,表明某事件发生的可能性越大,P越接近0,表示某事件发生的可能性越小。 小概率事件:当一个事件的概率P≤0.05或P≤0.01时,称为小概率事件。小概率事件表示某事件发生的可能性很小,在一次试验中基本上是不会发生的。 4.资料的类型: (1)数值变量 又称为定量资料或计量资料,其变量值是定量的,表现为数值大小,一般有度量衡单位。 (2)分类变量 又称为定性资料,其变量值是定性的,表现为互不相容的类别或属性。有两种情况: 无序分类 包括变量值取无等级顺序的二项分类或多项分类。 有序分类 又称为等级资料,各类之间有程度的差别,给人以“半定量”的概念,即定性变量的变量值取有等级顺序的几类。 5.误差: (1)抽样误差 是由于抽样原因引起的样本指标与总体指标间的差别。 (2)随机测量误差 (3)系统误差 (4)过失误差 抽样误差和随机测量误差是不能避免的,但可控制。系统误差和过失误差是可以避免的。 6.统计工作的基本步骤 (1)设计 (2)搜集资料 (3)整理资料 (4)分析资料 定量资料的统计描述 一、频率分布表与频率分布图 二、描述集中趋势的统计指标 三、描述离散趋势的统计指标 一、定量频数表的编制 1、求极差(全距) ? R=最大值-最小值 ? = 4.2-2.5=1.7 ? 2、求组距(i) 初定组数=10 ? i=极差/组数= 1.7/10=0.17≈0.2 3、分组段 原则:第一组段包括最小值,最后组段包括最大值。 每一组段都有上限和下限 下限:组段的起点(最小值) 上限:组段的终点(最大值) 频数表的用途: 1、揭示资料的分布特征和分布类型 2、便于进一步计算指标和统计分析 3、便于发现特大或特小的可疑值 对称分布 偏态分布 正偏态 负偏态 二、频数分布图 一、分布类型 正态分布:集中位置居中,左右两侧频数基本对称的分布。常见近似正态分布。 偏态分布:集中位置偏向一侧,频数分布不对称的分布。 特点:有极端的数据。 二、统计描述 统计描述包括两个方面:集中趋势的描述 和离散趋势的描述 跟总体有关的叫参数,希腊字母表示。 跟样本有关的叫统计量,用英文字母表示 集中趋势指标:均数,几何均数,中位数 离散趋势指标: (一)集中趋势指标描述 1.算术均数(均数 mean) 适用于正态分布或者近似正态分布 总体均数:?;样本均数: 2.几何均数(geometric mean) 常适用于一种特殊的偏态分布资料:等比资料(如10,20,40,80.)或对数正态分布资料(常见于抗体滴度)(原始数据是偏态,原始数据取了对数之后,对数值成为正态分布)。 3.中位数(median,M) 主要适用于偏态分布资料。中位数是指将一组变量值从小到大排列,位次居中的变量值。 描述偏态的是

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档