2单变量描述统计.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2单变量描述统计.ppt

第二章 单变量的描述统计 第一节 基本技术 第二节 集中趋势测量法 第三节 离散趋势测量法 第四节 正态分布与标准值 第一节 基本技术 一、定类变量 1、次数分布(频数分布) 指的是一个变量的各个情况出现的次数。 例如:社会工作0601班学生的性别这一变量的次数分布。一般用表格的形式表示出来,称为统计表。 统计表必须具备:表号(常用表1、表1.1、表1-1形式来表示)、表头(包括标题、时间、地点等)、标识行(变量名称和变量对应数的说明)、主体行(至少2行及以上)、表尾(间接资料写出来源) 表2-1 社会工作0601班学生的性别分布 2、比例 f/N×100% (常保留小数点后1-2位) 3、对比值:即两个数值的对比值。常见的有出生性别比。 出生性别对比值=男性人数:女性人数=118:100 二、定序变量 定类变量的所有的基本技术都可用于定序变量。但图示法有些区别。 1、累加次数(cf) 向上累加次数:将变量的取值按照从低到高的顺序将其频数相加起来。(cf↑) 向下累加次数:将变量的取值按照从高到低的顺序将其频数相加起来。 (cf↓) 即:cf↑表示小于某个取值的累加次数。 cf↓表示大于某个取值的累加次数。 例:甲、乙两同学分别在各自的班里考了80分,两班同学都为N=100,其中, 甲:cf↑=95 乙:cf↑=60 请问:甲、乙两位同学哪个考得更好?(或者:甲、乙两位同学哪位的相对成绩较好?) 解:因为两个班中N均为100,因此只需要对比其向上累加次数即可。甲的向上累加次数为95,表示小于他成绩的同学有95位,即甲为第5名,同理,小于乙同学成绩的班级同学有60位,即乙为第40名,因此甲考得好一些。 例:甲、乙两同学分别在各自的班里考了80分,两班同学都为N=100,其中, 甲:cf↓=95 乙:cf↓=60 请问:甲、乙两位同学哪个考得更好?(或者:甲、乙两位同学哪位的相对成绩较好?) 解:因为两个班中N均为100,因此只需要对比其向下累加次数即可。甲的向下累加次数为95,表示大于他成绩的同学有95位,即甲为倒数第5名,同理,大于乙同学成绩的班级同学有60位,即乙为倒数第40名,因此乙考得好一些。 思考:1、甲、乙的名次各是多少? 思考:2、如果两个班的同学的总数不同呢? 例如:甲、乙两同学分别在各自的班里考了80分,甲所在班的同学为N=100,乙所在班的同学为N=80,其中, 甲:cf↑=60 乙:cf↑=40 请问:甲、乙两位同学哪个考得更好?(或者:甲、乙两位同学哪位的相对成绩较好?) 引入概念: 2、向上累加频率(c%↑):表示低于某一个情况的比例 向下累加频率(c%↓):表示高于某一个情况的比例 c%↑=cf↑÷N ×100%, c%↓=cf↓÷N ×100% 解:甲:c% ↑=cf↑÷N ×100% =60/100 ×100 =60% 乙:c% ↑=cf↑÷N ×100% =40/80 ×100 =50% 根据向上累加频率的含义,又因为60%〉50%,因此甲考得好一些。 三、定距层次 所有可用来分析定类、定序层次变量的分析技术和方法都可用于分析定距资料,除此之外还有简化定距资料的一些技术。如 数据分组 1、连续型变量 表示法一:下图为某班同学身高分布 组距:上限-下限 组中值 =(上限+下限)÷2 对于此类统计表,上限不包括在本组内。 思考:请计算以上各组的组中值和组距。 缺上限的开口组组中值:下限+ 缺下限的开口组组中值:上限- 表示法2 其特点在于下一组的下限与上一组的上限不重合。构成一个中间有间断组距排列。计算组距、组中值的方法为先变成表示法1再根据公式计算。 (真实上限、真实下限) 2、离散型变量(计算方法:直接代入公式计算) 思考:面对杂乱分布的原始数据分布,如何进行分组?即:如何确定组数n和组距h? 22,20,18,10,23,35,42,59,36,28,62,33,41,26……(假定共100个数值) 注意:全距R:数据中最大值和最小值之差 R=62-10=52 斯特奇斯公式h= 代入公式,组距h=6.8,取整数,约等于7。组数n=R/h,代入约为8 根据分点精度比原统计数据精度高一位的原则,将数据分为以下8组:9.5-16.5,16.5-23.5,23.5-30.5,30.5-37.5,37.5-44.5,44.5-51.5,51.5-58.5,58.5-65.5 四、图示法 1、

文档评论(0)

zhoujiahao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档