第二篇单变量描述统计.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 单变量统计描述 一、基本技术 二、集中趋势测量法 三、离散趋势测量法 四、正态曲线 第一节 基本技术 一、定类层次 二、定序层次 三、定距层次 一、定类层次 适用于简化一个定类变量资料的方法包括: 次数分布、比例、比率、图示和对比值。 1、次数分布,即频数 次数分布(Frequency distribution): 变项内每一个值的原始资料出现多少次。用f表示。 例:甲乙两校学生父亲的职业(第36页) 表1 两个社区中违法者和非违法者的频数 研究对象 社区1 社区2 违法者 初犯者 58 68 屡犯者 43 137 非违法者 481 1081 总 和 582 1286 2、比例 将每类的次数(f)除以总数(N),公式P=f/N 3、比率(百分比) 把计算比例时所用的基数变大为100,即每一百有多少。 比率的公式为 百分率:f/N?100 千分率:f/N?1000 万分率:f/N?10000 关于比率(百分比)的例子 两条重要原则 (1) 一定要在百分数或比例的旁边列出个案的数目。 (2) 只有在百分数基数(分母)的个案数目达到50左右,才使用百分数。如果个案数目很少,最好直接用每个类别的个案数目。 4、对比值 例:某地总人口中有28600名男性和23500名女性 则性别对比值:男性人数:女性人数=28600:23500=1217:1000 5、 图示法 以图形来简化资料。 定类资料使用较多的有 条形图和圆形图。 (1) 条形图 以长方形的长度来表示次数或百分率的多少,宽度没有意义。长方形之间可以分开(也可以不分)。 例:某地区人口构成:干部110人,工人152人,农民288人,总数550 三者百分比的条形图 (2)圆形图:把一个圆形平面按数值的比例分割@。 农民360?52.4%=188.64? 工人360?27.6%=99.36? 干部360?20.0%=72? 二、定序层次 以上基本技术,如次数、比例、比率、对比值、长条图和圆形图等,也可以用于简化定序资料。 适用于定序层次而不可用于定类层次的,有累加次数和累加百分率。 1、累加次数 累加次数就是把次数逐级相加起来,分为两种; 向上累加(cf?) 向下累加(cf?) 作用:容易知道某值以下(或以上)之次数总和。 向上累积(cf?)表示由低层向高层累加,如下表五级 ? 一级;向下累积(cf?)表示由高层向低层累加,如下表一级 ? 五级@ 2、累加百分率(%) 将各级的百分率数值逐渐相加 三、定距层次 以上方法对定距层次的变量都适用。 但定距层次的变量在使用这些方法时必须先进行分组,由具体数字转化为区间。 例:某校学生家庭每月总收入(p41)@ 直方图 直方图:又称矩形图,以一个矩形的面积(长?宽)表示每组数值的次数或百分率的多少。 与条形图的不同:条形图的宽度没有意义。直方图的长度与宽度均有意义;直方图各个矩形要相连排列,条形图可以分开。 直方图的绘制 以坐标横轴的宽度表示组距,以纵轴的长度表示频次密度, 二者乘积为该组的次数。 频次密度=频次/组距 等距分组的情况下,可以用频次作为长条的长度。 多角线图 多角线图:把各个矩形顶端的中点用直线连结起来,其作用是使各组的次数(或百分率)的分布情况更显而易见。 组距的大小,会影响线条的平滑程度,组距愈小,线条就愈平滑。 第二节 集中趋势测量法 含义:找出一个数值来代表变项的资料分布,以反映资料的集中情况。 意义:根据这个代表值来估计或预测每个研究对象的数值。 常用指标:众值、中位值、均值 一个人到某公司求职,经过调查,得出关于该公司工资的一些数据,如果是你,应该如何选择? 关于集中趋势的小故事: 吉斯莫先生有一个小工厂,生产超级小玩意儿。 管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由5个领工和10个工人组成。工厂经营得很顺利,现在需要一个新工人。 现在吉斯莫先生正在接见萨姆,谈工作问题。 吉斯莫:我们这里报酬不错。平均薪金是每周300美元。你在学徒期间每周得75美元,不过很快就可以加工资。 萨姆工作了几天之后,要求见厂长。 萨姆;你欺骗我!我已经找其他工人核对过了,没有一个人的工资超过每周100元。平均工资怎么可能是一周300元呢? 吉斯莫:啊,萨姆,不要激动。平均工资是300元。我要向你证明这一点。 吉斯莫:这是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六个亲戚每人得250元,五个领工每人得20

文档评论(0)

0520 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档