- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3.3 数据分组 3.3.1 统计分组 3.3.2 品质分组 3.3.3 数量分组 3.3.4 累积频数分布 3.3.1 统计分组 统计分组:根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,了解数据分布的规律和特征 标志:总体各单位普遍具有的属性或特征 统计分组的原则: 穷尽原则:分组对象的每个单位都应该有组可归。 互斥原则:任何一个单位只能属于某一组,而不能同时或可能归属于几个组 分组的方法:品质分组和数量分组 3.3.2 品质分组 1. 列出各品质 ? ? ? ? ? ? ? ? ? ? 2. 计算各品质的频数 3. 制作频数分布表 4. 用图形显示数据 分类 频数 比例 A B C D E (基本过程) 频数(frequency) :落在各品质中的数据个数 比例(proportion) :某一品质数据占全部数据的比值,一般用百分比来表示%. 【例】一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次 。下边就是记录的原始数据 (例题分析) 绿色 健康饮品 不同品牌饮料的分组表 饮料品牌 频数 比例 百分比(%) 可口可乐 旭日升冰茶 百事可乐 汇源果汁 露露 15 11 9 6 9 0.30 0.22 0.18 0.12 0.18 30 22 18 12 18 合计 50 1 100 3.3.3 数量分组 分组方法 等距分组 异距分组 单变量值分组 组距分组 单变量值分组 1. 将一个变量值作为一组 2. 适合于离散变量 3. 适合于变量值较少的情况 组数太多不便于观察数据 分布的特征和规律 例: 教科书p22页表2-2 ? ? ? ? 某社区家庭户拥有孩子数情况表 孩子数(个) 户数 比例(%) 0 150 30 1 200 40 2 100 20 3 50 10 合计 500 100 组距分组 将变量值的一个区间作为一组 适合于数据较多的离散型变量和连续变量 上限不在内原则 可采用等距分组,也可采用不等距分组 ? ~ ? ? ~ ? ? ~ ? ? ~ ? ? ~ ? 离散型数据 某村庄家庭户拥有孩子数情况表 孩子数(个) 户数 比例(%) 0~1 150 30 2~3 200 40 4~5 100 20 6个及以上 50 10 合计 500 100 连续型数据(等距分组) 某工厂工人完成生产定额情况表 工人按完成生产定额分组(%) 工人数 (个) 比例 (%) 80-90 30 16.7 90-100 40 22.2 100-110 60 33.3 110-120 30 16.7 120-130 20 11.1 合计 180 100.0 上限不在内原则 不等距分组 某地区人口分布情况 人口年龄分组 人口数(万人) 1岁以下(婴儿组) 1-7岁(幼儿组) 7-17岁(学龄儿童组) 17-55岁(劳动力人口组) 55岁以上(老年组) 1 6 12 24.6 8.1 合计 51.7 组距分组(步骤) 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按 Sturges 提出的经验公式来确定组数K 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 统计出各组的频数并整理成频数分布表 组距分组几个概念 1. 下限:一个组的最小值 2. 上限:一个组的最大值 组距 :上限与下限之差 连续型:组距=本组上限 – 本组下限 离散型:组距=本组上限 – 前组上限 4. 组中值 :下限与上限之间的中点值 开口组的组距是以相邻组的组距为本组的组距 累积频数(cumulative frequencies):各分组频数的逐级累加 累积频率(cumulative percentages):各分组频率(百分比)的逐级累加 只适合于定序尺度以上的数据 3.3.4 累积频数分布 * * * * * * * * * * * * * * * * * * * 数据整理与展示 3.1 数据的录入 3.2 数据的预处理 3.3 数据分组(重点) 3.4 统计表和统计图 3.1 数据的录入 3.1.1 纸制统计表 3.1.
文档评论(0)