- 1、本文档共35页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 数据整理---数据分组 统计数据的分组分组是将总体所有单位按一定的标准区分为若干部分分组的目的:概括数据,清晰条理如何分组?将具有共性的个体归入同一组 将总体内部个体间的差异通过组别区分开来统计数据的分组品质数列是按现象的性质、类别标志进行的分组。例如人口按性别和民族分组;时间数列按时间发生的先后顺序分组。例如我国解放后各年的人口数字;GDP变量数列是按某一数量标志大小顺序进行的分组。例如某企业按工资收入的多少分组;空间数列是按不同地区标志进行的分组。例如人口按省、市、自治区分组;次数分配数据观察值在各组中的个数称为次数,各组间的次数称为次数分配。次数分配描述了总体的结构和特征。例如:某企业非熟练工人的周工资额(元)如何分组?变量次数分配的编制1、将原始资料顺序排序2、将各个数据按其数值大小归入相应的组内3、确定组数与组距4、确定组限如果数据分布比较均匀、对称,即中间数值次数多,大小极端值次数少,考虑用以下公式来确定组数:组数=1+3.322 log n组距=(观察值中的最大数值-观察值中的最小数值)/组数 分组计算组数=1+3.322 log n =5.9(n=30) 分6组组距:每组区间的宽度 =(观察值中的最大数值- 观察值中的最小数值)/组数 =(128-84)/6=7.3分6组,组距8排序: 84,85,87,91,91,94,95,96,97,99,101,101,103,103,105,105,105,106,106,106,106,107,107,109,110,111,111,118,119,121,128分6组,组距8每周工资(元)人 数(个)各组人数占总人数百分比(%)84~9251792~100517100~1081240108~116413116~124310124~13213 合计30100 结合实际数据一、比较计算组距值(7.3),组距为10比较好计算且方便,二、分组的组数相应从6减少为5。最小值为84,下限从80开 始, 分5组,组距10 每周工资(元)人数(个)各组人数占总人数百分比(%)80~9031090~100723100~1101343110~120517120~13027 合计30100分两组 工资收入次数分配表 工资收入分组次数8013017合计30反映不出观察值分布特征分组太细会出现什么问题? 不等距分组 在不等距分组情况下,要比较各组次数或分析总体结构,要消除由组距不等造成的影响。为此需计算单位组距的次数,即频数密度。 每组单位组距次数=某组次数/该组组距不等距分组人口按年龄分组人口数(万人)频数密度(万人)1岁以下221~7岁12.22.037~18岁242.1818~25岁14.82.1125~55岁34.21.1455岁以上16.30.54合计103.5-- 组限分类重叠组限:“100~200”,“200~300”间断组限:“100~199”,“200~299”开口组:“100以下”,“500以上”应用范围:离散变量可采用间断组限,亦可采用重叠组限;连续变量应采用重叠组限;数据资料中若有极端值应采用开口组. [注]重叠组限计数时应遵循“上组限不包括在内原则。组中值的计算 组中值=(下限+上限)/2 若遇开口组的资料,其开口组的组限一般按其相邻组的组距计,例 某生产车间50名工人日加工零件数如下(单位:个)。试对数据进行组距分组。1171081101121371221311181341141241251231271201291171261231281391221331191241071331341131151171261271201391301221231231281221181181271241251081121351211.将数据排序 107, 108, 108, 110, 112, 112, 113, 114, 115, 117, 117, 117, 118, 118, 118, 119, 120, 120, 121, 122, 122, 122, 122, 123, 123, 123, 123, 124, 124, 124, 125, 125, 126, 126, 127, 127, 127, 128, 128, 129, 130, 131, 133, 133, 134, 134, 135, 137, 139, 1392.确定组数及组距组数=1+3.322lg50=6.64≈7组距=(139-107)/7=4.6 ≈53.确定组限 最小值为107,以105为第一组下限。采用重叠组限. 某车间50名工作日加工零件数分组表按零件数分组频数(人)频率(%)105-110110-115115-120120-125125-1301
您可能关注的文档
最近下载
- 简易钢楼梯设计.doc VIP
- 【钢梯大样图】简易钢楼梯做法详图.pdf VIP
- 学科教学三种境界.ppt
- 中频感应电炉培训教材.ppt
- 第5.2课《学习工匠事迹,领略工匠风采》(课件)-【中职专用】高二语文同步精品课件(高教版2023·职业模块).pptx
- 铁路机车驾驶人员资格认证-HXN5型内燃机车专业知识考试题库(含答案).docx
- 初中数学项目化活动设计项目化学习活动作业方案案例设计.pptx VIP
- 初中数学项目化学习活动作业方案案例设计.pptx VIP
- 第5.2课+学习工匠事迹+领略工匠风采(高教版中职语文2023·职业模块).pptx VIP
- 无水印 scratch3.0编程校本课程.docx
文档评论(0)