变量数据整理.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
变量数据的整理 回顾:统计整是的概念: 统计整理是指根据统计的研究的目的和任务,对统计调查或科学试验获得的大量原始资料进行科学的分类、汇总,或对已经加工过的资料进行再加工,使之成为系统化、条理化、标准化的能反映总体特征的综合统计资料的工作过程。 注意概念的重点:大量原始资料→分类、汇总→系统化、标准化 变量数据的整理恰恰体现了这样一个工作过程 有一组数据:对某班40名学生某科某次考试成绩按试卷登记得到如下资料: 54 60 62 97 85 52 83 79 95 80 89 85 77 68 86 93 70 81 78 89 71 89 80 85 75 78 90 66 78 73 82 82 99 77 88 84 75 88 76 80 分类整理后得到 某班40名学生成绩情况 由此可以看出变量数据整理的结果 下面介绍如何完成这一过程,只看基本概念。 (一)变量分布数列的概念 变量分布数列:用数理标志进行分组所得到的分布数列。 单项式变量分布数列:若每一组别都是由单个的组值(整数或小数)表示。 如表:某班学生按年龄分组 15 16 16 15 16 17 16 16 17 16 16 17 17 17 16 15 16 17 17 17 经分组 年龄 学生人数(频数) 15 3 16 9 17 8 合计 20 组距式变量分布数列:若每一组都是由数域(区间)表示。 如前面40名学生成绩 由简单到复杂可看 (二)单项式变量分布数列的编制 某生产组20名工人同种产品日产量如下(单位:件) 13 18 15 19 14 17 13 15 17 19 15 17 18 14 16 15 16 17 16 这是一个离散型变量,其变量值不多,变动范围不大,宜编制单项式变量分布数列。 离散性变量(没有小数) 注意这组数据的特点:变量不多(20个) 变动范围不大(13—19) 所以适合编制单项式变量分布数列。 步骤如下: (1)按变量值大小顺序排列: 13 13 14 14 15 15 15 15 16 16 16 16 17 17 17 17 18 18 19 19 (2)每种变量值为一组(重复者只取一个),顺序排列为7组: 13 14 15 16 17 18 19 (3)列入表中并汇总出各组频数,如表所示。 20名工人日产量资料 日产量(件) 工人数(人)(频数) 频率 x f f/∑f 13 14 15 16 17 18 19 2 2 4 4 4 2 2 2/20 2/20 4/20 4/20 4/20 2/20 2/20 合计 20 1 三、组距变量分布数列的编制 组距变量分布数列 等距变量分布数列的编制方法 等距分组:标志值在各组保持相等的组距。 注意特点:变动均匀、没有大起大落 仍看前面例子: 对某班40名学生某科某次考试成绩按试卷登记得到如下资料: 54 60 62 97 85 52 83 79 95 80 89 85 77 68 86 93 70 81 78 89 71 89 80 85 75 78 90 66 78 73 82 82 99 77 88 84 75 88 76 80 步骤如下: (1)将原始数据按顺序排列起来,并确定变量性质。根据上例,对于数据按成绩由低到高排列可得到: 52 54 60 62 66 68 70 71 73 75 76 77 77 78 78 78 79 80 80 80 81 82 82 83 84 85 85 85 86 88 88 89 89 89 89 90 93 95 97 99 该例的变量性质为连续变量。确定变量性质是,是为了正确进行数列的编制和确定组限的表示方法。 变量特点: (2)计算全距 全距=最大变量值-量小变量值 全距=99-52=47 (3)确定组限、组距、组数 组限:两个组的两端变量值。 其中,每个组的起点值(或称最小值)为下限每个组的终点值(或称最大值)为上限。 组距:每个组中的上限值与下限值之差。 组距=上限-下限 组数:是指某个变量数列应划分为多少个组。 确定组距与组数的具体方法如下: 在计算组数与组距时,所使用的变量最小值应略低于实际资料的最小值,自50分开始,最大值应略高于实际资料最大值,取至100分,则全距为100-50=50。 上式中全距是既定的,而组数和组距是可变的。一般来讲,组

文档评论(0)

xuefei111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档