- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第30讲第三节
窗体顶端
第三节? 统计数据的整理
知识点一、统计分组
概念 根据统计研究的目的和要求,按某个标志(或几个标志)将被研究的总体划分为若干个不同性质的组 作用 (1)划分总体的类型
(2)反映现象内部结构和比例关系
(3)揭示现象之间的依从关系 种类 按分组标志的性质不同 品质标志分组;数量标志分组 按分组标志的多少和组合的情况 简单分组;复合分组 ?
知识点二、分布数列
(一)分布数列的概念
将总体各单位按某个标志分成若干组,列出各组的总体单位数或各组单位数在总体单位数中所占的比重,这样形成的数列称为分布数列。分布在各组的单位数称为次数或频数;各组单位数在总体单位数中所占的比重称为频率。分布数列由两个要素构成:一是总体按某个标志所分的组;二是各组频数或频率(比重)。
?
(二)分布数列的种类
1.品质分布数列
品质分布数列是按品质标志分组而形成的分布数列,亦称品质数列。例如,某住宅小区业主对物业服务企业服务状况评价结果,见表6-1。
表6-1 ?某住宅小区业主对物业服务企业服务状况评价
对服务的满意程度 户数(户) 频率(%) 非常满意 58 14.5 满意 84 21.0 一般 98 24.5 不满意 119 29.8 非常不满意 41 10.2 合计 400 100.0 ?
2.变量分布数列
(1)单项式数列。是指各组都由一个具体的标志值(又称变量值)来表示的数列,如表6-2所示。
表6-2??? 某住宅小区住户人口数分布
按每户人口数分组(人) 户数(户) 1 9 2 198 3 237 4 120 5 29 合计 593 ?
(2)组距式数列。是指各组都由两个变量值界定的变量区间(组距)来表示的数列。每一组两端的值称为组限,各组最小的值为下限,最大的值为上限。各组的组距是指该组区间的长度。
例如,人口按年龄分组可分为未满1岁,1~3岁,4~7岁,8~14岁,15~25岁……重合式组限形式。
例如人口按年龄分组分为未满1岁,1~4岁,4~8岁,8~15岁,15~26岁……统计上一般按“上限不在内”的原则进行处理,即作为上限的变量值应归属于后一组。如“8岁”应归属于第四组,其余类推。
组距式数列还可分为等距分组和不等距分组。各组组距相等的数列称为等距数列;各组组距不尽相等的数列称为异距数列。另外,组距式分组中,还会有开口组的情况。如果第一组只有上限,最后一组只有下限,这样的组称为开口组,如,表6-3中的第一组(25km2以下)和第五组(100km2以上)都属于开口组。
?
表6-3??? 某市200家物业服务企业按管理项目的物业面积分组
按管理物业面积分组 物业服务企业数(个) 比重(%) 25 km2以下 24 12.0 25~50km2 51 25.5 50~75km2 75 37.5 75~100km2 44 22.0 100km2以上 6 3.0 合计 200 100.0 ①对于重合式分组:组距=本组上限-本组下限?????? 组中值=(上限+下限)/2??? 或=下限+组距/2
②对于不重合式分组:组距=本组上限-上组上限 或=下组下限-本组下限
组中值=(本组下限+下组下限)/2 或=本组下限+组距/2
一般按下式计算:
组中值=上限-邻组组距/2 或=下限+邻组组距/2
?
(三)变量数列的编制
编制变量数列,首先对所搜集的资料按标志值大小进行排序,然后根据研究目的和现象的特点确定是编制单项式数列还是组距数列,组距数列是采用等距还是异距。下面结合例6-1来说明变量数列的编制方法和过程。
因为数据中最大的是2380元,最小的是810元,全距为1570元,且变量值个数较多,所以不宜编制单项式数列,只能编制组距式数列。编制组距式数列的关键是确定组距和组数。我们先采用组距为100元和150元,分别得到相应的分布数列,见表6-4。
?
从表6-4可看出,组距为100元太小,组数太多,各组单位数分散,看不出分布规律;组距为150元时,总体单位在各组的分布规律开始表现出来,但特征仍不是很明显。若再将组距扩大为200元,此时组数可定为8组(组数一全距/组距=1570/200=7.8),通过进一步整理,得到分布数列,见表6-5。
表6-5??? 某住宅小区业户家庭月人均可支配收入次数分布
家庭月人均收入(元) 户数 频率(%) 800~1000 5 9.26 1000~1200 7 12.96 1200~1400 10 18.52 1400~1600 13 24.07 1600~1800 8 14.82
文档评论(0)