- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
五、统计分组的方法 (一)属性分组的方法 1.对事物进行属性分组,其组数的多少首先取决于事物本身的特点。 2.对于有些事物构成比较复杂,组数可多可少的情况,就需要考虑统计研究任务的具体要求 ※(二)变量分组的方法 按数量标志分组,应注意如下两个问题: 首先,分组时各组数量界限的确定必须能反映事物质的差别。 其次,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。 1.单项式分组与组距式分组 (1)单项式分组:就是用一个变量值(标志值)作为一组,形成单项式变量数列。单项式分组一般适用于离散型变量且变量变动范围不大的场合。 ※(2)组距式分组:就是将变量依次划分为几段区间,一段区间表现为“从……到……”距离,把一段区间内的所有变量值归为一组,形成组距式变量数列。区间的距离就是组距。对于连续型变量或者变动范围较大的离散型变量,适宜采用组距式分组。 2.间断组距式分组和连续组距式分组 (1)间断组距式分组 :是指组限不相连的分组。 (2)连续组距式分组 :凡是组限相连(或重叠)的分组,即以同一数值作为相邻两组的共同界限的分组。统计上规定: “上限不在内” 3.等距分组与异距分组 等距分组:就是标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。凡是在标志值变动比较均匀的情况下,都可采用等距分组。 异距分组:各组组距并不完全相等的分组,在下列情况下,就必须考虑采用异距分组: 第一,标志值分布很不均匀的场合。 第二,标志值相等的量具有不同意义的场合。 第三,标志值按一定比例发展变化的场合。 变量数列 单项数列 组距数列 等距数列 异距数列 六、组距、组数与组中值 (一)组距 组距是各组上下限之间的距离,即各组最大标志值与最小标志值之差。 (二)组数 全距是总体中最大的标志值与最小的标志值之差。 组数的多少直接取决于两个因素,一个是总体的全距,另一个是组距。在等距分组的条件下,组数等于全距除以组距。在组距既定的条件下,全距大则组数多,全距小则组数少;在全距既定的条件下,组距大则组数少,组距小则组数多。 经验公式: (三)组中值 组中值:各组中点位置所对应的变量值。其计算公式为: 组中值= (适用所有闭口组) 或= (适用上开口组) 或= (适用下开口组) 第三节 统计分布(分配数列) 一、分配数列的概念种类 在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,并计算各组的单位数称为频数分布,或次数分布。 两个要素 1.组别:总体按某标志所分的组 2.频数(次数)和频率:各组的单位数叫频数,各组的单位数与总体单位总数之比叫频率。频率具有如下两个性质: (1)各组频率都是界于0和1之间的一个分数。即: (2)各组频率之和等于1 。即: 频数分布 品质频数分布 变量频数分布 单项数列 组距数列 2、整群抽样的优点 (1)能大大减低收集数据的费用;(2)当总体单元自然形成的群时,容易取得抽样框,抽样也更容易;(3)当群内单元差异大,而不同群之间的差异小时,可以提高效率。 3、缺点 (1)若群内各单元有趋同性,效率将会降低;(2)通常无法预先知道总样本量,因为不知道群内有多少单元;(3)方差估计比简单随机抽样更为复杂。 (1)定义:在抽样之前将总体分为同质的、互不重叠的若干子总体,也称为层。然后在每一个层独立地随机抽取样本。如工商业和农场调查中,常用一个规模变量作为分层变量,员工人数、销售额等。 分层抽样STR(层内同质,层间差异大) 2、优点:(1)由于性质相同的单元分在同一层,层内差异缩小,可以提高抽样效率;(2)可以得到各层子总体的估计;(3)操作与管理方便;(4)能避免得到一个“差”的样本。 3、缺点:(1)对抽样框的要求比较高,必须有分层的辅助信息;(2)收集或编制抽样框的费用比较高;(3)若调查变量与分层的变量不相关,效率可能降低;(4)估计值的计算比简单随机抽样复杂。 1、定义:它是由两个或更多个连续的阶段抽取样本的方法。如全国农产量调查、城乡居民住户调查、中小工商企业调查等。 总体 第一阶样本 最终样本 多阶抽样 2、优点:(1)当群具有同质性时,多阶抽样的效率高于整群抽样;(2)样本的分布比简单随机抽样集中,采用面访可以节约时间和费用;(3)不需要整个总体单元的名录框,只要群的名录框和抽中群的单元名录框。 3、缺点:(1)
原创力文档


文档评论(0)