2014上机内容.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2014上机内容.doc

上机一 变量系列及编制 目的: 加深变量系列相关概念及其在调查数据整理中的作用理解,掌握其编制方法。 变量序列的概念 变量序列是按照某种数量特征对总体进行分组,将分组后所形成的变量值按大小顺序排列所得到的序列。 构成要素: ①按分组变量进行分组所形成的各组变量值(x); ②总体单位在各变量组的分布次数(f); ③频率:各组总体单位分布次数占总体单位总数比重(W)。 2. 变量序列的种类 ⑴单值序列: 各分组变量都是一个具体的变量值。 适合于变量变异幅度不大、变量值数目有限的情况。 ⑵组距序列:各组变量是由两个变量值所限定的一个变动区间,且这个变动区域涵盖了其区间内的所有总体单位数。 ⒊ 组距序列的编制 1)确定变量的类型: ⑴ 离散型变量:变量个数少、变动幅度不大,可编制单值序列;变量个数较多,变动幅度较大,应编制组距序列。 ⑵ 连续型变量:只能编制组距序列。 2)确定组数和组距: ⑴ 组数是指组距序列中分组的个数。 组数的确定应以明确显示总体分布趋势为原则。 数量标志变异范围越大,组数就应越多,反之就越少。 ⑵ 组距是每组变量的上限与下限之差。 3)确定组限和组中值 ⑴ 组限:位于各组组距两端的数值。 A 最小值为组的下限,最大值为组的上限 B 离散型变量采用顺序两个变量作为相邻织的上限和下限 C 连续型变量用一个数值作为两个相临组的上限和下限 D 遵循“上限不在内”的原则。 ⑵ 组中值:各组变量范围的中间数值,代表各组变量值的一般水平。 组中值=(上限+下限)/2 开口组组中值的确定: 缺上限的开口组组中值=下限+邻组组距/2 缺下限的开口组组中值=上限-邻组组距/2 4)累积次数与累积频率 ⑴ 向上累计(以下累计或称较小制累计) 将各组频数和比率,由变量值低的组向变量值高的组逐组累计。 组距序列中的向上累计,表明各组上限以下总共所包含的总体频数和比率 有多少。 ⑵ 向下累计(以上累计或称较大制累计) 将各组频数和比率,由变量值高的组向变量值低的组逐组累计。 组距序列中的向下累计,表明各组下限以上总共所包含的总体频数和比率有多少。 ⒋ 交叉列表技术 单变量列表 只有一个变量对收集的数据产生控制。 双向交叉列表 双向交叉列表是指将两个或两个以上有一定联系的变量及其变量值按照一定的顺序交叉排列在一张统计表内,使各变量值成为不同变量的结点,从中分析变量之间相关关系的一种数据分析技术。 三向交叉列表 三向交叉列表是在双向交叉列表的基础上,加入第三个变量作进一步分析的方法。 编制步骤: ①选中一个变量,将其值稳定在各种变量值中的一个值上, ②将另一个自变量和因变量作双向交叉分组; ③将第一个变量稳定在其下一个变量值上,作另外两个变量的交叉列表,类推,直到第一个变量的所有变量值被一一列举完毕。 练习内容见下页 二、练习内容: Excel表操作练习(编程、计算、筛选…..) 下表为家庭收入基本状况累积表,为一典型的组距变量序列的累积表。 按家庭年收入分组 家庭数(户) 比重(%) 向上累积 向下累积 x f w f w f w 10000以下 10000~20000 20000~30000 30000~40000 40000~50000 50000~60000 60000以上 10 30 40 60 30 20 10 5 15 20 30 15 10 5 10 40 80 140 170 190 200 5 20 40 70 85 95 100 200 190 160 120 60 30 10 100 95 80 60 30 15 5 合计 200 100 - - - - 请针对上表明确下列概念: 表中构成三要素中调查量为: 计算量为: 组数: 组距: 封闭组组号: 开口组组号: 各组组中值分别为: 相邻组的上下限为同一数值,由此可判断此表变量为: (离散/连续型) 对封闭组,本组变量包含了哪一个组限值: (上限/下限) 思考表中的计算量都是如何计算的?有何意义? 从表中你能得出什么结论? 用Excel表编程计算复现上表。 为了解不同地区顾客获知某新药渠道,特从以下四个渠道对北京、上海、深圳三地做了调查: 朋友、电视、网络、报刊,在北京调查对应渠

文档评论(0)

suijiazhuang1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档