统计学在社会经济调查方面应用.docVIP

下载本文档

7
0
约2.13千字
约 5页
2017-09-04 发布于福建
举报
版权申诉

统计学在社会经济调查方面应用.doc

1、本文档共5页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

统计学在社会经济调查方面应用

统计学在社会经济调查方面应用　统计学在社会经济调查方面的应用　　1 调查方法设计及原则　分层抽样方案设计的原则须科学、有效、便利，也必须保证有较高的效率，即在相同的样本量的条件下，方案设计应使调查尽可能小、精度尽可能高，即目标量估计的抽样误差尽可能小。抽样方案必须有较强的可操作性，不仅便于具体抽样的实施，也便于后期数据处理。按照此原则，我们将全班112名同学按性别分为男、女两层并按姓氏排序编号。统计结果为男生69人，女生43人。　2 随机数表抽样法　随机数表是统计工作者用计算机生成的随机数组成，并保证表中每个位置上出现哪一个数字是随机数表等概率的，利用随机数表抽取样本保证了各个个体被抽取的概率相等。真正的随机数是使用物理现象产生的：比如掷钱币、骰子、转轮、使用电子元件的噪音、核裂变等等。这样的随机数发生器叫做物理性随机数发生器，它们的缺点是技术要求比较高。而通常我们使用的随机数表是使用伪随机数，这些数列是“似乎”随机的数，实际上它们是通过一个固定的、可以重复的计算方法产生的。计算机或计算器产生的随机数有很长的周期性。它们不真正地随机，因为它们实际上是可以计算出来的，但是它们具有类似于随机数的统计特征。本次调查采用随机号码表法抽取样本，完全排除主观挑选样本的可能性，使抽样调查有较强的科学性。本文的随机数表为EXCEL表通过函数“=INT（RAND（）*（b-a）+a）”生成，代表生成范围在（a，b）之间的随机整数。　将全班112名同学按性别分为二层。第一层为女同学，共43名人，按姓氏的拼音首字母排序，并编号1、2、3......43；第二层为男同学，共69人，采用　相同的办法排序，并编号1、2、3......69。　3 分层抽样调查　欲了解华南师范大学2012级MBA全体同学2013年5月31日上、下班花费时间、2013年5月26日-2013年6月1日网上购物金额以及这两个个指标，对30个样本进行了分层抽样调查，数据收集的方法为网络调查，被调查者采用收取邮件方式对调查问卷作回答。发出问卷30份，有效回收30份。调查统计结果列出下表：　分层抽样具有比纯随机抽样高的抽样精度，但由于分层抽样中各层的样本的具体情况在抽样检验之前是未知的，所以我们也就无从知道样本的均值、方差。必须根据调查数据作进一步的计算与分析。　4 抽样误差的计算　在112名同学总体中随机抽出30个样本，采用比例分配法把样本中的女、男分为两层，这里：N=112，n=30；N女=43，n女=21；N男=69，n男=18。　（一）指标1：上周五（2013年5月31日）上、下班花费时间　1、样本均值计算：　2、样本方差计算　3.置信区间　（二）指标2：上一周（2013年5月26日～2013年6月1日）网上购物金额　1.样本均值计算　2.样本方差计算　3.置信区间　5 分层设计分析　分层设计效应的目地在于为抽样调查提供一个近似的、好用的估计来提高调查效率，并对群内的一致性进行分析。以下数据的计算结果（表-5）是严格按照分层抽样比，选择两个代表性指标，对全班同学的上、下班花费时间，网购消费水平作总体估计。　判断调查的抽样精度没有一个统一的标准，要因定性和定量研究的目地而定。一般误差在5%范围内，抽样精度较高，在5%-10%之间抽样精度较好，在10%-20%之间数据是可用的，在20%以上，可以认为抽样样误差较大。数据均可根据抽样调查在允许误差的范围内进行修正。所以为了提高抽样精度，三个调查指标的数据计算都是在允许误差95%的置信度区间内进行。　其中，置信水平可以分析总体参数值落在样本统计值某一区内的概率，而置信区间是在某一置信水平下样本统计值与总体参数值间误差范围。其区间范围越大，置信水平越高。　指标2网上购物金额抽样误差37.78，从抽样误差的角度来看，完全可以满足推断总体的要求。在置信水平为95%的前提下计算出的置信度间隔148.1最宽，表明置信水平最高，用该数据来估计全班同学的网购消费水平的可信度就最高。由国家统计局资料显示，全国居民平日在互联网上的钱主要用于上网、购物、玩游戏，缴纳各种生活费用。随着中国网购市场日渐安全规范，人们越来越喜欢网上购物这种新型的消费方式。毕业论文　指标3上周锻炼身体的时间其抽样误差15.01，从抽样误差的角度来看，也可以满足推断总体的要求。在置信水平为95%的前提下计算出的置信度间隔58.84较宽，表明置信水平较高，用该数据来估计全班同学的上周锻炼身体的时间可信度也较高。一份《2012年度中国职场人平衡指数调研报告》中指出 “广州职场人工作时间全国第一，平均睡眠时间最短”。由此可见，人们没有更多的时间进行体育锻炼。对于本次调查华师全体同学的锻炼时间均值为73.39分钟，这