试议抽样调查中的概率论.docVIP

下载本文档

14
0
约2.88千字
约 3页
2018-03-28 发布于北京
举报
版权申诉

试议抽样调查中的概率论.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

试议抽样调查中的概率论武 ? (发表于《石河子科技》2008年第3期) 概率论最基本的概念,是在社会和自然界中某一类事件在相同的条件下可能发生也可能不发生,它的发生具有偶然性,这类事件称为随机事件或偶然事件,不同的随机事件发生的可能性大小是不同的。也就是说概率是用来表示随机事件发生的可能大小的一个量。很自然的把必然发生的事件的概率规定为1,即肯定;并把不可能发生的事件的概率规定为0,即否定。而实际上一般随机事件的概率不是绝对的肯定或绝对的否定,而是介于1和0之间的一个数,即可分出多个层次。概率越大表示事件发生的可能性也越大。在统计学中,对应该全部调查的对象称为总体,而随机抽取的若干个体称为总体的样本。用全部调查的结果虽然能够准确的反映事物的真实数目,但它的不足之处在于工作量大、花费人力、物力多,时间也拖的过长,且在许多特定条件下也是不可能的。只能采取抽样调查其中的一部分,获得事物的某些数据指标,进而推算总体,即用概率论的研究成果,通过样本来分析和判断总体。这就是抽样调查方法。由于各种偶然因素的影响是随机的,因此,在调查时的抽样也必须是随机的。只有这样,才能比较有效地消除正负两方面偶然因素的影响,提高统计值的准确性。调查的数量越多,偶然因素之间的相互抵消的就越彻底,总体的内在规律也就表现的越充分,这也是客观世界的一个普遍规律。归纳起来,随机抽样调查方法有两个显著的特点: 一是从原则上讲完全排斥了人民有意义的选择,不掺杂任何调查者的主观判断。也就是说,抽中和抽不中完全是偶然的,每一个单位被抽取的机会是均等的。二是在缺少资料的情况下,通过对部分单位的调查研究,获得某些数据,计算统计指标,即可对事物的总体情况作出相当可靠的推算。现在我们举一应用实例,来阐述整个抽样调查的全过程。兵团广播电视大学系统在我校评估时,曾对某专业同一年级94名学生的学习成绩进行了抽样调查,是按整群非重复抽样方法,抽取7名学生作为样本的。其考试成绩列入下表,并推算有关指标。样本分数偏差偏差的平方编号 (xi) (xi ?)(xi -)2 1 85 39 2 77 -5 25 3 80-2 44 84 2 4 5 82 00 6 88 636 7 78 -416 ∑ 574 样本的数字特征有: 样本平均数。可表示样本各数的集中位置,它是代替总体指标一般水平的统计指标。若样本为x1,x2,、、、、xn时。按式(1)计算。将已知数代入得: xi 82(分) (1) 样本方差S2样本标准差S。可表示样本中各数与集中位置的偏离程度。在抽样调查中占有很重要的位置。当n≤30时为小样本,按式(2)(3)计算。将已知数代入得: S2 (xi -)215.67(2) S3.96 (3) 式中: n??抽取样本的个数 xi ??样本个体分数值 ??样本个体分数值之和 n-1 ??t分布的自由度。与时为大样本。N比较大时,n与n-1的差别是很小的,为简便起见,可将n近似的代替式中的n-1。 (xi -)2??样本个体偏差的平方和抽样调查是一种非全面的调查,其数量特征同它的总体不完全相同,不同的样本将是不同的样本的指标。所以,各样本平均指标之间存在着差异,与总体平均指标之间也存在着不同程度的差异,这就是抽样误差。平均指标的抽样误差,是指所有的样本指标和总体指标的平均离差,可按式(4)计算。非重复抽样是将从总体单位中已随机抽取出来的样本单位除去,只从剩下的总体单位中再抽取。即每个总体单位多只能被抽中一次,代表性就大,所以,平均指标的抽样误差就小,精度就高。将已知数代入: 1.487 当N很大时,N-5与N-1差别是很小的,为简便起见,可将N近似的代替式中N-1。区间估计是根据样本指标和平均指标的抽样误差计算总体指标所在的范围,表示的是一个非绝对准确的范围,即推断总体指标在这个范围内的判断不是十分肯定的,只有一定的把握(概率)。那么,对已知的平均指标的抽样误差来说,总体指标落在估计区间的把握(概率)究竟有多大呢?一般比较常用的是以95%的把握(概率)作为区间估计,即t的取值为1.96,区间估计的把握程度(概率)按式(5)计算。 -t ??+ t 将已知数代入得: 82-1.96×1.487??82+1.96×1.48779??85 式中: T??平均指标的抽样误差个数 ??总体指标平均数因此,我们可以得出这样的结论,某专业同一级的学生平均考试分数在82分左右,并有95%的把握(概率)推断总体平均考试分数在79??85之间。不难看出,扩大平均指标的抽样误差,可以提高推断的把握程度(概率);反之,则降低推断的把握程度(概率)。即平均指标的抽样误差范围的变化和作推断的把握程度(概率)之间是有着