- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(抽样检验)试议抽样调查
中的概率论
试议抽样调查中的概率论
武昇
(发表于《石河子科技》2008 年第 3 期)
概率论最基本的概念,是在社会和自然界中某壹类事件在相同的条件下可能发生也可能不发
生,它的发生具有偶然性,这类事件称为随机事件或偶然事件,不同的随机事件发生的可能
性大小是不同的。也就是说概率是用来表示随机事件发生的可能大小的壹个量。很自然的把
必然发生的事件的概率规定为 1 ,即肯定;且把不可能发生的事件的概率规定为0 ,即否定。
而实际上壹般随机事件的概率不是绝对的肯定或绝对的否定,而是介于 1 和 0 之间的壹个数,
即可分出多个层次。概率越大表示事件发生的可能性也越大。
在统计学中,对应该全部调查的对象称为总体,而随机抽取的若干个体称为总体的样本。用
全部调查的结果虽然能够准确的反映事物的真实数目,但它的不足之处在于工作量大、花费
人力、物力多,时间也拖的过长,且在许多特定条件下也是不可能的。只能采取抽样调查其
中的壹部分,获得事物的某些数据指标,进而推算总体,即用概率论的研究成果,通过样本
来分析和判断总体。这就是抽样调查方法。
由于各种偶然因素的影响是随机的,因此,在调查时的抽样也必须是随机的。只有这样,才
能比较有效地消除正负俩方面偶然因素的影响,提高统计值的准确性。调查的数量越多,偶
然因素之间的相互抵消的就越彻底,总体的内在规律也就表现的越充分,这也是客观世界的
壹个普遍规律。
归纳起来,随机抽样调查方法有俩个显著的特点:
壹是从原则上讲完全排斥了人民有意义的选择,不掺杂任何调查者的主观判断。也就是说,
抽中和抽不中完全是偶然的,每壹个单位被抽取的机会是均等的。
二是在缺少资料的情况下,通过对部分单位的调查研究,获得某些数据,计算统计指标,即
可对事物的总体情况作出相当可靠的推算。
当下我们举壹应用实例,来阐述整个抽样调查的全过程。兵团广播电视大学系统在我校评估
时,曾对某专业同壹年级 94 名学生的学习成绩进行了抽样调查,是按整群非重复抽样方法,
抽取 7 名学生作为样本的。其考试成绩列入下表,且推算有关指标。
样本分数偏差偏差的平方
编号(x )(x –)(x -)2
i i i
18539
277-525
380-24
48424
58200
688636
778-416
∑574
样本的数字特征有:
样本平均数。可表示样本各数的集中位置,它是代替总体指标壹般水平的统计指标。若样本
为 x ,x , 、、、、x 时。按式(1)计算。将已知数代入得:
1 2 n
1
=x =82 (分)
x i
n
(1)
2
样本方差 S 样本标准差 S 。可表示样本中各数和集中位置的偏离程度。在抽样调查中占有很
重要的位置。当n ≤30 时为小样本,按式(2)(3)计算。将已知数代入得:
2 2
S = (x -) =15.67 (2)
i
S==3.96 (3)
式中:
n——抽取样本的个数
x ——样本个体分数值
i
n
xi
i1 ——样本个体分数值之和
n-1——t 分布的自由度。和时为大样本。N 比较大时,n 和 n-1 的差别是很小的,为简便起
见,可将n 近似的代替式中的 n-1 。
2
(x -) ——样本个体偏差的平方和
i
抽样调查是壹种非全面的调查,其数量特征同它的总体不完全相同,不同的样本将是不
同的样本的指标。所以,各样本平均指标之间存在着差异,和总体平均指标之间也存在着不
同程度的差异,这就是抽样误差。平均指标的抽样误差,是指所有的样本指标和总体指标的
平均离差,可按式(4)计算。
非重复抽样是将从总体单位中已随机抽取出来的样本单位除去,只从剩下的总体单位中
再抽取。即每个总体单位多只能被抽中壹次,代表性就大,所以,平均指标的抽样误差就小,
精度就高。将已知数代入:
==1.487
当N 很大时,N-5 和 N-1 差别是很小的,为简便起见,可将 N 近似的代替式中 N-1 。
区间估计是根据样本指标和平均指标的抽样误差计算总体指标所在的范围,表示的是壹个非
绝对准确的范围,即推断总体指标在这个范围内的判断不是十分肯定的,只有壹定的把握(概
率)。那么,对已知的平均指标的抽样误差来说,总体指标落在
文档评论(0)