- 5
- 0
- 约3.69千字
- 约 69页
- 2020-04-19 发布于上海
- 举报
第二章 抽 样; 第一节 抽样概述; 三. 抽样的基本术语
个体与抽样单位(Sampling Unit):个体是指一次直接的抽样所使用的基本单位,它往往与抽样单位相同,但并不完全等同;
总体(population):所有调查对象的集合体。它包括研究总体和调查总体,二者也不能完全等同;
总体规模:总体中含有的抽样单位的数目(N)。
样本(Sample):从总体中抽取出的一部分抽样单位的集合体。
样本容量:样本中含有的抽样单位的数目(n)。; 抽样框(Sampling Frame):一次抽样时总体中所有抽样单位的名单。
总体参数值( Parameter ):关于总体中某一变量取值的综合描述。
样本统计值(Statistic):关于样本中某一变量取值的综合描述。
抽样误差(sampling error):样本统计值和总体参数值之间的差异。 不可避免
置信水平(confidence level):总体参数值落在样本统计值某一正负区间的概率。
置信区间(confidence interval):在一定的置信水平下,样本统计值与总体参数值偏差的最大允许范围。;?;四. 抽样的基本规律
随机原则(random principle):在完全排除主观上人为选择的前提下,使总体中每一个单位有相同被抽中的机会。——概率抽样
;?;四. 抽样的基本规律
大数规律:大量重复观察的结果的平均数几乎接近某个确定的数值。;五. 抽样的基本程序 ;1. 确定总体;2. 确定抽样框——操作层面;3. 设计和选取样本; 4. 对样本进行评估;五. 抽样的特点 ;抽样成功的依据;第二节 概率抽样;一. 简单随机抽样 (Simple Random Sampling);2. 方法;总体较大时:随机数字表;2. 评价;二. 分层抽样(Stratified Sampling);★
●★ ■
■▼■●●
★■ ▼▼ ★
;N
10000; ;举例:20000户居民,按经济收入高低分类,高收入居民4000户,占总体20%;中等收入12000户,占总体60%;低收入户4000户,占总体20%,从中抽取200户,进行购买力调查。
等比例分层抽样
高收入层样本数:200× 20%=40户
中收入层样本数:200× 60%=120户
低收入层样本数:200× 20%=40户;分层抽样的适用性;某高一学生共500人,经调查,喜欢数学的学生占全体学生的30%,不喜欢数学的人数占40%,介于两者之间的学生占30%。为了考察学生的期中考试的数学成绩,如何用分层抽样抽取一个容量为50的样本
某公司有500人,其中35岁以下的125人,35-49的280人,50以上的95人。为了调查员工的身体健康情况,从中抽取100人,怎样用分层抽样抽?
某大学食堂为了了解新生的饮食习惯,以分层抽样方式从1500名新生中抽取200人进行调查,新生中南方学生500人,北方学生800人,西部学生200人,如何抽?
某市电视台在网上征集节目现场观众,报名的总人数12000人,来自4城区,东城区2400人,西城区4605人,南城区3795人,北城区1200人。用分层抽样抽取60人参加,如何抽?;三. 系统抽样(Systematic Sampling)(等距抽样);直线等距抽样练习题:
某大学有12000名学生,欲了解其生活态度,决定采用系统抽样的方法从中抽查200名学生,用简单随机抽样的方法抽出第一名学生序号为12,请计算第十位,第十五位学生的序号是多少?
;(二)循环等距抽样(k不为整数)
方法1. 1. 将总体N首尾相连, N
K=——,取接近K的整数;
2. 随机起点r从1-N中随机抽取 n
方法2. 调整直线等距抽样
1. 将K的小数点后移,便为整数[K]
2. 确定整数的随机起点[r],从10-[K]中选
3. 确定非整数的随机起点r,即将[r]的小数点移回来
4. 从r开始,每隔K各单位抽取一个单位
5. 再将所有抽取的号码的小数点略去
特点:所有单位有相同的中选概率1/K; 等距抽样与简单随机抽样相比,样本分布更为均匀,抽样误差更小
注意: 等距抽样是以总体的随机排列为前提的,如果总体的排列出现有规律的分布时,会使等距抽样产生极大的误差,降低样本的代表性
等距抽样最适用于同质性较高的总体,当总体内个体类别之间的数目悬殊过大时,样本的代表性可能较差。在这种情况下应采用另一种分层抽样方法。;系统抽样练习;练习
从编号1到900的总体中用系统抽样的办法抽取9个样本
某产品共有2563件,产品按出
原创力文档

文档评论(0)