- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
抽样调查方法在各地区交通事故发生数中的应用
摘要:抽样调查理论揭示,PPS抽样的效率要优于简单随机抽样及分层抽样 的结果。文章以我国2012年各地区交通事故发生数的均值和总量估计为例,验 证小样本条件下三者的抽样效率。应用抽样调查技术中的简单随机抽样估计、分 层抽样估计以及PPS抽样估计方法对我国31个省市的交通事故发生情况进行 分析,以2011年各地区交通事故发生数为基础,对2012年的数据进行估计, 进而为制定有效道路交通政策提供依据,同时提高自身抽样估计能力。结果显示, 无论是抽样估计结果效率、抽样误差还是95%置信度条件下的区间估计,PPS 估计的效率均高于简单随机抽样和分层抽样。
关键词:PPS抽样估计简单随机抽样估计分层抽样估计交通事故发生数
一、简单随机抽样、分层抽样和PPS抽样
简单随机抽样
K简单随机抽样
简单随机抽样又称纯随机抽样,设总体有N个单元,从中抽取n个样本容 量,使得每个样本被抽中的概率相等,这种抽样即为简单随机抽样。
简单随机抽样可以分为重复抽样和不重复抽样,其抽样概率是相等的,每个 总体单位被抽中的概率都为丄,其随即样本的产生可以通过随机样表、计算机
N
或计算器等方法产生。
2、简单随机抽样估计
(1 )总体均值的估计
简单随机抽样中,估计总体均值通常用样本均值来估计,即: A _ 1V
1 =1
其抽样方差为:V
*
S2
/ 、
1-3
Y)
n
N)
(2)总体总量的估计
当N在抽样时已知时,总体总量的估计就较为简单,它的估计量为总体均
值乘以总体单位数N ,即:丫 = 抽样方差为:卩丁 =
分层抽样
K分层抽样
分层抽样也称分类抽样或类型抽样,这种抽样方法是在抽样之前将总体的N 个单元划分为互不交叉重叠的若干层,设为L层,每一层包含的单元数分别为 N\,N”??、Nl,且N = £N,,然后再从各层中独立地抽取一定数量的总体单元组
J=1
成样本,设总的样本量为n ,各层的样本量分别为/?],刃2,…,刃L ,且宛二工叫o
/=1
由此获得的样本称为分层样本,如果每层中的抽样都是简单随机的,那么这种分 层抽样称为分层随机抽样。
2、分层抽样估计
(1 )总体均值的估计
在分层抽样中,首先要根据各层的样本,作出各层总体均值习的估计,然后 通过各层的权重加权成为总体的均值7。因此总体均值的估计量应为
1 /v /=! 1 i yv /=! /=!
(2)总体总量的估计
分层抽样总体总量的估计量为
可以看出,它是在估计各层样本均值的基础上分别乘以各层的总体单元数得到各 层的总量,然后在各层总量的基础上相加就得到总体的总量。
由于e是分层抽样中总体均值的无偏估计量,因总量的估计量也可以写成
Y = N九
其实这两个估计量是一致的。
总体总量估计量的方差为
其估计量为
(三)PPS抽样
K PPS抽样的概念
在日常生活中,由于抽样的总体可能差异不大,也有可能差异非常大, 当总体单元之间差异不大时(例抽查一家厂商的的某一产品),各单元具有 一定的代表性,可使用简单随机抽样得到的估计值是精确有效的。但当单 元之间差异非常大时,若用简单随机抽样会使估计值误差极大,应考虑用 不等概随机抽样(PPS抽样法)o
PPS抽样法是多项抽样的一种不等概抽样,又称按规模大小成比例的 概率抽样或按容量比例概率抽样法。设Zi , Z2...Zn是一组概率,按这组概 率对总体中的/V个单元进行放回抽样,每次抽中第/个单元的概率为乙, 独立地进行这样的抽样n次,这种不等概抽样为多项抽样。其中每个单元
的大小或规模的度量为MQ=YMi ,其入样的概率乙二竺,像这样每
个单元在每次抽选中入样的概率与其单元规模的大小成比例,则称为PPS
抽样。
2、PPS抽样估计
(1 )总体总量的估计
1943年,汉森和赫维茨对PPS抽样提出了估计总体总量的估计量为
其中乙?为入样的第i个单元的变量值,乙为第i个单元根据其规模大小的入
样概率,通常情况下若以该单位包括的元素单位为度量时,話可以 证明Yhh是总体总量的一个无偏估计量。
(2)总体均值的估计
总体均值是将总体总量除以总体单元数,因此在汉森■赫维茨估计量的
基础上除以N,即得总体均值的估计量为
A =丄£垄 Y pps Nn 台 ?
估计量的方差公式为
vfA「
PPS)
方差的估计量为
vfA ]
PPS)
二、案例分析
简单随机抽样
1、确定样本容量
(1 )首先用上一年的数据按30%的比例抽取10个样本进行小型试验,由 随机数表抽取的省市为:北京、吉林、黑龙江、安徽、福建、江西、广西、重庆、 陕西和甘肃。
Z2252
(2 )依据公式心一右一和厶二乡/莎,由此确定此次的样本容量〃,
/?=9o
(3 )再次利用随机数表抽取〃=9的样本,抽取的9个省市分别为:北京、 山
您可能关注的文档
- 操作系统与计算机软硬件关系浅析.doc
- 插床机构课设.doc
- 插花艺术课程结业论文.doc
- 插铺道岔技术交底.doc
- 插入式基础施工方法研究与探讨.doc
- 插秧机后齿轮设计毕业论文.doc
- 插值法程序解题.doc
- 拆降施工方案打印.doc
- 拆迁安置项目三期项目投资建议书.docx
- 掺烧高碱金属煤种的技术探讨.doc
- 四川省德阳市罗江中学2025届高三考前热身化学试卷含解析.doc
- 山东省枣庄现代实验学校2025届高三下学期第五次调研考试化学试题含解析.doc
- 吉林省长春市十一高中等九校教育联盟2025届高三一诊考试生物试卷含解析.doc
- 2025届江苏省盐城市伍佑中学高考仿真模拟化学试卷含解析.doc
- 2025届广西贺州中学高考冲刺押题(最后一卷)生物试卷含解析.doc
- 安徽省池州市贵池区2025届高三第一次模拟考试生物试卷含解析.doc
- 宁夏银川一中2025届高三(最后冲刺)化学试卷含解析.doc
- 广东省广州市增城区四校联考2025届高考压轴卷化学试卷含解析.doc
- 2025届邯郸市第一中学高考生物必刷试卷含解析.doc
- 2025届安徽省安庆市石化第一中学高考仿真卷化学试卷含解析.doc
文档评论(0)