网站大量收购闲置独家精品文档,联系QQ:2885784924

抽样的思想.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
抽样的思想

第八讲 抽样的思想 普查与抽样调查 统计思想:从总体中抽取一部分个体组成样本,先研究样本的情况,再由此推断总体的情况 一个抽样调查 抽样方案非常关键,如“你是否经常吸烟?” 两种误差 抽样误差(代表性误差):非抽样方案不好引起,是固有的随机性的反映,但应通过抽样设计,通过计算并采用一系列科学的方法,把代表性误差控制在允许的范围之内 测量误差(工作误差):如问卷等测量工具的设计缺陷、登记差错等,应加强责任心。由于抽样调查单位少,工作误差有可能比普查要小,特别是在总体包括的调查单位较多的情况下。 获得对敏感性问题的诚实回答 一个装有50个白球50个红球的袋子,每个被调查者随机从袋中摸出一个球(放回),是白球回答问题1:你的父亲阳历生日日期是不是奇数?是红球回答问题2:你是否经常吸烟? 回答“是”的人往一个盒子中放一个筹码,回答“否”的人什么都不要做 200个被调查者,最后盒子中有58个筹码,能估计吸烟人数的百分比吗? 抽样方法及其适用性 有意抽样(目的抽样)以调查者的主观判断为依据来抽取样本。易操作但主观随意性大、难以估计和控制抽样误差 典型抽样 随意调查 定额抽样 便利抽样 高中必修3中的统计要求 随机抽样 简单随机抽样(抽签法、 随机数法)学会 有无放回;形式不同,随机程度略有不同;从0开始编号的优点;不适用于总体中个体未确定和总体本身变异大的情形 系统抽样 了解 适用于大样本,不适用于周期、循环排列 分层抽样 了解 适用于层内同质性好,层间差异显著 中外研究表明,在简单随机抽样与分层抽样之间,学生可能更喜欢分层抽样方法(每一层都有个体被抽到,含有个体多的层其个体在样本中所占的比例也大,关于各层可获得结论) 有无放回的影响 假设甲袋中装着12个彩球,10个是红色的2个是蓝色的,乙袋中装着12000个彩球, 10000个是红色的2000个是蓝色的。在下面两种情况下,请针对甲袋和乙袋分别回答下述问题:取出的前8个球都是红球,问第9个球还是红球的概率是多少? 每次取一个球,取出后不放回 每次取一个球,取出后放回 通过样本能了解总体吗? 样本大小不同的几次抽样 样本大小为500的三次抽样 通过样本能了解总体吗? 小王家中有4口人,体重分别是20公斤、50公斤、60公斤和70公斤.可以计算得到4个人的平均体重为50公斤. 若只能抽样调查2个人次,则样本均值与总体均值相差不超过10公斤的概率大吗? 大多数的时候像 16种可能结果,有10种误差不超过10公斤,有14种误差不超过15公斤 对样本概念的分析 “样本,也称子样,是指从被抽样总体中抽取并要对其进行调查或观察的部分单位所组成的集合体。” “从所研究对象的全体(即总体)中抽出的部分个体叫做总体的一个样本。” 这两种定义指出样本的基本含义是“样本是总体中的一部分,它与总体的关系是部分和整体的关系” 仅仅停留在从属关系上 统计的基本思想是通过调查或观察样本来了解或推断总体的数量特征。因此,样本概念有两层含义,一是样本与总体的部分与整体的关系,二是样本对了解总体的意义。两层中的第一层是基本的。 池塘里有多少鱼? 捉--放--捉的方法: 捉来c条鱼,作标记,放回,充分混合后,再捉r条,其中t条已作标记,记池塘里有鱼N条,则 有2种理解途径: 替换原理,样本有很好的代表性,用样本中的比例估计总体中的比例 最大似然估计,写出该观察值出现的概率,捉r条恰有t条已作标记,它是N的函数,找出N的估计值,使得概率 达到最大。最大值时N的 取值 为了避免出现除数为0的情况,改用 高中统计选修内容 回归(不限于线性) 独立性检验 假设检验 聚类分析 参数估计 点估计 区间估计 变量间的相关关系 相互依存关系可分为两种类型。一类是函数关系(确定性的依存关系)。另一类为相关关系,对于变量的某个数值,可以有另一变量的若干数值与之相对应,这若干个数值围绕着它们的平均数呈现出有规律的波动(同时受其他随机因素影响) 确定现象之间有无相关关系以及相关关系的类型(可用散点图,如果每个点已经集中了一群个体的信息,那么相关关系会显现得更加明显) 判定现象之间相关关系的密切程度,通常是计算相关系数 r ,若其绝对值在0.75以上表明高度相关,0.25以下表明相关性较弱 拟合回归方程 判断回归分析的可靠性,对回归方程进行检验 根据回归方程进行预测和控制 售出热茶的杯数与气温之间的关系 最小二乘法 选修课中讲回归(线性/非线性) Y=ax+b+e 选修中的统计 通过典型案例介绍基本、常用的一些统计思想方法 回归 根据所收集到的数据找出回归方程,预测

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档