- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样和抽样分布 基本概念 抽样的主要目的: 根据样本数据所反映的信息来对总体参数进行统计推断 普查的缺陷:难度大,风险高 抽样调查的优越性与必要性 经济性(调查费用): 时效性 必须性(破坏性实验,大容量总体) 可以与普查相结合 抽样误差与非抽样误差 非抽样误差:调查中的认为误差(可避免) 人工造假数据(政绩需要,回访,调查人员工作态度) 调查方法选择不当(调查人员专业水平) 数据整理过程出现失误 数据分析过程出现失误 抽样误差:样本本身的误差 (不可避免,可控) 数据存在变异可能(机械磨损-产品质量出现问题) 量化计算位数取舍误差 抽样调查的主要问题之一——减少误差 基本抽样设计 简单随机——利用随机数 系统抽样(等距抽样) 分层抽样(代表性) 聚点抽样(全息技术)——理想化的抽样方式 多步抽样(序贯抽样,成本降低) 抽样分布的基本原理 总体参数的样本统计量: 均值、方差、标准差 样本均值、样本方差、样本标准差 参数:常数,但一般未知,有待于抽样调查的统计推断 统计量 统计理论中用来对数据进行分析、检验的变量 利用样本中个体标志构造的函数,样本发生变化会导致函数结果发生变化,所以统计量是一个变量 常见统计量 均值 方差、标准差 K阶矩 K阶中心矩 主要的抽样分布 正态分布 卡方分布(开方分布) T分布(学生氏分布) F分布 抽样分布定理: 正态分布再生定理: 设 为一组随机变量,若它们相互独立,而且都服从正态分布 ,则 服从正态分布 。 样本有退还:定理成立 样本无退还:定理近似成立 标准差进行调整 样本平均数的均值、方差(165页) 例 某施工班5个人的日工资为34、38、42、46、50元,则: 总体工人日平均工资: 总体日工资方差: 现用抽样的方法从5人中随机抽2个构成样本,并求样本平均工资来推断总体的平均工资水平。 重置抽样 表:样本平均工资 样本变量 34 38 42 46 50 34 38 42 46 50 34 36 38 40 42 36 38 40 42 44 38 40 42 44 46 40 42 44 46 48 42 44 46 48 50 表:样本日平均工资分布 样本日均工资 频 数 频 率 34 36 38 40 42 44 46 48 50 1 2 3 4 5 4 3 2 1 0.04 0.08 0.12 0.16 0.20 0.16 0.12 0.08 0.04 合计 25 1 样本平均数的平均数就等于总体平均数 重置抽样的抽样平均误差等于总体标准差除以样本单位数的算术平方根 不重置抽样 表:样本平均工资 样本变量 34 38 42 46 50 34 38 42 46 50 - 36 38 40 42 36 - 40 42 44 38 40 - 44 46 40 42 44 - 48 42 44 46 48 - 表:样本日平均工资分布 样本日均工资 频 数 频 率 36 38 40 42 44 46 48 2 2 4 4 4 2 2 0.1 0.1 0.2 0.2 0.2 0.1 0.1 合计 20 1 样本平均数的平均数就等于总体平均数 重置抽样的抽样平均误差等于重置抽样标准差乘以修正因子 当N远远大于n时不重置抽样近似为重置抽样,经验公式为N大于等于20n 中心极限定理 设 为一随机变量,若它们相互独立且同分布 (不一定是正态分布),则 。 具体内容与重置抽样相同,唯一不同——经验公式为n30。 中心极限定理是正态分布再生定理的推广。在实际工作中总体变量的分布通常是未知的。一切的关键在于样本容量n的大小。 例:某证券交易所经营1000种股票,平均股息为8%,标准差为4%。现从中随机抽取200种进行调查,求出样本股息低于总体平均股息0.5%的概率
文档评论(0)