DMD-4-抽样统计.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
DMD-4-抽样统计

数 据 模 型 决 策 第五章 决策分析中的抽样推断   决策者在某一决策过程需要建立恰当的决策模型,而这一过程的一个很重要的就是数据的支持。特别当遇到不确定因素时,他就希望了解不确定因素服从的分布以及分布中的重要参数,如数学期望,方差等。如何解决这些问题?通常的办法就是“抽样分析”。 数 据 模 型 决 策 5.1 随机抽样   随机抽样——从关心的所有对象中随机地选取若干对象。 总体——决策者或调查者关心或感性趣的所有对象(单元)的集合。 样本——总体中一些对象(单元)的集合。 在各种各样的随机抽样方法中应用广泛而简单的是简单随机抽样,由此获得的样本为简单随机样本。 简单随机抽样——样本的收集方法是使总体中的每一个对象(单元)被抽到的可能性都一样。 数 据 模 型 决 策 5.2 抽样数据的整理与概括   通过随机抽样,可以获得数据,这些数据来自于总体,自然反映了总体的有关信息。但这些数据最初仍然是一大堆看起来“杂乱无章”的数据,很难从中分离出我们感性趣的信息。因此,必须对这些数据进行整理,应用统计理论的方法获得一些“统计量”,以此来反映总体的一些重要特征——期望值、方差、分布函数等信息。 数 据 模 型 决 策 1、对总体分布函数 F(t)的估计 设x1,x2,…,xn是一个样本的n个观察值,对每一个xi赋予概率1/n ,然后,按其大小排序,得到所谓顺序统计量,于是可以获得统计学中的基于样本 x1,x2,…,xn 的经验分布 Fn(t),当样本容量 n 足够大时, Fn(t)将可以很好地拟合于总体的分布函数 F(t)。 数 据 模 型 决 策 2、关于总体均值与标准差的估计(点估计) 样本均值 数 据 模 型 决 策 2、关于总体均值与标准差的估计(点估计) 容易证明 E X = ? ( ? 为总体的均值) E S2 = ?2 ( ?2 为总体的方差) 因此 数 据 模 型 决 策 变异系数(Coefficient of Variation)—— CV   标准差虽然反映了样本数据离散的程度,但是比较两组样本的离散的程度时,不能只比较它们各自的标准差的大小,特别是当两组样本具有不同的测度单位时尤其如此。而变异系数作为一种相对性测度,用来比较两组具有不同测量单位的样本数据的变异性时特别有用。 数 据 模 型 决 策 3、中位数、分位数、众数   对于数据的统计分析,仅仅掌握一些诸如平均数,标准差等统计量有时是不够的,这就需要进一步分析引进另外一些概括统计量加以描述。   统计学中的“五数概括”——   中位数,上四分位数,下四分位数,最小值,最大值。 4、应用Microsoft Excel 计算概括统计量 5、基于样本数据的图形描述 数 据 模 型 决 策 5.3 均值的置信区间(区间估计)   前面所介绍的以样本均值来估计总体均值 ? ,样本标准差来估计总体标准差 ? ,这种估计方法在统计理论常称之为参数的点估计。然而,由于样本是随机抽取的,因此,估计量与要估计的参数之间将存在误差,从而,研究“真实的参数恰好就是估计值”缺乏实际意义,而研究“真实的参数恰好落入由样本xi 所构造的某个区间内”比较现实,这样的区间就称为参数的置信区间,而这样的估计称为参数的区间估计。进行参数的区间估计时一个重要的问题是“以多大的概率使我们相信真实的参数落入我们构造的区间内”。 数 据 模 型 决 策 1、大样本情况下总体均值 ? 的置信区间   由中心极限定理(当样本容量 n 足够大时) 数 据 模 型 决 策 2、t- 分布及小样本情况下均值 ? 的置信区间   当样本不是相当大时,我们就无法利用中心极限定理如前面一样去进行 ? 的区间估计。但是如果样本 x1,x2,…,xn 是独立地来自于同一正态母体 N( ? , ? )时,则 T 服从自由度为(n – 1 )的 t- 分布,记为 t(n - 1),即: 数 据 模 型 决 策 3、比率 p 的置信区间   在管理实践中,往往决策者非常关心的一个参数是具有某些特性的群体在总体中所占的比例,如质量管理经理关心生产成品

文档评论(0)

yan698698 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档