11-A阶段统计推断.pptVIP

下载本文档

2
0
约3.23千字
约 24页
2017-08-24 发布于浙江
举报
版权申诉

11-A阶段统计推断.ppt

1、本文档共24页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

统计推断的概要 1. 统计推断 2. 误差的来源 3. 置信区间主要内容 1. 统计推断统计推断是通过抽取样本，然后对样本进行分析,以样本的分析结果推测出“总体可能是这样”结论，对总体下一个正确判断的行为，即总体是否发生了变动。而且，一般以推测总体平均值，总体的比率，总体标准偏差等显示总体分布特征值的统计程序称为统计推断。总体样本样本样本对数据的统计处理统计推断信息分析对事件的结论措施及行动因此我们要注意的是：观察样本并非为得到样本的信息，其目的在于通过样本分析，得到总体的信息，并对总体下恰当结论，采取相应措施。点推断与区间推断当我们不知道的总体的特征值，我们可以利用样本推断总体的方法有两种. ■ 点推断: 推断为一个值例) 平均，标准偏差，方差，中位数,,,,, 但是点推断值中没有误差的概念。即，无法知道样本中求出的推断值是否接近总体的真值。 ■ 区间推断: 推断总体可能包括的期望区间例）置信区间，置信水平区间推断是完善点推断的短处，在点推断值上包括误差概念。是否还记得基础统计学中讲到总体和样本的知识？ Stat Basic Statistics Display Descriptive Statistics 利用图表分析方法中学习的上述菜单，在MINITAB中求点推断值与区间推断值。对总体的点推断值 -平均，标准偏差 -分散 -斜型，尖度 -最小，最大, Median -四分位数对总体区间推断值 95%置信度总体平均值的置信区间 -95%置信度下总体标准偏差的置信区间 -95%置信度总体中位数的置信区间不管大家观察的数据是一个测定值或统计推断的结果，都有可能是错误的. 这是因为我们在总体中抽取样本的时候，希望观测值(平均,标准偏差…)是与总体的特性值相同,但大部分都会发生一定的差异.有时这种差异会引起错误的统计推断. 2. 误差产生的来源总体样本 1 样本误差误差的根源 : 样本误差 / 样本偏移(层别)/测定误差/测定妥当性从总体任意取出样本的差异引起的误差样本 2 样本 3 总体样本 1 样本样本2 样本3 样本的层别错误造成偏向一侧，因样本选定引起的误差包括样本层别错误统计只能涉及样本误差,其它误差的根源应用其它解决方法对某一个问题,为了分析现象,假设抽取了几个样本 - 从总体抽取的样本的观测值(平均,标准偏差…)是否相同? - 样本的大小变化时发生什么? 为加深大家的理解,做一下实习. 样本误差由1000个组成的样本保存在“数据”变量. Calc Random data Normal Calc Random data Sample from columns… 从总体中随机抽取的5个观察值和30个观察值.然后反复进行 4次样本收集程序现在求上述标本的点推断值利用MINITAB的 Basic Statistics求标本的统计量. 注意计算的各个统计量具有相当的差异,确认因样本的大小的平均,标准偏差的差异,并说明理由从前面的例子可以看出样本大小为2时和30时均值推断的分布如上图。我们为了解总体的特性,抽取的是样本,所以我们只能得到均值的推断.总体真实的均值在上面提示的理论分布中的某一位置,样本容量越大,推断的均值越精确. 样本容量大小对推断值的影响观察一下样本容量大小对推断(对均值的推断)有什么样的影响? 样本容量越大,平均值的推断分散越小,推断的精确度越高。 n=30时平均的理论分布 n=2时平均的理论分布 ? 样本均值的分布平均值的标准偏差称平均的标准误差(SE Mean),如下定义. 一般标准误差越小推断值越好. 随样本容量变化的平均标准误差（平均值的标准偏差）样本大小 = n 样本的标准偏差平均的标准误差 = = x x S S 弯曲点标准误差 10 0 20 30 标准误差在样本大小为5,6时趋于稳定,样本大小为30时趋于平行.一般样本大小应为5以上,为了得到更精确的平均推断值，样本大小应为30以上. n=2时的理论分布 95% 置信区间 95% 置信区间总体的分布 n=30时的理论分布区间推断与点推断相比是引用误差概念的统计推断法,推断出总体特征值（平均、方差、比率）在什么范围之内，可以用置信区间来表示. 置信度或样本容量变化,推断的值的范围也会发生变化. 我们通过置信区间的计算就可以断定研究的变量“X”是否发生了变动？从而确定它是否