- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计推断的概要(分析阶段)(ZTE-GB303-V1.5)主要内容1. 统计推断2. 误差的来源3. 置信区间1. 统计推断统计推断是通过抽取样本,然后对样本进行分析,以样本的分析结果推测出“总体可能是这样”结论,对总体下一个正确判断的行为,即总体是否发生了变动。而且,一般以推测总体平均值,总体的比率,总体标准偏差等显示总体分布特征值的统计程序称为统计推断。样本对数据的统计处理统计推断总体样本对事件的结论样本信息分析措施及行动因此我们要注意的是:观察样本并非为得到样本的信息,其目的在于通过样本分析,得到总体的信息,并对总体下恰当结论,采取相应措施。 点推断与区间推断当我们不知道的总体的特征值,我们可以利用样本推断总体的方法有两种. ■ 点推断: 推断为一个值 例) 平均,标准偏差,方差, 中位数,,,,, 但是点推断值中没有误差的概念。 即,无法知道样本中求出的推断值是否接近总体的真值。 ■ 区间推断: 推断总体可能包括的期望区间 例)置信区间,置信水平 区间推断是完善点推断的短处,在点推断值上包括误差概念。是否还记得基础统计学中讲到总体和样本的知识?Stat Basic Statistics Display Descriptive Statistics利用图表分析方法中学习的上述菜单,在MINITAB中求点推断值与区间推断值。对总体的点推断值 -平均,标准偏差 -分散 -斜型,尖度 -最小,最大, Median -四分位数对总体区间推断值95%置信度总体平均值 的置信区间-95%置信度下总体标准 偏差的置信区间-95%置信度总体中位 数的置信区间2. 误差产生的来源不管大家观察的数据是一个测定值或统计推断的结果,都有可能是错误的. 这是因为我们在总体中抽取样本的时候,希望观测值(平均,标准偏差…)是与总体的特性值相同,但大部分都会发生一定的差异.有时这种差异会引起错误的统计推断.误差的根源 : 样本误差 / 样本偏移(层别)/测定误差/测定妥当性样本样本误差包括样本层别错误样本 1样本 1总体总体样本 2样本2样本 3样本3从总体任意取出样本的差异引起的误差样本的层别错误造成偏向一侧,因样本选定引起的误差统计只能涉及样本误差,其它误差的根源应用其它解决方法样本误差对某一个问题,为了分析现象,假设抽取了几个样本 - 从总体抽取的样本的观测值(平均,标准偏差…)是否相同? - 样本的大小变化时发生什么?为加深大家的理解,做一下实习. Calc Random data Normal由1000个组成的样本保存在“数据”变量.Calc Random data Sample from columns…从总体中随机抽取的5个观察值和30个观察值.然后反复进行4次样本收集程序现在求上述标本的点推断值利用MINITAB的 Basic Statistics求标本的统计量.注意计算的各个统计量具有相当的差异,确认因样本的大小的平均,标准偏差的差异,并说明理由样本容量大小对推断值的影响观察一下样本容量大小对推断(对均值的推断)有什么样的影响??样本容量越大,平均值的推断分散越小,推断的精确度越高。n=2时平均的理论分布n=30时平均的理论分布样本均值的分布从前面的例子可以看出样本大小为2时和30时均值推断的分布如上图。我们为了解总体的特性,抽取的是样本,所以我们只能得到均值的推断.总体真实的均值在上面提示的理论分布中的某一位置,样本容量越大,推断的均值越精确. 弯曲点标准误差S=平均的标准误差x=S样本的标准偏差xn=样本大小10020随样本容量变化的平均标准误差(平均值的标准偏差)平均值的标准偏差称平均的标准误差(SE Mean),如下定义.一般标准误差越小推断值越好.30标准误差在样本大小为5,6时趋于稳定,样本大小为30时趋于平行.一般样本大小应为5以上,为了得到更精确的平均推断值,样本大小应为30以上.3. 区间推断区间推断与点推断相比是引用误差概念的统计推断法,推断出总体特征值(平均、方差、比率)在什么范围之内,可以用置信区间来表示.置信度或样本容量变化,推断的值的范围也会发生变化.我们通过置信区间的计算就可以断定研究的变量“X”是否发生了变动?从而确定它是否是我们真正要关注的“关键的少数”?95% 置信区间95% 置信区间总体的分布 n=2时的理论分布 n=30时的理论分布举例(连续型数据)洗衣机传动装置的总高度将影响制动性能。项目Y是总高度,目标值=5.394,加工这种部件时所使用的固定架共有8个。您想了解什么?使用第三个固定架生产出的部件的平均高度与目标值是否一致? 分析步骤:1. 将数据绘制成图使用置信区间来确定所观测到的差异是 否真实。3. 得出结论。New5.3975.396高度 (英寸)5.395目标值
文档评论(0)