- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学第9讲 第9章 推论统计导论
* * 第9章 推论统计导论 9.1 抽样问题 问题1:你是一位临床心理学者,你想在某一社区进行心理治疗,你希望了解什么? 答案:社区的情绪问题和发病率。 问题2:如果你感到身体不适,医生想给你验血,医生想了解什么? 答案:医生想了解你是否患了某种疾病。 以上问题的共同点是什么? 答案:你想知道某总体的参数,通过参数得到结论 我们关心的“总体”主要是指一个假设整体。在典型的实验情境中,真实的总体是不存在的。而我们想得到的是假设这个总体存在时,总体的一些性质。 例如我们随机抽取一组病人(样本)服用某种药物,我们希望什么? 我们希望试验结果可以给可能使用这种药物的每一个人。当然这里是假想的总体。 因为我们无法对总体进行详细研究,只有根据样本统计量得出关于总体参数的结论。几乎所有的研究都是对有限的个体进行观察和测量,从中了解总体的情况。 9.2 抽样分布的概念 从总体中随机抽取N个样本,根据样本统计量推论总体参数。这些样本统计量可能出现的所有情况,称为“抽样分布”。每一种统计量都有抽样分布,例如平均数、标准差、方差、比例、中位数等。 例如,从一个μ=4,σ=1的总体中随机抽取一个相同容量的样本,大多数的样本平均数会接近4.0,也可能有极个别的偏离4.0,异常平均数的大小取决于样本大小。 随机抽取的个体的分数分布 N=2 N=20 样本平均数与总体平均数相差较大 样本平均数与总体平均数相差较小 N=40 样本平均数与总体平均数相差小 为什么抽样分布如此重要? 答案:一旦知道样本统计量的抽样分布,你就可以作出各种不同的假设检验。 例题:调查某地化工厂排放污水对环境所致影响,已知附近的野生海龟平均体重为μ=4,σ=1,理论上大约65%的海龟在3-5磅之间。 随机抽取一个比较大的海龟的样本,海龟重量接近4磅。样本平均数越接近总体平均数 假如我们抽样发现海龟重量大约是6磅,大样本也是如此,你会有什么想法? 答案:这些海龟已经不属于4磅的那个群体了。 另外一个问题,由样本估计总体,误差有多大?如何估计误差?需要把样本结果与预计的结果进行比较。而预计结果是根据抽样分布得出的。 抽样分布的性质: 1. 加大样本量,统计量的分布越接近参数分布。 2. 分布形态越对称,接近钟形分布。 图9-2 从三个不同总体中抽取样本量分别为2、4、30时的抽样分布,无论总体分布怎样,随着样本量增加,平均数的分布都接近正态 9.3 统计假设的检验----显著性水平 例题:假设一个完美的硬币,投掷10次,请预测:“不是5次正面5次反面的概率”是多少? 只有25%出现5次正面,不是对半的概率是75% 如果出现9次正面1次反面,如何对看待这个结果? 答案:我们怀疑这个硬币的可信度,因为太罕见 罕见的情况使我们怀疑这种情况不是偶然因素所致,而是硬币有问题。 这里有一个重要问题:“从投掷硬币的问题,我们能否得出推论的界限在哪里?” 答案:科学的本质是讲概率的,没有所谓绝对的科学,在科学领域,多数研究者会采纳下列两个临界点中的一个作为对非偶然性因素的作用进行推论的依据。 1. 在一个抽样分布中,如果一个事件发生的概率≤0.05时,研究者认为该事件不是偶然因素所致。而是其他因素引起,例如是对自变量的操纵引起的。 称为0.05的显著性水平(0.05 significance level)或5%的显著性水平。 2. 在一个抽样分布中,如果一个事件发生的概率≤0.01时,研究者认为该事件不是偶然因素所致。而是其他因素引起,例如是对自变量的操纵引起的。称为0.01的显著性水平(0.01significance level)或5%的显著性水平 实验者推论非偶然因素在某事件所起的作用的显著性水平称为α水平(αlevel ) ,例如α=0.05或0.01 在投掷硬币中,出现9次正面甚至更为极端情况的概率是多少呢? P(9次正面)+P(10次正面)+P(1次正面)+P(0次正面)= 0.010 +0.001 + 0.010 +0.001 =0.02 投掷硬币10次,出现9次正面这种罕见事件的双尾概率大约=0.02。如果选择α=0.05,我会认为这个结果是由非偶然因素造成的(硬币有偏向)。 如果选择α=0.01,则我们不能够判定是偶然所致。 注意:选择什么样的α水平,在研究设计阶段就要确定下来。我们不能先进行一项研究,然后分析结果,得到一个概率值后再去确定α水平。 9.4 统计假设的检验 9.4.1 虚无假设和被择假设 总体 样本 总体 假定μ=4.0 我们研究的目的:由样本推论总体 我们希望:如果样本平均数=6.0,那么总体平均数必定为6.0 我们只能说:如果μ=4.0,那么得到一个样本平均数不同于总体的概率是多大? 样本 推论统计
原创力文档


文档评论(0)