- 1、本文档共95页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
案例2 陆军部队要从大学招募军官。为了能进入军官预备学校,参加考试的大学毕业生的成绩必须名列前75%。 去年,平均考试成绩为80分,标准差为6,并且考试成绩服从正态分布,那么如果只招收成绩排在前75%的应聘者,最低录取分数线应该定为多少? 有50%的应聘者其成绩在80分以上,因此,要求的分数线应低于平均数,且落入平均数与分数线之间的分数比例为25%。在正态分布表中查找概率0.25,发现与其最为接近的概率是0.248 6,它所对应的z值为0.67。因为我们所感兴趣的变量值小于平均数,因此,我们在这里要求的z值应该为-0.67。 将z等于-0.67转化为原始数据,最后得到最低录取分数线为76分(-0.67×6)+80。 案例 如果知道某一学生考试得了87分,那么我们几乎无法判断该成绩是好是坏。因为考试的题目的难度,学生的现有知识水平、以及评分标准都会影响到学生的得分。87可以说很高,也可以说很低; 但如果我们知道了学生的Z分数,我们就可以了解该学生这次考试是低于平均分还是高于平均分以及在全班(或者总体)的一个什么位置。 试利用Z分数分析该考生的成绩(均值88. 标准差 6) 一个重要概念:自由度 自由度是“未知量的数目减去连接这些未知量的等式的数目”。 假设有两个变量(x和y),两个两个自由度。 如果:x+y=30。一个自由度 如果三个未知变量x,y,z,三个自由度。 如果知道x+y+z=50,两个自由度 ?2 分布 ?2 (chi-square)分布 定义 设随机变量X1, X2, ?, Xn彼此独立且都服从标准正态分布 N(0, 1),则随机变量 服从自由度为n的?2分布,记为 ?2 分布 性质 ?2 分布随机变量的取值范围为(0,?) 若Y1 ~ ?2 (n),Y2 ~ ?2 (m),且相互独立,则 Y1 ± Y2 ~ ?2 (n ± m) ?2 分布为非对称分布,其分布曲线的形状由自由度决定,自由度越大,分布越趋于对称 当 n ? ?, ?2 (n) ? N(n, 2n) ?2 分布 ?2 分布上侧分位数表:附表(p.277) t 分布 t 分布 t 分布与正态分布的比较 t 分布 定义 设Z ~ N(0, 1),Y ~ ?2 (n),且相互独立,则 服从自由度为n-1的 t 分布,记为 t 分布 性质 与标准正态分布相似 关于 t = 0对称 只有一个峰,峰值在t = 0 分布曲线受自由度影响,自由度越小,离散程度越大 当 n ? ?,t(n) ? N(0, 1) t 分布 t分布双侧分位数表:附表(p. 279) F 分布 F 分布 定义 若 X ~ ?2 (m),Y ~ ?2 (n),且相互独立,则 服从自由度为m(第一自由度)和n(第二自由度)的 F 分布,记为 F 分布 性质 F分布随机变量的取值范围为(0,?) F分布的分布曲线受两个自由度的影响 若F ~ F(m, n),则 1/F ~ F(n, m) 若X ~ t(n),则 X2 ~ F(1, n) F 分布 F分布的上侧分位数表:附表(p.281) 正态总体样本平均数的分布 样本平均数的期望和方差 设样本来自均数为?,方差为? 2的总体 设样本为简单随机样本 正态总体样本平均数的分布 期望 正态总体样本平均数的分布 方差 标准差 (平均数的标准误) 正态总体样本平均数的分布 正态总体样本平均数的分布 设样本来自正态总体 N(? , ? 2),则样本平均数也服从正态分布,其总体均数为? ,方差为? 2/n。 中心极限定理 无论样本所来自的总体是否服从正态分布, 只要样本足够大,样本平均数就近似服从正态分布,样本越大,近似程度越好。 所需的样本含量随原总体的分布而异,但只要样本含量 ? 30,无论原总体是何分布,都足以满足近似的要求。 设原总体的期望为?,方差为? 2,则样本平均数的期望为?,方差为? 2 /n。 本章到此结束! 谢谢各位! 管理定量分析第3章抽样方法与抽样分布. 谢谢 * * * 例2 大样本抽样 假设要研究某大学的学生对校方拟实行的一套学生管理条例的态度。研究总体为2 0000名该校注册学生。样本要素则为该大学的每个学生,此研究所考察的变量为对校规的态度,这是一个二项式变量:同意与不同意。我们将随机抽取其中100名学生为样本以估计总体的情况。 抽取更多的样本之后 两个概念 离散变量:是指采用记数的方法,如0,1,2,3,…来描述具体事物的数量特征。 例如,一个机构的职务分类数,一个部门的从业人数等等。这些都是离散变量的例子。 连续变量:在一个给定的区间内有无数多个变量值,例如,温度、气压、身高、体重、时间以及距离等等。注意,这些变量的共同特点是都可以用小数表示。 正态分布是用来描述
文档评论(0)