- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
*8.3.2独立性检验某位打猎新手与一位老猎人一起出处打猎,一只野兔从前方窜过。只听得一声枪响,野兔应声倒下了。你推测,这发命中的子弹是谁打的?依据是什么?根据概率的大小作出推测、决策等,体现了极大似然的思想情景1情景2一位刚参加工作的新教师,月薪是5000元,他希望下一年月薪是8000元;一位工作5年的青年教师,月薪是11000元,他希望下一年月薪是15000元.请问:哪位教师的理想更容易实现?一位公司高管现在的月薪是29万元,他希望下一年月薪为30万元.请问:三人谁的理想更容易实现?引例为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异.解:用Ω表示两所学校的全体学生构成的集合.考虑以Ω为样本空间的古典概型.对于Ω中每一名学生,定义分类变量X和Y如下:881771合计45738乙校(X=1)431033甲校(X=0)优秀(Y=1)不优秀(Y=0)合计数学成绩学校学习新知881771合计45738乙校(X=1)431033甲校(X=0)优秀(Y=1)不优秀(Y=0)合计数学成绩学校甲校学生中数学成绩不优秀和数学成绩优秀的频率分别为乙校学生中数学成绩不优秀和数学成绩优秀的频率分别为两个学校学生抽样数据中数学成绩优秀的频率存在差异,甲校的频率明显高于乙校的频率.依据频率稳定于概率的原理,推断甲校学生数学成绩优秀的概率大于乙校学生数学成绩优秀的概率,甲校学生的数学成绩优秀率比乙校学生的高.“两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率间存在差异推断出来的.对随机样本而言,频率具有随机性,频率与概率之间存在误差,我们的推断可能犯错误,在样本容量较小时,犯错误的可能性会较大.需要找到一种更为合理的推断方法,统计样本的实际观测值与理论推断值的吻合程度,对出现错误推断的概率有一定的控制或估算.例1为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异.881771合计45738乙校(X=1)431033甲校(X=0)优秀(Y=1)不优秀(Y=0)合计数学成绩学校如何理解两校学生的数学成绩优秀率无差异?分类变量X与Y之间什么关系?33104338745711788不优秀率合计数学成绩学校甲校(X=0)乙校(X=1)合计不优秀(Y=0)优秀(Y=1)优秀率分类变量X与Y相互独立,即两校学生的数学成绩优秀率无差异.零(原)假设H0:如何衡量样本的实际观测值与理论推断值之间的差距?XY合计Y1率Y2率Y1Y2X1aba+bX2cdc+d合计a+cb+da+b+c+d=n该表达式可化简为用χ2取值的大小判断零假设H0是否成立,即分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验。忽略χ2的实际分布于近似分布的误差,对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立,我们称xα为α的临界值,这个临界值可作为判断χ2大小的标准.小概率事件在一次实验中不大可能发生,可以构造一个与想矛盾的小概率事件实现。在假定H的条件下,队友有放回简单随机抽样,样本容量n充分大时,得到χ2的近似分布。χ2独立性检验中几个常用的小概率值和相应的临界值基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.(1)当时,我们推断H0,即,(2)当时,对于一个小概率值α=0.05,有如下的具体检验规则:α0
文档评论(0)