- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
独立性检验处理方法
独立性检验处理方法
摘 要:新的高中数学课程标准的建立,把原来在高中教材没有涉及到的问题都融入了高中的教学当中,如:算法与框图、茎叶图、还有回归分析和独立性检验,对于这些问题的处理上也是老师和学生关注的问题,作者就独立性检验一节的处理方式作以阐述,以起到抛砖引玉的作用.
关键词:独立性检验;假设检验;临界值
中图分类号:G632 文献标识码:A 文章编号:1002-7661(2012)12-178-02
本文将就以下几个问题展开阐述:
一、独立性检验的形成
独立性检验的基本过程是根据客观实践情况和经验,提出原假设,选好统计量,进行抽样、试验、计算、检验,进行判断.也就是说,整个过程贯穿着通过实践提出假设理论,再通过实践进行检验.假设的过程其实就是类似与数学证明中的反证法,其基本步骤如下:
假设: :两分类变量没有关系,用A、B表示两个分类变量,若 成立 事件A与事件B独立 .这单纯是从概率的角度衡量两个分类变量的是否有关.我们需要更进一步对相关程度进行检验,就是在假设 下,如果出现一个与 相矛盾的小概率事件,就可以推断 不成立,且该推断犯错误的概率不超过这个小概率.
二、独立性检验的基本思想
在新课程标准数学2-3第三章第二节对独立性检验进行了明确的阐述,课本首先通过对分类变量进行定义,分类变量也称属性变量或定性变量,它们的不同取值仅表示个体所属的类别,其取值是离散的.如性别变量,只能取男、女两个值,商品的等级变量只取一级、二级……,是否吸烟,宗教信仰,国籍等等都是分类变量.分类变量的均值和方差没有实际意义,所以不做研究.接着定义列联表:一般为两个或两个以上分类变量的汇总统计表.在我们的教材中仅限于两个分类变量的列联表,并且每个分类变量只取两个值,这样的列联表称为2×2列联表,如下:
总计
c
总计
在假设 成立的条件下,A表示 ,B表示 ,可以通过求分类变量 占总数与分类变量 占的总数的概率(用频率估计概率), 恰好为事件AB发生的频数; 和 恰好分别为事件A和B发生的频数.由于我们可以利用频率估计概率,所以在 成立的条件下应该有:
, ,可得:
.
即: .
因此, 越小,说明常上网与不及格之间的关系越弱,否则,关系越强.从这个角度这能说明两个变量间关系的强弱,而不能判断它们具体有多大程度上有关,在此基础上为了使不同样本的数据有一个统一而又合理的评判标准,统计学家们经过研究后构造了一个随机变量(卡方) = ,并且统计学家们通过实践还得到了如下的卡方临界值表:
P(K2≥k0) 0.50 0.40 0.25 0.15 0.10
k0 0.455 0.708 1.323 2.072 2.706
P(K2≥k0) 0.05 0.025 0.010 0.005 0.001
k0 3.841 5.024 6.635 7.879 10.828
在表格中的数字与上述式子能够说明一个什么问题呢?上面的表格中的第一行是作为检验的犯错的上界(上界也是我们要找的
那个小概率),下面的 是取值的临界值,接下来我们就从一个具体实例中做以分析:
例 1为了考察高中生的性别与是否喜欢数学课程之间的关系,在我校学生中随机抽取300名学生,得到如下列联表:
喜欢数学课程 不喜欢数学课程 总计
男 37 85 122
女 35 143 178
总计 72 228 300
由表中数据计算 的观测值.能够以95%的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?
解:可以有95%以上的把握认为“性别与喜欢数学课程之间有关系”.
= 4.514
因此应该断定“性别与喜欢数学课程之间有关系”成立,并且这种判断结果出错的可能性约为5%,所以,约有95%的把握认为“性别与喜欢数学课程之间有关系”。
这种利用随机变量 来确定是否能以一定的把握认为“两个分类变量之间有关系”的方法,称为两个分类变量的独立性检验。
在上述题目做判断两分类变量是否有关时出现了“断定”一词,“断定”一词在独立性检验中的含义是指检验判断,“断定为A,B有关系”就是检验判断为A,B有关系,也就是拒绝A,B无关系,即拒绝原假设 (接受假设 的对立面)。“约有95%的把握”中“把握”一词在独立性检验中的含义是指不犯错误的可信度,“有95%的把握”就是有95%可信度(可能性)。换而言之,应该是在原假设 成立的条件下,检验判断接受原假设 犯错误的概率不超过5%,而不犯错误的概率超过95%。换句话说,就是在原假设 成立的条件下,不犯错误接受对立假设 错误的概率超过95%。对与求出的 的观测值 越大说
文档评论(0)