计算机数据库(经济会计类)分类数据(new)随堂讲义.pptVIP

计算机数据库(经济会计类)分类数据(new)随堂讲义.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
As a result of this class, you will be able to ... 拟合优度检验 (例题分析步骤) 解:要回答观察频数与期望频数是否一致,检验如下假设: (1)提出假设(2)计算??统计量 H0:观察频数与期望频数一致(存活与性别无关) H1:观察频数与期望频数不一致(存活与性别有关) 拟合优度检验 (例题分析) (3)查??临界值。 自由度的计算为df=R-1,R为分类变量类型的个数。在本例中,分类变量是“性别”,有男、女两个类别,故R=2,于是自由度df=2-1=1。又给出显著性水平0.1,经查??分布表, ??0.1(1)=2.706 (4)决策。 由于??统计量大于??临界值。故拒绝H0,接受H1,说明存活状况与性别显著相关 总体比例的拟合优度检验 参见教材2,19页,例题 9.3 列联分析:独立性检验 9.3.1 列联表 9.3.2 独立性检验 列联表 (contingency table) 由两个以上的变量交叉分类的频数分布表 行变量的类别用 r 表示, ri 表示第 i 个类别 列变量的类别用 c 表示, cj 表示第 j 个类别 每种组合的观察频数用 fij 表示 表中列出了行变量和列变量的所有可能的组合,所以称为列联表 一个 r 行 c 列的列联表称为 r ? c 列联表 列联表的结构 (r ? c 列联表的一般表示) 列(cj) 合计 j =1 j = 2 … i =1 f11 f12 … r1 i = 2 f21 f22 … r2 : : : : : 合计 c1 c2 … n 列(cj) 行(ri) fij 表示第 i 行第 j 列的观察频数 独立性检验(P220) (例题分析) 【例】一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如表9-3所示,要求检验各个地区和原料质量之间是否存在依赖关系? (? ?0.05) 解:H0:地区和原料等级之间是独立的(不存在依赖关系) H1:地区和原料等级之间不独立 (存在依赖关系) ?? =19.82大于?? 0.05(4)=9.488,故拒绝H0,接受H1 ,即地区和原料等级之间存在依赖关系,原料的质量受地区的影响 独立性检验 (例题分析) 独立性检验步骤 1.提出假设 2.计算頻数的期望值 fe和??统计量 其中,RT(row total)为给定单元的行的合计; CT(column total)给定单元列的合计; n为頻数合计。 3.根据显著性水平(0.05、0.01、0.1), ??自由度(R -1)(C-1)=(行数-1) × (列数-1) 查表得??临界值 4.决策(见221) ??大于临界值,拒绝原假设,分类变量之间存在依赖关系。 9.5 列联分析中应注意的问题 9.5.1条件百分表的方向 9.5.2卡方分布(?? )的期望值准则 9.5.1条件百分表的方向 在列联表中,变量x、y的位置是任意设置的 但如果两者存在因果关系,一般将自变量x放在列的位置,条件百分表一般也按照自变量位置排列。(具体可参见教材P228) 例外情况也存在。如果因变量在样本内的分布不能代表其在总体内分布(如根据需要,抽样时扩大了因变量某项内容的样本量),若仍以自变量方向来计算百分表,则会歪曲事实。这是需要改为按因变量方向计算百分表。( P228) 9.5.2卡方分布的期望值准则 卡方分布进行独立性检验,要求样本量必须足够大,特别是每个单元的期望頻数(fe)不能过小,否则,检验将会出现错误结论。 准则一:如果只有两个单元(或两个类别),每个单元的期望頻数必须是5或5以上。 准则二:倘若有两个以上单元,如果20%的单元期望頻数(fe)小于5,则不能应用卡方检验。处理方法:将较小的(fe)合并,则可得到合理的结论。(P229) 本章小结 拟合优度检验:是一个分类变量的检验,如“性别”。 独立性检验:是两个分类变量(如“原料产地”和“原料等级”)的检验,即检验两个分类变量是否相互独立。 其分析的关键是:获得頻数期望值(fe) 结 束 * As a result of this class, you will be able to ... 9 9 9 第 9 章 分类数据分析 统计学 假设检验的难点说明: 单侧检验的假设 原假设:一般是原有的、传统的观点或结论,或原有的看法、状况。——不能轻易否定 备择假设:是新的、可能的猜测,或需要用证据来证明的命题。 ——需要用证据来验证的命题 举例说明: 例1:采用新

文档评论(0)

151****0104 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档