- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学课件第10章列联分析和对数线性模型配套讲义
* * 第十章 列联分析和对数线性模型 第一节 列联分析 第二节 对数线性模型 第一节 列联分析 * * 第十章 列联分析和对数线性模型 统计分析都是和变量打交道的,变量分为定量变量和定性变量(也称分类变量,含有序分类变量)两大类。比如银行可能用一个代码表示顾客的信用风险是好是坏,并用另一个代码表示这些顾客是自己买房还是租房。银行的信贷负责人员可能想知道信用风险状态是否和拥有房产有关。因为信用风险和拥有房产都是定性的、分类变量,前面介绍的统计技术不能够用来解决这个问题,我们需要一个新的统计工具来帮助管理者得到关于顾客总体的推断。这种统计工具就是列联表分析与对数线性模型。 * * 列联表 一、列联表数据 (一)列联表的构造 列联表(contingency table)是观测数据按两个或更多属性(定性变量)分类时所列出的频数表,也叫做交叉表格。 列联表中间的数据指的是各个定性变量不同水平组合下出现的频数或计数(count)。列联表包括二维列联表和高维列联表。 * * 一、列联表数据 二维列联表如下表所示,横向变量划分为r类视,纵向变量划分为s类。 * * 二维列联表 表10-1 一、列联表数据 二维列联表: 三维列联表: 这里所谓的三维即是由三个变量组成:投资方案、性别和年龄段。 * * 性别 投资方案:风险型 投资方案:稳健型 青年 中年 老年 青年 中年 老年 女 8 5 3 10 16 18 男 18 12 8 4 10 15 表10-3 投资方案选择 体型 运动习惯 偏胖体型 正常体型 偏瘦体型 合计 经常运动 15 45 20 80 偶尔运动 25 75 40 140 很少运动 20 30 30 80 合计 60 150 90 300 表10-2 运动习惯与体型数据表(单位:人) 一、列联表数据 数据录入统计软件(比如SPSS)中,往往需要将水平用代码表示.以表10-3为例,年龄段的“青年”、“中年”、“老年”用代码1、2、3代表;性别中的“女”、“男”用代码1、2代表;投资方案中的“风险型”、“稳健型”用代码1、2代表。 * * 一、列联表数据 (二)列联表的分布——观察值的分布 列联表也被称为条件频数表。表的最底行是每列的总次数,称之为行边缘频数,表的最右列是每行的总次数,称之为列边缘频数。表中的次数,称为条件频数,反映了数据的分布。以表10-2为例,得到表10-5. * * ? 偏瘦型 正常型 偏胖型 合计 经常运动 15 45 20 80 行百分数(%) 19 56 25 ? 列百分数(%) 25 30 22 ? 总百分数(%) 5 15 7 27 偶尔运动 25 75 40 140 行百分数(%) 18 54 29 ? 列百分数(%) 42 50 44 ? 总百分数(%) 8 25 13 46 很少运动 20 30 30 80 行百分数(%) 25 38 38 ? 列百分数(%) 33 20 33 ? 总百分数(%) 7 10 10 27 频数合计 60 150 90 300 总百分数合计% 20 50 30 100 表10-5 包含相对频数的列联表 (二)列联表的分布——期望值的分布 如果各种体型的人运动喜好相同,那么偏胖体型中经常运动的人数应该为 人,正常体型中经常运动的人数应该为 人,这16和41人就是期望值。根据这种计算方法可得到各个单元期望值的分布如表10-6所示。 表10-6 期望值分布表 (单位:人) 一、列联表数据 * * ? 偏胖型 正常型 偏瘦型 经常运动的期望值 偶尔运动的期望值 很少运动的期望值 二、 检验 分布是在统计学中经常用到的一种统计分布。前文已经介绍过,假设 是n个相互独立的随机变量,且 ,那么我们就定义 服从自由度为n的 分布,记作 : 可以用于变量间独立性检验,用于测量两个分类变量之间的相关程度。 统计量可以表示为 只有当样本容量足够大时才近似于卡方分布。 * * 二、 检验 统计量的计算过程如表所示: * * 第1步 第2步 第3步 15 16 -1 1 0.0625 45 40 5 25 0.625 20 24 -4 16 0.666667 25 28 -3 9 0
您可能关注的文档
最近下载
- GB 55009-2021 燃气工程项目规范.pdf VIP
- 机械搅拌澄清池的设计计算.doc VIP
- 邻里纠纷及其合法合理处理(社区法治大讲堂)课件.pptx VIP
- 从暂坐看现代都市女性的生存困境.docx VIP
- 产品售后服务响应时间和质量.docx VIP
- Unit 4 Amazing Plants and Animals Section B (1a-1f)课件—人教版英语八年级上册(内嵌音频+视频).pptx VIP
- 食堂食材配送服务食材质量承诺.docx VIP
- 2023年深圳楼市年报.docx VIP
- 西门子伺服操作说明书SINAMICS V90、SIMOTICS S-1FL6.pdf VIP
- 医疗健康园区环境监测方案.docx VIP
文档评论(0)