实验五列联分析和时间序列分析.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验五列联分析和时间序列分析.pptx

列联表分析又称交叉分组下的频数分析,它包括两大基本任务:第一,根据收集到的样本数据编制交叉列联表;第二,在交叉列联表的基础上,对两两变量间是否存在一定的相关性进行分析。 编制交叉列联表是交叉分组下的频数分析的第一个任务。交叉列联表是两个或两个以上的变量交叉分组后形成的频数分布表。;行变量;三维交叉列联表,反映了不同性别和不同职称以及不同文化程度交叉分组下的职工频数分布情况。 性别变量在spss中称为层变量(Layer);交叉列联表行列变量间关系的分析 在列联表的基础上作进一步的分析,可以得到行变量和列变量之间是否有联系、联系的紧密程度如何等更深层次的信息。 交叉列联表的χ 2卡方检验 ⑴建立原假设H0:行变量与列变量相互独立。 ⑵计算检验统计量 ⑶确定显著性水平和临界值 ⑷结论和决策 Pα,拒绝原假设,断定列联表??行列变量间不独立,存在依存关系;反之, Pα没有理由拒绝原假设,不能拒绝列联表的行列变量相互独立。 ;交叉列联表卡方检验的说明 ⑴ 列联表各单元格中期望频数大小的问题 列联表中不应有期望频数小于1的单元格,或不应有大量的期望频数小于5的单元格。如果交叉列联表中有20%以上单元格中的期望频数小于5,则一般不宜使用卡方检验。 ⑵样本量大小的问题 从Pearson卡方统计量的数学定义中可见,卡方值的大小会受到样本量的影响。有必要对Pearson卡方值进行必要的修正,以剔除样本量的影响。;案例4-5 利用“住房状况调查”数据,分析本市户口和外地户口家庭对“未来三年是否打算买房”是否持相同的态度。 利用交叉列联表来实现。列联表的行变量为“户口状况”,列变量为“未来三年”。;分析→描述统计→交叉表→把户口状况放入行,把未来三年放入列→选显示复式条形图;点统计量→选卡方;选单元格→选观测值、期望值、百分比的行、列、总计;残差的未标准化、标准化→ 继续→确定;在总共2993个样本中,有效2880,占96.2%。缺失113,占3.8%。;在总数2880中,本市2712,外地168,分别占总数的94.2%,5.8%,可见本市户口占多数。未来三年不买房,准备购买的样本数分别为2161,719,各占总样本的75.7%和25%,不买房占较大比例。 在本市户口(2712)中,未来三年不打算买房和打算买房的样本数分别是2052,660,占总样本的75.7%,24.3%,不打算买房占较大比例,打算买房的比例低于总体比例(25%); 在外地户口中(168)中,未来三年不打算不打算买房和打算买房的样本数分别为109,59,各占总样本(168)64.9%,35.1%,未来三年不打算买房的仍占较大比例,但打算买房的比例高于总体比例(25%)。;第一行是卡方检验的结果,观测值=9.819,自由度=1,P=0.002,原假设:本市户口和外地户口对未来三年是否买房的看法是一致的。因为P=0.0020.05=α,因此拒绝原假设,认为本市户口和外地户口对未来三年是否买房的看法是不一致的。这种不一致主要体现在打算买房的比例在本市户口中低于总体比例,而外地户口则高于总体比例。 似然比在大样本时和Pearson卡方检验通常是一致的;线性和线性组合(线性相关卡方),检验列联表中行列变量的线性相关性,原假设是行列变量零相关,只适用于定序变量,不能用于定类变量。户口状况为定类变量,因而不宜采用该检验。;本市户口和外地户口是否打算买房看法的分布条形图;参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。 非参数检验是在总体分布未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。 Spss中的非参数检验方法:单样本非参数检验、两独立样本参数检验、两配对样本非参数检验、多独立样本非参数检验、多配对样本非参数检验。;案例7-1 医学家在研究心脏病人猝死人数与日期的关系时发现:一周之中,星期一心脏病人猝死者较多,其他日子则基本相当。冬天的比例近似为2.8:1:1:1:1:1:1。现收集到心脏病人死亡日期的样本数据,推断其总体分布是否与上述理论分布相吻合。文件“心脏病猝死.sav”;分析→非参数检验→卡方→把死亡日期放入检验变量列表→在期望值的值中分别输入2.8、1、1、1、1、1、1 →确定→查看输出窗口;从图中可知,星期一~星期日实际死亡人数分别是55,23,18,11,26,20,15人;按照理论分布,168人在一周各天死亡的期望频数应为53.5,19.1,19.1,19.1,19.1,19.1,19.1。实际数与期望频数的差分别为1.5,3.9.-1.1,-8.1,6.9,0.9,-4.1。卡方统计量=7.757,自由度=6,P=0.2560.05=α,表示实际分布与理论分布无

文档评论(0)

rewfdgd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档