- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3-统计制表
第三讲:资料的统计描述(一):统计制表
描述性统计概述
描述性统计主要对统计数据的结构和总体情况进行描述,一般并不深入了解统计数据的内部规律。主要分三方面的内容:Reports(报表模块)、Descriptive Statistics(描述统计)Tables(定制表格)。描述性统计是统计分析和统计推断的基础,在以后的每个过程中几乎都会用到。本讲将主要介绍Reports与Tables模块中的统计制表
1、Reports
该命令共包含了4个过程,分别是OLAP Cubes(Online Analytical Processing在线分析),Case Summaries(案例摘要),Report Summaries in Rows(行摘要),Report Summaries in Columns(列摘要)。
OLAP Cubes:
所谓的在线分析指的是用快速简单的方式对变量进行描述,并生成一个多层表,用户可以按照需要组织分组变量的某个/某些特定水平组合输出,这在使用类别较多的分组变量时将会非常节省输出空间。例如研究者要对汽车的重量按照其产地以及汽缸数计算平均数以及标准差。
该窗口的右侧为当前数据中的所有变量,summary variables为需要进行分析的变量(本例中为weight),如果同时选入多个变量,系统将在同一张表格内一次对它们进行分析;grouping variables为分组变量(本例为origin与cylinder),但是请注意:OLAP过程不会同时输出分组变量的所有组合水平下的分析结果,而是用多层表格的形式表现,在默认情况仅仅显示合计的情况;同时origin与cylinder两个变量均未缺失的case才可进入最终分析。
Statistics子对话框中提供了几种常用的统计量,可根据研究目的选择合适的数值描述指标:
Differences子对话框用于计算不同汇总变量间、同一变量在各组间的差值或百分比:
定义要所需要的统计描述项目后,点击OK:
上表为进入分析的记录汇总,可见在所有的406条记录中,共有1条记录因为有缺失值而未能入选。下表即为在线分析结果,可见总共405辆汽车的总重量为1204910磅,均数为2975.09磅,标准差为843.546磅。注意该表仅仅是汇总结果,实际为一个多层表,请双击该表进入编辑状态后,可以按照产地和汽缸数的取值不同进行组合,得到不同的weight平均值和标准差。
如果研究者想进一步了解欧洲车与日本车在车重的差异,可以使用differences子对话框指定type of differences为arithmetic differnce,differences between groups of cases中的grouping为origin,category为2、minus为3,点击pairs按钮,OK即可得到下表:
似乎和上表相比没有任何差别,但是双击该表进入编辑状态,在country origin的下拉选项中多出了European-Japanese选项,选择它即可。请注意该表中的每一个指标都是单独计算的。
Case Summaries:
与OLAP过程可以产生自定义的简洁分层表格不同的是,该命令可以将指定分组变量的所有组合全部列出。仍然以上题为例,对车重按照产地与汽缸数分类统计其平均数与标准差。
该对话框与OLAP相似,将要分析的weight移入variables中,cylinder与origin移入grouping variables中;在statistics中选择需要的指标,点击OK即可。(最好将display cases前的小勾去掉,使得结果输出较为简洁)。
Report Summaries in Rows
该命令是专门用于生成复杂表格的,而且其输出格式为.txt格式。例如研究者想将系统自带数据Breast cancer survey观测对象,按照淋巴结是否转移、组织学分级分别统计患者的生存时间与肿瘤大小的平均数、标准差;并统计在不同组织学分级中,计算肿瘤大小超过1.5公分所占的比例。
如果通过前面介绍的命令,需要多步处理后才可以得到想要的结果;但是通过该命令可以仅仅运行一次就得到想要的结果。
Data columns为需要对其进行汇总的变量,break columns为分组变量
分别点击data columns中的time与size,定义其format,窗口如下:
同理也可以在break columns中定义的淋巴结转移情况、组织学分级;另外可以定义如何对这两个分组变量所对应的time和size进行统计描述:
定义结束后直接点击ok,系统运行后得出结果表格如下(节选),如果需要修改表格中的数据可以直接双击该表格编辑。
Repor
原创力文档


文档评论(0)