sas列联分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
sas列联分析

列联分析 1 分类数据与列联表 2 c2 检验 数据的类型与列联分析 分类数据 分类变量的结果表现为类别 例如:性别 (男, 女) 各类别用符号或数字代码来测度 使用分类或顺序尺度 你吸烟吗? 1.是;2.否 你赞成还是反对这一改革方案? 1.赞成;2.反对 对分类数据的描述和分析通常使用列联表 收集分类数据的目的是为了分析在各个类中数据的分布。例如,我们为了估计消费者中喜欢三种牙膏中每一种的比例,则统计购买这三种品牌牙膏的顾客购买每一种的人数。在这里仅仅是根据牙膏的种类来分类,我们称之为一维分类或一向分类。而顾客的投资倾向与职业的关系中,分类是按投资倾向和职业两个方向进行分类,我们称之为二向分类或列联表。我们先分析一向分类。下面通过例子来介绍一向分类数据的分析。 列联表的构造 列联表 (contingency table) 由两个以上的变量交叉分类的频数分布表 行变量的类别用 r 表示, ri 表示第 i 个类别 列变量的类别用 c 表示, cj 表示第 j 个类别 每种组合的观察频数用 fij 表示 表中列出了行变量和列变量的所有可能的组合,所以称为列联表 一个 r 行 c 列的列联表称为 r ? c 列联表 列联表的结构 (2 ? 2 列联表) 列联表的结构 (r ? c 列联表的一般表示) 列联表 (例题分析) 列联表的分布 观察值的分布 边缘分布 行边缘分布 行观察值的合计数的分布 例如,赞成改革方案的共有279人,反对改革方案的141人 列边缘分布 列观察值的合计数的分布 例如,四个分公司接受调查的人数分别为100人,120人,90人,110人 条件分布与条件频数 变量 X 条件下变量 Y 的分布,或在变量 Y 条件下变量 X 的分布 每个具体的观察值称为条件频数 观察值的分布 (图示) 百分比分布 (概念要点) 条件频数反映了数据的分布,但不适合对比 为在相同的基数上进行比较,可以计算相应的百分比,称为百分比分布 行百分比:行的每一个观察频数除以相应的行合计数(fij / ri) 列百分比:列的每一个观察频数除以相应的列合计数( fij / cj ) 总百分比:每一个观察值除以观察值的总个数( fij / n ) 百分比分布 (图示) 期望频数的分布 观察值与期望频数的分布对比表 (例题分析) ?? 统计量 ?? 统计量 用于测定两个分类变量之间的相关程度 计算公式为 频数过程 频数过程(FREQ)用于计算各种形式的频数及一些检验统计量。 频数过程句法 PROC FREQ options; OUTPUT OUT= SAS-data-setoutput-statistic-list; TABLES requests / options; WEIGHT variable; EXACT statistic-keywords; BY variable-list; 语句说明: PROC FREQ语句 PROC FREQ options; 选项说明: ORDER=选项及说明: FORMCHAR(1,2,7)= 符号串: 1规定垂直线字符; 2规定水平线字符; 7规定水平与垂直交叉线字符。 ? 通常情况下的FORMCHAR=选项: FORMCHAR(1,2,7)= | - +; ? 表格没有轮廓线和分隔线的FORMCHAR=选项: FORMCHAR(1,2,7)= ; /* 三个空格 */ WEIGHT语句 WEIGHT variable; 该语句规定一个WEIGHT变量,它的值表示相应观测的权数。该变量的值应大于零。若这个值0或缺失,假定该值为0。 BY语句 BY variable-list; 对BY变量定义的观测组分别计算其相应的简单统计量。当使用BY语句时,要求输入数据集已按BY变量排序的次序排列,除非指定NOTSORTED。 OUTPUT语句 OUTPUT OUT= SAS-data-setoutput-statistic-list; 该语句创建一个由PROC FREQ过程输出统计量的SAS数据集。OUTPUT创建的数集可以包括由TABLES语句规定的任意统计量。 PROC FREQ过程每一次只允许使用一个OUTPUT语句。当规定多个TABLES语句时,OUTPUT语句创建的数据集内容对应于最后那个TABLES语句,当一个TABLES语句中规定多个表时,OUTPUT创建的数据集内容对应于最后那个表。 选项说明: OUT=规定输出数据集; output-statistic-list规定输出数据集中所包含的统计量。 拟合优度检验

文档评论(0)

shuwkb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档