- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
本文格式为Word版,下载可任意编辑
— PAGE \* Arabic 1 —
6上机课第5讲 属性数据分析
属性数据分析一、列联表分析—得到概括性信息二、属性变量的无关联性检验 三、有序变量的关联性分析 四、FREQ过程 案例5.1 性别与主修专业是否相关— P116 案例5.2 是否判死刑与种族是否相关— —P119 案例5.3 工艺与产品质量是否有关系— —P125 案例5.4 患病程度和牛群大小是否相 关——P1302 变量的类型:1. 名义变量 2. 有序变量(两个值的差没有意义) 3. 区间变量(间隔变量,譬如温度) 4. 比率变量(比例变量) 名 义 变 量 属性变量 (定 性 变 量 、 离 散 变 量 ) 有 序 变 量 区 间 变 量 定量变量 (连 续 变 量 ) 比 率 变 量 属性数据 由属性变量得到的数据都是属性数据. 当我们研究的指标是一个属性变量, 并希望用其他变量来说明或预计这个属性 变量的取值时,不管用以说明的变量是属 性的或连续的,使用的统计方法统称为属 性数据分析. 对属性数据进行分析的目的:1. 2. 3. 4. 产生汇总分类数据列联表; 检验属性变量间的独立性(无关联性); 计算度量属性变量间的关联性统计量; 对高维数据进行分层分析和建模. 注:(1)本章仅研究1-3. (2)使用SAS中FREQ过程 一、 列联表分析几个概念: 1. 交织表(两个或两个以上变量的列联表) 2. 双向表(两个变量的列联表)3. 单元 4. 单元频数 两个属性变量的列联表1 1 2n11n 21 2n12n 22 … … … cn1c n2c sumn1 j n1 jn2 j n2 j r nr 1 nr 2 n 2 … … nrc nr j nrj sum n 1 n c n 由原始数据生成列联表1. 使用FREQ过程来生成列联表; 2. 使用SAS菜单系统“分析员应用〞生成 列联表(table analysis). 案例5.1 性别与主修专业是否相关. 书P116—原始数据表:属性变量:性别、 主修专业(统计专业和非统计专业). 程序:见属性数据分析中案例5.1 student 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 sex m m f m f f m m m f m f m m m f m m f m major yes no yes no yes yes no no yes yes no yes yes yes no yes yes no no yes 输出结果sex major 统计课程中学生的专业和性别 Frequency|Percent Row Pct Col Pct | | |no |yes | Total ||| f | | | | 1 | 5.00 | 14.29 | 12.50 | 6 | 30.00 | 85.71 | 50.00 | 7 35.00 ||| m | | | 7 | 35.00 | 53.85 | 6 | 30.00 | 46.15 | 13 65.00 | 87.50 | 50.00 | ||| Total 8 40.00 12 60.00 20 100.00 由现成的汇总表生成列联表 1. 使用FREQ过程来生成列联表; 注意:在FREQ过程中必需使用 WEIGHT语句. 2. 使用SAS菜单系统“分析员应用〞生成 列联表. 注意:要给出频数变量cell Counts. 案例5.2 是否判死刑与种族是否相关 看书P119. 数据如下表:种族 是否 判死刑 白人19 141 黑人17 149 是 否 程序:见属性数据分析中案例5.2 生成多个变量的交织表使用FREQ过程来生成列联表; proc freq data=welfare page;tables city*employ*politic*opinion; …… run; 二、属性变量的无关联性检验 1、属性变量无关联性的卡方检验 假设:H 0 : 行变量与列变量独立, H1 : 它们不独立 统计量: 2 i 1 j 1 r c ( n ij m ij ) m ij 2 其中:
您可能关注的文档
最近下载
- 《显微镜》ppt课件.ppt VIP
- TZS 0680—2025《医疗机构实验室生物安全管理组织架构规范》(水印版).pdf VIP
- 接待外宾的礼仪.pdf VIP
- 2025北京房山区区直部门和乡镇(街道)全日制临聘人员招聘37人备考练习试题及答案解析.docx VIP
- AQ 6111-2023 个体防护装备安全管理规范.pdf
- 有色冶金企业电力设计手册第二章电力负荷计算剖析.doc VIP
- 2025北京房山区区直部门和乡镇(街道)全日制临聘人员招聘37人考试备考题库及答案解析.docx VIP
- 环境保护与可持续发展 钱易.ppt VIP
- 三年级作文(精选15篇).docx VIP
- 食物的消化和吸收.pptx VIP
文档评论(0)