- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
两个变量之间的关系简单二元回归及非参数检验.ppt
SPSS Club Peking University;本学期的课程安排;Lesson3 相关分析及均值比较;为什么要做数据变换
二手数据,为我所用
一手数据,不能直接测量某种变量/格式不合意
怎么做数据变换
意义——专业理论指导
变换工具(记事本,excel,SPSS 结合使用)
例子:mobile数据的变换(课后作业);Excel文字合并
Excel中的其他函数/SoftChannel/723489689142558721760048.shtml
;统计图表的使用
何种情况下用条形图/直方图/饼图/曲线图
SPSS统计图的优化(三维,阴影,换色,标签等)
EXCEL做图(更加漂亮)
粘贴数据表或者导出结果(output/file/export)
Excel 做表和画图
;EXCEL 数据分列(注意时间格式和分列数量)
EXCEL 文本格式的数字变成数字格式(选择性粘贴,Value函数)
EXCEL 文本联合函数
SPSS数据重新编码及变量运算
;数据分类
点时间数据分类(上节课的练习)
连续定距数据分组(长度,重量,年龄,金钱,生育人数)做描述时用得多,在回归分析中一般不做这样的分组。
数据格式变换(单位变化:如分——秒)
虚拟编码
虚拟变量
效应变量
变量作函数变化
交互作用
多阶效用
返回均值、和、差、积、标准分、对数……理论很重要
带逻辑关系的返回
因子分析和聚类分析
;统计描述中的关系
单变量统计描述反映是两个量(类)之间的关系(表和图都是两维的),准确的说是,一个量在某一维度上的分布情况。
相关分析怎样描述关系
相关分析中有三个量,准确地说。相关分析描述的是一个量在两(多)个维度上的交叉分布情况。
相关分析描述的是这两个维度之间有没有特定的关系,以致统计量在交叉维度上的分布有结构性特征。
相关分析的类型(以变量的测量层次(决定统计层次)来分类)
;相关分析的类型
简单二元回归
回归系数(B)
相关系数(R)
确定系数(R方)
定序变量相关
斯皮尔曼相关系数),(排序差平方) ——Z检验(n 大于10
修正Rs系数(处理结或同序对)——T检验
Kendall的 tau 系数(同序对与异序对差在总可能对数中的比例)
Gramma系数——Z检验;Sommers 的dy系数 ——S检验(PRE)
定类变量相关——(卡方检验)
Q系数——2*2???格
卡方标准化基础上的: Phi系数 ,皮尔逊C列联系数 ,Cramer’s V系数 ,
PRE:Lambda, Goodman and Kruskal的 Tau-y系数,uncertainty coefficient;相关分析的类型(续)
定类-定距
E方(类为自变量,PRE,0-1取值)在交互表分析中,一般不用这个系数,定类与定距之间的关系也不在这里分析,而是在方差分析的时候再用。
均值比较,比例差异分析—P(二分变量)——T检验
方差分析(One-way ANOVA)(多分变量)——F检验
定类-定序
作为定类-定类处理
定序-定距
作为定类-定距处理
作为定距-定距处理
;相关分析:两个变量之间的关系
简单二元回归及非参数检验;简单二元回归
回归系数(B)
相关系数(R)
确定系数(R方);相关分析:两个变量之间的关系
简单二元回归及非参数检验;定序变量相关
斯皮尔曼相关系数),(排序差方) ——Z检验(n 大于10)
修正Rs系数(处理结或同序对)——T检验
Kendall的 tau 系数(同序对与异序对差在总可能对数中的比例)
Gramma系数——Z检验;
Sommers 的dy系数 ——S检验(PRE);定类变量相关(卡方检验)
基于卡方:
Q系数——2*2表格
Phi系数 (消除样本规模影响),
皮尔逊C列联系数(使phi系数限定在0-1之间) ,
Cramer’s V系数 ,V的最高上限可以达到1,但是不是很直观
;PRE:
Lambda
Goodman and Kruskal的 Tau-y系数
uncertainty coefficient
Lambda相关测量,又叫做Cuttman’s coefficient of predictability,它的基本的逻辑是计算以一个定类变量的值来预测另一个定类变量的值时,如果以众值作为预测的准则,可以减除多少误差。消减的误差再全部误差中所占的比例越大,表示两个变量之间相关的程度越大。
有对称和不对称两种,SPSS给出的是不对称的Lambda系数,有两个。;Goodman and Kruskal的 Tau-y系数
这个系数的敏感度高于Lambda系数,但只适合于分析不对称的关系,属于不对称相关测量法,要求两个定类变量中有一个是自变量,有一个是因变量,Tau-y系数的值是界于0—
文档评论(0)