数字特征-PPV课.PPT

  1. 1、本文档共111页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数字特征-PPV课

* 单相关、复相关和偏相关 单相关:两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量。 复相关:三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量。 在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系称为偏相关。 * 1.3.1二维数据的数字特征及相关系数 设(X,Y)T是二维总体,从中得到观测数据(x1,y1)T, (x2,y2)T,…, (xn,yn)T.引进数据观测矩阵得 记 ,则称 为二维观测数据的均值向量。记 * sxx,syy为X,Y的观测数据的方差, sxy为X,Y的观测数据的协方差,则对称的协方差矩阵为 由Schwarz不等式 可知S是非负定的。相关系数为: * 相关系数是随机变量X,Y的观测数据的两个分量线性相关性密切程度的度量,由观测数据做出散点图(见下页)则有: 当rxy=0或rxy≈0时,称X,Y的观测数据是不相关的或近似不相关的; 当0rxy1时,线性正相关的; 当-1rxy0时,线性负相关的; 当| rxy |=1时,完全线性相关;散点图呈现某些曲线关系时,也可能是rxy ≈0. * * 设二维总体(X,Y)T的分布函数是F(x,y);X,Y的方差分别是Var(X),Var(Y),总体协方差是Cov(X,Y), ρXY是总体的相关系数,即 观测数据的相关系数是总体相关系数的相合估计,故当n充分大时,有ρXY= rxy .但用rxy去度量ρXY是没有意义,因而要做检验: H0: ρXY= 0; H1: ρXY≠ 0; rxy为Pearson相关系数! * 当(X,Y)T是二维正态总体且 H0为真时,统计量 服从自由度为n-2的t分布t(n-2),则检验p值为 p=PH0(|t|=|t0|)= P (|t(n-2)|= |t0|) 给定显著水平α,当p α时,拒绝H0,此时认为X,Y相关,且rxy反映了线性关联性的强弱;否则不能拒绝H0 。 * 设(x1,y1)T, (x2,y2)T,…, (xn,yn)T是二维总体(X,Y)T的观测数据,且X的数据的秩统计量为R1,…,Rn,Y的数据的秩统计量为S1,…,Sn,若X,Y相关性强时,它们的秩统计量也具有较强的相关性. Spearman相关系数表示秩统计量的相关性! Spearman相关系数——秩相关系数: 秩:设x1,…,xn是总体的样本观测值,其次序统计量为x(1),x(2),…,x(n),若xi= x(k),则称k是的xi秩,记作Ri ,并称Ri是第i个秩统计量; R1,…,Rn是总称为秩统计量。 * Spearman相关系数为 同样不能用实测数据的秩相关系数来度量总体 秩相关系数也是无意义的,也一样要进行假设检验, 检验与前面的一样! * Proc corr过程:相关性分析的SAS过程 PROC CORR 选项列表; BY DESCENDING 变量名-1...DESCENDING 变量名-n NOTSORTED; FREQ 变量名; PARTIAL 变量名(列表); VAR 变量名(列表); WEIGHT 变量名; WITH 变量名(列表); * 选项列表:(1)data=sasdataset; (2)Pearson:要求输出Pearson相关矩阵,也是默认输出; (3) Spearman :要求输出Pearson相关矩阵,还有其它的值(本书不要求); (4)Cov:协方差矩阵; (5)Nosimple:指明不输出每个变量的简单描述性统计量的值 * BY, FREQ, WEIGHT与前面的univariate一样; Var: 指定的变量必须为数值型变量,至少应指定两个变量;可同时指定多个变量,此时SAS会对任意两个变量之间进行相关分析。 PARTIAL语句:用以对所指定的变量计算偏相关系数或类似的偏统计量,可计算的偏统计量与PROC CORR语句中指定的选项有关。 * WITH语句:WITH语句用来指定和VAR语句指定的变量进行相关分析的变量。 当有WITH语句存在时,VAR语句中指定的变量之间不再进行相关性分析,而其中的每个变量都和WITH语句指定的所有变量进行相关性分析,相关分析也不会发生在WITH语句所指定的变量之间。输出结果的相关矩阵中,VAR语句指定的变量排列在行上,WITH语句指定的变量则排列在列上。 * 例1.9 data examp1_9;

文档评论(0)

zhuwo + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档