用SAS作统计剖析.pptVIP

  • 1
  • 0
  • 约6.4千字
  • 约 88页
  • 2019-12-02 发布于天津
  • 举报
相关系数(Correlation Coef.) 强相关并不表示存在因果关系 弱相关并不表示变量间不存在关系 个别极端数据可能影响相关系数 相关系数的计算 SAS/INSIGHT Analyze ? Multivariate (Ys) ? Output ? Corr 在多变量分析窗中,由下拉菜单 Tables ? Corr 在散点图上加置信椭圆认识相关大小 Curves ? Confidence Ellipse ? Prediction: . . . 相关系数的计算 Analyst Statistics ? Descriptive ? Correlations 相关与回归 相关分析量化连续变化变量间线性相 关的强度 回归分析确定一个连续变量与另一些 连续变量间的关系 回归(Regression) 描述一个变量与另一些变量间统计联系的关系式,Y=f(x1,x2,...,xm), 用于解释和预测。 确定回归: 确定变量:Y 与那些 x1, x2,. . , xm 有关 选择形式:Y 与 x1, x2,. . , xm 以什麽形式 相联系,即 f 的表示式 确定系数:确定 Y=a1x1+a2x1x2+a3x12+... 中的 ai 回归的简单线性模型 Yi = b0+b1xi+ei i=1,2,. . .,n Yi: 因变量的第 i 次观测值 xi: 自变量的第 i 次观测值 b0,b1: 待估计的未知参数 ei: 余差(residual 相互独立,正态分布,零均值,同方差) 一般的:Yi=b0+b1x1i+b2x2i+. . .+bpxpi+ei 回归的简单线性模型 回归的简单线性模型 线性回归的拟合 最小二乘法估计(LSE) 回归的方差分解 总变异 回归阐明部分 回归未阐明部分 回归的方差分解 . . . . . 回归的方差分解 回归的假设检验 原假设:简单线性模型拟合数据不比基线 模型好 b1 = 0, r = 0, |b1| 小,SS(Model) 小 备选假设:简单线性模型拟合数据比基线 模型好 b1 0, r 0, |b1| 不为零,SS(Model) 大 预测值与置信限 回归分析计算 Analyst Analyst: Statistics Regression ? Simple . . . 变量的测量水平 名义型 (Nominal) 变量的值之间无逻辑次序 可按任何次序排序编码 变量:饮料的种类 变量的测量水平 有序型的 (Ordinal) 变量:饮料杯的型号 小 中 大 有序变量的值有明确的逻辑次序,但各 个值之间的距离并不清楚 变量的测量水平 连续型的 (Continuous) 变量:饮料的体积 连续型变量的值有 逻辑次序,且它们 之间的距离也是有 意义的 变量的类型 属性的与连续的 属性变量是指其测量结果只能取到较少的不同的值,通常用以表示对象的分类属性。 与属性变量对立的是连续性变量 名义型的、有序的和连续型变量当它们可能取到的数值较少时,可作为属性变量处理 属性变量取值的频数统计 对属性变量最基本的统计特征就是它可能取到的不同数值和取各个不同数值的概率(频率) 次序统计量 样本(Sample): 次序统计量(Order Statistics): 4, 3, 11, 3, 1 5, 8 1, 3, 3, 4, 5, 8, 11 描述数据中心位置的统计量 样本观测值:4, 3, 11, 3, 1, 5, 8 描述数据离散程度的统计量 描述数据离散程度的统计量 样本观测值:4, 3, 11, 3, 1, 5, 8 与均值方差有关的统计量 标准差(Std Dev): 标准误(Std Error): 变异系数(CV) 未校平方和(USS) 校正平方和(CSS) 偏度(Skewness) 偏度: (Skewness) 精确地 0 0 = 0 峰度(Kurtosis) 峰度: (Kurtosis) 精确地 0 = 0 0 0 0 分位数(Quantile) (0.4 分位数) 分位数(Quantile) p分位数: 附近的一个数 (小于p-分位点的样本数约占样本总数的100p%) 0.5-分位数即中位数 0.25-分位数称下四分位数 0.75-分位数称上四分位数 样本观测值:4, 3, 11, 3, 1, 5, 8(1

文档评论(0)

1亿VIP精品文档

相关文档