- 1、本文档共92页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 SPSS的相关分PPT
第九章 SPSS的聚类分析 聚类分析概述 概念: 聚类分析是统计学中研究“物以类聚”的一种方法,属多元统计分析方法. 例如:细分市场、消费行为划分 聚类分析是建立一种分类,是将一批样本(或变量)按照在性质上的“亲疏”程度,在没有先验知识的情况下自动进行分类的方法.其中:类内个体具有较高的相似性,类间的差异性较大. 聚类分析概述 两类:(A B) (C D E) 三类:(A B) (C) (D E) 依据平均得分的差距,差距较小的为一类. 分类过程中,没有事先指定分类的标准.完全根据样本数据客观产生分类结果. 聚类分析概述 亲疏远程度的衡量指标 相似性:数据间相似程度的度量 距离: 数据间差异程度的度量.距离越近,越“亲密”,聚成一类;距离越远,越“疏远”,分别属于不同的类 定距型个体间的距离: 把每个个案数据看成是n维空间上的点,在点和点之间定义某种距离.一般适用于定距数据 欧氏距离(EUCLID) 平方欧氏距离(SEUCLID) 个体距离矩阵 定距型个体间的距离 聚类分析概述 品质型个体间的距离 姓名 授课方式 上机时间 选某门课程 张三 1 1 1 李四 1 1 0 王五 0 0 1 聚类分析概述 聚类分析概述 品质型个体间的距离 简单匹配(simple matching)系数:适用二值变量。 个体j 个体i 1 0 1 a b 0 c d a为个体i与个体j在所有变量上同时取1的个数;d为同时取0的个数 特点:排除同时拥有或同时不拥有某特征的情况;取0和1地位等价,编码方案的变化不会引起系数的变化。 一元线性回归方程的检验 (一)拟和优度检验: (1)目的:检验样本观察点聚集在回归直线周围的密集程度,评价回归方程对样本数据点的拟和程度。 (2)思路: 因为: 因变量取值的变化受两个因素的影响 自变量不同取值的影响 其他因素的影响 如:儿子身高(y)的变化受:父亲身高(x)的影响、其他条件 于是: 因变量总变差=自变量引起的+其他因素引起的 即: 因变量总变差=回归方程可解释的+不可解释的 可证明:因变量总离差平方和=回归平方和+剩余平方和 一元线性回归方程的检验 (一)拟和优度检验: (3)统计量:判定系数 R2=SSR/SST=1-SSE/SST. R2体现了回归方程所能解释的因变量变差的比例;1-R2则体现了因变量总变差中,回归方程所无法解释的比例。 R2越接近于1,则说明回归平方和占了因变量总变差平方和的绝大部分比例,因变量的变差主要由自变量的不同取值造成,回归方程对样本数据点拟合得好 在一元回归中R2=r2; 因此,从这个意义上讲,判定系数能够比较好地反映回归直线对样本数据的代表程度和线性相关性。 一元线性回归方程的检验 (二)回归方程的显著性检验:F检验 (1)目的:检验自变量与因变量之间的线性关系是否显著,是否可用线性模型来表示. (2)H0: β =0 即:回归系数与0无显著差异 (3)利用F检验,构造F统计量: F=平均的回归平方和/平均的剩余平方和~F(1,n-1-1) 如果F值较大,则说明自变量造成的因变量的线性变动远大于随机因素对因变量的影响,自变量于因变量之间的线性关系较显著 (4)计算F统计量的值和相伴概率p (5)判断 p=a:拒绝H0,即:回归系数与0有显著差异,自变量与因变量之间存在显著的线性关系。反之,不能拒绝H0 一元线性回归方程的检验 (三)回归系数的显著性检验:t检验 (1)目的:检验自变量对因变量的线性影响是否显著. (2)H0:β=0 即:回归系数与0无显著差异 (3)利用t检验,构造t统计量: 其中:Sy是回归方程标准误差(Standard Error)的估计值,由均方误差开方后得到,反映了回归方程无法解释样本数据点的程度或偏离样本数据点的程度 如果回归系数的标准误差较小,必然得到一个相对较大的t值,表明该自变量x解释因变量线性变化的能力较强。 (4)计算t统计量的值和相伴概率p (5)判断 一元线性回归方程的检验 (四)t检验与F检验的关系 一元回归中,F检验与t检验一致,即: F=t2,两种检验可以相互替代 (六)F统计量和R2值的关系 如果回归方程的拟合优度高,F统计量就越显著。F统计量
文档评论(0)