- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(应用统计学经济与相关管理中的数据分析)第十二章聚类分析和判别分析.ppt
* 第十二章 聚类分析和判别分析 【本章导读及学习目标】 聚类分析和判别分析是重要的多元统计分析方法。聚类分析是研究样品或指标分类问题的一种多元统计方法,判别分析是判别样品所属类型的一种统计方法。这两种方法在国民经济许多领域中有着广泛的应用,并取得了许多卓有成效的成果。本章主要介绍聚类分析和判别分析这两种多元统计分析的重要方法。通过学习主要掌握聚类分析的主要分析方法——系统聚类法和K-均值聚类法。其中,系统聚类法主要包括最短距离法、最长距离法、中间距离法、重心法、类平均法和离差平方和法。掌握判别分析的主要方法——距离判别法、Bayes判别法和Fisher判别法,会利用SPSS软件在实际问题中进行聚类和判别分析。 * 第一节 聚 类 分 析 一、聚类分析概述 聚类分析的主要功能是建立一种分类方法,将一批样品或变量,按照它们在性质上的亲疏、相似程度进行分类。根据分类对象的不同又分为R型聚类(R-type cluster)和Q型聚类(Q-type cluster)两大类,R型聚类是对变量(指标)进行分类,Q型聚类是对样品进行分类。 聚类分析给人们提供了丰富多彩的分类方法,最常用的聚类方法是系统聚类法和K-均值聚类法,这两种方法的基本思想如下。 (1) 系统聚类法。 (2) K-均值聚类法。 此外,还有模糊聚类法、有序样品聚类法、分解法和加入法等。本节重点介绍在实际问题中应用最广泛的系统聚类法和K-均值聚类法,且主要讨论Q型聚类分析问题。 * 一、聚类分析概述 聚类分析是将一批样品或变量按照它们在性质上的亲疏程度或相似程度来进行分类。那么如何度量样品间的亲疏程度呢?研究样品或变量的亲疏程度的数量指标有两种,一种叫距离,它是将每一个样品看作p维空间的一个点,并用某种度量测量点与点之间的距离,距离较近的点归为一类,距离较远的点应属于不同的类;另一种叫相似系数,性质越接近的变量或样品,它们的相似系数越接近于1或-l,而彼此无关的变量或样品,它们的相似系数则越接近于0,相似的为一类,不相似的为不同类。 样品之间的聚类,常用距离来测度样品之间的亲疏程度。而变量之间的聚类,常用相似系数来测度变量之间的亲疏程度。 * 二、距离和相似系数 (一)数据的变换处理 1.中心化变换 2.极差规格化变换 3.标准化变换 (二)定义距离的准则 (三)常用的距离 1.闵可夫斯基距离 2.马氏距离 3.兰氏距离 (四)相似系数 1.相关系数 2.夹角余弦 * 第二节 判 别 分 析 一、判别分析概述 判别分析(discriminant analysis)是用于判断样品所属类型的一种统计分析方法,其特点是根据已掌握的、历史上每个类别的若干样本的数据信息,总结出客观事物分类的规律性,建立判别公式和判别准则,在遇到新的样本点时,只要根据总结出来的判别公式和判别准则,就能判别该样本点所属的类别。 在生产、科研和日常生活中经常遇到需要判别的问题,例如,医院存有部分肝炎、肺炎、冠心病、糖尿病等病人的资料,几类每个患者若干项症状指标数据,利用现有的这些资料可以建立判别的准则和方法,进而对一个新病人的数据进行判定,判定其患有哪种疾病。有一些昆虫的性别很难看出,只有通过解剖才能够判别;但是雄性和雌性昆虫在若干体表度量上有些综合的差异,于是统计学家就根据已知雌雄的昆虫体表度量得到一个标准,并且利用这个标准来判别其他未知性别的昆虫。这样的判别虽然不能保证百分之百准确,但至少大部分判别都是对的,而且不用杀死昆虫来进行判别了。在市场预测中,根据以往调查所得的种种指标,判别季度产品是畅销、平常或者滞销。在天气预报中,我们有一段较长时间关于某地区每天气象的记录资料,包括湿度、温度、气压等,可以建立一种方法,通过连续五天的气象资料来预报第六天的天气。 * 一、判别分析概述 * 二、距离判别法 (一)距离判别法的基本思想 (二)两总体的距离判别 1. 时的判别 2. 时的判别 (三)多个总体的距离判别 * 三、Bayes判别法 (一)最大后验概率准则 (二)最小平均误判损失准则 * 四、Fisher判别法 (一)Fisher判别的基本思想 (二)Fisher判别准则 (三)Fisher线性判别函数的确定 * 第三节 统计软件应用 在用SPSS统计软件进行聚类分析和判别分析时,一般不用太关心点间距离和类间距离的计算方法以及判别函数的计算方法,计算机会很容易完成这一繁杂的任务。对多数使用者而言,重要的不是计算问题,而是理解聚类和判别分析的思想和原理,懂得统计软件输出的结果,并对这些结果做出合理的解释和分析。 本节主要讲述利用SPSS统计软件进行聚类和判别分析的方法,从实例出发分别阐述聚类分析和判别分析在实际中的应用
您可能关注的文档
- (幼儿园相关管理课件)第十一章园长与幼儿园领导工作.ppt
- (幼儿园相关管理课件)第十三章幼儿园相关管理新进展.ppt
- (幼儿园相关管理课件)第十二章幼儿教育相关管理体制及其变革.ppt
- (幼儿园相关管理课件)第十章幼儿园组织文化建设.ppt
- (幼儿园相关管理课件)第四章幼儿园人事相关管理.ppt
- (幼儿园社会教育活动及的设计)第1单元模块1 自我意识.ppt
- (幼儿园社会教育活动及的设计)第1单元模块2 自我体验.ppt
- (幼儿园社会教育活动及的设计)第1单元模块3 自我控制.ppt
- (幼儿园社会教育活动及的设计)第2单元模块1 同伴交往.ppt
- (幼儿园社会教育活动及的设计)第2单元模块2 亲子交往.ppt
- 2023咸阳职业技术学院招聘笔试真题参考答案详解.docx
- 2023四川化工职业技术学院招聘笔试真题及参考答案详解.docx
- 2023哈尔滨职业技术学院招聘笔试真题及参考答案详解.docx
- 2023商洛职业技术学院招聘笔试真题及答案详解1套.docx
- 2023呼伦贝尔职业技术学院招聘笔试真题参考答案详解.docx
- 2023南阳农业职业学院招聘笔试真题参考答案详解.docx
- 2023天津公安警官职业学院招聘笔试真题带答案详解.docx
- 2023年上海电机学院招聘笔试真题参考答案详解.docx
- 2023年四川艺术职业学院招聘笔试真题参考答案详解.docx
- 2023安徽体育运动职业技术学院招聘笔试真题及答案详解一套.docx
最近下载
- 北京市海淀区六年级下册期末卷及答案.pdf VIP
- 石家庄市2025年高三年级教学质量检测(一)数学试卷(含答案).pdf
- 4.1树与二叉树教学设计2023—2024学年浙教版(2019)高中信息技术选修1.docx
- 如何上好一堂美术课课件.pptx
- 商法学 课件( 马工程) 第8--11章 证券法---破产法.pptx
- 济宁三号煤矿8.0 Mt-a新井设计 综采工作面沿空掘巷技术浅析.docx VIP
- ASUS华硕ROG - 玩家国度机箱ROG Z11 OLED editionROG Z11 user's manual for multiple languages.pdf
- T-CAQ 10204-2017 质量信得过班组建设准则.pdf
- 2025年山东省实验中学高三一模高考英语试卷试题(含答案详解).pdf VIP
- 医学免疫学(第7版)PPT课件 第二章 免疫器官和组织.pptx
文档评论(0)