- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
析 分 别 判
判别
• 有一些昆虫的性别很难看出,只有通过解
剖才能够判别;
• 但是雄性和雌性昆虫在若干体表度量上有
些综合的差异。于是统计学家就根据已知
雌雄的昆虫体表度量(这些用作度量的变
量亦称为预测变量)得到一个标准,并且
利用这个标准来判别其他未知性别的昆
虫。
• 这样的判别虽然不能保证百分之百准确,
但至少大部分判别都是对的,而且用不着
杀死昆虫来进行判别了。
判别分析(discriminant analysis)
• 这就是本章要讲的是判别分析。
• 判别分析和前面的聚类分析有什么不同
呢?
• 主要不同点就是,在聚类分析中一般人们
事先并不知道或一定要明确应该分成几
类,完全根据数据来确定。
• 而在判别分析中,至少有一个已经明确知
道类别的“训练样本” ,利用这个数据,就
可以建立判别准则,并通过预测变量来为
未知类别的观测值进行判别了。
判别分析例子
• 数据disc.sav:企图用一套打分体系来描绘企业的状况。
该体系对每个企业的一些指标(变量)进行评分。
• 这些指标包括:企业规模(is )、服务(se)、雇员工资比
例(sa) 、利润增长(prr) 、市场份额(ms) 、市场份额增长
(msr)、流动资金比例(cp)、资金周转速度(cs)等等。
• 另外,有一些企业已经被某杂志划分为上升企业、稳定
企业和下降企业。
• 我们希望根据这些企业的上述变量的打分和它们已知的
类别(三个类别之一:group-1代表上升,group-2代表
稳定,group-3代表下降)找出一个分类标准,以对没
有被该刊物分类的企业进行分类。
• 该数据有90个企业(90个观测值),其中30个属于上升
型,30个属于稳定型,30个属于下降型。这个数据就是
一个“训练样本” 。
Disc.sav数据
根据距离的判别(不用投影)
• Disc.sav数据有8个用来建立判别标准(或判别函
数) 的(预测)变量,另一个(group )是类别。
• 因此每一个企业的打分在这8个变量所构成的8维
空间中是一个点。这个数据有90个点,
• 由于已经知道所有点的类别了,所以可以求得每
个类型的中心。这样只要定义了如何计算距离,
就可以得到任何给定的点(企业)到这三个中心
的三个距离。
• 显然,最简单的办法就是离哪个中心距离最近,
就属于哪一类。通常使用的距离是所谓的
Mahalanobis距离。用来比较到各个中心距离的
数学函数称为判别函数(discriminant function).这
种根据远近判别的方法,原理简单,直观易懂。
Fisher判别法(先进行投影)
• 所谓Fisher判别法,就是一种先投影的方法。
• 考虑只有两个(预测)变量的判别分析问题。
• 假定这里只有两类。数据中的每个观测值是二维空间的
一个点。见图。
• 这里只有两种已知类型的训练样本。其中一类有38个点
(用“o”表示),另一类有44个点(用“*”表示)。按
照原来的变量(横坐标和纵坐标),很难将这两
种点分开。
• 于是就寻找一个方向,也就是图上的虚线方向,
沿着这个方向朝和这个虚线垂直的一条直线进行
投影会使得这两类分得最清楚。可以看出,如果
向其他方向投影,判别效果不会比这个好。
• 有了投影之后,再用前面讲到的距离远近的方法
来得到判别准则。这种首先进行投影的判别方法
就是Fisher判别法。
6
4
您可能关注的文档
- 制粒课员工教育训练讲义.pdf
- 康乐经营管理讲义.pdf
- 《不动产估价》课程讲义.pdf
- 储备干部培训-讲义.pdf
- 经典讲义:如何对员工进行培训?.pdf
- 电话接听与服务培训讲义.pdf
- 设计概算的编制讲义.pdf
- 企业所得税讲义.pdf
- 酒店行业礼仪礼貌讲义.pdf
- QC080000最新培训讲义.pdf
- 人教版一年级下册数学精品教学课件 第4单元 4.2.1 两位数减一、两位数(不退位)、整十数.ppt
- 人教版三年级下册数学精品教学课件 第2单元 整理和复习 (3).ppt
- 人教版三年级下册数学精品教学课件 第2单元 整理和复习.ppt
- 人教版三年级下册数学精品教学课件 第3单元 素养冲关练 复式统计表的综合应用 (2).ppt
- 人教版一年级下册数学精品教学课件 第4单元 4.2.3 整十数减一位数 (2).ppt
- 人教版一年级下册数学精品教学课件 第3单元 3.2.3语言描述两个数量之间的大小.ppt
- 人教版一年级下册数学精品教学课件 极速提分法 第10招 解决填数问题.ppt
- 人教版一年级下册数学精品教学课件 第3单元 3.2.1 百数表的规律 (2).ppt
- 人教版一年级下册数学精品教学课件 第4单元 4.2.2符号比较两个数的大小.ppt
- 人教版四年级下册数学精品教学课件 第10单元 10.5 统计与数学广角.ppt
最近下载
- 毕业实习周记.docx VIP
- 2023年福建厦门思明区招聘社区工作者考试真题及答案.pdf VIP
- IPC-AJ-820A 中文 CN 组装和连接手册 2012.pdf VIP
- 电厂培训稿件PPT.pptx VIP
- 国家开放大学电大考试《电子商务概论》(1-9)形成性考核.docx
- 2024年全行业行业薪酬报告-45页.doc VIP
- 2023年福建省厦门市思明区莲前街道社区工作者招聘考试题库及答案解析.docx VIP
- 人形机器人标准化白皮书(2024版).pdf
- 2025至2030年中国医疗用车行业市场发展监测及投资潜力预测报告.docx
- Ruby on Rails后端开发实战指南.doc VIP
文档评论(0)