第六章判别分解.pptVIP

  1. 1、本文档共81页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
“分类” 对话框 指定分类参数和判别结果 选择先验概率 各类先验概率相等:若分为m类,先验概率为1/m 根据各类样本容量的比例:先验概率与其样本量成正比 选择分类使用的协方差阵 显示各样本分类结果:判别分数、实际类、预测类、后验概率 各组协方差阵 用于协差阵不等时 一张包含各类的散点图 对每一类生成一张散点图 根据函数值分组的边界图 每个观测量的分类结果:判别依据是由除该观测量以外的其它观测量导出的,也称交互检验结果 合并组内协方差阵,用于类协方差相等时 “保存” 对话框 根据判别分数把观测量按后验概率最大指派所属类 保存判别分数 保存观测量属于某一类的概率:若分m类,每个观测量将保存m个概率值 计算结果 舒张压对冠心病的影响大于胆固醇 类均值处的线性判别函数 判别方程为: D = 0.638X1 + 0.800X2 - 10.753 依此方程,病人组的中心得分点为1.11198,正常人组的中心得分点为-1.04248。本例为二类判别,二类判别以0为分界点,若将某人的舒张压和胆固醇值代入判别方程,求出的判别分0的为冠心病人,判别分0的为正常人。 例:mba-car-preferrence 前一章MBA汽车偏好例 先用快速聚类将偏好数据分为3类 再用判别分析建立判别函数 首先进行方差检验,以确定判别方法 再进行相应的判别分析,给出误判率 协方差相等假设下的判别结果 Territorial Plot Territorial Plot Draw in perpendicular bisectors Territorial Plot This is “closest mean” classification. 用方差不等方法的判别结果 Territorial Plot显示的分界为非线性 将数据快速聚为4类后判别分析 方差相等 方差不等 先验概率 交叉检验 通信公司客户细分 某通信公司以服务项目将客户分为以下四类:basic service, e-service, plus service,total service 依据下述变量进行判别:Age in Years,Marital status,Household income in thousands, Years at current address, Retired, and Gender,Number of people in household ,Level of education, Years with current employer Boxs Test test 不考虑异方差 本章小结 判别分析:已知m类总体,对于一个给定样品y,判断来自哪个总体。 主要问题:寻找最佳的判别函数和建立判别规则 马氏等距离法 样本点到哪个类中心的马氏距离最近就归属于哪一类 Fisher方法 以类中心连线为投影方向(类间距离最大)建立判别函数 Bayesian方法 先验概率和不对称误判成本修正 本章小结-续 判别分析之检验 类协方差相等的检验: Box’s test 类方差相等:判别函数为线性函数,类分界线为直线 类方差不等:非线性函数,类分界线为曲线 类均值相等的检验: Wilks’s ? test 判别函数个数:分类数-1 * 转氨酶 例:books by mail 某书商从事邮购书业务。有50,000个顾客的统计数据,现公司计划推销一本新的艺术类书“the art history of Florence”。希望有针对性地邮寄订购单,即只向有可能购买该书的顾客推销,以降低成本。为了了解顾客情况,公司从50,000个现有顾客中随机抽取1000人发订购单,其中83人购买了该书。要求利用此数据中分析潜在购买者的特征。 对1000个顾客样本进行判别分析,选取“最近一次购买至今的月数”和“购买艺术类书的本数”为判别变量。分类变量“buystatu”:0未购买者,1购买者 求判别函数系数a∝?-1(?2-?1) ∴判别函数为z=-0.056month+1.577artnum z2=-0.056×9.41+1.577×1=1.05, z1=-0.056×12.73+1.577×0.33=-0.19 c=(1.05-0.19)/2=0.43 判别规则:z0.43∈buyer SPSS输出结果 判别规则:zc=(1.018-0.0922)/2=0.4629∈buyer 判别函数: 判别变量和标准化判别函数的相关系数 购买艺术书越多的顾客越可能购买,越近期的顾客越可能购买 判别得分的分布 Non-buyers buyers z=0 z=0 回判结果 误判率25% 发出263封订购信,约18.3%会订购 协方差阵相等的检验-Box’s test H0: ?1=?2=…=?m 协方差不等时的判别:非线性判别函

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档