统计实验(判别分析)..docVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计实验(判别分析).

实验二 判别分析 1.实验目的: 本实验讨论利用判别分析将待判样品进行归类的问题。通过该实验,能够起到如下的效果:(1) 理解判别分析的作用、思想、数学基础、方法和步骤;(2) 熟悉如何利用判别分析,提出问题、分析问题、解决问题、得出结论; (3)会调用SAS软件实现判别分析的各个步骤,根据计算的结果进行分析,得出正确的结论,解决实际的问题。 2.知识准备: 判别分析是要把待判样品按与已知类别的相近程度进行归类。其思想是:先给出与已知类别相近程度的量化标准,然后按照该标准,计算待判样品与已知类别的相近程度,将待判样品归入最接近的类别。相近程度的量化标准有很多种,如:距离判别法、费歇尔判别法、贝叶斯判别法、逐步判别法等,它们的数学表述各不相同。判别分析步骤大体分为(以贝叶斯判别法为例):首先由已知类别的数据(也称为训练样本的数据)根据贝叶斯公式计算出后验概率;然后结合损失函数得到判别函数,以判别函数的取值作为与已知类别相近程度的量化标准(函数值越大表示越相近);接着把训练样本的数据反代回判别函数,计算出其函数值,重新判断它们的类别(称回判类别),得到与原始类别不同的比例(误判率),以判断该方法是否有效(回判的方法还可采用交叉回判法,其思想是回判某个训练样品时,暂时将它作为待判样品,把它从训练样品中去掉,重新计算判别函数,然后判断该样品的类别);最后把待判样品的数据代入判别函数,算出函数值,将待判样品归入最相近的类别。 3.实验内容: 表1 人生三大要素指标数据 序 国家 X1 X2 X3 类 1 美国 76 99 5374 1 2 日本 79.5 99 5359 1 3 瑞士 78 99 5372 1 4 阿根廷 72.1 95.9 5242 1 5 阿联酋 73.8 77.7 5370 1 6 保加利亚 71.2 93 4250 2 7 古巴 75.3 94.9 3412 2 8 巴拉圭 70 91.2 3390 2 9 格鲁吉亚 72.8 99 2300 2 10 南非 62.9 80.6 3799 2 1 中国 68.5 79.3 1950 2 罗马尼亚 69.9 96.9 2840 3 希腊 77.6 93.8 5233 4 哥伦比亚 69.3 90.3 5158 人文发展指数是联合国开发计划署于1990年5月发表的第一份《人类发展报告》中公布的。该报告建议,目前对人文发展的衡量应当以人生的三大要素为重点,衡量人生三大要素的指标采用X1-出生时的预期寿命、X2-成人识字率X3-实际人均GDP,将以上三个指标的数字合成一个复合指数,即为人文发展指数。 今从1995年世界各国人文发展指数的排序中,选取高发展水平、中等发展水平的国家各五个作为样品,另选4个国家作为待判样品。贝叶斯判别分析【1】ata human1; input no X1 X2 X3 type; label X1=A X2=B X3=C; cards; 1 76 99 5374 1 2 79.5 99 5359 1 3 78 99 5372 1 4 72.1 95.9 5242 1 5 73.8 77.7 5370 1 6 71.2 93 4250 2 7 75.3 94.9 3412 2 8 70 91.2 3390 2 9 72.8 99 2300 2 10 62.9 80.6 3799 2 ; run; Data human2; input no X1 X2 X3; label X1=A X2=B X3=C; cards; 1 68.5 79.3 1950 2 69.9 96.9 2840 3 77.6 93.8 5233 4 69.3 90.3 5158 ; run; Proc discrim data=human1 testdata=human2 crosslisterr testlist; class type; var X1-X3; run; 语句解释: “Data humanl;”指将数据输入到文件“humanl”中; “input no X1 X2 X3 type;”指将后面数据对应地赋予

文档评论(0)

v4v5v4I + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档