- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计软件课程设计.
东北大学秦皇岛分校
统计软件课程设计报告
鸢尾花亚属类型的判别分析
?????
学 院 数学与统计学院 专 业 学 号 5122121 姓 名 殷晓娟 指导教师 马世美 张子选 成 绩 教师评语:
指导教师签字:
2014年7月6日1 绪 论
1.1 课题的背景
鸢尾花为法国的国花,是一类具有较高观赏价值的多年生草本植物。鸢尾属花卉属于鸢尾科,setosa、versicolor和virginica是三种有名的鸢尾花。1935年,埃德加·安德森(EdgarAnderson)从加拿大加斯帕半岛上的鸢尾属花朵中提取的地理变异数据(Anderson,E.,1935),并在统计学上形成了一类多重变量分析的Fisher鸢尾花数据集。每个样本含有四个特征,它们分别是花萼和花瓣的长度和宽度,这些特征可被用作样本的定量分析。基于这四个特征的集合,罗纳德·费雪(RonaldAylmerFisher)作为判别分析的一个例子,发展了一个线性判别分析以确定其属种(Fisher,R.A,1936)。由此,该数据集被广泛运用到统计学中。
1.2 SAS简介
SAS(Statistics?Analysis?System)是世界上最著名的统计分析系统之一,具有完备的数据访问、管理、分析和呈现功能,被誉为国际标准统计分析系统。1966年它最初由美国北卡罗莱纳州立大学(North?Carolina?State?University)的两位生物统计学研究生编制而成。1976
年正式成立SAS软件研究所,开始SAS系统的开发、维护、销售和培训工作,真正实现了这一软件的商业化。
SAS内含30余个模块,功能上覆盖了包括医药、金融等各行各业数据管理和数据分析的各个应用领域。
就常见的统计分析任务而言备选的一个专门模块是SAS/STAT。它主要包括:方差分析、回归分析、属性数据分析、非参数分析、多变量分析、判别分析、聚类分析、生存分析、得分方法等近70个过程,从而组成了一个庞大而完整的统计方法集[2]。
1.3 判别分析法简述
判别分析是用于判断样品所属类型的一种统计分析方法。在生产、科研和日常生活中经常遇到如何根据观测到的数据资料对所研究的对象进行判别归类的问题。判别分析是应用性很强的一种多元统计方法,已渗透到各个领域。常用的判别分析方法有距离判别法、贝叶斯判别法和费希尔判别法。
1.3.1 距离判别法
马氏距离:设总体G为m维总体(考察m个指标),均值向量为,协方差阵为Σ=(σij),则样品X=(x1,x2,…,xm)′与总体G的马氏距离定义为
分别计算样品X到两个总体的距离d21(X)和d22(X) (或记为d2(X,G1)和d2(X,G2) ),
并按距离最近准则判别归类,即判别准则为:判X∈ G1 , 当d2(X,G1) d2(X,G2) 时; 判X∈ G2 , 当d2(X,G1) d2(X,G2)时;待判, 当d2(X,G1) = d2(X,G2)时。
1.3.2 贝叶斯判别法
贝叶斯的统计思想总是假定对所研究的对象已有一定的认识,常用先验概率分布来描述这种认识 .然后我们抽取一个样本,用样本来修正已有的认识(先验概率分布),得到后验概率分布。各种统计推断都通过后验概率分布来进行.将贝叶斯思想用于判别分析就得到贝叶斯判别法。贝叶斯判别准则主要有两种:
1.按后验概率最大进行归类:X属于第t组的后验概率为
在正态假设下按后验概率最大进行归类的准则,等价于按广义平方距离最小准则进行归类。
2.按错判平均损失最小进行归类:设有k个总体: ,已知的联合密度函数为,先验概率为(i=1,…,k),错判损失为L(j|i)。则贝叶斯判别的解为:,其中
1.3.3 费希尔判别法
费希尔判别的基本思想是投影.将k组m维数据投影到某一个方向,使得投影后组与组之间尽可能地分开。而衡量组与组之间是否分开的方法借助于一元方差分析的思想,利用方差分析的思想来导出判别函数。
费希尔判别准则下线性判别函数u(X)=aX的解a为特征方程的最大特征根所对应的满足的特征向量l1;且相应的判别效率Δ()=[1]。
1.4 课题研究目的
依据鸢尾花亚属中典型个体的不同性状特征(花萼和花瓣的长度和宽度),对未知鸢尾花个体进行所属类型的判别分析,以探究距离判别法在鸢尾属的分类中应用。
2鸢尾花亚属类型的判别分析
2.1 判别分析过程
各取setosa、versicolor和virginica三种鸢尾花各45个,通过三种判别分析法分别建立判别准则,然后对剩余的15个研究对象进行判别归类, 数据见参考文献[3]。
2.1.1 距离判别法的实现
data d
您可能关注的文档
- 统计学导论第二版习题详解..doc
- 统计学期末考试试题(含答案)..doc
- 统计学术语中英文对照..doc
- 统计学模拟试卷1..doc
- 统计学模拟试卷2..doc
- 统计学模拟题(A-C201312)..doc
- 视频监控存储系统解决方案.doc
- 统计学第五版(贾俊平)课后思考题答案(完整版)..doc
- 统计学练习题(含作业及非官方答案)..doc
- 统计学练习题及答案..doc
- 四川省德阳市罗江中学2025届高三考前热身化学试卷含解析.doc
- 山东省枣庄现代实验学校2025届高三下学期第五次调研考试化学试题含解析.doc
- 吉林省长春市十一高中等九校教育联盟2025届高三一诊考试生物试卷含解析.doc
- 2025届江苏省盐城市伍佑中学高考仿真模拟化学试卷含解析.doc
- 2025届广西贺州中学高考冲刺押题(最后一卷)生物试卷含解析.doc
- 安徽省池州市贵池区2025届高三第一次模拟考试生物试卷含解析.doc
- 宁夏银川一中2025届高三(最后冲刺)化学试卷含解析.doc
- 广东省广州市增城区四校联考2025届高考压轴卷化学试卷含解析.doc
- 2025届邯郸市第一中学高考生物必刷试卷含解析.doc
- 2025届安徽省安庆市石化第一中学高考仿真卷化学试卷含解析.doc
文档评论(0)