- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
判别分析与聚类分析软件
用户使用手册
手册使用说明:
在您使用本软件之前请详细阅读本文档,对软件有一个详细的了解之后再使用。
本文档包括了对软件中用到的多元统计分析中判别分析与聚类分析的主要方法(包括距离判别分析、费希尔判别分析、贝叶斯判别分析、逐步判别分析及聚类分析)原理及在本软件中使用的基本方法与设计流程图进行了详尽的阐释,在通过本文档的阅读对软件有一个总体的了解后再确定您要使用的分析方法
目录
软件分析
软件分析阶段………………………………………3p
软件开发阶段………………………………………4p
使用说明
判别分析程序使用说明书……………………5p
逐步判别分析软件使用说明…………………9p
聚类分析软件使用说明………………………11p
程序设计说明
距离判别分析…………………………………9p
费希尔判别分析………………………………10p
贝叶斯判别分析………………………………11p
逐步判别分析…………………………………12p
聚类分析………………………………………15p
流程图
距离判别分析程序设计流程图………………………19p
费希尔判别分析程序设计流程图……………………22p
贝叶斯判别分析程序设计流程图………………………26p
逐步判别分析程序设计流程图………………………28p
聚类分析程序设计流程图……………………………31p
软件分析
一、软件分析阶段
问题定义及需求分析
判别分析是根据观察或测量到的若干变量值,判断研究对象如何分类的方法。在自然科学和社会科学的各个领域经常遇到需要对某个个体属于哪一类进行判断的情况,如已知肝病有多种类型,据病人的症候判断得的是哪一种肝病,又如已知某地区的土壤类型,据土壤样品的测定数据判断属于何种土壤类型。
一般来讲,有k个总体,它们的分布密度函数分别是。对于给定的一个样品,判别分析是判断它属于k个总体中哪一个的统计方法。
判别分析事先已知对象的类别和类别数,它正是在这样的情形下总结出分类方法,用于对新对象的分类。例如,医学实践中根据各种化验结果、疾病症状、体征判断患者患的是什么疾病;体育选材中根据运动员的体形、运动成绩、生理指标、心里素质指标、遗传因素判断是否选入运动队继续培养;动物、植物分类等都可以用判别分析来解决。判别分析是应用计算机进行运动员选材、动物、植物分类以及疾病辅助诊断的主要统计学基础。
聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。他们讨论的对象是一大堆样品。要求能合理地按他们各自的特性来进行合理的分类,这里没有任何模式可供参考或依据,也就是说在没有先验知识的情况下进行的,聚类分析的基本程序时,首先根据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行分类。具体进行聚类时,由于目的、要求不同,因而产生各种不同的聚类方法。
20世纪70年代以来,聚类分析方法得到国内外农林科学工作者越来越多的重视。许多学者用这一方法解决了土壤、地质、植物、动物、气象、作物的分类问题,跳出了传统农林上所建立的一套定性分类体系,提高了分类的速度和精度。
二、软件开发阶段
1、概要设计
判别是分类学的基本方法,是根据表明事物特点的变量值和它们所属的类求出判别函数,再根据判别函数对未知所属类别的事物进行分类的一种分析方法。
进行判别分析必须已知观测对象的分类和若干表明观测对象特征的变量值,判别分析就是要从中筛选出能提供较多信息的变量并建立判别函数,使得利用推导出的判别函数对观测量判别其所属类别时的错判率最小。
判别函数一般形式是:
其中为判别分数,为反映研究对象特征的变量,为各变量的系数,也称判别系数。
对于分为m类的研究对象,建立m个线性判别函数,对每个各体进行判别时,把测试的各变量值代入判别函数,得出判别分属,从而确定该个体属于哪一类;或者计算属于各类的概率,从而判断该个体属于哪一类;还可建立标准化和未标准化的典型判别函数。
由此软件设计的核心在于如何计算并表示出线性判别函数
1)判别分析中所需用到的统计量
当总体参数未知时,可由样本进行总体参数的估计。设从总体中抽取容量为n的多元随机样本,由于是随机抽样,故之间相互独立且均服从。
样本用矩阵表示为
称为观察矩阵或样本资料阵
样本均值向量定义为:
样本离差阵:
令,
令
其中
由此可知该软件若利用VB实现,关键是合理的设计并输出这些统计量的正确值
使用说明
判别分析程序使用说明书
距离判别分析、费希尔判别分析和贝叶斯判别分析这三种判别分析的用户界面统一用下面这个界面:
其中样品总数、指标总数、类别总数是依据客户需要而可以任意输入的;数据输入部分这里采用两种方式:使用表格和使用文本框,这个依据客户喜好可
文档评论(0)