- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蠓虫的分类模型
摘要
本文通过对两类蠓虫的触角长和翅长数据进行分析,用画散点图的方法对两类蠓虫进行区分,利用判别分析建模方法对未知的三个样本进行识别,将它们分类。在生物学中,根据触角长和翅长来识别一只蠓虫标本是Af还是Apf是很重要的。本文为此提供了方法。
在模型一中,本文通过画散点图,进而画出两条斜线将两类蠓虫分别划分在斜线的两侧,对它们进行分类。
在模型二中,本文通过马氏距离判别法对未知的三个样本进行判别,并将它们归类。得出的结果为:三个未知样本均为Apf类。
在模型三中,本文修改分类方法,用贝叶斯判别法对三个未知样本进行判别分类。计算结果表明:三个未知样本均属于Apf类。
最后,本文对马氏距离判别法做了误差分析,通过回代误判率和交叉误判率对模型进行评价。计算结果为:回代误判率为0,交叉误判率为0.0667。说明模型判别方法较准确。
本文从绘制散点图,利用判别分析建模方法角度对两类蠓虫进行识别,并对未知样本分类,进而利用误差分析对模型准确性予以预测,逐步深化,最后对模型进行评价与推广。
关键词 散点图 马氏距离 贝叶斯 回代误判 交叉误判
一、问题重述
(一)背景知识
两种蠓虫Af和Apf已由生物学家罗纳(w.L.Grogna)和维尔恩(W.W.Wirth)于1981年根据它们的触角长(mm)和翅长(mm)加以区分,6只Apf和9只Af蠓虫的触长,翅长数据如下:
Apf:(1.14,1.78), (1.18,1.96), (1.20,1.86), (1.26,2.00), (1.28,2.00), (1.30,1.96) ;
Af:(1.24,1.72), (1.36,1.74), (1.38,1.64), (1.38,1.82), (1.38,1.90), (1.40,1.70), (1.48,1.82),(1.54,1.82), (1.56,2.08)。
在生物学中,根据触角长和翅长来识别一只蠓虫标本是Af还是Apf是很重要的。(二)要解决的问题
1、根据给定的数据,制定一种方法,正确区分两类蠓虫;
2、用我们的方法对触长、翅长分别为(1.24,1.80)、(1.28,1.84)、(1. 40,2.04)的三个样本进行识别;
3、假设Af是宝贵的传粉益虫,Apf是某种疾病的载体,在这种情况下我们是否应该修改所用的分类方法。
二、问题的分析
1、对问题一的分析
对问题一, 我们利用画出散点图,再画斜线的方法对给出的6只Apf和9只Af蠓虫进行区分。
2、对问题二的分析
对问题二,我们可以根据马氏距离判别分析法对未知的三个样本进行识别,将它们分类。
3、对问题三的分析
对问题三,我们可以修改分类方法,用贝叶斯判别法对所给三个样本进行判别,将它们分类。
三、模型的假设
1、在问题一中,假设两类蠓虫的协方差矩阵是相等的;
2、假设Apf与Af的总数相同或Apf占总数的,Af占总数的,这样在用贝叶斯判别法时,即可用按比例分配方法估计两个总体的先验概率;
3、样本无性别差异。
4、触角长与翅长作为指标同样重要。
5、用触角长与翅长来判别蠓虫是充分的。
四、符号说明
A………………………………………………Apf类蠓虫
B………………………………………………Af类蠓虫
m1………………………………………………A类的均值向量
m2………………………………………………B类的均值向量
S1………………………………………………A类的协方差矩阵
S2………………………………………………B类的协方差矩阵
n1………………………………………………A类样本的容量
n2………………………………………………B类样本的容量
五、模型的建立与求解
1、问题一的建立与求解
区分步骤:
(1)利用Matlab软件,画出两类蠓虫分布的散点图如下:
(2)由散点图我们可以画出两条斜线,由此区分两类蠓虫,如下所示:
图2 用斜线区分两类蠓虫
(3)由图我们可以区分出两类蠓虫
2、问题二的建立与求解
用马氏距离判别步骤:
(1) 计算A、B两类的均值向量与协方差矩阵;
m1=mean(A), m2=mean(B),
S1=cov(A), S2=cov(B);
(2) 计算总体的协方差矩阵
;
( 3) 计算未知样本x到A,B两类马氏平方距离之差 :
d=(x-m1)S-1(x-m1)’- (x-m2)S-1(x-m2)’;
(4) 若d0,则x属于A类;若d0,则x属于B类。
(5)模型的求解:我们利用Matlab软件进行编程,可以求出三个样本到A类与B类的距离之差分别为d=-4.3279 ,-2.7137 ,-3.960
文档评论(0)