- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蠓虫分类问题的数学模型
蠓虫分类问题的数学模型摘要:本文针对Af和Apf两类蠓虫的分类问题分别利用马氏距离法、Fisher判别法和Bayes判别法建立了三个数学模型。 首先,利用马氏距离公式建立起样本到两类间距离公式,通过两个距离的大小,样本靠近哪个样本,则判给哪个样本。再采用Fisher判别法,将所有可能组合构成的区域分成两个互不相交的部分,则未知类别的样品落在哪个部分,就判属于那一类。建立此模型的主要目的就是为了将划分成两干个互相不重叠的部分,即找出区域分界面,在数学上就是找出曲面的函数,即判别函数。最后,再结合实际情况,根据误判对损失的影响大小利用Bayes判别法对于以上建立的模型进行优化与改进,是各种损失按概率的加权求和达到最小1.问题重述两种蠓虫Af和Apf巳由生物学家W.L Grogan和W.W.Wirth(1981年)根据它们的触角长度和翼长加以区分。现测得6只Apf和9只Af蠓虫的触角长度和翼长识别的依据是蠓虫的触角和翅膀的长度的数据(见下表),现在要根据数据,制定一种方法,正确区分两类蠓虫;并且将建立的模型将用于已知触角长和翼长三个待定的样本进行识别。且在假设Af 是宝贵的传粉益虫,而Apf是某种疾病的载体的情况下,对模型加以改进。 Af123456789触角长度1.241.361.381.381.381.41.481.541.56翼长1.721.741.641.821.91.71.821.822.08Apf123456触角长度1.14 1.18 1.20 1.26 1.28 1.30 翼长1.78 1.96 1.86 2.00 2.00 1.96 2.模型的假设和符号的设定2.1.模型的假设任意的触角长度和翼长属于Af和Apf的概率相等;任意触角长度和翼长随机组合;两类蠓虫总体都服从二维正态分布;同一种误判造成损失相等; 2.2符号的说明(1):表示总体,i=1,2;(2):x到的马氏平方距离,i=1,2;(3):判别函数,i=1,2;(4):总体的概率密度函数;(5):将来自的样品误判来自于后带来的损失。其它需要用到的符号,在后面再做说明。3.模型准备之所以将蠓虫归为同一类(Af或Apf),是因为它们之间有相同或相近之处,从指标上来讲大小比较接近。而本题的指标有两个(触角长和翼长),对于接近长度应有个准确的算法。如果用欧氏距离为各指标差的平方和,显然不尽合理。因为所选单位或类型不同(如米与厘米,质量与体积),对同样两个样品前后的欧氏距离影响很大,且不同的样本点之间的距离的变化不均匀。为克服这一不应有的现象,可以采用马氏距离对于触角长和翼长两个指标,它们对于判别样本x属于哪 一类,一般都有影响。但一般影响不会相同,总有一些指标影响大,一些指标影响小,因此按主要指标进行判别效果应比较好。同时,由于指标之间有一定的相关性,因而主要差异并不一定是某个指标,而经常是指标之间的某个线性组合。只有在这个方向上,样本点分得最开,因而容易区分。以下Fisher判别法将这一思想付诸实施,将所有样本上点向某一条直线投影,在这条特殊的直线上,样本的投影点最分散,最能清楚的反应出分类情况。3.模型的建立模型一:马氏距离判别法(1):下面给出相关定义: 定义:若x、y来自均值向量为、协方差矩阵为的总体的两个样本,则x、y之间的马氏平方距离为:,x与G的马氏平方距离为:。 (2):距离判别的思想: 有两个总体,给定一个待判样品,我们要判断它来自哪个总体,通过比较样本到总体的距离大小,距哪个总体距离小就属于哪个总体。这里都是基于马氏平方距离。(3):距离判别模型: 因为两总体协方差相等,即有,所以x到两总体马氏平方距离的差为:=记:再结合上面距离判别思想很容易有下面的距离判别准则: 实际生活中,总体的分布往往是不知道的,我们只有根据样本去判断总体,所以我们只有用估计值代替上面各个式子中的相关变量,假设,i=1,2…,是来自的样本,,i=1,2,…,的样本,我们用、、、、S分别来估计总体的均值、协方差,即用它们分别替换上面式子中的、、、、,其中:,,,,。 模型二:Fisher判别方法(1)设从两类蠓虫Af和Apf中抽取了若干样品(n围向量)Af类:(i=1、2、3......)Apf类:(i=1、2、3......)其中 m=+令a为中任一方向,则中点x在这条直上的投影是=x,这时上述数据在a上的投影为:Af类:(i=1、2、3......)Apf类:(i=1、2、3......)样本组间方差:G==a样本组内方差:E==a(注:)(2)使 =达最大值的L即为所求的方向,在根据统计知识知:F===~因而可以通过查表以决定根据显著性水平这些样本点在L上的投影是否可以分类。若可以分类,再求判别函数分界点。一般可取两类样本点的样本均值投影连线的中点或某一
文档评论(0)