Fisher 判别法及 主成分分析法 论文详解.docVIP

Fisher 判别法及 主成分分析法 论文详解.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
地沟油的识别问题 摘要 本文要解决的问题是根据所给的油的成分,判断该油属于地沟油还是优质油,以及在保证一定的准确率的条件下,用最少的化验指标来判断该油的类别。 问题一模型的建立,通过fisher 算法,依次计算出了地沟油、优质油的样本均值,类内离散度矩阵和类间离散度矩阵,根据类间离散度矩阵与类内离散度矩阵的比值最大,求得最佳投影矩阵。利用样本数据与最佳投影矩阵的乘积与阈值进行比较,得出判定油类别的判别式。 问题二根据第一问题中所建立的模型,通过matlab编写程序,与阈值进行比较后,得出最后的16组测试数据,前8组属于优质油,后8组属于地沟油。 问题三即需要减少化验指标。因为影响油的类别的因素十分复杂,该题中给了7种判别油类别的成分,我们需要用为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息 优质油的样本数据集合 地沟油的样本数据集合 i 油中包含的每一种成分 优质油中成分为i样本均值 地沟油中成分为i样本均值 优质油的样本均值矩阵 地沟油的样本均值矩阵 优质油的样本类内离散度矩阵 地沟油的样本类内离散度矩阵 总类内离散度矩阵 类间离散度矩阵 在最优方向上的投影 最优投影方向向量 θ 分类阈值 优质油中成分i的样本组数 地沟油中成分i的样本组数 R 相关系数矩阵 E 单位矩阵 e 特征向量矩阵 特征值 l 主成分载荷矩阵 Q 综合比重矩阵 B1 前四个主成份的贡献率矩阵 c 第四个主成分对应的累计贡献率 四、模型的建立及求解 4.1问题(一) 我们根据fisher算法建立模型。首先,分别求出优质油和地沟油的样本均值。然后根据离散度计算公式:计算出优质油和地沟油各自的类内离散度矩阵,进而求出总的类内离散度矩阵。接下来令类间离散度最大,总类内离散度最小来求得最佳投影方向向量的计算公式:。已知了最佳投影矩阵、优质油和地沟油的样本组数和两种油的均值矩阵,依据fisher算法,可知阈值θ。最后由投影公式计算出每组测试数据的投影与阈值θ作比较,可得出该组数据是属于优质油还是地沟油。 4.1.1建立判别模型 首先,根据样本数据得到两类油的样本数据集合及。 1)优质油中成分为i的样本均值为: 则优质油的样本均值向量为: 同理:地沟油中成分为i的样本均值为: 地沟油的样本均值向量为: 2)优质油中样本的类内离散度矩阵: 地沟油中样本的类内离散度矩阵: 类内总离散度为: 3)求出最佳投影方向上的向量,则需使得类内离散度最小,类间离散度最大,即: 得最佳投影方向的向量为: 4)阈值θ的计算方法为: 5)测试数据xx在最佳投影向量上的投影为(),则判断测试数据xx属于优质油还是地沟油的判别式如下: 4.2问题(二) 通过问题一的分析可知,若要判断该油属于地沟油还是优质油,需要求出测试数据中每组数据在上的投影,然后将与进行比较,判断大小。 通过Matlab编程,我们可以得出16组测试数据的和-。如果-大于等于0,该油属于优质油;如果小于0,则属于地沟油。得出的结果如表1所示: 表1:判定结果 -(=0.6596) 油的类别 0.7352 0.0756 优质油 0.6860 0.0265 优质油 0.6704 0.0109 优质油 0.6868 0.0272 优质油 0.6998 0.0402 优质油 0.6807 0.0211 优质油 0.7210 0.0614 优质油 0.7156 0.0560 优质油 0.5939 -0.0657 地沟油 0.6044 -0.0552 地沟油 0.5551 -0.1045 地沟油 0.5409 -0.1186 地沟油 0.5561 -0.1035 地沟油 0.5573 -0.1023 地沟油 0.5674 -0.0922 地沟油 0.5124 -0.1472 地沟油 4.3问题(三) 该问题要求在保证一定的准确率条件下,减少化验指标数,实际上就是一种降维的。在实际问题的研究中,往往会涉及众多有关的变量为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的。这些变量的协 方差矩阵即相关系数矩阵R为: 为原来变量与的相关系数,其计算公式为: 由于,所以R只需要计算其上三角元素或下三角元素即可。 2)计算特征值和特征向量,根据特征方程求出并使其按从大到小顺序排列,即。根据关系式:可求出对应于特征值的特征向量。 3)计算贡献率及累计贡献率,根据主成份分析法,主成份的贡献率为: 累计贡献率: 原变量协方差矩阵的特征根是主成分的方差,方差越大,表示包含的信息越多,因此取累计贡献率达85-95%的特征值所对应的第一、第二、第三……,第p个主成分。 4) 计算主成

文档评论(0)

钱缘 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档