数模第16讲主成分分析报告.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数模第16讲主成分分析报告

一、主成分分析概念 2)评酒员评分的正态分布检验 图 9-21 两组评酒员对红葡萄酒评分的正态概率图 图 9-22 两组评酒员对白葡萄酒评分的正态概率图 分析两组评分的均值数据是否服从正态分布,需要绘制数据的正态概率图。如果正态概率图中期望累计概率和观测累计概率分布或近似分布在斜率为1的直线上,则该数据服从或近似服从正态分布。 根据附件表1的平均分数据,利用Matlab命令:h=normplot(x)直接得到葡萄酒平均分x的正态概率图。 h=normplot(x) 结论:由图分析可知,两组数据都可以近似看成正态分布,从而可以进行参数的显著性检验。 3)评酒员评分的显著差异检验 对假设检验(2),同理进行F检验: 2.2 两组评酒员评价结果可信度评估 图 9-24 白葡萄酒两组评价结果的变异系数比较图 根据Excel表(附件3)可得,两组评酒员评分的变异系数比较: 图 9-23 红葡萄酒两组评价结果的变异系数比较图 评价结果 通过上面葡萄酒的两组评价结果变异系数比较图可以直观的发现:两组葡萄酒评分的变异系数明显不一样。 3.问题二求解:根据酿酒葡萄的理化指标和葡萄酒 的质量对酿酒葡萄进行分级 问题二的关键是确定评价指标,建立综合评价模型。 计算步骤为: (1) 根据资料筛选附表中的数据,确定对酿酒葡萄影响较大的理化指标,由于第二组的评价结果更可信,选取第二组的评价结果作为葡萄酒的质量。 (2) 将数据进行标准化处理,采用主成分分析法,找出主成分,以简化评价指标。 (3) 根据所得的主成分作为新的评价指标,建立对酿酒葡萄分级的综合评价模型,对酿酒葡萄的优劣进行分级。 由于附表的数据量太大,必须对数据进行初步的筛选。根据资料,酿酒葡萄中的氨基酸,蛋白质,花色苷,有机酸,酚类,醇类,还原糖,果穗,出汁率,多酚氧化酶活力,DPPH自由基,可溶性固形物这几个理化指标是对酿酒葡萄影响较大的理化指标。加上葡萄酒的质量指标,故初步确定了酿酒葡萄分级的13个指标。 3.1 酿酒葡萄分级的评价系统的简化 由于选取的指标太多,而且主观性较强,容易使它们提供的整体信息发生重叠,不易得出简明的规律。因此,采用主成分分析法,将多指标问题化为较少的综合指标问题,不但保证了各指标的不相关性,又反映了原来多指标的信息。 3.2 酿酒葡萄分级的评价指标的主成分分析 附件2 数学建模与数学实验 后勤工程学院数学教研室 第16讲 主成分分析 实验目的 实验内容 2.掌握用数学软件求解主成分分析问题。 1.了解主成分分析的基本内容。 1.主成分分析问题引例及基本理论。 2.用数学软件求解主成分分析问题。 3.应用实例 主成分分析就是设法将原来众多具有一定相关性的指标,重新组合成几个新的相互无关的综合指标,并且尽可能多地反映原来指标的信息。它是数学上的一种降维方法。 例如,在商业经济中,可以把复杂的数据综合成几个商业指数,如物价指数,消费指数等。 数学上的处理就是将原来P个指标作线性组合,作为新的综合指标,但是这种线性组合,如果不加限制,则可以有很多,我们应该如何去选取呢?为了让这种综合指标反映足够多原来的信息,要求综合指标的方差要大,即若Var(F1)越大,表示F1包含的信息越多,因此在所有线性组合中所选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息。 再考虑选取第二个线性组合F2 ,称F2为第二主成分,为了有效地反映原来的信息, F1中已有的信息就不需要出现在F2中,数学表达就是要求Cov(F1, F2)=0。依次类推可以构造出第三,第四,……,第p个主成分。这些主成分之间不仅不相关,而且它们的方差是依次递减的。在实际工作中,通常挑选前几个最大主成分,虽然可能会失去一小部分信息,但抓住了主要矛盾。 二、主成分分析法 定理 显然,贡献率越大,表明该成分综合的信息越多。 贡献率 主成分分析计算步骤 三、案例 数据来源:《中国统计年鉴》(1997-2006) 主成分分析过程 (1)录入原始数据 x=[ -0.7608 -0.6421 -0.5406 -1.2510 -1.1981 -1.1417 -1.3815 -0.5071 -0.8451 -0.7553 -0.7886 -1.1346 -1.0196 -1.2123 -1.1304 -0.5096 -0.7479 -0.6398 0.2219 -0.8632 -0.7682

文档评论(0)

586334000 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档