云南师范大学葡萄酒的类别判定教程.pptxVIP

云南师范大学葡萄酒的类别判定教程.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
云南师范大学葡萄酒的类别判定教程

葡萄酒的类别判定;一、案例背景;二、数据描述;三、名词解释;因子分析:因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。 聚类分析:聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。 ; 判别分析:判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。据此即可确定某一样本属于何类。当得到一个新的样品数据,要确定该样品属于已知类型中哪一类,这类问题属于判别分析问题。;四、数据图视化;半数观测的Andrew曲线图(图一);;五、分析方法;主成分分析的碎石图(图三); 虽然两个主成分提取的信息只占55.4%,但是可以得到变量和这两个主成分的相关关系,并且展示各观测在两个主成分上的得分。基于主成分分析的Biplot图(图四),可以看出,所有观测较明显的聚集为3群,部分变量之间存在较强的相关性,且所有变量的箭头长度相近,说明在两个主成分上各变量所占权重相似,但是由于两个主成分提取的信息不够充分,主成分载荷阵并未经过旋转,使得变量之间的关系看起来比较混乱,不能很好地进行解释,只能做基本的探索性分析。;基于主成分分析的Biplot图(图四) ?;; 为了得到更好的因子解释,考虑对因子分析载荷阵进行Varimax旋转,得到新的因子载荷阵(图六),我们可以为提取出来并经过方差最大化旋转的6个因子命名,分别为酚酮类物质、氨基酸与酒精、灰分及其碱度、色调和色度、苹果酸、Mg含量。由于各因子间还存在一定的变量混杂,需要进行更具体的各种化学成分及物理性质之间的关系分析。;;聚类分析的树形图(图七); 我们将观测聚为3类,与实际的葡萄酒的分类变量Type相比,178个观测中只有14个观测与实际不符,符合度达92.1%,其中第2类葡萄酒的符合度仅为81.7%,说明这类葡萄酒的数据特征不是很明显,不能够进行很好的区分,这个结论将在后面的分析中得到印证。 聚类分析结果与真实分类的比较: ;4、判别分析; 在两个线性判别函数的二维平面上,绘出各观测的散点图(图九),发现各类别间差异明显,判别效果较好。实际上,表面误判率为0(图十),由于该判别直接针对训练集样本,这个数值显然被高估了。 ; 为了得到更恰当的误判率,我们采用Leave-one-out方法进行交叉验证,得到线性判别方法的实际误判率为1.1%(图十一),判别效果很好。 放松各类别协方差矩阵相等的假定,同时假定数据服从多元正态分布,采用Bayes二次判别分析,得到实际误判率为0.6%(图十二),判别效果进一步增强。值得注意的是,对比线性判别与二次判别的结果可知,误判均发生在第2类葡萄酒(Andrew曲线图表明,第1类葡萄酒与第2类相似),因此,可以考虑针对第2类葡萄酒进行更有效的判别研究。;六、结论

文档评论(0)

shuwkb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档