毕业设计-采用聚类分析的方法对两种葡萄进行分类.docVIP

毕业设计-采用聚类分析的方法对两种葡萄进行分类.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
毕业设计-采用聚类分析的方法对两种葡萄进行分类

模 式 识 别 结 业 论 文 (采用聚类分析的方法对两种葡萄进行分类) 采用聚类分析的方法对两种葡萄进行分类 摘要 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,建立聚类分析模型。首先因为样品酒的60个指标之间具有较强的相关性,所以对变量指标进行R型聚类分析,降低变量个数;然后采用Q型聚类分析对样本进行分类。把两组样品葡萄分为5类。红葡萄分类结果:第一类:样品8(反式白藜芦醇苷指标为5.283,而其他样品都小于1);第二类:样品3(氨基酸指标为8397.28远大于该指标均值2385.31)第三类:样品10(VC含量10.25,远大于均值0.477);第四类:样品1、2、4、5、6、7、9、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27;第五类:酒样品11(花色苷指标为104.92,远大于均值7.787); 关键词: R型聚类 Q型聚类 1问题分析 要根据酿酒葡萄和葡萄酒的质量的这两种葡萄进行分级,首先对原始酿酒葡萄的理化指标数据进行整理,并把葡萄酒的平均质量指标作为葡萄的变量指标进行考虑。由于白葡萄和红葡萄的分析方法相同,所以我们以红葡萄为例来进行分析。 首先定性考察反映红葡萄指标状况的60个方面,可以看出某些指标之间可能存在较强的相关性。比如氨基酸的总量与天门冬氨酸、苏氨酸、丝氨酸、谷氨酸、脯氨酸、甘氨酸、丙氨酸、胱氨酸、缬氨酸、蛋氨酸、异亮氨酸、酪氨酸、苯丙氨酸、赖氨酸、组氨酸、精氨酸之间可能存在较强的相关性,白藜芦醇与反式白藜芦醇苷、顺势白藜芦醇苷、反式白藜芦醇、顺势白藜芦醇之间可能存在较强的相关性,还原糖与果糖和葡萄糖之间存在较强的相关性,为了验证这种想法,运用MATLAB软件计算60个指标的相关系数矩阵. 其次由相关性矩阵可以判断某些指标之间确实存在很强的相关性,因此可以考虑从这些指标中选取几个有代表性的指标进行聚类分析。为此,把60个指标根据其相关性进行R型聚类,聚成20类,再从每个类中选取代表性的指标。首先对每个变量的数据分别进行标准化处理。变量间相近性度量采用相关系数,类间相近性度量的计算选用类平均法,编写MATLAB程序,从而求出聚类树形图。 最后根据这20个变量指标对27中红葡萄进行聚类分析。首先对每个变量的数据分别进行标准化处理,样本间相似性采用欧氏距离度量,类间距离的计算选用类平均法,编写MATLAB程序,从而得到葡萄聚类树形图。 2模型的建立与求解 根据求得的相关系数矩阵,采用R型分析和Q型分析的方法对葡萄进行分类,具体的数学模型如下: (1)首先对葡萄的指标进行标准化处理,然后通过下面的模型可以求出葡萄变量指标的相关系数矩阵; (2)然后采用最短距离法求出相关系数矩阵中两个类中最近两点间的距离,再采用dendrogram函数,即可画出葡萄变量指标的聚类树形图; 最后对每个变量指标的数据分别进行标准化处理,样本间间的相似性采用欧氏距离度量,类间距离的计算选用类平均法,然后再次使用dendrogram函数求出葡萄的聚类树状图,从而得到葡萄的分类结果。 3模型的结果与分析 1)红葡萄分类的结果与分析如下: (1)对红葡萄变量的聚类树状图: 图1 对红葡萄变量的聚类树状图 由图形和MATLAB程序可知,把葡萄的变量指标分为20类,其中还原糖,果糖,葡萄糖,可溶性物质,PH值、可滴定酸,顾酸比,干物质含量,果穗质量,百粒质量,果梗比,出汁率,果皮质量,L*,果皮颜色a+,果皮颜色b*,H,C,18个变量指标之间有较大的相关性,被聚到一起;氨基酸,脯氨酸,花色苷3个变量指标之间存在有较大的相关性,被聚到一起;丝氨酸,缬氨酸,异亮氨酸,亮氨酸,赖氨酸,组氨酸,精氨酸之间存在较大的相关性,被聚成一类;白藜芦醇和顺势白藜芦醇苷之间存在较大的相关性,被聚成一类;黄酮醇。槲皮素,异鼠李素,总糖之间存在较大的相关性,被聚成一类;苏氨酸,谷氨酸,丙氨酸,苹果酸,柠檬酸,多酚氧化酶,褐变度,DPPH自由基,总酚,单宁,葡萄总黄酮之间存在较大的相关性,被聚成一类;其余各自成一类。这样就从60个指标中选定20个分析指标,可以根据这35个指标对27种红葡萄进行聚类分析。 (2)27种红葡萄聚成5类的树状图 图2 27种红葡萄聚成5类的树状图 由图可知,各种红葡萄之间存在较大的差异,可把27种葡萄分为4类,结果为: 第一类:红葡萄样品8;第二类:红葡萄样品3;第三类:红葡萄样品10;第四类:红葡萄样品1,2,4,5,6,7,9,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27;第五类:红葡萄酒样品11. 从以上结果结合聚类图中的合并

文档评论(0)

店小二 + 关注
实名认证
文档贡献者

包含各种材料

1亿VIP精品文档

相关文档