2012年全国大学生数学建模竞赛A题葡萄酒评价分析.doc

下载文档 降价啦

66
0
约2.01万字
约 30页
2017-05-13 发布于重庆
举报
版权申诉
保障服务

2012年全国大学生数学建模竞赛A题葡萄酒评价分析.doc

1、本文档共30页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

2012年全国大学生数学建模竞赛A题葡萄酒评价分析

对葡萄酒的评价分析 /view/dd3f7f9e8bd63186bdebbc53.html 摘要本文主要应用数理统计中的t检验法，回归分析法等方法对葡萄酒的评价的相关问题进行了分析，建立相应的模型。针对问题一，首先，对样本进行K-S检验得出数据取自的总体服从正态分布，进而运用成对数据t检验法进行检验，得出两组评酒员对每种葡萄酒的总评分有显著差异；在此基础上，采用两种方法分别判断哪组评酒员的可信度更高。方法一是计算出每组评酒员对每种葡萄酒的总评分的置信区间，评分处于置信区间内的人次百分比较高的一组可信度较高；方法二是比较两组评酒员对每种葡萄酒的总评分的方差的大小，总体方差分布较小的一组，可信度较高。两种方法均得出了同一结论，即第二组评酒员的结果更可信。针对问题二，基于问题一得到的结论，建立了酿酒葡萄品质的综合评价模型。首先，对数据指标进行归一化处理，并计算出酿酒葡萄与各指标因素间的相关系数。然后，分别用层次分析法和因子分析法确定了各指标因素的权重。最后，利用确定的权重，建立了酿酒葡萄品质的综合评价模型，对葡萄进行分级。如，优质的红葡萄样品是8、23、3、1。针对问题三，从两个层次建立相关性系数模型。首先，运用Excel软件分析葡萄酒各理化指标与酿酒葡萄成分的相关性；然后，进一步分析酿酒葡萄的综合评价指标与葡萄酒的理化指标之间的联系。得出结论：酿酒葡萄的花色苷成分与葡萄酒的花色苷呈显著正相关。针对问题四，分别建立回归分析模型和综合评价模型，其中综合评价模型建立方法同问题二，回归分析模型则先将葡萄和葡萄酒的各理化指标进行因子分析法降维后得数量较少的因子变量，对简化后的新指标进行回归分析，此处尝试用SPSS软件的回归分析中5种回归拟合方法，继而选取拟合度最佳的模型，得回归系数，建立多元线性回归方程分析各理化指标对葡萄酒质量的影响；将新指标得分带入方程，可求得线性拟合后的葡萄酒质量评分。进一步引入芳香物质作为评判指标，同样建立线性回归模型求得葡萄酒质量评分，将有无引入芳香物质作为指标的质量评价结果分别与可信度较高的评酒员对葡萄酒的评价结果进行回归模型检验比较和差值平方和比较，得到结论用葡萄和葡萄酒的理化指标来评价葡萄酒的质量是完全可行的，但加入芳香物质作为评价指标更能准确合理地评价葡萄酒的质量。关键词：葡萄酒评价；层次分析法；综合评价模型；因子分析法；SPSS；回归模型一．问题重述葡萄酒质量一般由每个评酒员对葡萄酒进行品尝后的得分来评判。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系，葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。由附件1某一年份一些葡萄酒的评价结果，附件2和附件3该年份这些葡萄酒的和酿酒葡萄的成分数据，现要求建立数学模型分析以下问题： 1. 附件1中两组评酒员的评价结果有无显著性差异，并判断可信度。 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4．分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响，并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。二．问题分析 1. 欲尽量减小分析工作量和评分员主观因素的影响，应先进行数据预处理。 2. 欲判定两组评酒员的评价结果的差异是否显著，可用统计学的t检验方法，从而需要对样本数据进行正态性检验；比较可信度，需利用置信区间或方差。 3. 欲对酿酒葡萄分级，可建立综合评价模型，其中需要进行权重分配。可运用相关性系数基础上的层次分析法（AHP）、两组评酒员对每种红葡萄酒的平均评分的样本、两组评酒员对每种红葡萄酒的平均评分的样本平均值、第一组评酒员对每种白葡萄酒的平均评分的样本、两组评酒员对每种白葡萄酒的平均评分的样本平均值样本X的数据个数样本Y的数据个数置信度判断矩阵的最大特征值判断矩阵的最大特征值的特征向量权重系数向量指标数值向量综合评价指标五．模型的建立与求解 5.1 问题1的模型建立与求解 5.1.1第一小问模型的建立欲判断两组评酒员的评价结果的差异是否显著，应建立两组评酒员的非参数检验模型，横向比较，验证样本服从正态分布后，对两组评酒员的评分进行t检验。首先，对数据进行预处理、选择样本，并运用SPSS软件检验其正态分布性；然后，用matlab计算两个样本X、Y的平均值。当两个平均值相差不大时，统计量应该服从自由度为m+n-2的t分布；接着，使用函数[h,sig,ci]=ttest2(X,Y，，tail) 进行此种检验，先默认tail=0进行双边检验，若h=0, 则根据X-Y的理论值所在的1-区间来判定tail为1或-1，继续进行单边检验；