主成分分析的计算步骤剖析.docVIP

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析的计算步骤剖析

葡萄酒的评价 摘要 本文通过聘请一批有资历的评酒员对葡萄酒的质量进行评价,从而得出不同组别、不同样品葡萄酒的质量。然后分析酿酒葡萄与葡萄酒质量的理化指标对葡萄质量的影响,以及它们之间的联系。 对于问题1我们用检验对评判两组评酒员的评价结果进行了显著性检验。 对于问题2我们对于问题3我们检验、主成分分析、Matlab编程、灰色关联度分析、 一、问题重述 1.1、问题背景:葡萄酒是一种健康饮料,口味独特,酒精含量又低,然而二、问题分析 对问题2 三、模型假设 1.假设二级指标对一级指标的影响不大; 2. 四、符号说明 1. :指标变量的个数; 2.rij:(i,j=1,2,…,p):为原变量的xi与xj之间的相关系数; 3.R:实对称矩阵; 4.:主成分; 5.:特征值; 6.:特征向量; 7.:主成分载荷; 8.:因素集; 9.:评语集; 10.:权重集; 11.:单位矩阵; 五、模型的建立与求解 (一)对于问题一:分析附件1中两组评酒员的评价结果的显著性差异,判断哪组更可信。 首先用采用excell统计学原理求出每一组每个样品的总得分。然后采用单因素试验的方差分析分析两组评酒员的评价结果有无显著差异。再采用t检验进一步验证。根据得出的数据求均值差的置信水平为0.95的置信区间。 第一种方法:采用方差分析 一般地为了考虑因素A是否对试验指标有影响,我们在因素的不同水平A1、A2,…,Ar下进行试验,如果在每一水平Ai下,进行了ni次观察,从而得到ni个数据,把因素每一水平下的试验指标看成一个随机变量,则这ni个数据就是的一个容量为ni的样本的值。现在我们要研究的是这r个总 体是否具有相同的分布,或r个样本()是否来自同一个总体。 检验假设(=0.05); :, :不全相等, 通过计算因素平法和、误差平法和、总和、自由度。再通过matlab可以得到均方、F比的值,从而可以确定有无显著的差异,其得出的表格及图像如下 方差来源 平法和 自由度 均方 F比 因素 误差 S-1 n-s = = 总和 n-1 = 经查表得(9,10)=3.022.87故各因素存在显著差异。 同理可以得出两组评酒员对其他样品的得分有无显著差异,经过多次应用matlab得到数据可以看出基本上无显著差异。这里=-(T=),=-, = - ,然后再算出其置信区间,通过置信区间看哪一组更可信。(方差)= /(n-s),代表均值。代表总平均,均值差的估计:(n-s),(n-s) 第二种方法:采用检验法 当总体呈正态分布,如果总体标准差未知,而且样本容量30,那么这时一切可能的样本平均数与总体平均数的离差统计量呈分布。 检验是用分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。相关样本平均数差异的显著性检验,用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本。相关样本的检验公式为: 。 在这里,,分别为两样本平均数; ,分别为两样本方差; 为相关样本的相关系数。 第一步 建立原假设=; 第二步 计算值,根据表(9)的数据我们可以计算出t=0.58 第三步 判断 根据自由度26,查值表1.7058,2.4786.由于实际计算出来的=0.582.4786=,则p0.99,故原假设成立。 结论为:两次测验成绩无显著地差异。 2.对于问题二: 主成分分析的计算步骤: 1计算相关系数矩阵 其中,rij(i,j=1,2,…,p)为原变量的xi与xj之间的相关系数,其计算公式为 因为R是实对称矩阵(即rij=rji),所以只需计算上三角元素或下三角元素即可。 2计算特征值与特征向量 首先解特征方程,求出特征值,并使其按大小顺序排列,即;然后分别求出对应于特征值的特征向量。这里要求=1,即,其中表示向量的第j个分量,即为单位向量。 3 计算主成分贡献率及累计贡献率 主成分的贡献率为 累计贡献率为 5.确定主成分个数: 一般取累计贡献率达85—95%的特征值所对应的第

您可能关注的文档

文档评论(0)

586334000 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档