多元统计论文基于微量元素的主成分分析对茶叶的评价.docVIP

多元统计论文基于微量元素的主成分分析对茶叶的评价.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元统计论文基于微量元素的主成分分析对茶叶的评价

基于微量元素的主成分分析对茶叶的评价 数学102班陈茂亮 摘要:以微量元素含量为指标,应用软件和软件对微量元素进行基本统计分析和主成分分析,筛选出四个主成分,找出微量元素的相关关系,并对不同的茶叶进行了排名,为研究茶叶的品质和功效提供依据。 关键词:微量元素;基本统计;主成分分析;茶叶评价 引言 现代医学已经证明,微量元素与人体的健康密切相关,已经发现了铁、镁、锌、铜、硒、锰等微量元素。这些微量元素都参与了生命体内的许多重要生理过程,与生命体内的许多疾病的发生密切相关。因此,微量元素的研究极为重要[]。茶是我们生活的必需品,具有润肺止渴,安神定性的功效。为了更好地研究茶的特性功效,通过基本统计分析和主成分分析对茶叶中的微量元素进行研究,对不同品种的茶进行综合排名。 一、 主成分分析概况 1.1 基本思想 主成分分析是一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关,这种将把多个变量化为少数几个相互无关的综合变量的统计分析方法叫做主成分分析或主分量分析。它对原变量进行转换,使少数几个变量是原变量的线性组合,同时,这些变量又尽可能多的表征原变量的数据结构特征而不失信息[]。 1.2 数学模型 对于一个样本资料,观测个变量,个样品的数据资料阵为: 其中 主成分分析就是将个观测变量综合成为个新的变量(综合变量),即 简写为 其中互不相关,的方差大于的方差大于的方差,以此类推, 为第一主成分,为第二主成分,以此类推,有第个主成分。称为主成分系数。 1.3 计算步骤 第一步:对原始数据进行标准化处理。 , 其中 ,。 第二步:计算样本相关系数矩阵。 假定原始数据标准化后仍为表示,则经标准化处理后的数据的相关系数为: 第三步:用雅克比方法求相关系数矩阵的特征值和相应的特征向量。 特征值为,特征向量 第四步:选择重要的主成分,并写出出成分表达式。 贡献率= 贡献率越大,说明该主成分所包含的原始变量的信息越强。主成分个数k的选取,主要根据主成分的累积贡献率来决定,即一般要求累积贡献率达到85%以上,这样才能保证综合变量能包括原始变量的绝大多数信息[]。 第五步:计算主成分得分 根据标准化的原始数据,按照各个样品,分别代入主成分表达式,就可以得到各主成分下的各个样品的新数据,即为主成分得分。 第六步:依据主成分得分的依据,进行进一步的统计分析,如综合评价。 对主成分进行加权综合。将主成分的权数根据它们的方差贡献率为确定,因为方差贡献率反映了各个主成分的信息含量多少。 综合评价得分: 二、数据处理过程 2.1 数据来源 数据来自文献不同产地茶叶矿物质元素含量的调查分析[] 2.2 数据基本统计分析与预处理 首先对原始数据进行描述性统计,包括最值、均值和方差的统计;其次由于原始数据差别较大,因此对数据进行标准化处理,以消除由于原始数据存在的量纲不同和数量级不同而对分析结果造成的影响。标准化后的数据具备可比性,并遵从正态分布规律[]。 三、数据处理结果 3.1 基本统计分析结果 对原始数据进行描述性统计后,得到各元素在茶叶中的含量分析。数据中各微量元素的最大值与最小值相差很大,最小相差约4倍,最大达20余倍。 表 1 数据描述性统计表 最小值 最大值 标准差 Ba 11.59 352.90 103.10 Co 0.16 0.51 0.10 Cr 0.53 1.58 0.32 Li 0.08 0.61 0.17 Zn 20.70 74.10 19.84 Mn 251.50 3048.00 760.68 Fe 60.30 844.00 231.07 Ca 2540.00 18200.00 4710.73 Na 11.40 213.00 60.58 Cu 6.31 35.20 8.28 S 1580.00 4530.00 841.02 K 14000.00 20100.00 1927.12 La 0.00 15.70 5.21 Sn 23.00 33.70 4.02 Mg 2040.00 4540.00 755.56 Sc 0.30 8.41 2.44 Ni 2.93 11.30 2.52 在对数据描述性统计后,数量级别差别便暴露了出来,的数量级相比其他的数据大。若不进行标准化处理,在进行主成分分析时,数据的级别差将会影响主成分的提取。进行标准化处理,使得数据的均值为0,方差为1,可以满足正态分布检验。这也为主成分的提取做好了准备。 3.2 主成分的提取 通过软件的数据分析,我们将原始数据多变量进行降维处理,得到数据的特征根和方差贡献率。从下表特征值及贡献率可以看出,各成分的贡献率依次递减,前4个成分的累积贡献率达87.

文档评论(0)

jiqinyu2015 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档