多元数据处理应用报告..docxVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元数据处理应用报告.

多元数据处理摘要:多元数据处理主要包括多元随机变量,协方差分析,趋势面分析,聚类分析,判别分析,主成分分析,因子分析,典型相关分析,回归分析以及各个分析方法的相互结合等等。本文主要介绍这些多元数据处理方法的基本原理,并具体介绍聚类分析法以及聚类分析法的应用举例。关键字:多元数据处理 聚类分析法在对社会,经济,技术等系统的认识过程当中,需要收集和分析大量表现系统特征和运行状态的数据信息。多元数据处理的基本内容,就是利用统计和数学的方法,对多维复杂数据群体进行科学分析。多元统计数据分析的主要内容包括对数据的描述性分析方法和解析性分析方法。其中,解析性分析方法的主要代表是回归分析和判别分析。概论在对原始数据进行分析和处理时,这类原始数据集合往往由于样本点数量巨大,用于表征系统的特征指标变量越多,且大多数具有动态特性,具有规模宏大,复杂难辨等特征。多元数据处理的基本内容,就是利用统计和数学的方法,对多维复杂数据群体进行科学分析。统计分析与决策的进程可以分为四个阶段:首先是对系统的描述性分析,即运用所掌握的信息,对系统进行尽可能充分和全面的认识;其次,对系统的解析性分析,常常通过建立数学模型,辨识和刻画系统的解析结构,确定系统中各因素或各元素的内在联系;再次,关于系统的预测性研究,其目的是掌握系统运行和动态变化的规律,对系统未来做出准确的预见;最后,即决策阶段,对系统的状态进行充分观察和认识,对系统构造及其要素的内在联系进行辨识和深入分析。这四个过程是循序渐进的。数据的描述性分析其目的是要在大规模的原始数据中,迅速将重要信息提取出来,对系统的主要特征进行认识和研究。包括主成分分析,对应分析和聚类分析,均属于描述性研究的范畴。其显著特征是,均属于非模型化的研究方法。主成分分析主要用于分析样本点定量变量类型的数据表。能够保证在数据信息损失最小的前提下,对高维数据集合进行降维处理,迅速揭示系统中的主要因素。对应分析是对主成分分析的拓广,主要是对定性数据进行最佳综合简化,并实现高维定性数据系统的可视见性。聚类分析则用于对大量的样本点集合进行分类分析,或对众多变量进行归类划分,更适用于系统的类群构造及其内在相似性的研究。数据的解析性分析数据的解析性分析方法,主要包括回归分析,判别分析以及偏最小二乘回归分析。所谓解析性分析是指一类模型式的数据分析方法,在进行数据分析之前,对所需分析的变量因果关系,相随变动关系或数据分布状况有一定的认知,并希望通过建立数学模型,使对系统变量间关系的认识更加准确化和数量化。回归分析用于辨识一个或一组变量的变动对另一个变量变动的影响程度。在回归模型中,凡是变量之间的关系是线性关系的模型,都称之为线性回归模型,否则为非线性回归模型。偏最小二乘回归研究的焦点主要集中在如何建立多个因变量与多个自变量之间的统计关系的模型上,特别在因变量之间及自变量之间存在多重相关性时,使用该方法具有优越性。判别分析的问题是,已知存在K个总体G1,G2,…,Gk,并且已得到K个随机样本,第一个样本中的每个个体都来自G1,以此类推,根据已有的统计数据信息,构造一个判别函数以及相应的判别准则。预测性分析与决策性分析决策性分析方法是最先被引入,也是最为普遍的定量化方法,最典型的如数学规划,网络分析技术等,这些方法共同特点是在约束条件下,对多种可行方案进行择优,以给出目标效益最佳的决策方案。方法分类多元数据统计分析方法主要有:回归分析法,判别分析法,聚类分析法,主成分分析法,对应分析法,偏最小二乘回归分析法,时序立体数据表分析法等。回归分析法回归分析法研究一个因变量与一个或几个解析变量之间的相互依存关系,并估计或预测在解释变量的数值已知或固定的基础上因变量的平均值。回归分析法是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)。在统计关系中处理的是随机变量而不是普通变量,具有一定的概率分布,在测量这些变量时,总会有误差存在,此外,还有其他因素影响着变量。回归分析中,当研究的因果关系只涉及因变量和一个自变量时,叫做一元回归分析;当研究的因果关系涉及因变量和两个或两个以上自变量时,叫做多元回归分析。此外,回归分析中,又依据描述自变量与因变量之间因果关系的函数表达式是线性的还是非线性的,分为线性回归分析和非线性回归分析。回归分析法预测是利用回归分析方法,根据一个或一组自变量的变动情况预测与其有相关关系的某随机变量的未来值。进行回归分析需要建立描述变量间相关关系的回归方程。根据自变量的个数,可以是一元回归,也可以是多元回归。根据所研究问题的性质,可以是线性回归,也可以是非线性回归。非线性回归方程一般可以通过数学方法为线性回归方程进行处理。判别分析判别分析是用于判别个体所属群体的一种统计方法,在自然科学,社会学

文档评论(0)

jiulama + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档