多元统计分析概述.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Chapter 1 多元统计分析概述 【目的要求】要求学生了解多元统计分析的基本内容及应用领域,并掌握一些基本概念;对统计分析软件有一个基本认识。 【教学内容】多元统计分析的基本内容;相关的补充知识和将要涉及的计算软件程序。 1.1 多元统计分析的历史 在统计学的基本内容中,只考虑一个因素或几个因素对一个观测指标(变量)影响大小的问题,称为一元统计分析或单因素分析。若考虑一个因素或几个因素对两个或两个以上观测指标(变量)的影响大小,或者多个观测指标(变量)间的相互关系问题,即为多元统计分析。多元统计分析是研究客观事物中多个指标(变量)间相互依赖关系的统计规律的数理统计学分支之一。 在经济生活中,受多种指标(随机变量)共同作用和影响的现象大量存在。有两种方法可同时对多个随机变量的观测数据进行有效的分析和研究。一种方法是把多个随机变量分开分析,每次处理一个,逐次分析研究。但当变量较多时,变量之间不可避免地存在着相关性,而且分开处理不仅会丢失很多信息,往往也不容易取得好的研究结论。另一种方法是同时进行分析研究,即用多元统计分析来解决,通过对多个随机变量观测数据的分析,来研究变量之间的相互关系并揭示变量的内在规律。所以说,多元统计分析就是研究多个随机变量之间相互依赖关系及其内在统计规律的一门科学。 多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法。构成多元统计分析模型的数学方法并不新颖,如与多元有关的基本概率分布(多元正态分布源自19世纪30年代)、主成分分析(由K.Pearson于1901年提出,再由Hotelling于1933年推广的一种统计方法)。由于随机变量较多时,多元分析的计算工作量及其繁冗,没有计算机根本无法完成,因此,知道有了计算机之后,多元分析技术才进入实用阶段并得到迅速发展。近20年来,随着计算机应用技术的发展和科研生产的迫切需要,多元统计分析技术被广泛地应用于经济、管理、地质、气象、水文、医学、工业、农业和教育学等许多领域,已经成为解决实际问题的有效方法。 1.2 多元统计分析的用途 在采用多元统计分析技术进行数据处理、建立宏观或微观系统模型时,可以解决一下四个方面的问题: (1)变量之间的相依性分析。分析多个或多组变量之间的相依关系,是一切科学研究尤其是经济管理研究的主要内容,简单相关分析、偏相关分析、复相关分析和典型相关分析提供了进行这类分析的必要方法。 (2)构造预测模型,进行预报控制。在自然和社会科学领域的科研和生产中,探索多元系统运行的客观规律及其与外部环境的关系,进行预测预报,以实现对系统的最优控制,是应用多元统计分析技术的主要目的。在多元统计分析中,用于预报控制的模型有两大类:一类是预测预报模型,通常采用多元线性回归或逐步回归分析、非线性回归、判别分析等建模技术;另一类是描述性模型,通常采用综合评价的分析技术。 (3)进行数值分类,构造分类模式。在多元系统的分析中,往往需要将系统性质相似事物或现象归为一类,以便找出它们之间的联系和内在规律。过去许多研究多是按单因素进行定性处理,以致处理结果反映不出系统的总特征。进行数值分类,构造分类模式一般采用聚类分析和判别分析技术。 (4)简化系统结构,探讨系统内核。可采用主成分分析、因子分析、对应分析等方法,在众多因素中找出各个变量最佳的子集合,根据子集合所包含的信息描述多元系统的结果及各个引子对系统的影响。抓住主要矛盾,把握主要矛盾的主要方面,舍弃次要因素,以简化系统的结构,认识系统的内核。 如何选择适当的方法来解决实际问题,需要对问题进行综合考虑。对一个问题可以综合运用多种统计方法进行分析。例如,一个预报模型的建立,可现根据有关经济学、管理学原理,确定理论模型和设计方案;根据观察或实验结果,收集相应资料;对资料进行初步提炼;然后应用多元统计分析方法(如相关分析、逐步回归分析、主成分分析等)研究各个变量之间的相关性,选择最佳的变量子集合;在此基础上构造预报模型;最后对模型进行诊断和优化处理,并应用于经济管理的生产实际中。 1.3 多元统计分析的内容 多元统计分析的内容主要有:多元数据图示法、多元线性相关与回归分析、聚类分析、判别分析、主成分分析、因子分析、对应分析及典型相关分析等。 1. 多元数据分数学表示 多元数据是指具有多个变量的数据。如果将每个变量看做成一个随机变量的话,多个变量形成的数据集将是一个随机矩阵,所以多元数据的基本表现形式是一个矩阵。对这些数据矩阵进行数学表示是我们的首要任务。也就是说,多元数据的基本运算是矩阵运算,而R语言是优秀的矩阵运算语言,这也是我们应用它的一大优势。 2. 多元数据的直观分析 直观分析即图示法是进行数据分析的重要辅助手段。例如,通过两变量的散点图可以考察一场的观测值对样本相关系数的影响,利用矩阵散点图可以考

文档评论(0)

a13355589 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档