- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章多元分析概述ppt课件
* 第一章 多元分析概述 第一节 引言 第二节 应用背景 第三节 计算机在统计分析中的应用 第一节 引言 多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法。 近30年来,随着计算机应用技术的发展和科研生产的迫切需要,多元统计分析技术被广泛地应用于地质、气象、水文、医学、工业、农业和经济等许多领域,已经成为解决实际问题的有效方法。 机遇与挑战 随着Internet的日益普及,各行各业都开始采用计算机及相应的信息技术进行管理和决策,这使得各企事业单位生成、收集、存储和处理数据的能力大大提高,数据量与日俱增,大量复杂信息层出不穷。在信息爆炸的今天,人们已经意识到数据最值钱的时代已经到来。 显然,大量数据在给人们带来方便的同时也带来一系列问题。 信息量过大,超过了人们掌握、消化的能力; 一些信息真伪难辩,从而给信息的正确应用带来困难; 信息组织形式的不一致性导致难以对信息进行有效统一处理 这种变化使传统的数据库技术和数据处理手段已经不能满足要求.网络的迅猛发展也使得网络上的各种资源信息异常丰富,在其中进行信息的查找如大海捞针。这样又给多元统计分析理论的发展和方法的应用提出了新的挑战。 多元统计分析发展的历史 起源于上世纪初,1928年Wishart发表论文《多元正态总体样本协差阵的精确分布》,可以说是多元分析的开端。 20世纪30年代R.A. Fisher 、H.Hotelling、S.N.Roy、许宝騄等人作了一系列的奠基性工作。 20世纪40年代在心理、教育、生物等方面有不少的应用,但由于计算量大,使其发展受到影响,甚至停滞了相当长得时间。 20世纪50年代中期,随着电子计算机的出现和发展,使多元分析方法在地质、气象、医学、社会学等方面得到广泛得应用。 20世纪60年代通过应用和实践又完善和发展了理论,由于新的理论、新的方法不断涌现又促使它的应用范围更加扩大。 20世纪70年代初期在我国才受到各个领域的极大关注,并在多元统计分析的理论研究和应用上也取得了很多显著成绩,有些研究工作已达到国际水平,并已形成一支科技队伍,活跃在各条战线上。 在20世纪末与本世纪初,人们获得的数据正以前所未有的速度急剧增加,产生了很多超大型数据库,遍及超级市场销售、银行存款、天文学、粒子物理、化学、医学以及政府统计等领域,多元统计与人工智能和数据库技术相结合,已在经济、商业、金融、天文等行业得到了成功的应用。 本课程重点介绍多元正态总体的参数估计和假设检验以及常用的统计方法。这些方法包括判别分析、聚类分析、主成分分析、因子分析、相应分析、典型相关分析、多维标度法以及多变量的可视化分析等。 我们将利用SPSS统计软件来实现实证分析。 许宝騄(1910.09.01 - 1970.12.18), 字闲若,数学家,1910年出生于北京,原籍浙江杭州,祖父曾任苏州知府,父亲曾任两浙盐运使,系名门世家。 在中国开创了概率论、数理统计的教学与研究工作。在奈曼-皮尔逊理论、参数估计理论、多元分析、极限理论等方面取得卓越成就,是多元统计分析学科的开拓者之一。 统计方法是科学研究的一种重要工具,其应用颇为广泛。特别地,多元统计分析方法常常被应用于自然科学、社会科学等领域的问题中。 第二节 应用背景 一、统计学的生命力在于应用 (一) 统计学产生于应用 统计学的发展过程中可以看出统计学产生于应用,在应用过程中发展,它的生命力在于应用。 300多年前,威廉·配第(1623-1687)写的《政治算术》,从其研究方法看,被认为是一本统计学著作。政治算术学派的统计学家将统计方法应用于各自熟悉和感兴趣的研究领域,都还是把其应用对象当作肯定性事物之间的联系来进行研究的。他们确信,事物现象存在着简单明了的数量关系,需要用定性与定量的方法将这种关系(规律)揭示或描述。使人们能够更具体、真切地认识世界。 数理统计学派的奠基人凯特勒在统计学中引入了概率论,把它应用于自然界和社会的许多方面. 在应用中对发展统计方法贡献显著的当推生物统计学派的戈尔登(1822-1921)、皮尔逊(1857-1936)和农业实验学派的孟德尔(1822--1884)、戈塞特(1876-1937)等。 戈尔登六年中测量了近万人的“身高、体重、阔度、呼吸力、拉力和压力、手击的速率、听力、视力、色觉及个人的其他资料”。在探究这些数据内在联系的过程中提出了今天在自然科学和社会科学领域中广泛应用的“相关”思想。将大量数据加以综合描述和比较,从而能使他的遗传理论建立在比较精确的基础上,为统计学引入了中位数、四分位数、分布、回归等极为重要的概念和方法。 皮尔逊在检验他老师戈尔登的“祖先遗传法则”和自然选择中“淘汰”对器官的相关及变异的影响中,引入了复相关的概念和
文档评论(0)