数据方法电子教案讲述.ppt

  1. 1、本文档共241页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据方法电子教案讲述

数 据 分 析 方 法 引 言 数据分析:分析和处理数据的理论与方法,从中获得有用的 信息。 常用的数据分析软件:SPSS, MATHEMATICA, MATLAB, SAS, S-PLUS, STATISTICA等等。 SPSS 是Statistical Package for the Social Science的 简称。 数据分析应用于:通讯、医疗、银行、证券、保险、制造、 商业、市场研究、科研、教育等多个领域和行业。 数据描述性分析步骤: 分析-描述统计-频率(统计量、图表)或描述或探索 频率:统计量-百分位值(四分位数、百分位数)、集中趋势(均值、中位数等)、离散程度(标准差、方差、偏度、峰度等) 描述或探索类似频率 图形(或图表):散点图、直方图(显示正态曲线)、QQ图 茎叶图:分析-描述统计-探索分析(显示默认两者都指统计和图、图) 数据描述性分析步骤: 分析-相关分析-两个变量相关分析(相关系数、选项)或按前面计算方差办法2个同时输入 线性回归分析步骤:分析-回归分析-线性回归 销售量数据及计算表 2.在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A1是以鱼粉为主的饲料,A2是以槐树粉为主的饲料,A3是以苜蓿粉为主的饲料。为比较三种饲料的效果,特选 24 只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量。试验结果如下表所示: 单因素方差分析步骤: 分析-均值比较-单因素ANOVA(一维方差分析) 两因素等重复方差分析步骤(无交互效应) : 分析-常规线性模型-单变量 两因素等重复方差分析步骤(有交互效应) : 分析-均值比较-单因素ANOVA 练习 在某种金属材料的生产过程中, 对热处理温度(因素B)与时间(因素A)各取两个水平, 产品强度的测定结果(相对值)如表9.12所示. 在同一条件下每个实验重复两次. 设各水平搭配下强度的总体服从正态分布且方差相同. 各样本独立. 问热处理温度, 时间以及这两者的交互作用对产品强度是否有显著的影响(取a=0.05)? 例 下面给出在某5个不同地点, 不同时间空气中颗粒状物(以mg/m3计)的含量数据: 两因素非重复方差分析步骤(无交互效应) : 分析-常规线性模型-单变量 第4章 主成分分析与典型相关分析 一、主成分分析 引例:某人要做一件上衣需要测量很多尺寸,如身长、袖长、胸围、腰围、肩宽、肩后等十几项指标,但某服装厂要生产一批新型服装决不可能把尺寸的型号分得过多,而是从多种指标中综合成几个少数的综合指标,作为分类的型号,利用主成分将十几项指标综合成3项指标,一项反映长度的指标,一项反映胖瘦的指标,一项反映特体的指标。 主成分分析:就是将多个具有一定相关性的指标(变量),重新组合成一组新的相互无关的综合指标(变量)来代替原来指标的统计方法。 目的:就是对原变量加以“改造”,在不致损失原变量太多信息的条件下尽可能地降低原变量的维数,即用维数较少的“新变量”代替原来的各变量。(用于系统评估或分类,利用少数几个主成分得分为新数据进一步分析,如基于主成分的回归分析,聚类分析等) 讨论的问题是: (1) 基于相关系数矩阵还是基于协方差矩阵做主成分分 析。当分析中所选择的经济变量具有不同的量纲, 变量水平差异很大,应该选择基于相关系数矩阵的 主成分分析。 (2)选择几个主成分。主成分分析的目的是简化变量, 一般情况下主成分的个数应该小于原始变量的个 数。关于保留几个主成分,应该权衡主成分个数和 保留的信息。 (3)如何解释主成分所包含的经济意义。 主成分分析步骤: 分析-数据降维-因子分析- 变量、 描述(统计量-原始分析结果,相关矩阵系数、相关矩阵中的显著水平可以没有)、 抽取(方法-主成分分析法、分析—相关性矩阵或协方差矩阵、提取-因子数1或2或3由累积贡献率决定)、 得分(保存为变量-保存到数据库中) 注:输出结果中特征向量应除以特征值开方才为单位化特征向量 二 、 典型相关分析 (一) 典型相关分析的概念及基本思想 例如,研究苗木地上部分的高、地径、地上重(第 一组变量)与地下部分的主根长、根幅、地下重、 侧根数(第二组变量)之间的关系。 典型相关分析:就是研究两组变量之间相关关系的 一种多元统计方法。 基本思想:首先在两组变量中找出变量的线性组 合,使其具有最大相关性,然后再在每组变量

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档