北京--基于SPSS的基本统计介绍.ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
New world old world 注意事项 各变量之间需要具有一定的相关性 如果需要进一步进行聚类分析,可计算各成分值。 0.6-0.9 0.05 参考书目 1. Ronald D. Yockey(著),刘超,吴铮(译). SPSS 其实很简单[M]. 中国人民大学出版社, 2010. 2. 汪东华. 多元统计分析与 SPSS 应用[M]. 华东理工大学出版社, 2010. 3. 贾俊平. 应用统计学(第二版)[M]. 中国人民大学出版社, 2013. 基于SPSS的基本统计分析技巧 吴浩 清华大学深圳研究生院 深圳出入境检验检疫局食品检验检疫研究中心 whakyo@ 统计的概念 什么是统计 统计学是通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象发展趋势。 描述性统计:频数(frequencies)、集中趋势(均值、中位数、众数)、变异性(标准差、方差) 推断统计:使用样本归纳总体一种统计学方法。 t-test、方差分析(ANOVA)、主成分分析(PCA) 样本 (sample) 总体(population) 成本高、难获得 总体的一小部分 推断、预测 样本的获取:抽样 抽样方法:简单随机、分层抽样、系统抽样、整群抽样 随机抽样 分层抽样 系统抽样 整群抽样 t-test 单样本t-test:样本均值和总体均值或者已知值进行比较。 前提假设:观测独立,样本服从正态分布 独立样本t-test:两个独立样本的均值比较。 前提假设:观测独立,样本服从正态分布,每组总体方差相等(Levene检验) 配对样本t-test:某种程度上相关的两个样本的均值比较。 前提假设:组内观测独立,样本服从正态分布 配对样本:指对同一个样本进行两次测定,或者两个完全一样的样本在不同条件下测定的值 方差分析 (analysis of variance,ANOVA) 一维组间方差分析(one way-ANOVA) 定义:一个因素影响下,两个或更多独立组的均值进行比较。 因素:产地 变量:葡萄酒中乙醇的碳同位素值 不同产地间葡萄酒中乙醇碳同位素值是否有差异 1=法国 2=西班牙 3=意大利 4=南非 P 值 方差齐性检验 Levene 统计量 df1 df2 p 0.618 3 81 0.605 0.05 事后检验(Post hoc):评价那些组不同 a b bc d 二维组间方差分析 (two-way ANOVA) Factor level location a b c vegetation 1 2 3 Location*vegetation (a,b,c) * (1,2,3) 例如:不同地点,不同植被下沉积物中的碳含量 两个因素属于嵌套关系:3个地点,每个地点的植被均不一样 由于初始变量不一致导致变量差异的情况,如各地点植被年龄差异较大 前提假设 1. 每个总体服从正态分布 2. 方差齐次 3. 观测值独立 方差分析中的数据转换 1. 对数转换 适合于原始数据的变异幅度很大的数据组,如各处理组方差与平均数间成正比关系。X’=lg(x) 2. 反正弦转换 适合于服从二项式分布的资料,数据以百分数表示,数据在30%~70%之间。X’=sin-1sqrt(p) 3. 平方根转换 适合于各组方差与平均数之间有某种比例关系,适合泊松分布的数据组。X‘=sqrt(p) 多元方差分析 (MANOVA) 用于两个或两个以上因变量的方差分析 优点:可以在一次研究中同时检验具有多个因变量的影响以及各因素间的交互作用。其应用的限制条件,各个因素每一水平的样本必须是独立的随机样本,其重复观测的数据服从正态分布,且各总体方差相等。 例如: 光照强度对藻类种群数量和生物量的影响(一维二元方差分析) 光照强度和营养盐水平对藻类种群数量和生物量的影响(二维二元方差分析) 主成分分析 主成分分析(principal component analysis, PCA):采取降维的方法找出几个综合因子来代表原来众多的变量,使得这些综合因子尽可能地反映原来变量的信息量,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。 主要应用:污染物溯源、食物来源、产地溯源 7个国家葡萄酒可被分为2个主要地区New world 和 Old world 43.6% 42.5% PCA在葡萄酒产地溯源中的应用 US SA AU CH ES IT FR Ethanol d13C Glycerol d13c K Ca Na ….. Sr 测定7个国家146只葡萄酒中的10个指标 想知道通过这10个指标是否能区

文档评论(0)

123****6648 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档