推断性单变量统计.pdf

  1. 1、本文档共129页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
推断性单变量统计

推断性单变量统计 ①以参数估计和假设检验为基础的推断性单变量 统计分析,包括点估计与区间估计,方差分析, 2 t‐检验、F‐检验与χ ‐检验等经典检验和p‐值检验。 ②非参数统计分析的概念和原理,以及常用的非 参数估计与检验方法。 • 统计学中,样本并不需要精确地反映总体特征。 纵使是良好设计的采样,也不能确保样本能精 确地反映总体特征。记住,任何样本都可能错 误地或不完全地表达总体。 • 尽管我们有关总体的知识可能含糊不清和非常 有限,借助样本数据可以估计出总体特征或统 计量。 采样分布 • 采样分布(sampling distribution )是概率分布 的特定类型,它的分布曲线形状随样本大小n 而变化。 • 以样本大小为基础的自由度(degrees of  freedom )定义了绘制采样分布的参数。 • 采样分布是统计学分布,而不是单个数值的分 布。每个统计量(均值、众数和中位数等)都 有各自的分布。 几种重要的采样分布:    t分布 • t分布描述样本均值的采样分布,其真实的总 体方差是未知的。 • t分布是对称的,其均值是0,但标准差大于1。 • 随着自由度增加,在有限情形下,t分布接近 正态分布。统计学上,称为渐近逼近。 • t分布是t检验(用于不同采样的均值比较)的 依据。 2  几种重要的采样分布:       分布 几种重要的采样分布:   F 分布 参数估计 • 给定样本数据,进一步拟合模型和数据,因此需 要确定特定模型的最佳拟合参数,需要估计参数 的方法。即从总体中抽取样本,对样本统计量进 行统计推断,得出相关总体参数的过程,就是参 数估计。 • 参数估计包括两种形式:点估计和区间估计。 • 点估计的价值是在于定义模型,是面对未知的情 形计算估计。 • 区间估计的价值是量化参数估计的准确性,是对 统计量有所理解,需要进一步对相关假设情形, 作出检验和推断。 • 参数估计(parameter estimation )是数理统计的核心内 容。面对的问题是假定总体分布是已知的,表达总体分 布特征的参数θ是未知的。 • 对不同分布,待估计的参数可能有区别。比如, Weibull分布的参数估计除一般统计量(如均值、总量、 方差等)外,还可能包括位置、形态和尺度参数。 • 对应随机样本组,估计就是随机变量。因此,一个样本 估计是以样本分布为基础。不同采样方式,参数估计与 计算方法同样有差别。 • 然而,环境科学中,环境总体的分布往往是未知的,不 能轻意假定环境数据就是服从正态分布或对数正态分布, 而应当根据问题性质,审慎地研究; • 不同于经典数学问题,环境样本数值也是不确定的,实 际测量结果可能因为实验室类型、仪器和分析人员而变 化。 • 经典统计上,要求样本满足一些条件: ①随机采集数据。实际非参数估计中,也要求随机 采样。即每个样本的选择概率是相同的,一个样本的 选择也不影响其它样本的选择概率。 ②观测样本必须是正态分布,或近似正态分布。参 数估计的一般假设是样本数据服从正态分布,正态分 布的均值和方差本身就是参数。 ③当采样的总体有多个,则对每组总体采集的样本 必须具有相同的方差。 ④样本数据必须是可测量的,至少是区间变量或者 近似这个尺度的离散型分布数据,如动物数量、细胞 数量、微生物数量计数。 小结 • 是借助样本数据,估计目标环境总体的参数。 • 参数统计方法是从样本数值估计总体特征参数的方法, 如矩法、最大似然估计、最小二乘法、Bayes估计、极 小极大估计、Pitman估计、区间估计和鲁棒性估计等。 • 常用参数统计方法包括: ①

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档