第二章 数据分析简介..pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 第二章 化学实验数据的统计分析 一、基本概念 1.总体和样本:研究对象的全体称为总体(母体); 自总体中随机抽出的一部分样品称为样本(子样)。 样本容量:样本中所含个体的数目称为样本容量 (样本大小)。 例如:对某软锰矿中二氧化锰含量的测定 分析人员按规定对物料进行预处理后,得到大约500g样品,这就是总体;从500g试样中取出12份软锰矿样品进行分析,得到12个测定值,这12个测定值就构成了本软锰矿样品总体的一个随机样本,样本容量为12。 统计学中,通常通过研究样本来研究总体,因此,一般用来表示统计对象的统计特征的量是相对出现的。 2.位置特征参数——算术均值: 当N→∞时, 称为总体平均值,用μ表示。 当N≤20时, 称为样本平均值,又称数学期望。 为了表示 和μ的差别,我们通常用误差来表示, 其差别大小可用来判断位置特征参数的准确性。 误差:δi=xi-μ (i=1,2,…,N),可分为随机误 差 和系统误差。 由于真值μ一般不可知,故误差也不好直接计算,从而又用偏差来表示测定结果的精密度。 偏差 准确度:测定值与真值的差别大小 精密度:测定值之间的离散特征 可见,误差和偏差是分别用来表示总体和样本位置特征参数的准确度的一对概念,一般偏差用的较多。 3.散度特征参数——方差: ——标准差: 其中,当N→∞时,测定值与真值差的平方和除以测定次数称为总体方差,用σ2表示;其平方根称为总体标准差,用σ表示。 当N≤20时,测定值与平均值差的平方和除以自由度(测定次数减1)称为样本方差,用s2表示;其平方根称 为样本标准差,用s表示。 总体标准差又称为标准误差,样本标准差又称为标准偏差。 4.分布特征参数——偏度系数和峰度系数 标准偏度系数g1= 偏度系数描述了随机变量分布相对其均值的不对称程度, 又称为偏斜度。 偏度系数0,因为均数在众数之左,是一种左偏的分布, 又称为负偏。 偏态系数0,因为均数在众数之右,是一种右偏的分布, 又称为正偏。 标准峰度系数 g2= 峰度系数反映了与正态分布相比,随机变量分布的尖锐度 或平坦度。 若一组观察数据的偏斜度、峰值都接近于0,则可以认为这组数据是来自正态总体的;若其峰值为正,则表示与正态分布相比,其分布相对尖锐(数据分布相对集中);若其峰值为负,则表示与正态分布相比,其分布相对平坦(数据分布相对分散)。 5.相关特征参数——线性相关系数: 相关系数是变量之间相关程度的指标,上式表示的是 样本线性相关系数,如果n→∞时并且其中的平均值用真 值代替,则表示总体线性相关系数,用ρ表示。 线性相关系数的物理意义: ⑴当|r|=1时,表明两变量之间呈严格的线性关系,可以 用直线方程描述。 ⑵当r=0时,表明两变量不相关,不能建立线性回归方程。 ⑶当0|r|1时,表明两变量之间有一定的依赖关系,可以 在一定条件下建立回归方程,并且,|r|越大,两变量的相 关程度越大。 上式适用一元线性回归,其它回归类型的相关系数也可以 通过类似的方法计算。 6.显著性检验 显著性检验是指利用统计学的方法,检验被处理的问题 是否存在统计上的明显差别,以确定方法是否可靠以及可靠 的程度。 例如:当采用一种新方法对某标准试样进行测定时,所得 平均值与标准值不完全一致,这时就要分析新方法引起误差 的原因以及判断新方法是否可靠,就要用到显著性检验。 显著性检验常用置信度(P)和置信期间来表示。 置信度(P)表示测定值出现在某一置信期间的概率,而落在 此范围之外的概率(1-P)则称为显著性水准,用a表示。 6.1 显著性检验的步骤 ①假设不存在显著性差别,即不同测定方法的结果均可信; ②确定一个显著性水平,分析工作中多取a=0.05的显著性 水平,即置信度为95%。 ③计算统计量并作出判断。 显著性检验常用的方法有t检验法和F检验法。 6.2.1 t检验法——平均值与标准值μ比较 ① t值计算 ② 查的t表值 ③ 比较t表和t计,如果t表 t计,则有显著性差 异,表示有系统误差。 例:采用某种新方法测定基准明矾中铝的质量分数,得到下列 9个分析数据10.74%,10.77%,10.77%,10.77%,10.81%, 10.82%,10.73%,10.86%,10.81%。己知明矾中铝含量的标 准值(以理论值代)为10.77%。试问采用该新方法后,是否引 起系统误差(置信度为95%)? 解: 已知 : N=9, f =9-1=8 求:平均值,标准偏差及 t 值 t 值表:当P=0.95,

文档评论(0)

wyjy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档