统计学基础13461.ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学基础13461.ppt

培训资料 – 统计学基础 Training Material – Basic Statistics 1、定义:在一定条件下,并不总是出现相同结果的现象称为随机现象。 2、随机现象的特点: (1)随机现象的结果至少有两个; (2)至于哪一个出现,事先人们并不知道。 随机试验:对随机现象,在基本相同的条件下,重复进行试验或观察,可能出现各种不同的结果;试验共有哪些结果事前是知道的,但每次试验出现哪一种结果却是无法预见的,这种试验称为随机试验. 随机试验特点:每次试验不能预测其结果,这反映随机试验结果的出现具有偶然性;但如果进行大量重复试验,所出现结果又具有某种规律性-——统计规律性. 日常生活与生产实践中,诸如一批种子的“发芽率”,某人射击的“命中率”,某产品的“次品率”等等,都是用频率来近似概率的例子. 虽然我们并不能由概率的统计定义确切地定出一个事件的概率,但是它提供了一种估计概率的方法. 频率与概率的关系就像物体长度的测量值与该长度之间的关系:物体的长度是客观存在的,是该物体的固有属性,测量值是它的某种程度的近似值. 同样,随机事件发生的可能性的大小——概率是随机事件的客观属性,多次随机试验所得的频率则是它的某种程度的近似. 在相同条件下重复作N次试验,各次试验互不影响. 考察事件A出现的次数(频数) n,称为A在N次试验中出现的频率(frequency). 频率一般与试验次数N有关;并且在N固定时, 作若干组N次试验,各组频率一般也不相同. 但当N很大时,频率却呈现某种稳定性,即在某常数附近摆动;且当N无限增大时,一般说来,频率会“趋向”这个常数. 这种规律称为随机现象的统计规律. 很自然,把频率所稳定到的那个常数表示事件A在一次试验中发生的可能性的大小,称作概率(probability), 记为P(A). 概率 — 事件发生可能性大小的度量 一个随机事件A发生可能性的大小用这个事件的概率P(A)来表示。概率是一个介于0到1之间的数。概率越大,事件发生的可能性就愈大;概率愈小,事件发生的可能性也就愈小。 特别地,不可能事件的概率为0,必然事件的概率为1。即: P(φ) = 0 , P(Ω) = 1 英文字母使用频率的研究,对于信息的编码、密码的破译等是十分有用的. 大量统计表明,字母E的使用频率最高,约为0.105;其次为字母T、O;字母J、Q与Z的使用频率最低,仅为0.001. 据此可以认为,在英语中,字母E出现的概率最高,约为0.105 使用?(X-Xm)2/n来估计总体的方差时,分母的n必须改为(n-1)才不会低估总体的方差,这里(n-1)就叫做样本的自由度。 自由度(degree of freedom, df)是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数称为该统计量的自由度。 例如,在估计总体的平均数时,样本中的n个数全部加起来,其中任何一个数都和其他数据相独立,从其中抽出任何一个数都不影响其他数据(这也是随机抽样所要求的)。因此一组数据中每一个数据都是独立的,所以自由度就是估计总体参数时独立数据的数目,而平均数是根据n个独立数据来估计的,因此自由度为n。 但是为什么用样本估计总体的方差时,方差的自由度就是(n-1)? ?2= ?(X-?)2/n 从此公式我们可以看出总体的方差是由各数据与总体平均数的差值求出来的,因此必须将?固定后才可以求总体的方差。因此,由于?被固定,它就不能独立自由变化,也就是方差受到总体平均数的限制,少了一个自由变化的机会,因此要从n里减掉一个。 假设一个样本有两个数值, X1=10, X2=20 样本的平均数是: m=? X/n=(10+20)/2=15 现在假设我们已知Xm=15,X1=10, 根据公式Xm=? X/n,则有 X2=2Xm-X1=2×15-10=20 我们可以知道在有两个数据样本中,当平均数的值和其中一个数据的值已知时,另一个数据的值就不能自由变化了,因此这个样本的自由度就减少一个,变成了(n-1)。依此类推:在一组数据中,当其平均数和前面的数据都已知时,最后一个数据就被固定而不能独立变化了,因此这个样本能够独立自由变化的数目就是(n-1)个. 因此,总体方差的估计值为: S2= ?(X-Xm)2/(n-1) 由上述公式可以进一步推导出以样本标准差估计总体标准差的公式为: S= √?(X-Xm)2/(n-1) 由表可以看出计算方差和标准差的两对公式所算出来的结果是不同的,在实际中应如何运用要根据是要计算总体的参数还是样本的统计量。如果要计算样本的统计

文档评论(0)

cai + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档