第四讲 概率及概率分布.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 概率和概率分布 魏玉清 上一章内容回顾 试验资料均具有集中性和离散性两种基本特征。 平均数是反映集中性的特征数,变异数是反映离散性的特征数。 平均数包括算术平均数、中位数、众数和几何平均数。算术平均数具有离均差之和等于零和离均差平方和为最小的性质。 变异数包括极差、方差、标准差和变异系数。方差等于观测值离均差的平方和除以自由度,可以反映出资料中每一个观测值的变异。标准差是方差的平方根,其单位与平均数相符;用标准差除以平均数即为变异系数,可以进行单位不同资料间变异程度的比较。 前面两章,我们介绍了如何搜集和整理样本资料。但是,我们研究一组样本数据的最终目的不在于研究样本本身,而是根据样本提供的信息对其来自的总体的特征和分布规律作出尽可能精确和可靠的推断,这称为统计推断。 由于抽样误差的存在,统计推断的结论带有一定的不确定性,即它不可能是完全正确的。 所以,我们在理解和运用统计推断的方法之前,必须熟悉不确定性的理论-概率和概率分布。 第一节 概率的基本概念 一、 概率论的一些基本术语 例一,在掷一次骰子的试验中,有如下的一些可能发生的事件: 7、频率 频率的定义:设事件A在n次重复试验中发生了m次,其比值m/n称为事件A发生的频率,记为W(A)=m/n 显然事件A的频率是介于0和1之间的一个数 0≤ W(A) ≤1 8、概率 概率的求法 二、事件间的关系 1、 和事件 2、 积事件 3、 互斥事件 4、 对立事件 5、 完全事件系 6、 事件的独立性 三、计算事件概率的法则 1、 互斥事件的加法 2、 独立事件的乘法 3、 对立事件的概率 4、 完全事件系的概率 5、 非独立事件的乘法 第二节 概率分布 一、 随机变量 随机变量能帮助我们深入理解总体和样本的概念,使总体和样本的关系更加明确。随机变量的引入使统计学的深入研究成为可能。 随机变量一般用大写字母来表示,如X,Y,U等。变量的观测值一般用小写字母来表示,如xi,yi,ui等表示随机变量X,Y,U的第i次观测值。 二、 概率分布 连续型变量的一个特征是取的值非常多(不可数),无法象离散型变量那样对每一个值赋予一个概率。 在研究连续型变量概率时,“”,“”均可相应换成“≥”,“≤”,而概率数值不变。 每个连续型变量都有它自己的密度函数曲线。 一个术语:分布函数或称累积分布函数,是随机变量X取得小于x0的值的概率。 在分布函数已知的情况下,概率也可以通过分布函数来求。 三、大数定理 大数定律(law of large numbers)是概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。常用的有: 1、贝努里大数定律(Bernoulli theorem) 2、辛钦大数定律(Khinchine theorem) 第三节 几种常见的理论分布 一、 二项总体与二项式分布 有些总体的各个个体的某些性状,只能发生非此即彼的两种结果,“此”和“彼”是对立事件。例如种子的发芽与不发芽,施药后害虫的死或活,产品的合格与不合格。这种由非此及彼事件构成的总体,称之为二项总体(binomial population)。 为便于研究,通常给“此”事件以变量“1”,具概率p;给“彼”事件以变量“0”,具概率q其概率关系为: p+q=1 1-q=p 例如,观察施用某种农药后蚜虫的死亡数,记“死”为0,“活”为1。如果每次观察5只,则观察的结果将有0(5只全死)、1(4死1活)、2(3死2活)、3(2死3活)、4(1死4活)、5(5只全活),共6种变量。由这6种变量的相应概率组成的分布,就是n=5时活虫数的二项分布。 二、 二项式分布的概率计算方法 下面用一个例子来讲解这一问题。 红花豌豆和白花豌豆杂交,F2代出现红花的概率为p=3/4,出现白花的概率为q=1/4。如果将F1代种子成行种植,每行种4粒。问一行全是红花、三株红花、二株红花、一株红花、0红花的概率各是多少。 上例各项的概率相当于(p+q)4的展开: (p+q)4=C40p4+C41p3q+C42p2q2+C43pq3+C44q4 =p4+4p3q+6p2q2+4pq3+q4 同理,以样本容量为n进行的抽样,得到的概率分布为(p+q)n的展开。 每一项的系数为: 7头愈好,3头死去的概率为: 9头愈好,1头死去的概率为: 三、 二项式分布的形状和参数 一、形状 (p=0.5,n=5)的概率分布图 当p=q时。二项分布呈对称形状,如p≠q,则表现偏斜形状。但从理论和实践检验,当n很大时即使p≠q,它也接近对称形状。所以这一理论分布是由n和p两个参数决定的。 二、参数

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档