- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学概念和方法—第5章
第五章 概率;主要内容;概率,又称或然率、机会率或机率、可能性,是一个在0到1之间的实数,是对随机事件发生的可能性的度量。
小概率(接近零)事件很少发生,而大概率(接近1)的事件经常发生。
概率为零的事件称为不可能事件,概率为1的事件称为必然事件。
;5.1怎样得到概率;使用相对频数的方法;利用主观概率;例 对以下情况应用哪种概率?
a.等可能事件;b.相对频数;c.主观概率
问题:
1.一个有十年历史的短途航空公司继续保持无事故记录;
2.玩扑克牌的人从一幅牌中抽出一张A;
3.曲靖12月底下雪的厚度大于20厘米;
4.明天郊游时下雨;
5.一个家庭的双胞胎数。;5.2概率的计算;5.3 优势:概率的对照物;例 1993年,在国际奥委会决定2000年奥运会的举办城市之前,伦敦的赌场经营人给出了他们认为的奥运会主办城市的优势如右表所示。
很明显,赌场经营者认为悉尼很可能成为主办地,而巴西利亚则不大可能。
优势往往可以理解为赌注与赢得的比例。 ;如果复杂事件的概率很难直接计算得到,可以应用简单事件发生的概率来计算复杂事件的概率。
为了节省精力,前人通过预先制定各种概率问题的解决方法,给出了这些问题中变量取值及其概率的分布规律,这就是概率分布律。常见的变量有离散变量和连续型变量。;二项分布;假设二元变量的两个取值为成功和失败。用p来代表成功的概率,则失败的概率为1-p。在n个观察值的样本中,设成功的次数为k次,则:
;在上面那个例子中,如果n=4,k=3,p=0.49。那么三次成功一次失败的概率是:
二项分布通常只在小样本时使用,若n很大,一般用正态分布来近似它。;泊松(Poisson)分布;超几何分布;5.5 连续变量的概率分布;标准正态分布N(0,1);期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。
标准正态分布N(0,1)曲线,面积分布规律是:在-1.96~+1.96范围内曲线下的面积等于0.9500,在-2.58~+2.58范围内曲线下面积为0.9900。 因为曲线是对称的,随机抽到的大于或等于1.96的概率为0.025,小于或等于-1.96的概率为0.025.
变量的值称为z得分。
回顾标准分的含义。;一般的正态分布记为N(μ,σ2).
正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。
;正态分布的由来;t-分布;t-分布是一族分布,记为t(n),n称为自由度。
t-分布是以0为中心(均值为0),左右对称的单峰分布;
t分布是一簇曲线,其形态变化与自由度n大小有关。自由度n越小,t分布曲线越低平;自由度n越大,t分布曲线越接近标准正态分布曲线N(0,1) 。;t-分布和正态分布;t分布的自由度越大,则该t分布的曲线就越接近正态分布。在自由度大于30以后,就很难说出这两种曲线的差异了。在自由度等于50时,这两种曲线就几乎相同了。自由度大于100时,通常使用正态分布来代替。;t分布历史;x2分布;;;F-分布;上图是自由度为4和40的F分布。F分布有两个自由度,这两个自由度位置不可调换。
设U~X2(n1),V ~X2(n2),则称
服从自由度为(n1,n2)的F-分布,记为F ~F(n1,n2).
从上图可知,F-变量也是非负的,F分布的取值大部分在0-到5之间变化。在自由度小时,F-值要大些。
;F分布是以统计学家R.A.Fisher姓氏的第一个字母命名的.
由F分布表,5%的F-值大于2.45,而只有1%的F-值大于3.51。当我们从数据计算一个服从自由度为4和40的F-分布的值并发现它大于2.35(或甚至大于3.51),那么我们就发现了一个不寻常的F-值。;正态分布数据的需要
使用上述分布解决问题时须考虑数据本身是否服从正态分布。;5.6使用概率来核对假设;5.7决策分析:利用概率来作决策;小结;问题;如果有人告诉你,他得到某个特定问题的x2值为-11.11,你的反应是什么?
除了很小的自由度之外,F变量的一般取值范围是什么?
根据这段文字:“z大于2.5的概率等于0.0062,而10个自由度的t变量大于2.5的概率等于0.0152。”
a.对哪一个变量更可能找出大于2.5的数?
b.为什么z变量与t变量此时有区别?
c.什么能使这两个统计量之间的差别变得非常小?;扔十次公平硬币,出现8次正面的概率是多少?大于8次正面的概率又是多少?;根据左边的表,问:
a.随机选择一个云南人半年内可支配收入大于¥10442.3的概率是多少?
b.随机选择十个云南人,所有半年可支配收入大于¥10442.3的概率是多
文档评论(0)