概率统计补充案例.doc

下载文档 降价啦

135
0
约2.12万字
约 22页
2016-12-10 发布于重庆
举报
版权申诉
保障服务

概率统计补充案例.doc

1、本文档共22页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

概率统计补充案例

补充案例：概率部分：案例1、“三人行必有我师焉” 案例2、抓阄问题案例3、贝叶斯方法运用案例介绍案例4、化验呈阳性者是否患病案例5、敏感性问题的调查案例7、碰运气能否通过英语四级考试案例8、检验方案的确定问题案例9、风险型决策模型案例10、一种很迷惑游客的赌博游戏案例11、标准分及其应用案例12、正态分布在人才招聘中的应用案例13、预测录取分数线和考生考试名统计部分：案例14、随机变量函数的均值和标准差的近似计算方法案例15、如何表示考试成绩比较合理案例16、如何估计湖中黑、白鱼的比例案例17、预测水稻总产量案例18、工程师的建议是否应采纳案例19、母亲嗜酒是否影响下—代的健康案例20、银行经理的方案是否有效案例21、一元线性回归分析的Excel实现案例22、方差分析的Excel实现案例23、预测高考分数案例24、两次地震间的间隔时间服从指数分布案例1、“三人行必有我师焉” 我们可以运用概率知识解释孔子的名言“三人行必有我师焉”. 首先我们要明确一个问题，即只要在某一方面领先就可以为师(韩愈说“术业有专攻”). 俗语说“三百六十行，行行出状元”，我们不妨把一个人的才能分成360个方面。孔子是个大圣人，我们假设他在一个方面超过某个人的概率为99％，那么孔子在这方面超过与他“同行”的两个人的概率为99％ ×99％ =98.0l％，在360个方面孔子总比这两人强的概率为(98.01％)360=0.07％，即这两个人在某一方面可以做孔子老师的概率为99.93％.从数学角度分析，孔子的话是很有道理的. 案例2、抓阄问题一项耐力比赛胜出的10人中有1 人可以获得一次旅游的机会，组织者决定以抓阄的方式分配这一名额. 采取一组10人抓阄，10张阄中只有一张写“有”. 每个人都想争取到这次机会，你希望自己是第几个抓阄者呢? 有人说要先抓，否则写有“有”的阄被别人抓到，自己就没有机会了；有人说不急于先抓，如果前面的人没有抓到写有“有”的阄，这时再抓抓到“有”的机会会大一些. 为了统一认识，用概率的方法构造一个摸球模型来说明问题. 摸球模型：袋中装有1 个红球和9 个黄球除颜色不同外球的大小、形状、质量都相同. 现在10 人依次摸球(不放回)，求红球被第个人摸到的概率( = 1, 2, ?, 10). 解决问题：设 = “ 第个人摸到红球， = 1, 2, ?, 10. 显然，红球被第一个人摸到的概率为 . 因为，于是红球被第二个人摸到的概率为 . 同样，由知红球被第三个人摸到的概率为 . 如此继续，类似可得 = . 　　由此可见，其结果与无关，表明10 个人无论摸球顺序如何，每个人摸到红球的机会相等. 这也说明10 个人抓阄，只要每个人在抓之前不知道他前边那些已经抓完的结果，无论先后, 抓到的机会是均等的. 在现实生活中单位分房、学生分班、短缺物品的分配等，人们常常乐于用抓阄的办法来解决，其合理性保证当然得归功于“概率”. 通过上面的摸球模型，我们总结出分配中的“抓阄”问题，无论先抓后抓，结果是一样的.学完概率之后再遇到抓阄问题时不必争先恐后，我们要发扬风格让他人先抓. 案例3、贝叶斯方法运用案例介绍什么是贝叶斯过滤器？垃圾邮件是一种令人头痛的顽症，困扰着所有的互联网用户。正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法，主要有关键词法和校验码法等。前者的过滤依据是特定的词语；后者则是计算邮件文本的校验码，再与已知的垃圾邮件进行对比。它们的识别效果都不理想，而且很容易规避。 2002年，Paul Graham提出使用贝叶斯推断过滤垃圾邮件。他说，这样做的效果，好得不可思议。1000封垃圾邮件可以过滤掉995封，且没有一个误判。另外，这种过滤器还具有自我学习的功能，会根据新收到的邮件，不断调整。收到的垃圾邮件越多，它的准确率就越高。建立历史资料库贝叶斯过滤器是一种统计学过滤器，建立在已有的统计结果之上。所以，我们必须预先提供两组已经识别好的邮件，一组是正常邮件，另一组是垃圾邮件。我们用这两组邮件，对过滤器进行训练。这两组邮件的规模越大，训练效果就越好。Paul Graham使用的邮件规模，是正常邮件和垃圾邮件各4000封。训练过程很简单。首先，解析所有邮件，提取每一个词。然后，计算每个词语在正常邮件和垃圾邮件中的出现频率。比如，我们假定sex这个词，在4000封垃圾邮件中，有200封包含这个词，那么它的出现频率就是5%；而在4000封正常邮件中，只有2封包含这个词，那么出现频率就是0.05%。（【注释】如果某个词只出现在垃圾邮件中，Paul Graham就假