要听他连续说多少次我爱你 - Web Mining Lab.PDFVIP

要听他连续说多少次我爱你 - Web Mining Lab.PDF

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
要听他连续说多少次我爱你 - Web Mining Lab

要听他连续说多少次“我爱你”才能相信 ——怎样判断一枚硬币是不是公平的? 抛硬币是生活中最常被拿来举例子的Bernoulli (贝努力)试验。这也是一个最简单的概率事 件,只有两个选项,正面或者反面(假设不存在立着的情况)。这个例子也可以推广到很多 二分变量(binary variables )的取值概率问题。支持或者反对,使用或者不用等等。 一枚硬币如果是公平的话,每次抛硬币得到正反面的机会各等于二分之一。现在我们假定说 抛硬币得到正面的概率是p ,得到反面的概率是q=(1-p) 。 现在我们有一枚硬币,抛了100 次,得到了55 次正面。那么,我们知道,在这100 次里面, 我们得到正面的概率是55/100=.55 。但我们都抛了100 次了,知道了p=.55 ,又怎么样呢? ˆ 我们想知道的是,下次以及每次抛这个硬币,得到正面的概率p 的估计值p-hat ( )是多 p 少。 这么想的话,上面所说的 p=.55 是指我们抛了的 100 次我们知道的抛硬币得到正面的概率 是.55,也就是我们的样本(sample )里的p=.55 。我们想知道的是通过我们的样本推测到总 ˆ 体(population )的抛这枚硬币得正面的估计值p-hat ( )是多少呢? p ˆ 从样本统计量p 推算总体估计值p-hat ( )就要考虑置信区间(Confidence Interval )。下面 p 这枚公式就能推算,从我们这个抛了100 次的样本,估计抛这枚硬币得正面的概率是: ⎛ p (1−p ) p (1−p ) ⎞ ⎜⎜p −Z α/2 , p +Z α/2 ⎟⎟ (公式一) ⎝ n n ⎠ 这里的n就是我们抛的次数,也就是样本量(sample size )。这里的Zα/2 是一个统计量,根据 不同的置信度(Confidence Level, 如90%,95%,99%等)有不同的固定的取值。这个Zα/2 是 另外一个故事了。有兴趣的同学可以去维基百科看“Confidence Interval (置信区间)”这个 词条/wiki/Confidence_interval 。当然了,这个取值还隐藏了另外一个关 于正态分布的假设,那也是另一个故事了。 如果我们采用95%的置信度,对应的Zα/2 就等于 1.96。我们这100 次硬币来估算这枚硬币 被抛得正面的概率就是一个区间(.452, .648)。也就是说,如果我们再抛100 次硬币,我们 有95%的机会得到正面的次数在45 次到65 次之间。 好吧好吧。我承认我有些罗嗦了。上面这些其实不是我想说的重点。我想说的重点是,我们 要连续抛多少次正面,在 95% 的置信度上,才有根据不否定硬币是不公平的(有点绕,嘿 嘿)? 下面就是一个假设检验的问题了。假设检验的一般就得提出一个零假设(Null Hypothesis , H )和一个备择假设(Alternative Hypothesis ,H )。 0 1 我们这里的零假设就是硬币是公平的,也就是每次抛硬币得到正面的概率是1/2。 H0 :p-hat=.5 我们这里的备择假设就是硬币是不公平的,也就是每次抛硬币得到正面的概率不是1/2。 H1:p-hat.5 我们说的每次抛多少次正面才够的意思是,我们已经确定了p1=1 ,我们想知道的是n 的最小 值。我们的问题可以等价地转换成我们估算的p-hat 和假定硬币公平的p-hat 之间的差,怎么

文档评论(0)

2105194781 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档