- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
论贝叶斯方法在计算机智能化中应用
论贝叶斯方法在计算机智能化中应用
摘要:贝叶斯方法被证明是非常general且强大的推理框架,当它被应用到计算机技术中时,可以给我们的网络生活带来及大的方便。本文着重介绍这一神奇的算法。
关键词:贝叶斯 推理 计算机技术 概率
0 引言
也许你还没有注意到,但这的确发生在你身边。当你在某个功能强大的E-market网站,搜索你所需的商品时,你是否注意到每次打开的搜索页里总是会有一些并不是和你所搜索的关键字相关的商品,它们出现网页的边上或最下方,而这些商品却是你所感兴趣的。(当然你必须是会员)或者,你登录某线学习网络平台时,每次在线学习你都会得到和所学知识相关,或你所感兴趣的知识。网购购物平台和学习平台是怎么知道你的兴趣和爱好,难到计算机会推理?这就是贝叶斯方法在计算机技术中的应用。
1 先来认识贝叶斯公式
贝叶斯公式是怎么来的?看这样一个例子:一所学校里面有60%的男生,40%的女生。男生总是留短发,女生则一半留短发一半留长发。有了这些信息之后可以容易地计算“随机选取一个学生,他(她)留短发的概率和留长发的概率是多大”,这个就是 “正向概率”的计算。然而,假设走在校园中,迎面走来一个留短发的学生(很不幸的是你高度近似,你只看得见他(她)留的是否短发,而无法确定他(她)的性别),能够推断出他(她)是男生的概率是多大吗?
不妨把问题重新叙述成:你在校园里面随机游走,遇到了N个留短发的人(仍然假设你无法直接观察到他们的性别),问这N个人里面有多少个女生多少个男生。
来算一算:假设学校里面人的总数是U个。60%的男生都留短发,于是得到了U*P(Boy)*P(Short|Boy)个留短发的(男生)(其中P(Boy)是男生的概率=60%,这里可以简单的理解为男生的比例;P(Short|Boy)是条件概率,即在Boy这个条件下留短发的概率是多大,这里是100%,因为所有男生都留短发)。40%的女生里面又有一半(50%)是留短发的,于是又得到了U*P(Girl)*P(Short|Girl)个留短发的(女生)。加起来一共是U*P(Boy)*P(Short|Boy)+U*P(Girl)*P(Short|Girl)个留短发的,其中有U*P(Girl)*P(Short|Girl)个女生。两者一比就是要求的答案。
下面把这个答案形式化一下:要求的是P(Girl|Short)(留短发的人里面有多少女生),我们计算的结果是U*P(Girl)*P(Short |Girl)/ [U*P(Boy)*P(Short|Boy)+U*P(Girl)*P(Short|Girl)]。容易发现这里校园内人的总数是无关的,可以消去。于是得到
P(Girl|Short)=P(Girl)*P(Short|Girl)/[P(Boy)*P(Short |Boy)+P(Girl)*P(Short |Girl)]
注意,如果把上式收缩起来,分母其实就是P(Short),分子其实就是 P(Short,Girl)。而这个比例很自然地就读作:在留短发的人(P(Short))里面有多少(留短发)的女孩(P(Short,Girl))。
上式中的Short和Boy/Girl可以指代一切东西,所以其一般形式就是:
P(B|A)=P(A|B)*P(B)/[P(A|B)*P(B)+P(A|~B)*P(~B)]
收缩起来就是:
P(B|A)=P(AB)/P(A)
其实这个就等于:
P(B|A)*P(A)=P(AB)
这就是贝叶斯公式,看似这么平凡的贝叶斯公式,背后却隐含着非常深刻的原理。
2 计算机猜单词纠正拼写错误
我们在计算机中录入时,常会不经意间犯错,比如,用户在计算机中输入了一个不在字典中的单词,计算机要帮我们去纠正这个错误:“这个家伙到底真正想输入的单词是什么呢?”用刚才形式化的语言来叙述就是,需要求:P(猜测他想输入的单词|实际输入的单词)这个概率。并找出那个使得这个概率最大的猜测单词。这里,比如用户输入:thew,那么到底是想输入the,还是想输入thaw?到底哪个猜测可能性更大呢?幸运的是计算机可以用贝叶斯公式来直接出它们各自的概率,不妨将多个猜测记为h1h2..(h代表hypothesis),它们都属于一个有限且离散的猜测空间H(单词总共就那么多而已),将用户实际输入的单词记为D(D代表Data,即观测数据),于是P(猜测1|实际输入的单词)可以抽象地记为:P(h1|D)类似地,对于猜测2,则是P(h2|D)。不妨统一记为:P(h|D)运用一次贝叶斯公式,计算机得到:P(h|D)=P(h)*P(D|h) /P(D)对于不同的具体猜测h1h2h3..,P(D)都是
文档评论(0)