AdaBoost.MH 算法 硕士毕业论文_正文.doc

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
AdaBoost.MH 算法 硕士毕业论文_正文 导读:就爱阅读网友为您分享以下“AdaBoost.MH 算法 硕士毕业论文_正文”的资讯,希望对您有所帮助,感谢您对92的支持! 大连理工大学硕士学位论文 Gale等人提出的分类器是一个特殊的贝叶斯分类器,即单纯贝叶斯分类器。它把分类所基于的状态空间描述成一系列的特征,根据出现在上下文的词来描述词w 的上下文。 单纯贝叶斯假设认为用来刻画事物特征的属性都是条件独立的: P(c|sk)?P({vj|vjinc}|sk})??vjincP(vj|sk) (1.3) 在词义排歧中,单纯贝叶斯假设有两个结论。第一个是上下文中所有结构和词语顺序都可以被忽略。这通常是指一个可有重复的单词集模型。另一个结论是指在可有重复的单词集中出现的词均独立于其它词。 基于信息论的方法 信息论分类方法试图寻找一个单一的上下文特征,它可以可靠地指示出多义词的哪一种词义被使用。为了更好的地应用语料信息,信息的量值需要进行规范化。Brown等人使用了Flip-Flop算法来解决这个问题。算法描述如下: Find random partition P = {P1,P2} of {t1,t2,…,tm} While (improving) do Find partition Q = {Q1,Q2} of {x1,x2,…,xn} that maximizes I(P;Q) Find partition P = {P1,P2} of {t1,t2,…,tm} that maximizes I(P;Q) End. Flip-Flop算法的每一次迭代都必须满足使互信息I(P;Q)单调增加,所以算法的一个很自然的中止条件就是互信息I(P;Q)不再增加或者增加很少。其中P为最初的词义划分,Q为指示器。I(P;Q)为P,Q的互信息。互信息的定义如下: I(X;Y)?p(x,y) p(x)p(y) ??x?Xy?Yp(x,y)log (1.4) 对于计算一个特殊指示器值的最佳划分,Flip-Flop算法是一个有效的线性时间算法,它基于分裂理论(splitting theorem)[8]。对所有可能的

文档评论(0)

raojun00007 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档