- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
AdaBoost.MH 算法 硕士毕业论文_正文
导读:就爱阅读网友为您分享以下“AdaBoost.MH 算法 硕士毕业论文_正文”的资讯,希望对您有所帮助,感谢您对92的支持!
大连理工大学硕士学位论文
Gale等人提出的分类器是一个特殊的贝叶斯分类器,即单纯贝叶斯分类器。它把分类所基于的状态空间描述成一系列的特征,根据出现在上下文的词来描述词w 的上下文。
单纯贝叶斯假设认为用来刻画事物特征的属性都是条件独立的:
P(c|sk)?P({vj|vjinc}|sk})??vjincP(vj|sk) (1.3) 在词义排歧中,单纯贝叶斯假设有两个结论。第一个是上下文中所有结构和词语顺序都可以被忽略。这通常是指一个可有重复的单词集模型。另一个结论是指在可有重复的单词集中出现的词均独立于其它词。
基于信息论的方法
信息论分类方法试图寻找一个单一的上下文特征,它可以可靠地指示出多义词的哪一种词义被使用。为了更好的地应用语料信息,信息的量值需要进行规范化。Brown等人使用了Flip-Flop算法来解决这个问题。算法描述如下:
Find random partition P = {P1,P2} of {t1,t2,…,tm}
While (improving) do
Find partition Q = {Q1,Q2} of {x1,x2,…,xn}
that maximizes I(P;Q)
Find partition P = {P1,P2} of {t1,t2,…,tm}
that maximizes I(P;Q)
End.
Flip-Flop算法的每一次迭代都必须满足使互信息I(P;Q)单调增加,所以算法的一个很自然的中止条件就是互信息I(P;Q)不再增加或者增加很少。其中P为最初的词义划分,Q为指示器。I(P;Q)为P,Q的互信息。互信息的定义如下:
I(X;Y)?p(x,y)
p(x)p(y) ??x?Xy?Yp(x,y)log (1.4)
对于计算一个特殊指示器值的最佳划分,Flip-Flop算法是一个有效的线性时间算法,它基于分裂理论(splitting theorem)[8]。对所有可能的
您可能关注的文档
- 4G网络技术概论与应用_图文.doc
- 4词的本义_图文.doc
- 3月份节日 3、4月份节日.doc
- 5-4-3-2加几教案.doc
- 51单片机AT89C51 AT89C2051中文资料.doc
- 51单片机串口通信讲解.doc
- 4号台风妮妲来袭 当台风、暴雨、暴雪来袭时.doc
- 51电子密码锁 基于89C51电子密码锁设计_图文.doc
- 56号教室的奇迹读后感 读后感56号奇迹.doc
- 51-56——语病专题(二).doc
- 两个相干源产生波具有3b chmc.pdf
- wifi高性能模块ce fcc rohs认证-xrf report电子档.pdf
- linux pci multiport installation manual多端口安装手册.pdf
- 二章基本概念理论.pdf
- 互联网工程任务组ietfs turnerrfc5940 txt.pdf
- mtz0数学高级证明集合关系群mathematics paper 3 sets relations and groups french.pdf
- 网上书店需求规格说明.pdf
- 系统测试用例pcweb终端.pdf
- apv1 keil环境下接口兼容问题.pdf
- 2023届江西省八所重点中学高三3月联考英语试题(原卷版).docx
文档评论(0)