- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于adaboost.mh算法的汉语多义词消歧-计算机软件与理论专业论文
人连理工大学硕+学位论文摘
人连理工大学硕+学位论文
摘 要
词义排歧在机器翻译、信息检索、句子分析和语音识别等许多领域有重要的作用。 因此词义排歧方法的研究具有重要的理论和实践意义。本文主要研究在标注语料库支持 下的基于有指导学习算法的词义排歧方法。
在词义排歧模型中引入有指导的AdaBoost.MH算法。首先通过简单决策树算法对 多义词上下文中的知识源进行学习,产生准确率较低的弱规则;之后,通过AdaBoost.MH 算法对这些弱规则进行加强:经过若干次迭代后,最终得到一个准确度更高的规则,即 为最终的排歧模型。同时,针对系统的学习效率和实用性给出了一种简单终止算法迭代 的方法。
为评测AdaBoost.MH算法排歧效果,本文在SENSEVAL3中文语料上进行了 AdaBoost.MH算法和贝叶斯算法的词义排歧对比实验,结果表明AdaBoost.MH算法比 贝叶斯算法具有更强的学习能力,前者的开放测试正确率比后者的开放测试正确率高出 近8个百分点。
此外,为获取多义词上下文中的知识源,本文在使用传统的词性标注和局部搭配序 歹4知识源的基础上,引入了一种新的知识源,即语义范畴。实验结果表明语义范畴的引 入有助于提高算法的学习效率和词义排歧的正确率。
在对6个典型汉语多义词和SENSEVAL3中文语料中20个汉语多义词的词义消歧 实验中,AdaBoost.MH算法获得了较高的开放测试正确率,前者的平均开放测试正确率 达到85.75%,后者的平均开放测试正确率达到75.84%。
人工建立有指导学习算法所需的大规模标注语料是相当困难的,为解决此问题,本 文给出了一种利用WWW资源自动构建适合汉语多义词排歧的标注语料库的方法。并
通过实验验证了这种语料库的可用性。 关键词:自然语言处理;词义捧歧:AdaBoost.刖算法;知识源
人连理I:大学硕士学位论文Chinese
人连理I:大学硕士学位论文
Chinese Word Sense Disambiguation with AdaBoost.MH Algorithm Abstract
Word sense disambiguation OVSD)plays all important role in many areas of natural language processing such as machine translation,information retrieval,sentence analysis, speech recognition.The research on WSD has great theoretical and practical significance.The main work in the dissertation is to study the supervised learning algorithm learning WSD knowledge from many kinds of resources based on large sense—tagged Chinese corpus.
An approach based on supervised AdaBoost.MH learning algorithm for Chinese word sense disambiguation is presented.AdaBoost.MH algorithm is employed to leam WSD knowledge from many kinds of resources and to boost the accuracy of the weak stumps rules for decision trees and repeatedly calls a learner to finally produce a more accurate mle.A simple stopping criterion is also presented in view of the efficiency of learning and the utility
of system.
In contrast experiment between AdaBoost.MH algorithm and Naive Bayes algorithm,the former has a higher learning capability.For the open tests’accuracy rates in SENSEVAL3
Chinese corpus,the former outdoes 8 percentage points compared to
您可能关注的文档
- 基于bim技术的城市综合体日照环境分析与评价-结构工程专业论文.docx
- 基于df1的plc远程通信及其网络自动化的研究与实现-控制理论与控制工程专业论文.docx
- 基于cortex-m3和android的智能家居控制系统研究设计-电子与通信工程专业论文.docx
- 基于adams的履带车辆差速转向机构虚拟样机分析 固体力学专业论文.docx
- 基于corba的网管接口测试结果比较集的研究-计算机软件与理论专业论文.docx
- 基于dicom标准的医学图像通信与处理-电路与系统专业论文.docx
- 基于bim的建设项目投资控制研究-工程管理专业论文.docx
- 基于arm现场总线过程控制仪表平台设计-控制理论与控制工程专业论文.docx
- 基于cps标准的agc控制策略研究-控制理论与控制工程专业论文.docx
- 基于curvelet变换和形态学的视网膜血管分割-通信与信息系统专业论文.docx
- 基于bim的施工现场劳务人员安全疏散研究-工程经济与管理专业论文.docx
- 基于devicenet现场总线的报文分析与网络监控技术研究-控制理论与控制工程专业论文.docx
- 基于 bim 的建筑结构模型的研究-信号与信息处理专业论文.docx
- 基于bpel的web服务组合技术研究与实现论-计算机软件与理论专业论文.docx
- 基于6sigma的f公司pvd颜色稳定性改善研究-工商管理专业论文.docx
- 基于 flexsim 的汽车销售物流配送中心订单处理系统仿真研究-载运工具运用工程专业论文.docx
- 基于camel3协议的scp系统计费策略的研究与实现-计算机应用技术专业论文.docx
- 基于can协议的电力牵引试验站监控系统-控制理论与控制工程专业论文.docx
- 基于corba和移动agent的电子商务系统框架研究-计算机应用技术专业论文.docx
- 基于.net电力预实算应用系统设计与实现-软件工程专业论文.docx
文档评论(0)