- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
WordSenseDisambiguation(WSD)
•Given
•上下文中的一个词
•一组固定的可能词义
•判断这个词在此处的具体含义
•为什么?机器翻译、问答系统、语音合成
•哪些词义?
•英译西:一组西班牙语翻译
•语音合成:像bass和bow这样的同形异义词
•一般来说:像WordNet这样的词典中的词义
WordSenseDisambiguation(WSD)
•Given
•Awordincontext
•Afixedinventoryofpotentialwordsenses
•Decidewhichsenseofthewordthisis
•Why?Machinetranslation,QA,speechsynthesis
•Whatsetofsenses?
•English-to--SpanishMT:setofSpanishtranslations
•SpeechSynthesis:homographslikebassandbow
•Ingeneral:thesensesinathesauruslikeWordNet
WSD任务的两种变体
•词汇样本任务
•小型预选目标词集合(line,nt)
•并且每个词都有对应的意义
•监督式机器学习:为每个词训练一个分类器
•全词任务
•整篇文本中的每个词
•一个包含每个词义项的词典
•数据稀疏:无法训练特定词的分类器
TwovariantsofWSDtask
•LexicalSampletask
•Smallpre--selectedsetoftargetwords(line,nt)
•Andinventoryofsensesforeachword
•Supervisedmachinelearning:trainaclassifierforeachword
•All--wordstask
•Everywordinanentiretext
•Alexiconwithsensesforeachword
•Datasparseness:can’ttrainword--specificclassifiers
WSD方法
•监督机器学习
•词典/字典方法
•半监督学习
4
WSDMethods
•SupervisedMachineLearning
•Thesaurus/DictionaryMethods
•Semi--SupervisedLearning
4
词义消歧
监督机器学习
WordSense
Disambiguation
Supervised
MachineLearning
监督机器学习方法
•监督机器学习方法:
•a训练语料库在上下文中带有词义标注的
用于训练一个分类器,该分类器可以为新文本中的
您可能关注的文档
最近下载
- 表面麻醉剂的生产工艺及流程.docx
- JRC-JLR-7800-7500 GPS-中文操作说明书.pdf VIP
- 社会保障学作业四 答案 国家开放大学.docx
- 社会保障学作业二 答案 国家开放大学.docx
- 专题05+生物的分类、鉴别和保护(期末复习课件)七年级生物上学期新教材冀少版.pptx VIP
- 专题04+微生物+(期末复习课件)七年级生物上学期新教材冀少版.pptx VIP
- 专题03+藻类、植物和动物(期末复习课件)七年级生物上学期新教材冀少版.pptx VIP
- 专题02+组织、器官、系统和生物体(期末复习课件)七年级生物上学期新教材冀少版.pptx VIP
- 专题01+细胞(期末复习课件)七年级生物上学期新教材冀少版.pptx VIP
- 2025公路水泥混凝土路面设计规范.pdf
原创力文档


文档评论(0)