是贝叶斯公式的推广.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
是贝叶斯公式的推广

概要 什么是语义分析 词义标注 语义角色标注 义项标注 义类标注 WordNet、同义词词林、HowNet 词义消歧方法 语义角色标注 PropBank 新型语义知识库 1 什么是语义分析 词义的标注 给文本中每个词标注义项、义类 短语、句子意义的标注 目前还是难题,没有很好的表示方法 语义角色标注 句法语义分析 标注施事、受事、工具等 2 义项的标注  义项  依据:传统的语文词典  标注困难  未登录词 除了专名外,“拥趸”  未登录义项 “囧”  临时用法 “红领巾”  增补释义是一件耗时耗力的事情,也不是语料库建设的任务  直接应用  信息检索:“黄金” (本义和比喻义)  机器翻译:“bank” (河岸或银行)  隐喻理解:“红领巾”  间接应用  词频统计:词义消歧之前其实只是词的书写形式的统计,词义消岐之 后的统计才更准确。  语句理解:理解每个词的含义之后才能做到语句的正确理解。 汉语词义资源:现代汉语词典  权威的中型语文词典,确定词形的词义数的基本依据  词义61186个,词形48728个,平均每个词形(包括多义词和同 形词)有1.25566个词义。 词义数 词形数 词形数占比 累计占比 1 40253 82.6075 82.6075 2 6439 13.2142 95.8217 3 1224 2.5119 98.3336 4 397 0.8147 99.1483 5 173 0.3550 99.5033 6 100 0.2052 99.7085 7 46 0.0944 99.8029 8 ~26 96 0.2000 100.0000 词义数的确认  《现代汉语词典》的编排方式是以字领词,字本 身可能是词,也可能不是词;以该字开头的多字 词排列于该字条之下。 不成词单字条目不存在词义数确认问题。 某些单字条目是多义的: 有些义项是词,有些义项只是词素。 有些义项虽然可算是词,但总是与其他词构成 比较固定的搭配,在收录词语搭配之后,这些 义项可以不计。 一些词的词义(包括隐喻用法),词典未必尽录。 绿色、猪头 6 词义的结构化表示 及标注 3 义类 更好地体现词语 间的语义关系 树形的义类体系 上下位关系 整体部分关系 同义关系 反义关系 标注 给出词语的义 类 3.1 WordNet 3.0 世界上最重要的语义

文档评论(0)

suijiazhuang1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档