自然语言理解-词典概述.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
HowNet名词示例 雇主:DEF=human|人,*employ|雇用 雇员:DEF=human|人,$employ|雇用 熨斗:DEF=tool|用具,*AlterForm|变形状,#level|平 假期:DEF=time|时间,@rest|休息,@WhileAway|消闲 旅馆:DEF=InstitutePlace|场所,@reside|住下,#tour|旅游 救生艇:DEF=ship|船,*rescue|救助 心脏:DEF=part|部件,%AnimalHuman|动物,heart|心 CPU:DEF=part|部件,%computer|电脑, heart|心 * 表示施事、经验者、或关系主体等角色;$ 表示受事、内容、领属物等角色;# 表示相关关系;@ 表示场所、时间等角色;%表示部分整体关系 HowNet动词示例 NO.=015492 W_C=打 G_C=V E_C=~毛衣,~毛裤,~双毛袜子,~草鞋,~一条围巾,~麻绳,~条辫子 W_E=knit G_E=V E_E= DEF=weave|辫编 救灾: DEF=rescue|救助,StateIni=unfortunate|不幸 扭亏为盈: DEF=alter|改变,StateIni=InDebt|亏损,StateFin=earn|赚 HowNet动名语义关系描述 V event|事件 V1 static|静态 V2 act|行动 ActGeneral|泛动{agent,content} start|开始{agent,content} do|做{agent,content,manner} try|尝试{agent,content} endeavour|卖力{agent,content} VieFor|快干{agent,content} RashlyAct|蛮干{agent,content} venture|冒险{agent,content} …… HowNet信息结构库 信息结构 餐馆:可以吃饭的场所 走私集团:一个从事犯罪活动的团体,特征是转移物品 句法分布式 餐馆: N1 + N2 走私集团:V + N 句法结构式 餐馆: N1 ..N2 走私集团: V ..N 信息结构模式 餐馆:{(物质,食物) [受事] --事件,行动,吃} --[处所] (组织/场所) 走私集团:(事件,行动) --[施事] (人/拟人) HowNet信息结构库(续) 0分类号 SYN_S=N --N句法结构式 SEM_S=(万物) [领属物] --(万物) 信息结构模式 Query1: 什么? Answer1: N1 + N2Query2: 什么样的?Query Answer: 表示该信息结构模式传达的真正信息并由此可产生的问与答 Answer2: “有”N1 “的”N2 例子:花园-洋房,星-空,艳阳-天,草-原,草-地,沙-地,花-园, 林荫-道,林荫-路,林荫-大道,水翼-船,气垫-船, 功勋-演员,功勋-运动员,技术-人员,专业-技术人员, 专业-人才,专业-人员,技-师,技-工,技术-员,手艺-人, HowNet的规模 HowNet双语知识库 中文词项53335 英文词项57392 中文词条65953 英文词条75356 总记录数116533 HowNet信息结构库 信息结构模式:271个 句法分布式:49个 句法结构式:58个 实例:11,000 词语总字数:中文60,000字 人有了知识,就会具备各种分析能力, 明辨是非的能力。 所以我们要勤恳读书,广泛阅读, 古人说“书中自有黄金屋。 ”通过阅读科技书籍,我们能丰富知识, 培养逻辑思维能力; 通过阅读文学作品,我们能提高文学鉴赏水平, 培养文学情趣; 通过阅读报刊,我们能增长见识,扩大自己的知识面。 有许多书籍还能培养我们的道德情操, 给我们巨大的精神力量, 鼓舞我们前进。 * 基于《知网》的词语相似度计算 困难:知识描述语言的复杂语法 方法一: 只计算第一独立义原的相似度 优点:简单 缺点:过于粗疏 方法二:Li Sujian, et al. (2002) 综合利用《知网》和《同义词词林》 利用了《知网》义原之间除上下位以外的其他关系 综合考虑相似度和相关度(未必合理) 词语的相似度计算 对于两个汉语词语W1和W2,如果W1有n个义项(概念):S11,S12,……,S1n,W2有m个义项(概念):S21,S22,……,S2m,我们规定,W1和W2的相似度各个概 念的相似度之最大值,也就是说: 注:在实际的文本中最好先排岐。 义原的相似度计算 义原之间的语义距离: 其中p1和p2表示两个义原(primitive),d是p1和p2在义原层次体系中的路径长度,是一

文档评论(0)

***** + 关注
实名认证
内容提供者

我是自由职业者,从事文档的创作工作。

1亿VIP精品文档

相关文档