意义计算的实现-知网!.ppt

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
意义计算的实现-知网!

提纲 相似度的计算 相关概念的计算 知网英汉翻译系统 在意义计算中,一些常用的函数 容易混淆的两个概念 词语相关性——反映的是两个词语互相关联的程度,即词语之间的组合特点,它可以用词语在同一个语境中共现的可能性来衡量。 词语相似性——反映的是词语之间的聚合特点。 什么是概念的相似度 概念相似度是一个主观性很强的概念,会根据不同的应用而产生不同的定义。 实现方法 同义词 同类词 反义或对义词 抽取参与计算的DEF片段 概念计算 实现方法—特殊情况 在符合下列情况是直接得出相似度值,无需其他计算: 同义词 相似度为1.000000。 同类词 相似度为0.950000。 反义或对义词 (仅限于单个义原) 相似度为0.000000。 实现方法—抽取DEF 不是所有的概念都是直接拿到DEF就进行计算的,有些概念中存在特殊的动态角色,需要特别的处理。对于动态角色CoEvent, 需要用CoEvent 后面的KDML部分作为这个词语的DEF来参与计算,用以建立不同类别词语之间的关系。如 : 旅程(名词): DEF={fact|事情:CoEvent={tour|旅游}}。 旅行(动词): DEF={tour|旅游} 实现方法—四个部分 公式: Sim(D1,D2) = (P1*β1+P2*β2+P3*β3+P4*β4)* γ 概念相似度的计算分为4个部分来进行。 β是每一个部分计算结果的权值。 β1+β2+β3+β4 =1, 目前我们指定:β1=0.1,β2=0.1,β3=0.7,β4=0.1。 γ为惩罚因子。 实现方法—包含关系的计算(部分1) 两个DEF相互包含关系的计算 公式:P1 = 1/L L:包含关系存在的层次 实现方法—包含关系的计算(部分1) “心理医生”: DEF={human|人:HostOf={Occupation|职位},domain={medical|医},{doctor|医治:agent={~},content={disease|疾病:cause={mental|精神}}}} “医生”: DEF={human|人:HostOf={Occupation|职位},domain={medical|医},{doctor|医治:agent={~}}} “手指”: {part|部件:whole={part|部件:PartPosition={hand|手},whole={human|人}}} “手”: {part|部件:PartPosition={hand|手},whole={human|人}} 实现方法—概念主类相似度的计算(部分2) 两个概念主类之间的相似度的计算 公式:P2 = α / ( d +α ) d为两个主类义原在Taxonomy树上的距离。 α= 1 。 距离与相似度为反比关系,即距离越近相似度越高。 实现方法—概念主类相似度的计算(部分2) “human|人” : entity|实体 = thing|万物 = physical|物质 = animate|生物 = AnimalHuman|动物 = human|人 实现方法—节点相似性的计算(部分3) DEF的各个节点相似性的计算,这一部分的计算是在整个相似度计算中最复杂,也是权值比例最大的一部分。 具体包含如下三个方面的计算: 同层相同节点的计算; 对于动态角色domain的进一步处理; 两个DEF相同节点数与总节点数的计算 实现方法—节点相似性的计算(部分3) “患儿”: DEF={human|人:domain={medical|医},modifier={child|少儿}, {SufferFrom|罹患:experiencer={~}},{doctor|医治:patient={~}}} “儿科医生”: DEF={human|人:HostOf={Occupation|职位},domain={medical|医}, {doctor|医治:agent={~},patient={human|人:modifier={child|少儿}}}} 实现方法—节点相似性的计算(部分3) 实现方法—节点相似性的计算(部分3) 同层相同节点的计算 公式:S1 = Nsim / Nmax / 2x Nsim :同层相同节点数 Nmax:同层最大节点数 2x :x是层次数 那么以上我们所举的例子的计算结果为: S1 =1/21 + 0.5/22 + 0/23 + 0/24 =0.5 + 0.125 + 0 + 0 =0.625 实现方法—节点相似性的计算(部分3) 对于动态角色domain的进一步处理。 如果两个DEF中都存在domain,并且domain的值也相

文档评论(0)

wangyueyue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档