【精品课件】语义标记推理.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语义标记推理 白硕 上海证券交易所 中科院计算所 2010年5月 汉语的“意合”特性 汉语被认为是一种高度“意合”的自然语言。 汉语的语义描述体系是学者们几十年来一直不懈追求构建的目标。 对汉语的“意合”特性,去除神秘化、不可知论的因素以及概念根基定义等非语言学的因素,目前学术界在语言学意义上达成共识的理解是:汉语的语言成分携带的语义标记之间的某种“契合”性,决定了这些成分在组成更大的结构时的语义角色指派关系。 国内学者的努力 很多学者都在努力构建尽可能符合这种理想的语义标记体系,形式化地再现其“契合”机制。 具体的努力可以举出 配价理论 鲁川的“汉语格语法” 董振东的“知网” 黄曾阳的“概念层次网络”等 这些理论对推动汉语语义的形式化描述做出了重要的贡献,但是从语言学的角度考虑,汉语中仍然有大量难以解决的歧义问题、语义指向问题和指代照应问题缺乏系统性的解决方法。 两难困境 照搬传统词类和语法理论的结论,必然产生大量“伪歧义” 严格以例句为评判的最终标准,必然产生极为细碎的“小类” 到底是在句法层面容忍“伪歧义”、把困难推给语义层面,还是通过足够细粒度的有语言学意义的“小类”刻画相对精致的句法规则体系,是一个关系重大的选择,在汉语里后者尚缺乏足够的实践 楼层的比喻 作者的学术思想发展历程 1984-1996:沿着基于小类的方向前进 《语言学知识的计算机辅助发现》 面向自然语言的几何题求解 1997-2010:沿着基于意合的方向前进 范畴表达式演算 语义标记推理 时间跨度长,方向转换大,非功利性 基于小类:举例 【例句】 AB的中点和BC的中点的连线…… 【基于传统范畴】 NP的NP和NP的NP的NP…… 【基于小类】 线段的点结构和线段的点结构的线结构…… 语义=角色指派+符号根基 角色指派图示:元件 角色指派图示:装配图 语义学基本问题 如何形成装配图? 一句话对应多少个装配图? 如何筛选合情理的装配图? 鸡不吃了 菜不吃了 语义学界的“哥德巴赫猜想” 一定有一种标记体系,每个语言成分都携带着相应的标记 随着成分结合成更大的成分,也同步对标记进行相应的演算或者推理,将结果赋给更大的成分 标记就附着在正负配价点上面! “鸡”和“菜”的正配价点上携带的标记各是什么? “吃”的两个负配价点上携带的标记各是什么? “吃”和“鸡”产生一种成分的结合的时候,双方各自的配价点有哪些变化? 鸡不吃了 菜不吃了 除了选择性匹配,还有什么? 选择性匹配 定义一组(有限个)“基本标记”,它们之间根据上下位概念关系,形成一个“偏序” 比如: ObjAnimateHuman,ObjFood RelationEvent, RelationBoolean 两个基本标记只有在存在“公共下位”时才构成成功的“选择性匹配”,完成匹配后,这两个标记要被替换为它们的“公共下位”,即它们的“合一”(Unification) 绑定 实行“绑定”的配价点,必须随时保持一致的标记,如果它们当中的任何一个由于选择性匹配而发生被更下位的标记替换,那么所有其他的配价点上的标记也要同步替换 用“基本标记:约束变元”的标记形式来表示绑定,同样基本标记、同样约束变元的标记在选择性匹配的动态过程中具有同一性 复合标记 含有一个正配价点,若干个负配价点的语言成分,我们赋予其一个“复合标记” 若正配价点上的标记为t,n个负配价点上的语义标记分别为t1,t2,…,tn,则这个语言成分所携带的“复合标记”为t1,t2,…,tn?t ?是一个标记连接词,类似逻辑连接词“蕴涵” 谓词、有价名词、虚词往往都携带“复合标记” 抽象列表 一个复杂标记的左部,我们真正关注的可能只是其中的一项ti,它的标记值会参与某种标记推理,而其余项(负配价点)则被模糊化,我们使用“抽象列表”来描述这样的左部 定义X为抽象列表变元的可数集合 一个抽象项列表为形如?([sign]ti)的表达式,其中,ti是项,?∈X, sign为+、-或空 抽象列表与实例列表的匹配 在标记推理过程中,抽象列表可以通过合一操作实例化为一个具体的项列表 当sign为+时,t优先匹配具体项列表的左端首个可合一的项; 当sign为-时, t优先匹配具体项列表的右端首个可合一的项; 当sign为空时,t可匹配具体项列表中任何可合一的项。 推理 物理学中的量纲运算 速度=长度/时间 速度*时间=(长度/时间)*时间=长度 范畴语法中的约分运算 S?NP VP S=NP * NP\S 逻辑学中的假言推理 A, A?B B 标记推理 t1,t2,…,tn?t, ti t1,t2,…ti-1,ti+1,…,tn?t 推理规则模板 大部分情况下,可以自发推理达成语义角色指派 少部分情况下,自发推理无法唯一达成语义角色指

文档评论(0)

沃爱茜 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档