13.范畴表达式演算白硕赵章界.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
13.范畴表达式演算白硕赵章界

短语结构制导的 范畴表达式演算 白 硕 赵章界 中国科学院计算技术研究所 2004年7月 有一种东西叫意义? 符号,最根本的属性是“牺牲自己、代表别人” 语义学,顾名思义,研究的是符号的意义,也就是被符号代表的那个“别人”,即它的“所指” 如果符号和它的意义完全同构,研究符号本身就足够了,可惜即使在数学中,这一点都做不到 在自然语言中,不确定的指称、不确定的角色指派、失败的举一反三,让我们寄希望于意义 不确定的指称 不确定的角色指派 不成功的举一反三 计算机处理语言一定需要意义? 计算机处理自然语言,面对着各个层次上的不确定性 之所以需要意义和(传统意义上的)语义学,正是由于这些不确定性 直接在这些不确定性的驱动下设计具有恰当区分能力的标签(标注)体系,在这一过程中不排除借鉴意义的世界中的若干要素,可能是一种更有效的做法 “权宜的”语义学 我无需关心意义的世界到底有什么 我无需努力去“重构”意义的世界,为它建立什么模型 我只需为大大小小的符号串贴一些“人为的”、“权宜的”标签,在这种标签之间定义一种演算,做到: 我们在意义的世界里感受到多少种不确定的指称,这种演算一定会给出多少套不同的标签 我们在意义的世界里感受到多少种不确定的角色指派,这种演算一定会在标签之间建立多少种结构制约关系 那么,从计算的角度看,这种演算就可能是成功的 这种标签演算体系应该—— 有层次(反映标签之间的上下位关系) 有结构(反映成分间基于标签的结合关系) 有运算(构造正确的标签组合) 有约束(构造时满足并传播特定约束条件) 有弹性(利用结构中满足特定条件的标签) 有顺序(利用标签在结构中的顺序信息) 范畴表达式演算正中下怀 有层次(偏序) 有结构(带空穴的复杂标签) 有运算(特化、泛化、约分) 有约束(填入空穴时的匹配约束,空穴与其他标签的绑定约束,句法规则对填入空穴的方式的约束) 有弹性(可以指定与标签匹配的空穴) 有顺序(可以指定与标签匹配的左数/右数第几个空穴) 有层次——基本范畴的继承关系 有结构——复杂范畴 有运算——特化与泛化 有运算——约分 有约束——继承、绑定、规则 绑定约分 短语结构制导的约束规则 空成分负载结构的情况 空成分负载结构的情况 有弹性,有顺序——定位因子 理论渊源 范畴语法 配价理论 类型-逻辑语义学 依存语法 短语结构如何制导 主谓结构 述宾结构 述补结构 联合结构 偏正结构(定中) 偏正结构(状中) 介宾结构 连谓结构(连动) 连谓结构(兼语) 双宾结构 的字结构 把字结构 被字结构 给字结构 在字结构 所字结构 时态结构 数量结构…… 王冕死了父亲 台上坐着主席团 卖盐的 我是县长派来的 这些馒头把我吃胖了 他被地主放狗咬了 语义指向——树砍光了 语义指向——他砍累了 语义指向——刀砍钝了 泛化运算的消岐作用 总结 我们提出了一套标签演算体系 它继承了范畴语法、配价理论、类型-逻辑语义学、依存语法的优点 它可以在传统的表层语法框架内,更好地捕捉成分之间相互作用,从不确定的指称、不确定的角色指派中最终筛选出接近直观的结果 它有明确的、可检验的计算机制 * 符号的世界 意义的世界 鸡 鸡 鸡 不吃了 停止了进食 不吃 这种食物了 张三 找 李四 去 坦白交待 张三 找 李四 去 坦白交待 张三 找 李四 去 坦白交待 看了三天就腻了 看了三天就忘了 开始看 腻了 看完了 忘了 top entity relation event boolean obj mental animate food human …… 基本范畴集合和它上面的偏序关系构成一非空的、可数的、有界完备的偏序集合 如果a,b1,b2,…,bn是范畴,那么a/ b1,b2,…,bn也是范畴,其中a称为中心范畴, b1,b2,…,bn称为空穴 b1 b2 bn a 空穴 如果一个复杂范畴的空穴被相应范畴或其特化范畴所填充,那么这个复杂范畴就变成它的中心范畴 在基本标签集合中,下位标签与上位标签可进行特化(⊙ )运算,结果为下位标签。例如: Entity ⊙ human = human 在基本标签集合中,任何两标签可进行泛化(∨ )运算,结果为二者的最小公共上位标签,也就是说,基本标签集合和它上面的泛化运算构成一半格。例如: Human ∨ food = obj Event / animate, food animate food * * animate food Event / animate, food event 类比:物理学中的“量纲” 引入了偏序结构上的约分机制,扩充了约分对象 引入了范畴之间的绑定关系,借鉴中心词的继承,扩充了约分效果的影响范围 引入了短语结构制导机制,利用短语结构规则对范畴的限定关系,缩小了候选约分运算的范围 取消了范畴语

文档评论(0)

sunhao111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档