汉语复合名词语义信息标注词库——基于生成词库理论.pptVIP

汉语复合名词语义信息标注词库——基于生成词库理论.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉语复合名词语义信息标注词库 ——基于生成词库理论 宋作艳 北京师范大学文学院 meszy@163.com 目录 1.生成词库理论简介 2.词库标注 3.实例分析 4.结论 5.下一步工作 * 1.生成词库理论简介 生成词库 词项的词汇语义表达 句法层面的语义生成机制 论元结构(ARGUMENT STRUCTURE) 词汇类型结构(LEXICAL TYPING STRUCTURE) 物性结构(QUALIA STRUCTURE) 事件结构(EVENT STRUCTURE) 纯粹类型选择(pure selection) 类型强迫(type coercion) 类型调节(type accommodation) * 物性结构 A.形式角色(formal role) 描写事物在更大的认知域内区别于其它事物的属性。包括方位、大小、形状和维度等。 B.构成角色(constitutive role) 描写事物与其组成部分之间的关系。包括材料、重量、部分和组成成分。 C.功用角色(telic role) 描写事物的用途(purpose)和功能(function)。 D.施成角色(agentive role) 描写事物是怎样形成或产生的,如创造、因果关系。 * 书: 形式:大、红…… 构成:封面、扉页、封底…… 功用:读 施成:写 * 语义分类体系 * 自然类N: rock, water,woman,tiger,tree 人造类A: knife, beer,husband,dancer 合成类C: book, lunch,university,temperature * 2.词库标注 * 目标 找出复合名词的构词、释义模式 构建基于生成词库理论的汉语语义类型体系 * 3.实例分析 * * Constitutive 构成 Formal 形式 Telic 功用 Agentive 施成 复合名词的类 合计 自然 人造 石X 16(84%) 0 2(11%) 1(5%) 1 18 19 纸X 27(93%) 0 2(7%) 0 0 29 29 X石 1(5%) 10(48%) 7(33%) 3(14%) 17 4 21 X纸 10(14%) 13(18%) 41(55%) 10(14%) 0 74 74 * 推导关系 1)如果中心名词是人造类,复合名词一定是人造类,不受物性关系的影响。如: N+A=A:石碑、石雕、面纸、彩纸 A +A=A:纸箱、纸篓、纸船 2)如果中心名词是自然类,复合名词的类受物性关系的影响。如: N+N=N:卵石、滑石、石笋(形式)、试金石、吸铁石(自然功用) N+N=A:石林、石狮、石羊(构成) A + N=A:界石、柱石、纸鹤、纸花(人为功用) * 隐喻式构词 1)N+U/N:石狮、石羊[后喻式:形状] 2)A+U/N:纸鱼、纸鸢、纸鹤、纸花、纸人 [后喻式:形状] 3)N+A:石锁[后喻式:形状] 4)A+A:纸船、纸巾、纸钱[后喻式:形状和功用] * 1)N+N:鹅卵石、鸡冠石、白云石、卵石、萤石、油石[前喻式:形状、颜色、性质等] 2)N+A:马粪纸、牛皮纸、绵纸、糯米纸[前喻式:形状、颜色、性质等] 3)A+A:玻璃纸、瓦楞纸、塑料纸[前喻式:形状、颜色、性质、功用等] * 4.结论 1)不同的物性关系体现了不同的构词、语义模式,这些模式可以用于复合名词的释义。 2)不同物性关系在人造类名词和自然类名词的分布和频率是不一样的; 3)物性信息和两种语义类型可以用于隐喻复合词的解释; 4)构词成分的类与复合名词的类之间存在推导关系。 * 5.下一步工作 1)扩大词库规模,自动标注 2)找出构词、释义规则 3)把名词复合词的分析应用到名词短语中 4)开发应用:未登录词、自动释义、词典编纂 * * 建立此词库的目的主要有两个,一是希望能从物性信息、自然类与人造类的角度揭示汉语名词复合词的构词、语义特点,进而探究汉语语义体系(知识体系)的分类问题。二是希望能找出复合名词的构词、释义模式,以期用于中文信息处理中语义类的自动聚类、未登录词、术语等的自动识别和自动释义。 * 在物性信息和语义类型方面不尽相同:“X石”中涉及的物性关系依次是:形式、功用、施成和构成。“X纸”中最主要的物性关系则是功用,然后才是形式、施成和构成。 * 如果修饰成分表形式和自然功用,复合名词是自然类;如果修饰成分表构成(材料)和人为功用,复合名词是人造类。 “吸铁石”可以用来吸铁,这是它的自然属性,与人的意愿无关。 * 石头做的形状像锁的一种运动器材。 ?多一个“形状” * 本文介绍了基于生成词库理论的复合名词语义信息标注词库,主要标注复合名词的四种物性信息(构成、形式、功用和施成)和两种语义类型(自然类、

文档评论(0)

xcuzhrouh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档