漢语并列关系的识别研究.pptVIP

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
漢语并列关系的识别研究

汉语并列关系的识别研究 北京信息科技大学 研三 郑略省 2017-4-9 2 主要内容 研究的意义 并列关系的标注方式 并列关系的构成角色 并列关系的特征选择 实验结果分析 结论 3 研究的意义 自然语言深层处理技术已用于机器翻译、信息抽取和问答系统等方面 句法分析是自然语言深层处理的基础 依存句法比短语句法更容易处理 有 江南 南部 小到中雨 贵州 西部 将 华南 Root SBV COO ATT ADV VOB COO ATT 4 研究的意义 目前依存句法分析研究的重心放在统一建模上,对汉语特殊结构的研究较少 McDonald的方法整体识别效果LAS 和UAS为78.2%,80.8% 并列关系识别效果偏低,正确率和召回率分别为64.0%, 54.8% 5 研究的意义 汉语并列结构研究主要在于识别并列结构的边界,并不能直接应用到依存句法分析当中 (贵州 南部 、江南 、华南 西部) 将 有 小到中雨 6 主要内容 研究的意义 并列关系的标注方式 并列关系的构成角色 并列关系的特征选择 实验结果分析 结论 7 并列关系的标注方式 依存语法中并列关系(COO)的标注方式由并列词组、核心词和尾词组成 并列词组,指的是在同一并列结构中发生并列关系的所有并列成分 核心词,指的是在并列词组中有一个并列成分充当核心节点的作用,其它并列成分均以核心词为父亲节点 尾词,指的是距离核心词最远的并列成分 标注方式是遵循左核心原则 8 主要内容 研究的意义 并列关系的标注方式 并列关系的构成角色 并列关系的特征选择 实验结果分析 结论 9 并列关系的构成角色 角色表是识别并列关系的基础。根据角色表,计算机能够理解汉语并列结构 编码 意义 例子 H 并列词组的核心词 经济 、 政治 和 外交 B 并列词组的非核心词 经济 、 政治 和 外交 O 以上之外其它的角色 ? 贵州 O H O B O O B …… 南部 江南 、 、 华南 …… 西部 COO COO 10 并列关系的构成角色 并列关系可分为无标记和有标记 无标记:结构复杂,不易识别 “指手画脚,照本宣科”,“深入细致,扎实有效” 有标记:结构上由并列标记连接 连词:和、与、并……”,中国和南非 标点符号:主要是逗号为主 编码 意义 例子 H 并列词组的核心词 经济 、 政治 和 外交 B 并列词组的非核心词 经济 、 政治 和 外交 R 并列词组内部的并列标记 仓库 、 厂房 和 民宅 I 并列词组内部的非并列标记 汇率 和 股票 价格 O 以上之外其它的角色 ? 贵州 O H R B R I B …… 南部 江南 、 、 华南 …… 西部 11 并列关系的构成角色 有标记并列关系比较难识别的是嵌套并列关系,主要困难在于个别并列成分充当多重角色 老虎 H R B R X R B …… 、 和 麻雀 竹 、 …… 梅 编码 意义 例子 H 并列词组的核心词 经济 、 政治 和 外交 B 并列词组的非核心词 经济 、 政治 和 外交 R 并列词组内部的并列标记 仓库 、 厂房 和 民宅 I 并列词组内部的非并列标记 汇率 和 股票 价格 X 并列词组的核心词,又是另一个并列词组的非核心词 松鼠 、 麻雀 和 竹 、 梅 、 松 、 柏 O 以上之外其它的角色 ? COO COO COO 12 并列关系的构成角色 该文根据并列关系的特点和上下文信息,制定了完整角色表 编码 意义 例子 H 并列词组的核心词 经济 、 政治 和 外交 指手画脚 , 照本宣科 X 并列词组的核心词,又是另一个并列词组的非核心词 松鼠 、 麻雀 和 竹 、 梅 、 松 、 柏 B 并列词组的非核心词 青草 、鲜花 和 河流 、 湖泊 R 并列词组内部的并列标记 仓库 、 厂房 和 民宅 I 并列词组内部的非并列标记 汇率 和 股票 价格 L 核心词的上文 贵州 南部 、 江南 、 华南 西部 F 尾词的下文 华南 西部 和 北部 有 小到中雨 C 既是上文又是下文 那些 诗句 、 那些 祝辞 , 喜悦 、 激动 、 欣慰 之 情 O 以上之外其它的角色 ? 13 主要内容 研究的意义 并列关系的标注方式 并列关系的构成角色 并列关系的特征选择 实验结果分析 结论 14 并列关系的特征选择 特征的合理选择是识别并列关系的关键。 特征

您可能关注的文档

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档