中文句法异构蕴含语块标注和边界识别研究.pdfVIP

中文句法异构蕴含语块标注和边界识别研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 ** 卷 第 * 期 中文信息学报 Vol. ** ,No. * 201* 年 * 月 JOURNAL OF CHINESE INFORMATION PROCESSING ***. ,201* 文章编号:1003-0077 (2017)00-0000-00 中文句法异构蕴含语块标注和边界识别研究 1 1 1 1 1,2 金天华 姜珊 赵美倩 刘璐 于东 (1.北京语言大学 信息科学学院,北京 100083;2.北京语言大学 语言资源高精尖创新中心,北京 100083) 摘要:文本蕴含是自然语言处理的难点,其形式类型复杂、知识难以概括。早期多利用词汇蕴含和逻辑推理知识 识别蕴含,但仅对特定类型的蕴含有效。近年来,利用大规模数据训练深度学习模型的方法在句级蕴含关系识别任务 上取得优异性能,但模型不可解释,尤其是无法标定引起蕴含的具体语言片段。本文研究文本蕴含成因形式,归纳为 词汇、句法异构、常识三类,并以句法异构蕴含为研究对象。针对上述两个问题,提出句法异构蕴含语块的概念,定 义其边界识别任务。本文制定句法异构蕴含语块标注规范,建立标注数据集。在此基础上,分别建立基于规则和基于 深度学习的模型,探索句法异构蕴含语块的自动识别方法。实验结果表明,本文提出的深度学习模型能有效发现蕴含 片段,为下一步研究提供了可靠的基线方法。 关键词:文本蕴含;句法异构;语块标注 中图分类号:TP391 文献标识码:A Chinese Chunked-based Heterogeneous Entailment Parser and Boundary Location 1 1 1 1 1,2 Jin Tianhua , Jiang Shan , Zhao Meiqian , Liu Lu , Yu Dong ( 1. College of Information Science, Beijing Language and Culture University, Beijing 100083, China; 2. Beijing Ad- vanced Innovation Center for Language Resources , Beijing Language and Culture University, Beijing 100083, China) Abstract : Recognize textual entailment(RTE) is a difficult task for natural language processing. In early period, RTE was based on lexical knowledge and logical reasoning knowledge, which only worked on specific type. Recently, deep learning models become a mainstream. But this approach can not locate concrete linguistic fragments in sentences. This paper divides textual entailment into three main categories: lexical entailment, chunked -based heterogeneous entailment and common -sense entailment. So we propose the concept of chunked-based heterogeneous to define

文档评论(0)

yuxiufeng + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档