一种基于跨度的实体关系联合抽取模型.pdfVIP

一种基于跨度的实体关系联合抽取模型.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

创新与实践TECHNOLOGYANDMARKET

Vol.31,No.6,2024

一种基于跨度的实体关系联合抽取模型

段慧蓉,冯国富

南京审计大学,江苏南京211815

摘要实体关系联合抽取旨在从文本中自动识别实体及实体间的关系,并生成<主体实体、关系、客体实体>三元组

形式的语义信息,在问答系统、知识图谱等领域具有重要意义。但是目前仍然存在着实体关系重叠、误差累计等问题。

为了解决上述问题,提出了一种基于跨度的实体关系联合抽取模型SpERT.MDP。该模型在实体和关系分类中融入句

法信息和词性特征,以及使用多层感知器(multilayerperceptron,MLP)和softmax进行跨度分类。试验结果表明:所提出

的模型优于目前主流模型。

关键词实体关系联合抽取;依存句法分析;词性标注;多层感知器

doi:10.3969/j.issn.10068554.2024.06.004

以所有可能的字符子序列作为标记的基本单位,每个

0引言

字符子序列称为1个跨度,有利于识别嵌套实体。例

实体关系抽取是信息抽取领域的重要分支之一,[1]

如Dixitetal.提出了基于双向长短期记忆网络(bi

旨在从非结构化的文本数据中正确识别出特定类型directionallongandshorttermmemory,BiLSTM)的跨

的实体,并预测实体之间的关系,最终呈现出SPO度级端到端模型,实现了在所有可能的跨上并行地进

(subject,prediction,object)三元组形式的结构化数[2]

行实体识别。Luanetal.提出通用框架DyGIE,通

据。实体关系抽取是构建知识图谱、问答系统及文本过在编码过程中动态构建图模型来捕获跨度间的相

摘要等领域的重要前置任务,对大数据时代节约昂贵[3]

互作用。此外,Waddenetal.在编码端采用bert模

的人工成本、自动化处理繁多的数据具有重要现实型,而非原先DyGIE框架中的BiLSTM,进一步提出

意义。[4]

了DyGIE++模型。Ebertsetal.提出基于跨度的实

传统的三元组提取主要基于管道方法,先抽取实体关系联合抽取模型(spanbasedentityandrelation

体,再抽取实体间的关系。虽然这种流水线的抽取方transformer,SpERT),采用bert预训练模型作为编码

式使抽取过程更容易理解,但忽略了2个过程之间的器,一一枚举得到文本中所有可能的实体跨度,接着

内部联系,会造成误差累计、信息冗余、交互缺失等问通过2个多层前馈神经网络(feedforwardnearalnet

题。近年来,实体关系联合抽取方法的研究越来越受work,FFNN)对每个实体跨度进行建模和分类,有利

到关注,实体抽取和关系抽取为同时进行的2个任于减少误差传播,缓解实体重叠问题。

务,通过参数共享的方法加强2个任务之间的联系,

您可能关注的文档

文档评论(0)

经管专家 + 关注
实名认证
服务提供商

初级会计持证人

专注于经营管理类文案的拟写、润色等,本人已有10余年相关工作经验,具有扎实的文案功底,尤善于各种框架类PPT文案,并收集有数百万份各层级、各领域规范类文件。欢迎大家咨询!

版权声明书
用户编号:6055234005000000
领域认证该用户于2023年12月17日上传了初级会计

1亿VIP精品文档

相关文档