生成式金融事件检测与论元抽取方法研究.pdfVIP

生成式金融事件检测与论元抽取方法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

从大量金融文本中实时提取关键事件信息,并将其结构化存储,对于金

融机构和政府部门及时把握市场动态,有重要意义。金融事件抽取任务主要

分为金融事件检测和论元抽取两个子任务,旨在识别事件类型并提取关键论

元要素。然而,在实际金融事件抽取场景中,由于事件类型的多样性和复杂

性,以及数据的长尾分布问题,现有方法面临着显著挑战,难以满足实际应

用的需求。为了更有针对性地处理上述问题,本研究采用两阶段流水线的方

式,分别对金融事件检测和论元抽取两个子任务进行建模。

针对事件检测任务中事件类型多样和事件类型相近的问题,提出了一种

约束生成方法。该方法通过采用生成式任务的建模方式,直接生成事件类型

的文本字符,从而有效地利用了金融事件类型的语义信息;在生成过程中根

据金融事件模板进行约束生成,从而实现了更精准的事件检测。在DuEE-fin

中文金融领域事件抽取数据集上,约束生成的事件检测的方法相比于传统抽

取模型有了在微平均F1指标上有3.28%的提升,在CCKS2022FEW-SHOT

中文金融事件检测任务的线上测试集上,提升9.26%的宏平均F1指标,展现

了更好的鲁棒性。

针对事件论元抽取任务中事件论元模板复杂的问题,本文采取了字符提

示和实体嵌入的实体增强策略,以提高模型在处理事件论元多样性方面的性

能。基于片段生成的论元抽取模型,在注入论元和潜在实体的关系信息的后

提升了论元抽取效果,在DuEE-fin金融事件论元抽取数据集上有4.07%的

Arg-C得分提升;在WIKIEVENTS英文篇章级别事件论元抽取数据集上相较

其他基线模型有了3.12%的Arg-C得分提升,达到目前已知最佳性能;在

ACE2005英文事件抽取数据集上,实体增强的片段生成模型也有较好的性能

表现。同时针对金融论元组成复杂的问题,本文进行了大语言模型进行论元

抽取指令微调尝试,通过大语言模型强大的文本生成能力,更灵活的处理金

融论元抽取任务,提升了21.48%的F1得分,大幅度优化了金融论元抽取的

效果。

通过上述策略,本文提出了生成式的事件抽取模型,在金融领域事件抽

取数据集上和通用领域事件抽取数据集上都取得了良好的性能,证明了本文

提出的事件抽取方法能够有效地完成金融事件抽取任务。

关键词:金融事件抽取;约束生成;实体增强;片段生成模型;大语言模型

-I-

Abstract

Real-timeextractionandstructuredstorageofkeyeventinformationfrom

vastfinancialtextsarecrucial.Ithelpsfinancialinstitutionsandgovernment

departmentsgraspmarketdynamics.Financialeventextractiontasksaredivided

intotwosub-tasks:eventdetectionandargumentextraction.Theyaimtoidentify

typesofeventsandextractkeyelements.However,thesetasksarechallenging

duetothediversityandcomplexityofeventtypesandthelong-taildistribution

ofdata.Toaddresstheaforementionedissuesinamoretargetedmanner,thisstudy

adoptsatwo-stagepipelineapproach,whichseparatelymodelsthetwosubtasks

offinancialeventdetectionandargumentextraction.

Toaddresstheissuesofdi

文档评论(0)

营销资料库 + 关注
实名认证
文档贡献者

本账号发布文档部分来源于互联网,仅用于技术分享交流用,版权为原作者所有。 2,文档内容部分来自网络意见,与本账号立场无关。

1亿VIP精品文档

相关文档