面向社交媒体文本和图像的多模态命名实体识别研究.pdfVIP

下载本文档

2
0
约10.18万字
约 70页
2025-10-30 发布于江西
举报
版权申诉

面向社交媒体文本和图像的多模态命名实体识别研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

面向社交媒体文本和图像的

多模态命名实体识别研究

摘要

随着社交媒体网络的快速发展，从非结构化的社交媒体数据中提取重要信息成为了

迫切需求。但因社交媒体文本通常较短，语义不足，导致仅依赖文本特征难以取得良好

的命名实体识别效果。因此，结合图像信息的多模态命名实体识别方法逐渐成为了热门

的研究方向。然而，受制于多模态数据量较少的原因，对比学习在解决不同模态来自不

同编码器的表示不一致问题时，效果有限。同时，如何充分进行模态间的交互融合以此

来挖掘两种模态之间的关联信息也是当前多模态命名实体识别方法面临的问题。为此，

本文对多模态命名实体识别方法进行研究。本文主要研究内容如下：

首先，本文提出了一致性表示增强模块。该模块通过结合对比学习和最大均值差异

损失来训练网络，使两种模态的特征表示更为一致。同时，对于两种模态的特征表示，

本文采用具有相似架构的两个预训练模型来获取。其次，对于模态间的交互，本文提出

了一种双阶段和外部特征引导的多层次交互方法。双阶段模态交互第一阶段通过跨模态

交叉注意力得到交互特征，第二阶段先通过注意力机制增强文本和图像的关键特征，再

将其送入跨模态交叉注意力得到交互特征。此方法实现了全局级别以及细粒度层次的交

互，提高了模型对模态间关联信息的理解能力。同时，本文采用非缩放注意力计算两种

模态之间的注意力分数，使实体与图像中相似区域和不相似区域更加有区分性。此外，

由于交互特征容易受到不相关图像区域的噪声干扰，因此本文又采用外部信息引导的交

互方式，以纠正交互过程中产生的错误实体信息。在此基础上，本文采用多任务学习的

方法在模型中添加了实体边界检测模块，来提高模型对实体边界信息的关注度，进而提

升模型的整体性能。实验结果表明，本文的方法能够使两种模态之间的表示更加一致以

及更为充分的进行模态间交互融合，比对比方法具有更优的实体识别效果和泛化性能。

【关键词】：社交媒体；多模态命名实体识别；多模态交互融合；对比学习

ResearchonMultimodalNamedEntity

RecognitionforSocialMedia

TextsandImages

Abstract

Withtherapiddevelopmentofsocialmedianetworks,extractingimportantinformation

fromunstructuredsocialmediadatahasbecomeanurgentneed.However,thesocialmedia

textsareusuallyshortandsemanticallyinsufficient,whichmakesitdifficulttoachievegood

namedentityrecognitionbyrelyingonlyontextfeatures.Therefore,multimodalnamedentity

recognitionmethodscombiningimageinformationhavegraduallybecomeapopularresearch

direction.However,constrainedbythesmallamountofmultimodaldata,comparativelearning

haslimitedeffectinsolvingtheproblemofinconsistentrepresentationofdifferentmodalities

fromdifferentencoders.Meanwhile,howtoadequatelyperforminter-modalfusiontominethe

associationinformationbetweentwomodalitiesisalsoaproblemfacedbycurrentmultimodal

named

您可能关注的文档

文档评论（0）

营销资料库 + 关注: 实名认证

文档贡献者

本账号发布文档部分来源于互联网，仅用于技术分享交流用，版权为原作者所有。 2，文档内容部分来自网络意见，与本账号立场无关。

咨询Ta 进入空间

1亿VIP精品文档

更多 >

面向社交媒体文本和图像的多模态命名实体识别研究.pdfVIP