- 1、本文档共77页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
华中科技大学硕士学位论文
摘要
随着互联网技术的飞速发展,社交媒体中出现了越来越多的多模态数据。这些多
模态数据包含文本、图像和视频等大量有用信息,在情感分类、个性化推荐和舆情监
控等方面都具有极其重要的作用。本文旨在研究基于多模态融合的社交媒体图文分
类算法,并从张量特征融合和神经网络特征融合这两个角度来研究,提出两种粗粒度
的图文多模态分类模型:
(1)针对基于向量拼接的多模态分类模型的低效性和主流多模态分类模型忽略
单模态信息等问题,本文提出一种基于紧凑双线性池化和多重损失的多模态分类模
型。该模型使用紧凑双线性池化进行多模态融合,并在模型的训练阶段引入多重损失
函数,以增强模型对单模态信息的处理能力。在两个公开多模态数据集上,该模型在
仅使用粗粒度信息和具有更低模型复杂度的情况下,达到细粒度模型的最优结果。
(2)针对预训练模型的多层次编码信息利用不充分和多模态融合模块复杂度高
等问题,本文提出一种基于门控多模态单元和多层次编码的多模态分类模型。该模型
联合建模数据的多模态信息和多层次信息,使用预训练模型进行单模态特征提取,并
保存特征表示的多层次编码信息,且使用门控多模态单元进行模态间和层次间的特
征融合。在两个公开多模态数据集上,该模型在仅使用粗粒度信息和具有更低模型复
杂度的情况下,取得了比细粒度模型更优的结果,在两个数据集的准确率上分别提升
0.96%和1.14%。
由于细粒度信息需要额外的标注成本,本文提出的粗粒度多模态分类模型的应
用场景更加广泛。为了验证本文提出的模型的有效性和泛化性,本文构建了实验室私
有的粗粒度多模态数据集AIFUN,并在本文提出的两种多模态分类模型以及主流模
型上进行对比实验。实验结果表明,本文提出的两种多模态分类模型在各项性能指标
上均优于主流模型,并且基于神经网络特征融合的多模态模型的分类效果要优于基
于张量特征融合的多模态模型,在准确率上达到最优结果88.26%。
关键词:多模态分类;社交媒体;多模态融合;双线性池化;门控多模态单元
I
华中科技大学硕士学位论文
Abstract
WiththerapiddevelopmentofInternettechnology,moreandmoremultimodaldata
appearinsocialmedia.Thesemultimodaldatacontainrichusefulinformationsuchastexts,
images,andvideos,andplaythecrucialroleinsentimentanalysis,personalized
recommendation,andpublicopinionmonitoring.Thetopicofthisthesisistheclassification
algorithmofimagesandtextsinsocialmediabasedonthemultimodalfusion.Wepropose
twocoarse-grainedmultimodalclassificationmodelsbasedontensorfeaturefusionand
neuralnetworkfeaturefusion:
(1)Aimingattheinefficiencyofthemultimodalclassificationmodelbasedonvector
concatenationandthedisregardofsingle-modalinformationbythemultimodal
classificationmodel,weproposeamultimodalclassificationmodelbasedonthecompa
您可能关注的文档
- 混合式教学法在中职旅游专业课教学中的应用研究.pdf
- 活动星系核的伽玛射线辐射和伽玛射线耀发统计性质研究.pdf
- 活化过硫酸钠氧化对土壤不同团聚体中PAHs去除效果研究.pdf
- 活性表达可调制的铁基纳米酶的开发及生物医学应用.pdf
- 活性炭负载Fe3O4的制备及其处理乳液废水性能研究.pdf
- 积极老龄化视角下老年人就业权的法治保障.pdf
- 积极心理健康课程提升高中生心盛的效果研究.pdf
- 基层部门预算管理一体化优化研究—以Y税务分局为例.pdf
- 基层税务机关纳税服务优化研究——以G市税务局为例.pdf
- 基层税务机关纳税服务优化研究—以H市(县级市)税务局为例.pdf
- 2025年湖北三环专用汽车有限公司校园招聘模拟试题附带答案详解新版.docx
- 急性会厌炎患者的护理.pptx
- 2025年湖北三环专用汽车有限公司校园招聘模拟试题附带答案详解汇编.docx
- 2025年广东省乐昌市事业单位考试(中小学教师类D类)职业能力倾向测验试卷参考答案.docx
- 2025年湖北三环股份有限公司校园招聘85人公开引进高层次人才和急需紧缺人才笔试参考题库答案详解版参.docx
- 脑血管病的介入治疗术前评估及围手术期用药课件.pptx
- 2025年河北省河间市事业单位考试(中小学教师类D类)职业能力倾向测验试卷学生专用.docx
- 2025年河南省巩义市事业单位公开招聘考试职业能力倾向测验(D类)(中小学教师类)真题附答案.docx
- 吉林省德惠市事业单位公开招聘考试职业能力倾向测验(D类)(中小学教师类)真题一套.docx
- 2025年河南省林州市事业单位公开招聘考试职业能力倾向测验(D类)(中小学教师类)真题及参考答案.docx
文档评论(0)