多模态数据融合与检索技术-多模态学习.pptxVIP

多模态数据融合与检索技术-多模态学习.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

多模态学习

主要内容

2.1多模态数据概述

2.2多模态学习

2.3多模态数据融合与检索技术

2.1多模态数据概述

2.1.1异构多模态数据

2.1.2异源多模态数据

2.1.1异构多模态数据

■异构多模态数据:由不同的媒介产生的模态数据,包括文字、图像、

照片、声音、动画和影片。

□文本

□图像中文名狗

外文名dog

□动画别名犬

图像拉丁学名Canislupusfamiliaris

□声音界动物界

□视频

文字

媒介

视频

音频

▶01:04

2.1多模态数据概述

2.1.1异构多模态数据

2.1.2异源多模态数据

2.1.2异源多模态数据

■异源多模态数据:来自不同传感器的同一类媒介产生的数据。

□红外图像

□合成孔径雷达(SAR)图像

□超声诊断图像(B超)

□计算机断层扫描图像(CT)

红外图像

CT图像

传感器

SAR图像

B超图像

主要内容

2.1多模态数据概述

2.2多模态学习

2.3多模态数据融合与检索技术

2.2多模态学习

2.2.1多模态学习分类概述

2.2.2多模态学习研究进展

2.2.3多模态学习实际应用

2.2.4多模态学习研究展望

2.2.1多模态学习分类概述

■多模态学习:多模态数据的挖掘分析过程可被理解为“多模态学

习”,目的是建立一个能处理和关联多种模态信息的模型,有效的

“多模态学习”可获得更丰富的语义信息,进而提升待表示事物的整

体性能。

□基于模型的多模态学习:表示学习与协同学习

□基于任务的多模态学习:转化任务,融合任务,检索任务。

1970-2010

传统多模态学习前沿多模态学习

2.2.1多模态学习分类概述

■多模态表示学习(MultimodalRepresentation):通过利用多模态

之间的互补性和关联性,剔除模态间的冗余性,从而为每个模态提取

最具有判别性的特征表示,以帮助它们学习到更好的特征表示,并最

终表示和汇总成多模式数据。包括两大研究方向:联合表示学习与协

同表示学习。

联合表示协同表示

表示表示1表示2

模态1模态2模态1模态2

2.2.1多模态学习分类概述

■联合表示学习(JointRepresentations):将多个单模态投影到一

个共享的子空间。以便能够融合多个模态的特征,形成一个多模态向

量空间。

输入图像生成文本输入文本生成图像

夜晚,海上,雪景,自然,

灯塔,红色,黄昏,树,

光亮白色

文档评论(0)

178****8896 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档