多模态十大经典数据集合集及其应用场景_多模态处理场景.docxVIP

下载本文档

0
0
约2.98千字
约 7页
2025-10-31 发布于北京
举报
版权申诉

多模态十大经典数据集合集及其应用场景_多模态处理场景.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

COCO2017

发布方：

微软

发布时间：

2017-09-30

简介：

COCO是一个大规模的对象检测、分割和字幕数据集。COCO有几个特点：对象分割上下文中的识别超像素东西分割330K图像（200K标记）150万个对象实例80个对象类别91个东西类别每张图片5个字幕250,000人拥有关键点

下载地址：

VisualGenomeDatasetV1.2

发布方：

?斯坦福大学·德累斯顿工业大学·SnapchatInc.·雅虎

发布时间：

2016-08-29

简介：

视觉基因组是与图像和图像内容的语义信息相关的数据集。与ImageNet图像标注数据集相比，具有更丰富的语义信息，用于扩展基于图像和语义信息的人工智能应用。该数据集目前包含108,249张图像、420万个区域内容描述、170万个图像内容问答、210万个对象案例、180万个属性和180万个关系。该数据集于2015年由斯坦福大学首次发布，随后是2016年的1.2和2017年的1.4。

下载地址：

/api/v0/api_home.html

DoubanConversationCorpus

发布方：

北京航空航天大学·南开大学·MicrosoftResearch

发布时间：

2017

简介：

我们发布豆瓣会话语料库，包括一个训练数据集、一个开发集和一个基于检索的聊天机器人的测试集。豆瓣会话语料统计如下表所示。火车瓦尔测试会话响应对1m50k10k平均每个会话的积极响应111.18无情河童不适用不适用0.41每次会话的最小转数333每个会话的最大值989145每次会话的平均转数6.696.755.95每个话语的平均字数18.5618.5020.74测试数据包含1000个对话上下文，对于每个上下文，我们创建10个响应作为候选。我们招募了三名标注员来判断候选人是否对会议做出了适当的回应。正确的响应意味着响应可以自然地回复给定上下文的消息。每对收到三个标签，大部分标签被视为最终决定。据我们所知，这是第一个用于基于检索的聊天机器人的人工标记测试集。整个语料链接?/s/90t0qtji9ow20ca/DoubanConversaionCorpus.zip?dl=0?数据模板标签\t对话话语（由\t分割）\t响应该数据集于2015年由斯坦福大学首次发布，随后是2016年的1.2和2017年的1.4。

下载地址：/MarkWuNLP/MultiTurnResponseSelection

论文地址：

/pdf/1612.01627v2.pdf

COCO2014

发布方：

微软

发布时间：

2014

简介：

下载地址：/

AIChallenger2017

发布方：

北京大学·中国科学院大学·创新工场·复旦大学数据科学学院

发布时间：

2017-09-26

简介：

一个名为AIC（AIChallenger）的大规模数据集，包含三个子数据集，人类关键点检测（HKD）、大规模属性数据集（LAD）和图像中文字幕（ICC）。在这个数据集中，我们标注了类标签（LAD）、关键点坐标（HKD）、边界框（HKD和LAD）、属性（LAD）和标题（ICC）。这些丰富的注释弥合了低级图像和高级概念之间的语义鸿沟。所提出的数据集是评估和改进不同计算方法的有效基准。此外，对于相关任务，其他人也可以使用我们的数据集作为新资源来预训练他们的模型。

下载地址：

/AIChallenger/AI_Challenger_2017

论文地址：

/pdf/1711.06475.pdf

TriviaQA

发布方：

华盛顿大学·艾伦人工智能研究所

发布时间：2017-01-01

简介：

TriviaQA是一个现实的基于文本的问答数据集，其中包括来自维基百科和网络的662K文档中的950K问答对。该数据集比斯坦福问答数据集（SQuAD）等标准QA基准数据集更具挑战性，因为问题的答案可能无法通过跨度预测直接获得，而且上下文很长。TriviaQA数据集由人工验证和机器生成的QA子集组成。

下载地址：

/triviaqa/

论文地址：

/pdf/1705.03551v2.pdf

StaQC

发布方：

华盛顿大学·俄亥俄州立大学·富士通

您可能关注的文档

文档评论（0）

wszwtlg202 + 关注: 实名认证

文档贡献者

一页纸且

咨询Ta 进入空间

1亿VIP精品文档

更多 >

多模态十大经典数据集合集及其应用场景_多模态处理场景.docxVIP