多模态十大经典数据集合集及其应用场景_多模态处理场景.docxVIP

多模态十大经典数据集合集及其应用场景_多模态处理场景.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

1

COCO2017

发布方:

微软

发布时间:

2017-09-30

简介:

COCO是一个大规模的对象检测、分割和字幕数据集。COCO有几个特点:对象分割上下文中的识别超像素东西分割330K图像(200K标记)150万个对象实例80个对象类别91个东西类别每张图片5个字幕250,000人拥有关键点

下载地址:

/

2

VisualGenomeDatasetV1.2

发布方:

?斯坦福大学·德累斯顿工业大学·SnapchatInc.·雅虎

发布时间:

2016-08-29

简介:

视觉基因组是与图像和图像内容的语义信息相关的数据集。与ImageNet图像标注数据集相比,具有更丰富的语义信息,用于扩展基于图像和语义信息的人工智能应用。该数据集目前包含108,249张图像、420万个区域内容描述、170万个图像内容问答、210万个对象案例、180万个属性和180万个关系。该数据集于2015年由斯坦福大学首次发布,随后是2016年的1.2和2017年的1.4。

下载地址:

/api/v0/api_home.html

3

DoubanConversationCorpus

发布方:

北京航空航天大学·南开大学·MicrosoftResearch

发布时间:

2017

简介:

我们发布豆瓣会话语料库,包括一个训练数据集、一个开发集和一个基于检索的聊天机器人的测试集。豆瓣会话语料统计如下表所示。火车瓦尔测试会话响应对1m50k10k平均每个会话的积极响应111.18无情河童不适用不适用0.41每次会话的最小转数333每个会话的最大值989145每次会话的平均转数6.696.755.95每个话语的平均字数18.5618.5020.74测试数据包含1000个对话上下文,对于每个上下文,我们创建10个响应作为候选。我们招募了三名标注员来判断候选人是否对会议做出了适当的回应。正确的响应意味着响应可以自然地回复给定上下文的消息。每对收到三个标签,大部分标签被视为最终决定。据我们所知,这是第一个用于基于检索的聊天机器人的人工标记测试集。整个语料链接?/s/90t0qtji9ow20ca/DoubanConversaionCorpus.zip?dl=0?数据模板标签\t对话话语(由\t分割)\t响应该数据集于2015年由斯坦福大学首次发布,随后是2016年的1.2和2017年的1.4。

下载地址:/MarkWuNLP/MultiTurnResponseSelection

论文地址:

/pdf/1612.01627v2.pdf

4

COCO2014

发布方:

微软

发布时间:

2014

简介:

COCO是一个大规模的对象检测、分割和字幕数据集。COCO有几个特点:对象分割上下文中的识别超像素东西分割330K图像(200K标记)150万个对象实例80个对象类别91个东西类别每张图片5个字幕250,000人拥有关键点

下载地址:/

5

AIChallenger2017

发布方:

北京大学·中国科学院大学·创新工场·复旦大学数据科学学院

发布时间:

2017-09-26

简介:

一个名为AIC(AIChallenger)的大规模数据集,包含三个子数据集,人类关键点检测(HKD)、大规模属性数据集(LAD)和图像中文字幕(ICC)。在这个数据集中,我们标注了类标签(LAD)、关键点坐标(HKD)、边界框(HKD和LAD)、属性(LAD)和标题(ICC)。这些丰富的注释弥合了低级图像和高级概念之间的语义鸿沟。所提出的数据集是评估和改进不同计算方法的有效基准。此外,对于相关任务,其他人也可以使用我们的数据集作为新资源来预训练他们的模型。

下载地址:

/AIChallenger/AI_Challenger_2017

论文地址:

/pdf/1711.06475.pdf

6

TriviaQA

发布方:

华盛顿大学·艾伦人工智能研究所

发布时间:2017-01-01

简介:

TriviaQA是一个现实的基于文本的问答数据集,其中包括来自维基百科和网络的662K文档中的950K问答对。该数据集比斯坦福问答数据集(SQuAD)等标准QA基准数据集更具挑战性,因为问题的答案可能无法通过跨度预测直接获得,而且上下文很长。TriviaQA数据集由人工验证和机器生成的QA子集组成。

下载地址:

/triviaqa/

论文地址:

/pdf/1705.03551v2.pdf

7

StaQC

发布方:

华盛顿大学·俄亥俄州立大学·富士通

文档评论(0)

wszwtlg202 + 关注
实名认证
文档贡献者

一页纸且

1亿VIP精品文档

相关文档