- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
1
COCO2017
发布方:
微软
发布时间:
2017-09-30
简介:
COCO是一个大规模的对象检测、分割和字幕数据集。COCO有几个特点:对象分割上下文中的识别超像素东西分割330K图像(200K标记)150万个对象实例80个对象类别91个东西类别每张图片5个字幕250,000人拥有关键点
下载地址:
/
2
VisualGenomeDatasetV1.2
发布方:
?斯坦福大学·德累斯顿工业大学·SnapchatInc.·雅虎
发布时间:
2016-08-29
简介:
视觉基因组是与图像和图像内容的语义信息相关的数据集。与ImageNet图像标注数据集相比,具有更丰富的语义信息,用于扩展基于图像和语义信息的人工智能应用。该数据集目前包含108,249张图像、420万个区域内容描述、170万个图像内容问答、210万个对象案例、180万个属性和180万个关系。该数据集于2015年由斯坦福大学首次发布,随后是2016年的1.2和2017年的1.4。
下载地址:
/api/v0/api_home.html
3
DoubanConversationCorpus
发布方:
北京航空航天大学·南开大学·MicrosoftResearch
发布时间:
2017
简介:
我们发布豆瓣会话语料库,包括一个训练数据集、一个开发集和一个基于检索的聊天机器人的测试集。豆瓣会话语料统计如下表所示。火车瓦尔测试会话响应对1m50k10k平均每个会话的积极响应111.18无情河童不适用不适用0.41每次会话的最小转数333每个会话的最大值989145每次会话的平均转数6.696.755.95每个话语的平均字数18.5618.5020.74测试数据包含1000个对话上下文,对于每个上下文,我们创建10个响应作为候选。我们招募了三名标注员来判断候选人是否对会议做出了适当的回应。正确的响应意味着响应可以自然地回复给定上下文的消息。每对收到三个标签,大部分标签被视为最终决定。据我们所知,这是第一个用于基于检索的聊天机器人的人工标记测试集。整个语料链接?/s/90t0qtji9ow20ca/DoubanConversaionCorpus.zip?dl=0?数据模板标签\t对话话语(由\t分割)\t响应该数据集于2015年由斯坦福大学首次发布,随后是2016年的1.2和2017年的1.4。
下载地址:/MarkWuNLP/MultiTurnResponseSelection
论文地址:
/pdf/1612.01627v2.pdf
4
COCO2014
发布方:
微软
发布时间:
2014
简介:
COCO是一个大规模的对象检测、分割和字幕数据集。COCO有几个特点:对象分割上下文中的识别超像素东西分割330K图像(200K标记)150万个对象实例80个对象类别91个东西类别每张图片5个字幕250,000人拥有关键点
下载地址:/
5
AIChallenger2017
发布方:
北京大学·中国科学院大学·创新工场·复旦大学数据科学学院
发布时间:
2017-09-26
简介:
一个名为AIC(AIChallenger)的大规模数据集,包含三个子数据集,人类关键点检测(HKD)、大规模属性数据集(LAD)和图像中文字幕(ICC)。在这个数据集中,我们标注了类标签(LAD)、关键点坐标(HKD)、边界框(HKD和LAD)、属性(LAD)和标题(ICC)。这些丰富的注释弥合了低级图像和高级概念之间的语义鸿沟。所提出的数据集是评估和改进不同计算方法的有效基准。此外,对于相关任务,其他人也可以使用我们的数据集作为新资源来预训练他们的模型。
下载地址:
/AIChallenger/AI_Challenger_2017
论文地址:
/pdf/1711.06475.pdf
6
TriviaQA
发布方:
华盛顿大学·艾伦人工智能研究所
发布时间:2017-01-01
简介:
TriviaQA是一个现实的基于文本的问答数据集,其中包括来自维基百科和网络的662K文档中的950K问答对。该数据集比斯坦福问答数据集(SQuAD)等标准QA基准数据集更具挑战性,因为问题的答案可能无法通过跨度预测直接获得,而且上下文很长。TriviaQA数据集由人工验证和机器生成的QA子集组成。
下载地址:
/triviaqa/
论文地址:
/pdf/1705.03551v2.pdf
7
StaQC
发布方:
华盛顿大学·俄亥俄州立大学·富士通
原创力文档


文档评论(0)