9 自监督学习OpenAI科学家一文详解自监督学习.docxVIP

下载本文档

12
0
约3.39千字
约 10页
2021-07-17 发布于湖南
举报
版权申诉

9 自监督学习OpenAI科学家一文详解自监督学习.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

【自监督学习】OpenAI科学家一文详解自监督学习 2020-03-19 原文新智元 ??新智元报道?? 来源：kguttag 编辑：张佳、鹏飞【新智元导读】本文中，OpenAI机器人科学家引见了自监督学习。自监督学习为以监督学习供应了巨大的机会，可以更好地利用未标记数据。这篇文章涵盖了关于图像，视频和把握问题的自我监督学习任务的很多好玩的想法。自监督学习为监督学习方式供应了巨大的机会，可以更好地利用未标记的数据。这篇文章涵盖了关于图像、视频和把握问题的自监督学习任务的很多好玩想法。对于给定任务，使用足够的数据标签，监督学习可以很好地处理问题。要想实现良好的功能，通常需要相当数量的数据标记，但是收集手工标记数据的成本很高（如ImageNet），并且难以扩展。考虑到未标记的数据量（例如，免费文本，网上的全部图像）远远超过了数量无限的人类标记的数据集，对这些数据弃置不用是一种很大的铺张。但是，无监督学习并不简约，并且通常比监督学习效率低得多。假如我们可以免费获得未标记数据，并以监督方式训练无监督数据集，该当如何做？可以通过一种特殊的形式来支配有监督的学习任务，使其仅依靠剩余的信息来猜测一部分信息，从而实现训练目标。这就是所谓的自监督学习。为什么要进行自监督学习？自监督学习使我们能够免费利用数据附带的各种标签。用洁净的标签生产数据集很昂贵，但未标记的数据却无时无刻不在产生。为了利用大量的未标记数据，一种方法是正确设置学习目标，以便从数据本身获得监督。提到自监督任务（也称为pretext任务）就要提到监督损失函数。但是，我们通常不关怀任务的最终执行情况；而只对学习的两头表示感爱好，我们期望这些两头表示可以涵盖良好的语义或结构含义，并且能够无益于各种下游的实际任务。广义上讲，全部生成模型都可以被认为是自监督的，只不过目标不同：生成模型侧重于创建各种逼真的图像，而自监督的表示学习的侧重点是如何产生对多个任务有用的良好特征。基于图像的自监督表示学习对于图像的自监督表示学习，已经提出了很多想法。常见的工作流程是在一个或多个带有未标记图像的pretext任务上训练模型，然后使用该模型的一个两头特征层，为ImageNet分类供应多项规律回归分类器。最近，一些争辩人员提议在标记数据上训练监督学习，在未标记数据上使用共享权重，并同时训练自监督的pretext任务。失真我们期望图像上的稍微失真不会转变其原始语义或几何形式。带有稍微失真的图像可以认为与原始图像相同，因此估计学习到的特征并不会失真。使用Exemplar-CNN创建带有未标记图像补丁的替代训练数据集。上图：一只可爱的鹿的原始补丁在左上角。使用随机变换，导致各种失真的补丁。在pretext任务中，全部这些都应归为同一类旋转整个图像是另一种好玩且低成本的方法，可在语义内容保持不变的情况下修改输入图像。每个输入图像首先随机旋转90度的倍数，分别对应于[0°，90°，180°，270°]。模型经过训练可以猜测使用了哪种旋转角度，从而得出4类分类问题。为了识别旋转了不同角度的同一图像，模型必需学会识别高级对象部分，如头部，鼻子和眼睛，以及这些部分的相对位置，让使模型以这种方式学习对象的语义概念。补丁? 其次类自监督学习任务从一张图像中提取多个补丁，并要求模型猜测这些补丁之间的关系。除了诸如边界图案或纹理之类的琐碎信号不断消灭之外，还发觉了另一个好玩且琐碎的处理方案，称为“色差”。它是由穿过透镜的不同波长的光的不同焦距触发的。在此过程中，颜色通道之间可能存在微小偏移。? 因此，该模型可以通过简约比较绿色和品红色在两个不同色块中的区分方式，来学习辨别相对位置。这是一个简约的处理方案，与图像内容无关。另一个想法是将“功能”或“视觉图元”视为一个标量值属性，可以对多个补丁进行汇总，并在不同补丁之间进行比较。然后通过计算特征和简约的算术来定义补丁之间的关系。着色着色可以用来完成强大的自监督任务：训练模型以对灰度输入图像进行着色；精确?????的任务是，将该图像映射到量化的颜色值输出上的分布。为了在常见颜色和可能与图像中的关键对象相关联的稀有颜色之间取得平衡，可以通过权重项对损失函数进行重新平衡。生成建模生成建模的pretext任务是在学习有意义的潜在表示的同时重建原始输入。去噪自动编码器的任务是学习从部分损坏或带随机噪声的图像中恢复原图像。该设计的灵感源于这样一个现实：即便有噪声，人类也可以轻松识别图片中的对象，这表明，算法可以提取关键的视觉特征，并将其与噪声分别。生成对抗网络（GAN）能够学习从简约的潜在变量映射到任意简单的数据分布。争辩表明，此类生成模型的潜在空间可以捕获数据中的语义变化；比如在人脸上训练GAN模型时，一些潜在变量与面部表情，