使用深度学习的图像分类-Koko.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
使用深度学习的图像分类-Koko

使用深度学 习的图像分类 TEAM: 3SIGMA MEMBER: Yuting Kou Yicheng Li Haodong Duan 问题综述 ● 1887张图片,分为19类别 ● 每一类别数量从30+张至170张不等 ● 数据集中的一些图片: 尝试一:多层感知机 尝试一:多层感知机 ● 多层感知机原理上课 已经介绍过,不再赘述 ● 在将多层感知机应用于此问题的过程中,我们将每一张图片先处理为灰度图像, 再将大小resize成为64X64,最后将这一二维矩阵flatten成4096维的向量作为感 知机输入 ● 我们选取的网络结构为两层网络,中间层单元数量为200,输出层单元数量为19 (即为分类数量),中间层的激活函数选择RELU,输出层选择Softmax (即直接对 应分类结果),我们在训练时还使用了dropout的策略,即在中间层随机扔掉一部 分结果,以避免产生过拟合。 尝试一:多层感知机 ● resize后的灰度图像: 即使人类 也不易分 辨 goldfish firework 尝试一:多层感知机 ● 结果:使用此方法时,我们设定参数batch-size=128,优化器为 AdagradOptimizor (可以随迭代次数增大自适应地降低学 习率)。learning rate=0.0001,drop-out=0.75。最终,测试集准确率大致为40%。因为这一准确率 过低,所以我们更改了方法,并未将此方法应用于全部training-CV对。 ● 这一方法存在两点主要缺陷:一是参数量过大,若输入图片大小稍大,或者中间 层或单元数量比较 多,将会带来参数量大量增长,给计算带来很大负担。因此, 我们不得不缩减输入和中间层大小,而这样又自然会损失大量信息。另外一方面 ,这种方式直接将二维的图片压缩为一维,这意味着我们损失了图片之中的位置 信息,这一点也对效果产生了影响。 尝试二:卷积神经网络 ● 简介: ● 卷积神经网络通过卷积、激活、池化等一系列操作,提取图像特征并由此进行分 类。相对于上文所提及的多层感知机,它在多层感知机的两个缺陷上都得到了提 高:中间层的每一个feature map仅仅需要一个卷积核作为参数,一般使用的卷 积核大小仅为3X3,即9个参数,因此整个网络的参数数量大大削减。另外一方面 ,由于卷积相当于对一片图像上的小区域进行了特征提取。因此,也使用到了图 像的位置信息。在大部分数据集上,卷积神经网络都有着较 多层感知机方法更好 地效果。 尝试二:卷积神经网络 ● 我们选取的网络结构为ResNet。这一神经网络的结构于15年 ● 这一结构的优点在于他将网络较 被提出,当年在 图像相关的各 项任务上都取得了极佳的成 前层的结果使用了一个增加的通 绩。其最大的优点来源于一残差 单元的结构 道,原样传播到了网络较后层。这 相当于一个不求有功,但求无 过的 做法。采用 这样的网络结构,层数 的加深至少不会 让训练的结果变 得更差(本来情况下, 较深的网络

文档评论(0)

sunhongz + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档