- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
深度学习在图像中的应用主讲教师:XXX
目录CONTENT1图像识别基础2基于深度学习的大规模图像识别3应用举例:人脸识别4应用举例:图像风格化5应用举例:图像标注
1.图像识别基础1.人眼和计算机的图像识别过程
1.图像识别基础2.计算机对图像进行识别的难点
2.基于深度学习的大规模图像识别1.大规模图像数据库:ImagenetImageNet由美国斯坦福大学LiFei-fei教授的研究团队提出,是一个很大规模的数据库,包含超过一千五百万具有标签的高清图像,这些图像可以分成约两万两千个类别。这些图像均从网络中采集而得;并使用亚马逊的“土耳其机器人”众包工具,集广大网民的力量手工标注获得图像对应的标签。
2.基于深度学习的大规模图像识别2.AlexNet网络结构AlexNet总共包含8个学习层:前5层是卷积层,最后3层是全连接层。在这5个卷积层中,第1、2、5层后面有最大值池化(Maxpooling)层。
2.基于深度学习的大规模图像识别3.非线性激活函数ReLUAlexNet中,使用ReLU激活函数来替代Sigmoid激活函数。相比较于Sigmoid激活函数而言:(1)ReLU激活函数在大于0的部分梯度为常数,不会出现梯度弥散现象;(2)ReLU激活函数在小于0的部分梯度都为0,可以在一定程度上缓解过拟合现象的发生;(3)ReLU激活函数的导数计算非常简单快速
2.基于深度学习的大规模图像识别4.增加训练样本增加训练样本,又称为数据增强(dataaugmentation),通过对图像进行变换人为地扩大训练数据集。该方法是减少过拟合现象的一个最容易和最普遍的方法。常见数据增强方法:1、随机裁剪和水平翻转;2、颜色调整
2.基于深度学习的大规模图像识别5.dropout技术在网络训练期间,dropout技术相当于是对整体神经网络进行子采样。具体实现方法为:以50%的概率将神经网络中每一个隐层结点的输出设置为0,使之不参与前向传播和反向传播。
3.应用举例:人脸识别在自然场景中进行自动人脸识别的经典流程一般分为以下三个步骤:人脸检测(facerecognition)、人脸对齐(facealignment,又称作面部特征点对齐)、特征提取和分类器设计1.人脸识别的经典流程
3.应用举例:人脸识别LFW(LabeledFacesintheWild)数据库是自然场景环境下人脸识别问题的测试基准,是目前用得最多的自然场景人脸图像数据库。该数据库中的图像来源于因特网,采集的是自然场景环境下的人脸图像,目的是提高自然场景环境下人脸识别的准确率。这个数据库包含5749个人,共13233幅图像。2.人脸图像数据库
3.应用举例:人脸识别DeepFace方法的贡献主要包括两点:一是基于3D模型对人脸进行对齐;二是使用大数据训练深层的人工神经网络,得到具有判别性的人脸特征。3.基于深度学习的人脸识别方法
4.应用举例:图像风格化1.内容重构下图中所得到的五个内容重构结果分别基于VGG模型中的‘conv1_1’层(a),‘conv2_1’层(b),‘conv3_1’层(c),‘conv4_1’层(d)和‘conv5_1’层(e)。
4.应用举例:图像风格化2.风格重构通过计算卷积神经网络在某一层各特征图之间的相关性对图像的风格进行重构,可以得到一个相对应的风格表示图。为了生成与给定图的风格相匹配的纹理图像,Gatys等人首先初始化一个白噪声图像,接着使用梯度下降法来寻找与原图的风格表示相匹配的图像,得到在该层风格重构的生成图像。上页图中所得到的五个风格重构结果分别基于VGG模型中的‘conv1_1’层(a),‘conv1_1’和‘conv2_1’层(b),‘conv1_1’、‘conv2_1’和‘conv3_1’层(c),‘conv1_1’、‘conv2_1’、‘conv3_1’和‘conv4_1’层(d),‘conv1_1’、‘conv2_1’、‘conv3_1’、‘conv4_1’和‘conv5_1’层(e)对风格表示进行匹配而得。
4.应用举例:图像风格化3.内容与风格的重组下图中第A行显示的是与VGG模型中‘conv1_1’层风格重构相匹配的结果,第B行显示的是与VGG模型中‘conv1_1’和‘conv2_1’层风格重构相匹配的结果,第C行显示的是与VGG模型中‘conv1_1’、‘conv2_1’和‘conv3_1’层风格重构相匹配的结果,第D行显示的是与VGG模型中‘conv1_1’、‘conv2_1’、‘conv3_1’和‘conv4_1’层风格重构相匹配的
您可能关注的文档
- 商业计划书(BP)财务计划、风险控制、资本退出与附录的撰写秘籍.商业计划书(bp)财务计划、风险控制、资本退出与附录的撰写秘籍.ppt
- 商业计划书(BP)产品与服务的撰写秘籍.商业计划书(bp)产品与服务的撰写秘籍.ppt
- 商业计划书(BP)封面、摘要和公司介绍的撰写秘籍.商业计划书(bp)封面、摘要和公司介绍的撰写秘籍.ppt
- 商业计划书(BP)生产运营、公司管理的撰写秘籍.商业计划书(bp)生产运营、公司管理的撰写秘籍.ppt
- 商业计划书(BP)行业与市场的撰写秘籍.商业计划书(bp)行业与市场的撰写秘籍.ppt
- 射频技术的应用类型.射频技术的应用类型.ppt
- 射频技术概述.射频技术概述.ppt
原创力文档


文档评论(0)