Keras与深度学习实战.pptxVIP

  1. 1、本文档共473页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

深度学习简介;;深度学习目前在很多领域的表现都优于过去的方法,在图像分类与识别、语音识别与合成、人脸识别、视频分类与行为识别等领域都有着不俗的表现。

除此以外,深度学习还涉及到与生活相关的纹理识别、行人检测、场景标记、门牌识别等领域。

人脸识别采用深度学习方法后的识别率超过了目前非深度学习算法以及人类的识别率。

深度学习技术在语音识别领域更是取得了突破性的进展,在大规模图像分类问题上也远超传统方法。

;2006年,杰弗里·辛顿(GeoffreyHinton)等人在顶尖学术刊物《科学》上发表了一篇文章,该文章提出了深层网络训练中梯度消失问题的解决方案。

首先使用无监督预训练对权值进行初始化。

然后使用有监督训练微调权值。

在2012年,拥有8层网络的深层神经网络AlexNet在图片识别竞赛中取得了优异的成绩,展现了深层神经网络强大的学习能力。

此后数十层、数百层、甚至上千层的深度神经网络模型被相继提出。

神经网络和深度学习并没有本质上的区别,通常将利用深层神经网络实现的算法称为深度学习,可以认为深度学习是深层神经网络的一个代名词。

;深度学习特指基于深层神经网络实现的模型或算法,其核心在于自动地将简单的特征组合成更加复杂的特征,并使用这些组合特征解决问题。

深度学习是机器学习的一个分支,它除了可以学习特征和任务之间的关联之外,还能自动从简单特征中提取更加复杂的特征。

虽然深度学习研发的初始受到了很多大脑工作原理的启发,但是现代深度学习的发展并不拘泥于模拟人脑神经元和人脑的工作机制。

现代的深度学习已经超越了神经科学观点,它可以更广泛地适用于各种并不是由神经网络启发而来的机器学习框架。

;;深度学习在图像分类、图像分割、图像生成、图像标题生成(图像理解)、图像风格变换、物体检测、物体测量等方面被应用。

以及物体分拣、视觉定位、情感分析、无人驾驶、机器翻译、文本到语音转换、手写文字转录、智能问答系统等方面均有应用。

这些深度学习的应用与日常生活也是息息相关,如手机中的语音助手、汽车上的智能辅助驾驶、人脸支付??。

;图像分类的核心是从给定的分类集合中,给图像分配一个标签的任务。

实际上,图像分类是分析一个输入图像并返回一个将图像分类的标签。

标签总是来自预定义的可能类别集。

利用深度学习算法可以实现对猫的图像进行分类,如右图。

;图像分割就是将图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程,它是由图像处理到图像分析的关键步骤,现有的图像分割方法主要分为4类:

基于阈值的分割方法。

基于区域的分割方法。

基于边缘的分割方法。

基于特定理论的分割方法。;从数学角度来看,图像分割是将数字图像划分成互不相交的区域的过程。

图像分割的过程也是一个标记过程,即把属于同一区域的像素赋予相同的编号。

对街道车辆图像进行分割的结果,如下图。;有一种新的研究,能实现在生成图像的过程中不需要另外输入任何图像,只要前期使用大量的真实图像让网络进行学习,即可由网络自动生成新的图像。

目前常见的生成模型有VAE系列、GAN系列等。

其中GAN系列算法近年来取得了巨大的进展,最新GAN模型产生的图片效果达到了肉眼难辨真伪的程度。

如计算机提供的真实图像与计算机根据真实图像生成的假图像对比。;左图是为计算机提供的真实图像。

右图为计算机根据真实图像生成的假图像。;神经图像标题(NeuralImageCaption,NIC)模型会自动生成介绍输入图像的文字,该模型由深层的卷积神经网络和自然语言语言处理的循环神经网络(RecurrentNeuralNetwork,RNN)构成。

卷积神经网络提取图像特征,RNN生成文本。;输入下图所示的原图像可以生成诸如。

“一个男人和一个女孩坐在地上吃”

“一个男人和一个小女孩正坐在人行道上吃,附近一个蓝色的袋子”

“一个男人穿着一件黑色的衬衫和一个穿着橙色礼服的小女孩分享一种享受”等标题。

;图像风格的变换是利用了卷积神经网络可以提取高层特征的效果,不在像素级别进行损失函数的计算,而是将原图像和生成图像都输入至一个已经训练好的神经网络里。

在得到的某种特征表示上计算欧式距离(内容损失函数)。

这样得到的图像与原图内容相似,但像素级别不一定相似,且所得图像更具鲁棒性。

输入两个图像,计算机会生成一个新的图像。;两个输入图像中,一个称为“内容图像”,如左图所示。

另外一个称为“风格图像”,如右图所示。

;如果将梵高的绘画风格应用于内容图像上,那么深度学习会按照要求绘制出新风格,其输出图像如下图。;物体检测就是从图像中确定物体的位置,并对物体进行分类。

根据骑行图像对骑行者进行检测,如下图。;物体检测是机器视觉领域最主要的应用之一,例如,汽车违规行驶的检测会为了保障行车、行人的安全在路口安装交通检测系统,

文档评论(0)

139****1983 + 关注
实名认证
文档贡献者

副教授、一级建造师持证人

一线教师。

领域认证该用户于2023年06月21日上传了副教授、一级建造师

1亿VIP精品文档

相关文档