第1章 1.2 深度学习与其他领域.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

深度学习与其他领域;;深度学习最早兴起于图像识别,但是在短短几年时间内,深度学习已经被推广到了机器学习的各个领域。

如今,深度学习在很多应用领域都有非常出色的表现,如计算机视觉、自然语言处理、语音识别等。

深度学习在其他领域的应用,使这些领域迎来了高速发展期。;计算机视觉是一门研究如何使机器“看”的科学,涉及计算机如何从数字图像或视频中获得高级理解。

形象地说,即通过给计算机安装上眼睛(照相机)和大脑(算法),让计算机能够感知环境。

以代替人眼对目标进行识别、跟踪和测量等操作,并对图像进行进一步的处理,使图像更适合人眼观察或传入仪器。

计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领域。

作为一门综合性的学科,计算机视觉已经吸引了来自各个学科的研究者参加到对它的研究之中。

其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学、神经生理学和认知科学等学科。

;计算机视觉是深度学习技术最早取得突破性成就的领域。

在2010年到2011年间,基于传统机器学习的算法并没有带来正确率(预测正确的样本数量占总样本数量的比例)的大幅度提升。

在2012年的ILSVRC比赛中,杰弗里·辛顿(GeoffreyHinton)教授研究小组利用深度学习技术在ImageNet数据集上将图像分类的错误率(预测错误的样本数量占总样本数量的比例)大幅度下降到16%。

在2012年到2015年间,通过对深度学习算法的不断研究,使深度学习在ImageNet数据集上实现图像分类的错误率以较大的速度递减。

这说明深度学习打破了传统机器学习算法在图像分类上的瓶颈,使得图像分类问题得到了更好的解决。

;在ImageNet数据集上,深度学习不仅突破了图像分类的技术瓶颈,同时也突破了物体识别的技术瓶颈。

相对于图像分类,物体识别的难度更高,图像分类问题只需判断图片中包含哪一种物体,但在物体识别问题中,需要给出所包含物体的具体位置。

而且一张图片中可能出现多个需要识别的物体,所有可以被识别的物体都需要用不同的方框标注出来。

在物体识别问题中,人脸识别是应用非常广泛的技术,它既可??应用于娱乐行业,又可以应用于安防、风控行业。

在娱乐行业中,基于人脸识别的相机自动对焦、自动美颜等功能基本已经成为每一款自拍软件的必备功能。;在安防、风控领域,人脸识别的应用更是大大地提高了工作效率并节省了人力成本。

例如,在互联网金融行业,为了控制贷款风险,在用户注册或贷款发放时需要验证本人信息。

个人信息验证中一个很重要的步骤是验证用户提供的证件和用户是否为同一个人,通过人脸识别技术,这个过程可以被更为高效地实现。

在计算机视觉领域,光学字符识别(OpticalCharacterRecognition,OCR)也较早地使用了深度学习。

早在1989年,卷积神经网络就已经成功应用到识别手写邮政编码的问题上,达到接近95%的正确率。

在MNIST手写体数字识别数据集上,最新的深度学习算法可以达到99.77%的正确率,这也超过了人类的表现。

;光学字符识别在金融界的应用十分广泛,在21世纪初期,杨立昆(YannLeCun)教授将基于卷积神经网络的手写体数字识别系统应用于银行支票的数额识别。

此系统在2000年左右已经处理了某国全部支票数量的10%~20%。

数字识别技术也可以应用到地图的开发中,某公司实现的数字识别系统可以从街景图中识别任意长度的数字,并在SVHN数据集上达到96%的正确率。

除此之外,文字识别技术可以将扫描的图书数字化,从而实现图书内容的搜索功能。

;;深度学习自然语言处理(NaturalLanguageProcessing,NLP)是人工智能和语言学领域的分支学科。

自然语言处理包含机器理解、解释和生成人类语言的方法,因此,也将它描述为自然语言理解(NaturalLanguageUnderstanding,NLU)和自然语言生成(NaturalLanguageGeneration,NLG)。

传统的NLP方法采用基于语言学的方法,它基于语言的基本语义和句法元素(如词性)构建。

基于深度学习的自然语言处理避开了对中间元素的需求,并且可以针对通用任务学习该任务本身的层次表示。

1966年自动语言处理咨询委员会的报告强调了机器翻译从流程到实施成本面临的巨大困难,导致投资方减少了在资金方面的投资,使得NLP的研究几乎停滞。;1960年到1970年的十年是世界知识研究的一个重要时期,该时期强调语义而非句法结构,探索名词和动词之间的语法在这个时代扮演着重要的角色。

1960年到1970年的十年期间出现了处理诸如短语的增强过渡网络,以及以自然语言回答的语言处理系统SHRDLU。

随后又出现了LUNAR系统,即一个将自然语言理解与基于逻辑的系统相结合的问

文档评论(0)

学海无涯而人有崖 + 关注
实名认证
文档贡献者

教师资格证、人力资源管理师持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年06月11日上传了教师资格证、人力资源管理师

1亿VIP精品文档

相关文档