- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器学习
机器学习
第12章高级深度学习
第12章高级深度学习
章节介绍
• 最近几年深度学习领域技术发展较快,出现了大量网络层数大,参数多,应用广
泛地深度神经网络,在图像识别,文本翻译等方面涌现了很多较新地扩展架构
虽然这些新地架构与深度学习地基础应用并没有明显地区分界限,了解这些
技术与应用有助于把握机器学习地未来发展方向。本章主要介绍卷积神经
网络中地目地检测与追踪, 目地分割,并介绍注意力模型及其在自然语言方面
地应用,然后对无监督学习下地生成模型与生成对抗网络地理论及应用进行
说明。
章节结构
• 高级卷积神经网络
• 目地检测与追踪
• 目地分割
• 高级循环神经网络应用
• Encoder-Decoder模型
• 注意力模型
• LSTM高级应用
• 无监督式深度学习
• 深度信念网络
• 生成对抗网络模型
• 强化学习
• 迁移学习
• 对偶学习
高级卷积神经网络
• 目地识别是一个基于分类地识别问题,在给定数据中,找出哪一些样本是目
地分类。图片作为数据分类时是以给定地图片作为单位对图像进行处理,而
非像素。图像分类是根据图像地语义信息将不同类别图像区分开来,是计算
机视觉中重要地基本问题,图像分类在很多领域有广泛应用,包括人脸识别,
智能视频分析, 自动驾驶,基于内容地图像检索与相册自动归类等。本节包
括目地检测与追踪, 目地分割与有关框架地介绍。
目地检测与追踪
议程
目地检测是将目地从图像中提取出来。运动目地检测是从不断变化地序列图像
中进行目地检测,分为静态背景下地运动检测与动态背景下地运动检测。在运
动目地跟踪问题地研究上,有两种主要地思路:一种依赖于目地地先验知识,需
要提前为运动目地建模,然后在图像序列中实时找到匹配地目地,另一种不依赖
于先验知识,直接从图像序列中检测到运动目地,并进行目地识别,最终跟踪感
兴趣地运动目地。在目地检测与追踪需要注意运动目地地表示,例如对其视觉
特征进行建模,并采用相似性度量来对帧图像进行匹配,在追踪过程中需要处理
大量冗余信息,采用搜索算法缩小比较范围。目前跟踪分类主要基于主动轮廓
地跟踪,基于特征,区域,模型地跟踪等。
目地检测与追踪
议程
传统地目地检测一般使用滑动窗口地框架,主要包括以下三个步骤:
利用不同尺寸地滑动窗口框住图中地某一部分作为候选区域。
提取候选区域有关地视觉特征。例如人脸检测常用地Harr特征;行人检测与普通
目地检测常用地HOG特征。
利用分类器进行识别。
交集并集比
议程
• 物体检测是通过IoU来进行精准度评价地。使用两个区域地交集区域处以两
个区域地并集区域,如下图所示。一般IoU地值越大,表示物体预测越准确。
mAP
议程
mAP是目地检测中度量识别精度地指标。多个类别物体检测中,每一个类别都可
以根据查全率与查准率绘制一条P-R曲线,横坐标为查全率,纵坐标为查准率,AP就
是该曲线下地面积,mAP是多个类别AP地平均值。计算公式如下。Q表示目地检
测地类别集合,ᵃᵆᵅᵄ (ᵅ )是计算类别下物体地平均准确率。mAP地取值范围在
[0,1]之间。
感兴趣区域
议程
感兴趣区域是目地检测地一个概念,表示系统感兴趣地区域,在Fast-RN等模型中
都有ROI处理地模块,ROI区域地提取能够在消除一些噪声地同时减少后续图像
处理地数据量,是较常用地方法。
非极大值抑制
议程
非极大值抑制是抑制那些非极大值地框,找出最佳地检测物体。从一张图片中
找出多个可能是物体地矩形框,并计算每个矩形框地置信度分值。
将所有框地得分排序,选中最高分及其对应地框,记为B1。
遍历其余地框Bi,如果与B1地重叠面积大于一定阈值,就将Bi删除,这个操作就是
抑制最大重叠区域。
选择第二高置信度地框,重复上述过程。
选择性搜索
议程
选择性搜索地方法综合了蛮力搜索与分割地方法。目地是找出可能地目地位置
来进行物体识别,与传统地单一策略相比,选择性搜索提供了多种策略,并且与
蛮力搜索相比,大幅度降低搜索空间。选择性搜索使用分层分组,将特征按照区
域划分,得到一些小地初始区域,计算区域间相似度,使用贪婪算法对区域进行
迭代分组,将相似度高地区域进行合并。为了提高性能,综合采用颜色相似度,
纹理相似度,尺寸相似度与填充相似度等多种策略加权求与。
R-N
议程
R-N是基于区域地卷积神经网络,是一种
原创力文档


文档评论(0)