机器学习第2版深度学习目标检测与识别.ppt

下载文档

1
0
约1.8万字
约 98页
2023-09-25 发布于江苏
举报
版权申诉
保障服务

机器学习第2版深度学习目标检测与识别.ppt

1、本文档共98页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

分类层（cls_score）输出每一个位置上，9个anchor属于前景和背景的概率；窗口回归层（bbox_pred）输出每一个位置上，9个anchor对应窗口应该平移缩放的参数。考察训练集中的每张图像： a. 对每个标定的真值候选区域，与其重叠比例最大的anchor记为前景样本 b. 对a)剩余的anchor，如果其与某个标定重叠比例大于0.7，记为前景样本；如果其与任意一个标定的重叠比例都小于0.3，记为背景样本 c. 对a),b)剩余的anchor，弃去不用。 d. 跨越图像边界的anchor弃去不用 YOLO的核心思想就是利用整张图作为网络的输入，直接在输出层回归bounding box的位置和bounding box所属的类别。 /darknet/yolo/ 得到每个box的class-specific confidence score以后，设置阈值，滤掉得分低的boxes，对保留的boxes进行NMS处理，就得到最终的检测结果。其中坐标的x,y用对应网格的offset归一化到0-1之间，w,h用图像的width和height归一化到0-1之间。在实现中，最主要的就是怎么设计损失函数，让这个三个方面得到很好的平衡。作者简单粗暴的全部采用了sum-squared error loss来做这件事 * 多尺度检测将图像生成不同的scale，然后不同scale的图像生成对应的不同scale的特征从网络不同层抽取不同尺度的特征做预测高层特征进行上采样和低层特征进行自顶向下的连接同时利用低层特征高分辨率和高层特征的高语义信息，通过融合这些不同层的特征达到预测的效果 RetinaNet算法主干网络目标分类子网目标回归子网 Focal Loss（FL）是Cross-Entropy Loss的改进版本，为容易错误分类的样本分配更大权重来处理类不平衡问题。 MobileNet网络（1） Mobilenet v1是Google于2017年发布的网络架构充分利用移动设备和嵌入式应用的有限的资源，有效地最大化模型的准确性 Mobilenet v1核心是把卷积拆分为Depthwise+Pointwise两部分 Depthwise MobileNet网络（2） Pointwise特征普通卷积：3x3 Conv+BN+ReLU Mobilenet卷积：3x3 Depthwise Conv+BN+ReLU 和 1x1 Pointwise Conv+BN+ReLU MobileNet网络（3） ShuffleNet网络语义分割-UNet UNet2015年发表在 MICCAI，结构比较简单，广泛应用于医学图像分割等场合。与全卷机网络FCN思路非常类似，改进分割网络。由于网络结构像U型，所以取名UNet网络。 Unpooling Upsampling（上采样）在FCN、U-net等网络结构中，上采样是指可以让图像编码变成更高分辨率的技术。 Unpooling在CNN中表示max pooling的逆操作。 UNet 第一部分特征提取，结构类似VGG。第二部分上采样部分。特征提取部分：每经过一个池化层就一个尺度，包括原图尺度一共有5个尺度。上采样部分：每上采样一次，就与特征提取部分对应的通道数相同尺度拼接，但是拼接之前要将其crop。改进FCN之处：多尺度适合超大图像分割，适合医学等图像分割。 UNet的核心常见的图像分割算法使用卷积层和池化层来增加感受野，也缩小了特征图。然后再利用上采样还原图像尺寸，其中会造成精度上的损失。使用skip connection（虚线）为上采样弥补信息。脑出血. 在CT影像上，高密度的区域就大概率是一块出血。 UNet UNet的结构包括U型结构和skip-connection。首先进行Conv+Pooling下采样；然后Deconv反卷积进行上采样（部分采用resize+线性插值上采样），crop之前的低层feature map，进行融合；然后再次上采样。重复这个过程，直到获得输出388x388x2的feature map，最后经过softmax获得output segment map。来源：/jakeret/tf_unet UNet的损失函数图像分割可以定义为像素级别的分类任务。图像由各种像素组成，这些像素组合在一起定义了图像中的不同元素，因此将这些像素分类为一类元素的方法称为语义图像分割。 Binary Cross Entropy Weighted Cross Entropy Balanced Cross Entropy Dice Loss Focal loss Tversky loss Focal Tversky loss 来源：/abs/2006.1482

您可能关注的文档

文档评论（0）

dllkxy + 关注: 实名认证

内容提供者

本文库主要涉及建筑、教育等资料，有问题可以联系解决哦

咨询Ta 进入空间

用户编号：5213302032000001

1亿VIP精品文档

更多 >

机器学习第2版深度学习目标检测与识别.ppt