- 1、本文档共290页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
5.4目标位置及类别的预测主要通过神经网络进行分类和回归预测,输出矩阵维度一般为:[BatchSize×候选锚框数量×(4+类别数量)]:每个候选锚框的输出为:1)锚框原始位置:[cx,cy,w,h],其中(cx,cy)为中心坐标,w为矩形框宽度,h为矩形框高度;2)分类预测结果:锚框标记位置属于某个类别的概率,如[0.11,0.23,0.8,…],数组大小为所有类别总数;3)回归预测结果:锚框位置偏移值[?x,?y,?w,?h],为锚框原始位置与标注类别所在矩形框之间的偏移值5.5训练5.6预测结果输出5.7预测结果的评价及最优化由于采用标记框的格式,一般输出多个框,再通过非极大值抑制算法输出结果最好的一个。非极大值抑制(Non-MaximumSuppression,NMS),顾名思义就是抑制不是极大值的元素。例如在行人检测中,滑动窗口经特征提取,经分类器分类识别后,每个窗口都会得到一个分数。但是滑动窗口会导致很多窗口与其他窗口存在包含或者大部分交叉的情况。这时就需要用到NMS来选取那些邻域里分数最高(是行人的概率最大),并且抑制那些分数低的窗口多个输出框经过NMS输出最优结果图06任务6完成作业作业MSCOCO的全称是MicrosoftCommonObjectsinContext,起源于是微软于2014年出资标注的MicrosoftCOCO数据集,与ImageNet竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。当在ImageNet竞赛停办后,COCO竞赛就成为是当前目标识别、检测等领域的一个最权威、最重要的标杆,也是目前该领域在国际上唯一能汇集Google、微软、Facebook以及国内外众多顶尖院校和优秀创新企业共同参与的大赛。访问/,了解COCO数据集格式下载Coco128数据集并实现YOLO在该数据集上的训练。访问,阅读YOLO官方文档,理解YOLO在不同任务上的应用。按照官方文档下载更多的YOLO模型,实现行人检测,车辆检测等不同任务PyTorch深度学习项目教程项目7工业检测图像分割IMAGESEGMENTATION要点:UNet、数据标注、第三方框架的使用讲课人:0讲课时间:*项目背景ProjectBackground问题:图像分割是计算机视觉的基本任务之一。图像分割旨在将图像分成若干个互不重叠的区域或像素集合,使得每个区域内的像素具有相似的特征。在工业检测中,图像分割主要用于将感兴趣的目标(如产品、物体或缺陷)与背景进行分离。解决:在传统数字图像处理中,一般采用阈值分割、区域生长、边缘检测、图割等方法,自从深度学习技术普及以来,基于UNet结构的分割模型迅速得到了推广,通过大量的标记数据进行训练,深度学习分割模型的准确性大大超越了传统算法。知识目标KnowledgeObjectives理解图像分割的基本概念及其在工业检测中的应用学习分割数据标注的方法和技巧掌握图像分割检测算法的开发流程和关键步骤学习并深入理解UNet网络结构及其在图像分割中的应用能力目标AbilityGoals能够熟练使用LabelMe等工具完成分割数据的标注工作能够掌握将LabelMe生成的数据格式转换为分割模型所支持的数据格式的方法能够运用UNet网络结构开发图像分割算法,并对其进行优化和调整具备独立解决实际项目中图像分割问题的能力素养目标ProfessionalAttainments具备从实际项目出发,理解项目需求和应用场景的能力能够根据项目需求,独立选取合适的开发工具和算法框架具备良好的创新意识和团队协作能力,能够在项目中发挥积极作用注重核心价值观的培养,将技术应用于产业发展之中目录任务1了解图像分割需求任务2数据集构建任务3图像分割网络训练任务4网络推理及结果评价01任务1了解图像分割需求1.1工业检测的流程实际应用中,需要分离不规则的图像区域,方便进行下一步操作。为了实现硅钢片料的测量,首先需要对图像进行分割处理,然后再进行具体的测量1.2图像分割图像分割是图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,同时也是图像处理中最困难的问题之一。所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分为若干个互不相交的区域,使得这些特征在同一个区域内表现出一致性或相似性,而在不同区域间表现出明显的不同。简单地说就是在一幅图像中,把目标从背景中分离出来。本质来讲,图像分割是一种将像素分类的过程,分类的依据包括像素间的相似性、非连续性等。图像分割包括语义分割和实例分割两种类型。在语义分割中,所有物体都是同一类型的,所有相
文档评论(0)