网站大量收购独家精品文档,联系QQ:2885784924

图像处理与机器视觉 第12章 目标分类、检测与分割.ppt

图像处理与机器视觉 第12章 目标分类、检测与分割.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

**************树立利用数学、自然科学、工程基础解决复杂工程问题的意识;初步建立以问题为导向的教学方式;通过对简单专业问题的探索,使学生学会对工程问题的分析,设计满足特定需求的控制系统;并能够在设计环节中体现创新意识,考虑社会、健康、安全、法律、文化以及环境等因素。采用CDIO理念,通过项目驱动引导学生“做中学”,使学生通过具体工程项目的学习得到实践中通用的能力;进而能够解决一般工程项目整个生命周期产生的问题,掌握项目开发流程、开发技巧和文档写作规范;*2.3、单阶段目标检测算法-YOLO系列*2.5、案例:基于FasterR-CNN算法的目标检测*VOC07+12数据集(训练数据:16551张图像,共40058个目标。测试数据:4952张图像,共12032个目标)PASCALVOC挑战赛(ThePASCALVisualObjectClasses)是一个世界级的计算机视觉挑战赛*(1)数据准备VOC数据集下载地址如下:链接:/s/1STBDRK2MpZfJJ-jRzL6iuA提取码:vh7m修改voc_annotation.py里面的annotation_mode=2,运行voc_annotation.py生成根目录下的2007_train.txt和2007_val.txt。(2)参数文件下载权重包括voc_weights_resnet.pth或者voc_weights_vgg.pth以及主干的网络权重。链接:/s/1IiBMIyw8bF132FQGz79Q6Q提取码:dpje(3)模型训练rain.py的默认参数用于训练VOC数据集,直接运行train.py即可开始训练(4)模型评估运行get_map.py即可获得评估结果,评估结果会保存在map_out文件夹中2.5、案例:基于FasterR-CNN算法的目标检测*2.5、案例:基于FasterR-CNN算法的目标检测APscore_threholdF1RecallPrecisionaeroplane81.47%0.50.6982.46%58.60%bicycle88.13%0.50.7688.43%67.27%bus86.95%0.50.7189.20%59.19%car88.58%0.50.7089.51%56.97%dog89.70%0.50.7690.39%65.87%horse90.23%0.50.7689.94%65.76%...mAP80.27%2.6、案例:基于YOLOv8的目标检测*数据集:COCO128数据集,该数据集包含2017年COCO的前128张图像,该数据集使用相同的128张图像进行训练和测试。*(1)下载预训练模型在YOLOv8的GitHub开源网址上下载对应版本的模型/ultralytics/assets/releases(2)训练训练模型命令如下:yolotask=detectmode=trainmodel=yolov8x.yamldata=mydata.yamlepochs=300batch=1(3)验证输入下面的命令进行模型的验证,这里的models为训练的最好的那一组权重;Yolodetectvaldata=datasets/Apple/apple.yamlmodel=runs/detect/train/weights/best.ptbatch=42.6、案例:基于YOLOv8的目标检测2.6、案例:基于YOLOv8的目标检测*(1)真实值(2)预测值3、图像分割*图像分割是计算机视觉领域的一个重要任务,其目标是将图像分成多个子区域,每个子区域通常具有相似的语义或特征。基于深度学习的图像分割技术主要分为:语义分割、实例分割、全景分割。1.语义分割FCN网络是基于深学习度的语义分割技术的开山之作。2017年PSPNet对FCN网络存在的分割问题进行了改进,PSPNet将图像感受野增大,包含了图像的浅层深层特征。U-Net网络是2015年发表在MICCAI上的文章,是基于FCN架构的改进,结合了图像的底层和高层信息,广泛应用在解决医学领域的图像处理问题中。DeepLab是谷歌团队基于CNN开发的语义分割模型,目前有四个算法,最新算法是DeepLabv3+。3、图像分割*2.实例分割实例分割的研究

文档评论(0)

dllkxy + 关注
实名认证
内容提供者

本文库主要涉及建筑、教育等资料,有问题可以联系解决哦

版权声明书
用户编号:5213302032000001

1亿VIP精品文档

相关文档