图像处理与机器视觉第12章目标分类、检测与分割.ppt

下载文档

0
0
约5.91千字
约 32页
2025-03-17 发布于甘肃
举报
版权申诉
保障服务

图像处理与机器视觉第12章目标分类、检测与分割.ppt

1、本文档共32页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

**************树立利用数学、自然科学、工程基础解决复杂工程问题的意识；初步建立以问题为导向的教学方式；通过对简单专业问题的探索，使学生学会对工程问题的分析，设计满足特定需求的控制系统；并能够在设计环节中体现创新意识，考虑社会、健康、安全、法律、文化以及环境等因素。采用CDIO理念，通过项目驱动引导学生“做中学”，使学生通过具体工程项目的学习得到实践中通用的能力；进而能够解决一般工程项目整个生命周期产生的问题，掌握项目开发流程、开发技巧和文档写作规范；*2.3、单阶段目标检测算法-YOLO系列*2.5、案例：基于FasterR-CNN算法的目标检测*VOC07+12数据集（训练数据：16551张图像，共40058个目标。测试数据：4952张图像，共12032个目标）PASCALVOC挑战赛（ThePASCALVisualObjectClasses）是一个世界级的计算机视觉挑战赛*（1）数据准备VOC数据集下载地址如下：链接：/s/1STBDRK2MpZfJJ-jRzL6iuA提取码：vh7m修改voc_annotation.py里面的annotation_mode=2，运行voc_annotation.py生成根目录下的2007_train.txt和2007_val.txt。（2）参数文件下载权重包括voc_weights_resnet.pth或者voc_weights_vgg.pth以及主干的网络权重。链接：/s/1IiBMIyw8bF132FQGz79Q6Q提取码：dpje（3）模型训练rain.py的默认参数用于训练VOC数据集，直接运行train.py即可开始训练（4）模型评估运行get_map.py即可获得评估结果，评估结果会保存在map_out文件夹中2.5、案例：基于FasterR-CNN算法的目标检测*2.5、案例：基于FasterR-CNN算法的目标检测APscore_threholdF1RecallPrecisionaeroplane81.47%0.50.6982.46%58.60%bicycle88.13%0.50.7688.43%67.27%bus86.95%0.50.7189.20%59.19%car88.58%0.50.7089.51%56.97%dog89.70%0.50.7690.39%65.87%horse90.23%0.50.7689.94%65.76%...mAP80.27%2.6、案例：基于YOLOv8的目标检测*数据集：COCO128数据集，该数据集包含2017年COCO的前128张图像，该数据集使用相同的128张图像进行训练和测试。*（1）下载预训练模型在YOLOv8的GitHub开源网址上下载对应版本的模型/ultralytics/assets/releases（2）训练训练模型命令如下：yolotask=detectmode=trainmodel=yolov8x.yamldata=mydata.yamlepochs=300batch=1（3）验证输入下面的命令进行模型的验证，这里的models为训练的最好的那一组权重；Yolodetectvaldata=datasets/Apple/apple.yamlmodel=runs/detect/train/weights/best.ptbatch=42.6、案例：基于YOLOv8的目标检测2.6、案例：基于YOLOv8的目标检测*（1）真实值（2）预测值3、图像分割*图像分割是计算机视觉领域的一个重要任务，其目标是将图像分成多个子区域，每个子区域通常具有相似的语义或特征。基于深度学习的图像分割技术主要分为：语义分割、实例分割、全景分割。1.语义分割FCN网络是基于深学习度的语义分割技术的开山之作。2017年PSPNet对FCN网络存在的分割问题进行了改进，PSPNet将图像感受野增大，包含了图像的浅层深层特征。U-Net网络是2015年发表在MICCAI上的文章，是基于FCN架构的改进，结合了图像的底层和高层信息，广泛应用在解决医学领域的图像处理问题中。DeepLab是谷歌团队基于CNN开发的语义分割模型，目前有四个算法，最新算法是DeepLabv3+。3、图像分割*2.实例分割实例分割的研究

您可能关注的文档

文档评论（0）

dllkxy + 关注: 实名认证

内容提供者

本文库主要涉及建筑、教育等资料，有问题可以联系解决哦

咨询Ta 进入空间

用户编号：5213302032000001

1亿VIP精品文档

更多 >

图像处理与机器视觉第12章目标分类、检测与分割.ppt