- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
模型训练与评估8.3
8.3.1数据集介绍8.3模型训练与评估在图像数据集方面,我们使用了PASCALVOC的语义分割基准数据集。PASCALVOC是常用的训练和评价语义分割算法性能的数据集,基本上已经成了综合评估新的语义分割算法的基准数据集。它包含20个前景对象类和1个背景类,总共21个语义分类,如图8-14所示。原始数据集包含1464张训练图像、1449张验证图像、1456张测试图像,且大小均为513×513。在此基础上,Hariharan等人对PASCALVOC数据集进行了改进,提供了额外的像素级标注,使数据集拥有10582张训练图像,本文使用这些图像来训练测试网络模型。
8.3模型训练与评估
VOC数据集的文件夹结构如图8-15所示。8.3模型训练与评估
Annotations中包含了对应图片的xml信息,xml信息包含了该图片的基本信息,xml语言很易读,从一张图片的xml文件中可以轻易得出这幅图片的一些基本信息。如果segmented一栏为1,意味着这幅图用于分割(因为VOC2012中共有上万张图片,但并不都用于分割任务,有的用于目标检测或动作识别等);若这一栏为0,则意味着这幅图不是用于图像分割的。ImageSets中有用的部分为Segmentation文件,其中有用于标记分割任务图像信息的txt文件,包括train.txt和val.txt文件。图8-16所示为ImageSets目录结构。JPEGimages中则存放了数据集的原图片,这些图片一共有17125张,但并不是都使用,仅对train.txt和val.txt文件中列出的图像进行分割任务时使用,而其他图像则用于不同的任务中。SegmentationClass文件夹存放的是按照类别分割的图像。每个类别都对应着其特定的颜色。SegmentationObject文件夹存放的是按照物体分割的图像。每个物体都对应着其特定的颜色。8.3模型训练与评估
8.3模型训练与评估
8.3.2网络训练将下载好的VOC数据集放到项目文件的根目录下,运行train.py文件进行训练。网络训练的具体代码如下:8.3模型训练与评估
8.3模型训练与评估
8.3模型训练与评估
8.3模型训练与评估
8.3模型训练与评估
8.3模型训练与评估
8.3模型训练与评估
8.3模型训练与评估
8.3模型训练与评估
8.3模型训练与评估
8.3.3训练参数解析在上述网络训练(train.py)中有大量训练参数和命令的设置,为了方便对网络训练过程的理解,下面对这些训练参数进行解析说明。(1)Cuda。Cuda=True表示使用Cuda,若没有GPU,则可以将其设置为False。(2)num_classes=21,需要的分类个数+1(背景)。(3)backbone=mobilenet,所使用的主干网络:mobilenet、xception。(4)model_path=model_data/deeplab_mobilenetv2.pth,加载预训练权重,数据的预训练权重对不同数据集是通用的,因为特征是通用的。预训练权重对于99%的情况都必须要用,不用的话权值太过随机,特征提取效果不明显,网络训练的结果也不会好。如果想要断点续练,就将model_path设置成logs文件夹下已经训练的权值文件。8.3模型训练与评估
(5)downsample_factor=16,下采样的倍数8、16,8要求更大的显存。(6)input_shape=[512,512],输入图片的大小。(7)训练分为两个阶段,分别是冻结阶段和解冻阶段。①冻结阶段训练参数。此时模型的主干被冻结了,特征提取网络不发生改变,占用的显存较小,仅对网络进行微调。Init_Epoch=0Freeze_Epoch=50Freeze_batch_size=8Freeze_lr=5e-48.3模型训练与评估
②解冻阶段训练参数。此时模型的主干不被冻结了,特征提取网络会发生改变,占用的显存较大,网络所有的参数都会发生改变。UnFreeze_Epoch=100UnFreeze_batch_size=4UnFreeze_lr=5e-5(8)VOCdevkit_path=?VOCdevkit?,数据集路径,默认指向根目录的数据集文件夹。(9)dice_loss=False。建议选项如下。①种类少(几类)时,设置为True。②种类多(十几类)时,如果batch_size比较大(10以上),那么设置为True。③种类多(十几类)时,如果batch_size比较小(10以下),那么设置为False。8.3模型训练与评估
(10)是否使用主干网络的预训练权重。此处使用的是主干的
您可能关注的文档
- 计算机视觉应用--DeepLabV3+网络的基本原理.pptx
- 计算机视觉应用--PyTorch常用模块及库.pptx
- 计算机视觉应用--PyTorch环境配置与安装.pptx
- 计算机视觉应用--PyTorch框架简介.pptx
- 计算机视觉应用--PyTorch中的 Tensor.pptx
- 计算机视觉应用--ResNet的基本原理.pptx
- 计算机视觉应用--常用的3D目标检测数据集及其评价指标.pptx
- 计算机视觉应用--单阶段式2D目标检测网络 YOLOv5.pptx
- 计算机视觉应用--基于深度学习的3D目标检测方法.pptx
- 计算机视觉应用--经典的3D目标检测算法 VoxelNet.pptx
- 建银国际证券-港股熊牛切换走向深化:新质生产力助力打开港股长期上升空间.pdf
- 国金证券-创业板50择时跟踪:2月进一步提升创业板50看涨比例.pdf
- 信用|关注存单和城投下沉的机会.pdf
- 政策半月观:三大方向进一步受重视.pdf
- 固定收益专题报告:建筑行业信用风险及投资价值全梳理.pdf
- AI行业跟踪报告第58期:华勤技术,AI云、端全线卡位,全面受益于AI落地.pdf
- 高频选股因子:大单因子表现继续反弹,AI增强组合持续回撤.pdf
- 投资策略研究*专题报告:科技引领“中国资产”价值重估进度加快.pdf
- 电子行业:高阶智驾加速普及,催动硬件快速放量.pdf
- 浙商证券-北汽蓝谷-600733-北汽蓝谷深度报告:联袂小马打造无人出租,携手华为进军全民智驾.pdf
文档评论(0)