全球赛昇腾赛道技术考点分布.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

设置运行环境

设置数据路径并构建源数据集。

数据增强。

定义归一化和形状转换操作:

归一化:基于均值[0.485×255,0.456×255,0.406×255]和标准差[0.229×255,0.224×255,0.225×255]对输入图像进行归一化。

形状转换:将输入图像的形状从H,W,C转换为C,H,W。分别对训练数据集和测试数据集进行增强

训练数据集:

定义RandomCropDecodeResize,它结合了裁剪、解码和调整大小的操作。图像大小已在现有代码中定义。其他参数保留默认值。

定义RandomHorizontalFlip,即水平随机翻转操作。图像翻转的概率设置为0.5。

定义RandomColorAdjust,即对图像的亮度、对比度、饱和度和色调进行随机调整。将亮度、对比度和饱和度调整因子设置为0.4。

对图像应用由train_trans定义的增强操作。

对图像标签应用由type_cast_op定义的数据类型转换。

打乱数据集序列,缓冲区大小已在现有代码中定义。

将数据集打包成批次。批次大小已在现有代码中定义,并且将丢弃余数设置为True。

测试数据集:

定义Decode,即图像解码操作,将图像解码为RGB格式。

定义Resize,即图像大小调整操作。宽度为resize_height/0.875,高度为resize_width/0.875,两者都需要向上取整。保留插值的默认值。

定义CenterCrop,即对中心区域的裁剪操作。大小可自行推断。

将由evaltrans定义的增强操作应用于图像。

将由type_cast_op定义的数据类型转换应用于图像标签。

将数据集打包成批次。批次大小已在现有代码中定义,并且设置dropremainder为True。

可视化数据。

获取图像并实现图像可视化。

基于数据集对象创建一个迭代器,并逐个获取图像。

可视化四张图像,注意此处的形状转换。

构建一个由卷积层、批归一化(BN)层和激活函数组成的结构。

当groups等于1时,实现标准卷积,填充模式设置为pad,填充设置为(kernel_size-1)//2(如先前代码中所定义),其他所有参数根据实际参数设置。

当groups不等于1时,将输出通道数设置为与输入通道数相等,以实现深度可分离卷积,填充模式设置为pad,填充设置为(kernel_size-1)//2(如先前代码中所定义),其他所有参数根据实际参数设置。(具体情况具体分析,会有变化)

构建一个残差结构或者倒置残差结构。找到InvertedResidual类,其中use_res_connect参数用于确定是否建立残差连接。

仅当输入通道数和输出通道数相等且步幅为1时,建立残差连接。

返回残差连接后的输出。

模型构建与训练

实例化一个模型、定义损失函数、学习率和优化器,并封装模型、设置检查点策略并实施模型训练、设置保存检查点的配置策略:每saveckptepochs×步长步数保存一次检查点文件、最多可保存epochs个检查点文件、saveckptepochs和epochs从配置中获取、设置检查点回调对象:将每个检查点文件的前缀设置为XXX、将保存检查点文件的路径设置为saveckptpath,该路径从配置中获取。根据需要设置其他参数、调用模型训练API以实施模型训练。

可视化模型训练结果:

a)在第一个画布中,绘制模型在训练数据集和验证数据集上的损失变化趋势(横轴为epoch,纵轴为训练损失或评估损失)。

b)在第二个画布中,绘制模型在验证数据集上的准确率变化趋势(横轴为epoch,纵轴为评估准确率)。

c)选择模型的最优检查点文件,即保存评估准确率值最高的epoch时的文件。使用代码实现此操作,而非通过观察。注意:使用np.argmax。

35、在线模型推理与保存

加载测试图像,对图像进行预处理,然后执行推理。

a)使用image_process函数对要推理的图像进行预处理。

1)实现图像归一化,即(每个通道的像素值-均值)/标准差。

2)实现形状转换。

b)使用infer_one函数对图像执行推理。

1)使用image_process函数对图像进行预处理,将其输入到模型中进行推理,并获得模型推理结果。

2)获取模型推理结果中最大概率值的索引。

c)对九张图像进行推理。

1)实例化XXX。

2)实例化XXX。

3)将训练过程中评估准确率最高的epoch保存的检查点文件中的权重值加载到网络中。

36、保存模型

定义输入数据结构并导出一个air、om

文档评论(0)

OS + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档