自定义数据集与定长图文处理技术详解及实践.pptxVIP

下载本文档

1
0
约小于1千字
约 10页
2026-05-23 发布于北京
举报

自定义数据集与定长图文处理技术详解及实践.pptx

猿人学图像识别相关课程主讲人：安澜安之若素，波澜吃惊

lesson6自定义数据集、定长图文安之若素，波澜吃惊

part1自定义数据集安之若素，波澜吃惊

自定义数据集为了让加载器可以加载我们的自定义数据集，我们要为了自定义数据集实现四个核心功能：1.继承Dataset类2.__len__3.__getitem__4.transforms

自定义数据集继承和transforms没什么好说的。主要是__getitem__和__len__首先我们要指定一个目录，获取目录下的文件建立一个分类映射表，令标注数据变为映射表索引__getitem__核心操作，打开图片，返回图片tensor和labels的tensor__len__提取目录下的文件数量

part2计算标准值安之若素，波澜吃惊

计算标准值均值=每一个通道上独立计算均值的平均值（或者一起计算）标准差=每一个通道上独立计算标准差（必须一起计算）我们先实现一个MNIST和cifar10的标准值计算程序以验证程序准确性

part3取巧训练定长图文安之若素，波澜吃惊

定长图文虽然我们正常来讲，利用单纯的卷积和全连接层只能获取图片的唯一最大特征，但是由于图文定长，所以我们可以取巧训练。比如10个数字，定长4，那么就可以做40个特征，即：第一个数是几/第二个数是几/第三个数是几/第四个数是几，并且以10个特征作为切断，前

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

自定义数据集与定长图文处理技术详解及实践.pptxVIP