- 1
- 0
- 约小于1千字
- 约 10页
- 2026-05-23 发布于北京
- 举报
猿人学图像识别相关课程主讲人:安澜安之若素,波澜吃惊
lesson6自定义数据集、定长图文安之若素,波澜吃惊
part1自定义数据集安之若素,波澜吃惊
自定义数据集为了让加载器可以加载我们的自定义数据集,我们要为了自定义数据集实现四个核心功能:1.继承Dataset类2.__len__3.__getitem__4.transforms
自定义数据集继承和transforms没什么好说的。主要是__getitem__和__len__首先我们要指定一个目录,获取目录下的文件建立一个分类映射表,令标注数据变为映射表索引__getitem__核心操作,打开图片,返回图片tensor和labels的tensor__len__提取目录下的文件数量
part2计算标准值安之若素,波澜吃惊
计算标准值均值=每一个通道上独立计算均值的平均值(或者一起计算)标准差=每一个通道上独立计算标准差(必须一起计算)我们先实现一个MNIST和cifar10的标准值计算程序以验证程序准确性
part3取巧训练定长图文安之若素,波澜吃惊
定长图文虽然我们正常来讲,利用单纯的卷积和全连接层只能获取图片的唯一最大特征,但是由于图文定长,所以我们可以取巧训练。比如10个数字,定长4,那么就可以做40个特征,即:第一个数是几/第二个数是几/第三个数是几/第四个数是几,并且以10个特征作为切断,前
原创力文档

文档评论(0)