Pytorch框架学习(6)——transforms与normalize

图像预处理Transforms与normalize

1. transforms运行机制

在这里插入图片描述
torchvision工具包中包含三个主要模块,今天主要学习transforms

  • torchvision.transforms:常用的数据预处理方法,提升泛化能力
    • 包括:数据中心化、数据标准化、缩放、裁剪、旋转、翻转、填充、噪声添加、灰度变换、线性变换、仿射变换、亮度、饱和度及对比度变换等

在这里插入图片描述

2. 数据标准化——transforms.normalize

  • transforms.Normalize()
  • 功能:逐channel的对图像进行标准化(均值变为0,标准差变为1),可以加快模型的收敛
    • output = (input - mean) / std
    • mean:各通道的均值
    • std:各通道的标准差
    • inplace:是否原地操作

3. transforms数据增强

3.1 数据增强

  • 数据增强又称为数据增广,数据扩增,它是对训练集进行变换,使训练集更丰富,从而让模型更具泛化能力。
    在这里插入图片描述

3.2 transforms——裁剪

  1. transforms.CenterCrop

    • 功能:从图像中心裁剪图片
    • size:所需裁剪图片尺寸
  2. transforms.RandomCrop

    • 功能:从图片中随机裁剪出尺寸为size的图片
    • size:所需裁剪图片尺寸
    • padding:设置填充大小。当为a时,上下左右均填充a个像素,当为(a,b)时,上下填充b个像素,左右填充a个像素。当为(a,b,c,d)时,左上右下分别填充abcd
    • pad_if_need:若图像小于设定size,则填充
    • padding_mode:填充模式:(1)constant像素值由fill设定(默认模式);(2)edge像素值由图像边缘像素决定(3)reflect镜像填充,最后一个像素不镜像,eg,[1,2,3,4]->[3,2,1,2,3,4,3,2];(4)symmetric镜像填充,最后一个像素镜像,eg,[1,2,3,4]->[2,1,1,2,3,4,4,3]
    • fill:constant时,设置填充的像素值
  3. RandomResizedCrop

    • 功能:随机大小、长宽比裁剪图片
    • size:所需裁剪图片尺寸
    • scale:随机裁剪面积比例,默认(0.08,1)
    • ratio:随机长宽比,默认(3/4,4/3)
    • interpolation:插值方法,PIL.Image.NEAREST最近邻,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Aidanmomo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值