【深度学习】Pytorch基础-CSDN博客

本文链接：https://blog.csdn.net/CSUzhangpeike/article/details/136485152

张量

运算与操作

加减乘除
pytorch中tensor运算逐元素进行，或者一一对应计算
常用操作
典型维度为N X C X H X W，N为图像张数，C为图像通道数，HW为图高宽。

sum()
一般，指定维度，且keepdim=True该维度上元素相加，长度变为1。
升降维度
unsqueeze() 扩充维度

    image = PIL.Image.open('lena.jpg').convert('RGB')
    transform = torchvision.tranforms.Compose([torchvision.transforms.ToTensor()])
    img = transform(image)
    img = img.unsqueeze(0)

sequeeze()将长度为1的维度抹除，数据不会减少。

将输入（图像）转换为张量，torchvision.transforms.ToTensor()

class ToTensor:
    """Convert a ``PIL Image`` or ``numpy.ndarray`` to tensor. This transform does not support torchscript.

tensor转换为cvMat

获得元素
反归一化
变换通道顺序

维度展开

    # 除第1维，其他维展开
    x = torch.flatten(x, 1)

Variable

view()方法
卷积输出N*C*H*W，输入全连接层，需要变形为N*size

torchvision

import torchvision as tv
# 查看网络的结构
features = tv.models.alexnet().features
# 在dim=1上求和，第1维度压缩为1
torch.sum(in_feat**2,dim=1,keepdim=True)

torch.nn

Module
用于构建神经网络模型的基类，有方法
register_buffer，register_parameter，声明常量与模型参数。
ModuleList
train()与eval()
ConvTranspose2d 图像反卷积，可实现上采样，如ConvTranspose2d(256, 128, 3, 2, 1, 1), 输入输出通道分别为256\128，反卷积核大小为3，反卷积的stride为2，即图像大小变为2倍，输出尺寸公式是卷积公式的逆运算；与卷积参数一致，形式即正逆。

$kernel_size [ 0 ] − 1 ) + output_padding [ 0 ] + 1 H_{out} = (H_{in} - 1) \times \text{stride}[0] - 2 \times \text{padding}[0] + \text{dilation}[0] \times (\text{kernel\_size}[0] - 1) + \text{output\_padding}[0] + 1$