初学者如何入门PyTorch-CSDN博客

本文链接：https://blog.csdn.net/Java_rich/article/details/147339270

PyTorch是当前最受欢迎的深度学习框架之一，其动态计算图、直观的API设计和强大的GPU加速能力使其成为科研与工程领域的首选工具。以下从核心概念到实践应用的全方位解析将帮助你快速掌握PyTorch的核心技术。

详细图可关助我的V.X【服务号】AI技术星球 发送：211C 自取学习路线+200G资料包

一、PyTorch核心原理

1、张量（Tensor）

PyTorch的基础数据结构是多维数组张量，支持CPU/GPU运算。与NumPy的ndarray不同，PyTorch张量支持自动微分（Autograd）：

import torch
x = torch.tensor([[1.0, 2.0], [3.0, 4.0]], requires_grad=True)
y = x * 2 + 3
loss = y.sum()
loss.backward()  # 自动计算梯度
print(x.grad)    # 输出梯度值：[[2,2],[2,2]]

2、动态计算图

PyTorch采用动态计算图，允许在运行时修改计算逻辑。例如，在循环神经网络（RNN）中，动态图能灵活处理变长输入：

for data in dataset:
    output = model(data)  # 每批数据生成独立的计算图
    loss = criterion(output, target)
    loss.backward()

3、自动微分（Autograd）

通过跟踪张量操作，PyTorch自动构建计算图并计算梯度。例如，计算函数 𝑓 ( 𝑥 ) = 𝑥 2 f(x)=x 2 在 𝑥 = 3 x=3处的导数：

x = torch.tensor(3.0, requires_grad=True)
y = x**2
y.backward()
print(x.grad)  # 输出6.0

二、安装与配置

1、环境准备

Anaconda：推荐使用Anaconda管理Python环境。
CUDA支持：检查GPU驱动版本（nvidia-smi），选择匹配的CUDA版本。

2、安装命令

# CPU版本
conda install pytorch torchvision torchaudio cpuonly -c pytorch

# CUDA 11.3版本
conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch

3、验证安装

import torch
print(torch.__version__)          # 查看PyTorch版本
print(torch.cuda.is_available())  # 输出True表示GPU可用

三、基础语法与操作

1、张量操作

2、神经网络构建

import torch.nn as nn

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(784, 256)  # 全连接层
        self.fc2 = nn.Linear(256, 10)
        
    def forward(self, x):
        x = torch.relu(self.fc1(x))
        return self.fc2(x)

model = Net()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)
criterion = nn.CrossEntropyLoss()

四、深度学习应用实例

1、线性回归

# 数据生成
x_train = torch.randn(100, 1) * 10
y_train = 3 * x_train + 5 + torch.randn(100, 1)

# 模型训练
model = nn.Linear(1, 1)
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
for epoch in range(100):
    pred = model(x_train)
    loss = criterion(pred, y_train)
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
print(model.weight, model.bias)  # 接近3和5

2、图像分类（MNIST）

from torchvision import datasets, transforms

# 数据加载
transform = transforms.Compose([transforms.ToTensor()])
train_data = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
train_loader = torch.utils.data.DataLoader(train_data, batch_size=64, shuffle=True)

# 训练循环
for images, labels in train_loader:
    outputs = model(images.view(-1, 784))
    loss = criterion(outputs, labels)
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()