PyTorch 中，tensor不设置requires_grad和设置requires_grad=False的区别

木禾DING

已于 2023-06-27 11:40:01 修改

阅读量2.7k

点赞数 3

CC 4.0 BY-SA版权

文章标签： pytorch 深度学习 python

于 2023-06-27 11:15:25 首次发布

本文链接：https://blog.csdn.net/ding_programmer/article/details/131412835

在PyTorch中，tensor的requires_grad属性决定了是否需要计算梯度。如果不设置或设为False，PyTorch不会构建计算图，不计算梯度，能节省资源。当设置为True时，不仅该tensor，其依赖的tensor也会自动要求计算梯度。未设置requires_grad尝试计算梯度会导致错误。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在 PyTorch 中，tensor 不设置 requires_grad 和设置 requires_grad=False 的区别在于是否需要计算梯度。

当一个 tensor 不设置 requires_grad 时，默认值为 False，表示该 tensor 不需要计算梯度。这种情况下，PyTorch 不会构建用于计算 tensor 梯度的计算图，因此也不会计算 tensor 的梯度。

而当一个 tensor 设置 requires_grad=False 时，表示该 tensor 明确地告知 PyTorch 不需要计算梯度。这种情况下，PyTorch 不会为该 tensor 计算梯度，从而节省计算资源。

需要注意的是，如果一个 tensor 设置了 requires_grad=True，那么其依赖的所有 tensor 也会自动设置为 requires_grad=True。这是因为这些 tensor 在计算梯度时都是必要的。因此，如果我们需要对某个 tensor 计算梯度，那么它所依赖的所有 tensor 也需要计算梯度。

以下是一个简单的示例代码，演示了不设置 requires_grad 和设置 requires_grad=False 的区别：

import torch

# 创建两个 tensor
x = torch.tensor([2.0])
y = torch.tensor([3.0], requires_grad=True)

# 对 tensor 进行计算
z = x * y

# 计算梯度
z.backward(). 

# 输出梯度
print(x.grad)  # None
print(y.grad)  # tensor([2.])

在上述代码中，我们创建了两个 tensor x 和 y，其中 x 没有设置 requires_grad，而 y 设置了 requires_grad=True。然后，我们对这两个 tensor 进行计算，将它们相乘，得到 z。之后，我们调用 backward() 方法计算梯度。可以看到，x 的梯度为 None，而 y 的梯度为 2，这是因为 x 没有设置 requires_grad，因此 PyTorch 不会为它计算梯度，而 y 的梯度为 2，表示其计算出的梯度值为 2。
如果我们将 y 的 requires_grad 设置为 False，则 PyTorch 不会为 y 计算梯度，代码如下：

import torch

# 创建两个 tensor
x = torch.tensor([2.0])
y = torch.tensor([3.0], requires_grad=False)

# 对 tensor 进行计算
z = x * y

# 计算梯度
z.backward()

# 输出梯度
print(x.grad)  # None
print(y.grad)  # None

在上述代码中，我们将 y 的 requires_grad 设置为 False，表示不需要为它计算梯度。因此，当我们调用 backward() 方法计算梯度时，x 和 y 的梯度都为 None。

但如果两者都没有设置requires_grad

import torch

# 创建两个 tensor
x = torch.tensor([2.0])
y = torch.tensor([3.0])

# 对 tensor 进行计算
z = x * y


# 计算梯度
z.backward()


# 输出梯度
print(x.grad)  
print(y.grad)  

直接报错：RuntimeError: element 0 of tensors does not require grad and does not have a grad_fn