『PyTorch』权值初始化

最新推荐文章于 2022-09-28 08:47:35 发布

原创最新推荐文章于 2022-09-28 08:47:35 发布

· 505 阅读

4 ·

版权

文章标签：

#深度学习 #神经网络 #pytorch #机器学习

PyTorch 专栏收录该内容

21 篇文章

订阅专栏

1. 梯度消失与梯度爆炸

就是梯度趋于零或者无穷，梯度消失更容易出现

2. PyTorch提供的一些权值和偏置初始化方法

2.1 Xavier均匀分布

不适用ReLU，适用于饱和函数，如sigmoid，tanh

nn.xavier_uniform_(tensor, gain=1.)

2.2 Xavier正态分布

不适用ReLU，适用于饱和函数，如sigmoid，tanh

nn.xavier_normal_(tensor, gain=1.)

2.3. Kaiming均匀分布

适用于ReLu

nn.kaiming_uniform_(tensor, a=0, mode='fan_in', nonlinearity='leaky_relu')

2.4 Kaiming正态分布

适用于ReLu

nn.kaiming_normal_(tensor, a=0, mode='fan_in', nonlinearity='leaky_relu')

2.5 均匀分布

nn.uniform_(tensor, a=0., b=1.)

2.6 正态分布

 nn.normal_(tensor, mean=0., std=1.)

2.7 常数分布

nn.constant_(tensor, val)
nn.ones_(tensor)
nn.zeros_(tensor)

2.8 正交矩阵初始化

nn.orthogonal_(tensor, gain=1)

2.9 单位矩阵初始化

nn.eye_(tensor)

2.10 稀疏矩阵初始化

nn.sparse_(tensor, sparsity, std=0.01)

3. 使用方法

在网络类内部定义initialize_weights(self)方法

nn.init.方法名(self.weight.data)
nn.init.方法名(self.bias.data)

或者，由于这些data都是Tensor，也可以使用Tensor的方法来初始化

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ツぃ☆ve芜情

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【19】pytorch中的权值初始化方法

Clichong

09-15

1053

以下内容来源于Pytorch官方文档与博主余霆嵩提供资料文章目录1. 常用的初始化方法1.1 均匀分布初始化（uniform_）1.2 正态分布初始化（normal_）1.3 常数初始化（constant_）1.4 一值初始化（ones_）1.5 零值初始化（zeros_）1.6 单位矩阵初始化（eye_）1.7 狄拉克初始化（dirac_）1.8 正交初始化（orthogonal_）1.9 稀疏初始化（sparse_）1.10 Xavier初始化1.10.1 Xavier均匀分布（xavier_un.

pytorch学习笔记十：权值初始化的十种方法

Dear_learner的博客

02-23

1992

在上一节中了解了为什么要进行权值初始化以及如何选择权值初始化方法，在这一节来了解一下pytroch中十种权值初始化方法一、权值初始化流程 1、先设定什么层用什么初始化方法，初始化方法在 torch.nn.init 中给出； 2、实例化一个模型之后，执行该函数，即可完成初始化。示例： def initialize_weights(self): for m in self.modules: # 对卷积层进行初始化 if isinstance(m, nn.Conv2d)

参与评论您还未登录，请先登录后发表或查看评论

pytorch——构建模型三要素与权重初始化

weixin_45833008的博客

09-17

1120

构建模型三要素与权重初始化 pytorch4 构建模型三要素与权重初始化构建模型三要素与权重初始化模型三要素参数初始化完整运行代码尺寸计算与参数计算模型三要素三要素其实很简单必须要继承nn.Module这个类，要让PyTorch知道这个类是一个Module 在__init__(self)中设置好需要的组件，比如conv，pooling，Linear，BatchNorm等等最后在forward(self,x)中用定义好的组件进行组装，就像搭积木，把网络结构搭建出来，这样一个模型就定义好了我们来看一个

pytorch模型的数据初始化代码

zzr

07-15

760

import torch.nn as nn import torch.nn.functional as F def initialize_weights(self): for m in self.modules(): if isinstance(m, nn.Linear): nn.init.normal_(m.weight.data, 0, 0....

Pytorch下训练神经网络，卷积核的初始权重设置

weixin_45288536的博客

06-28

5476

训练了一些网络，发现一个问题，怎样查卷积核的初始权重，以及初始权重是如何配置的？ 1.首先了解初始化的目的使得神经网络在训练过程中学习到有用的信息，这意味着参数的梯度能为0。那么参数初始化应该满足：各层激活值不会出现饱和现象；各层激活值不为0。 2.随机生成小的随机数我们将参数初始化为小的随机数。其中randn从均值为0，标准差是1的高斯分布中取样。需要注意的是参数初始值不能取得太小，因为小的参数在反向传播时会导致小的梯度，对于深度网络来说，也会产生梯度消失问题，降低参数的收敛速度。 3.Pytorch

Pytorch—如何进行网络参数初始化

终曲

07-08

9732

Pytorch网络参数初始化的方法常用的参数初始化方法方法（均省略前缀 torch.nn.init.）功能 uniform_(tensor, a=0.0, b=1.0) 从均匀分布 U(a,b) 中生成值，填充输入的张量 normal_(tensor, mean=0.0, std=1.0) 从给定均值 mean 和标准差 std 的正态分布中生成值，填充输入的张量 constant_(tensor, val) 用 val 的值填充输入的张量 ones_(tensor)

Pytroch进行模型权重初始化

qq_43428929的博客

07-20

3967

Pytroch常见的模型参数初始化方法有apply和model.modules()。Pytroch会自动给模型进行初始化，当需要自己定义模型初始化时才需要这两个方法。

pytorch学习笔记九：权值初始化

Dear_learner的博客

02-21

2611

一、概念权值初始化是指在网络模型训练之前，对各节点的权值和偏置初始化的过程，正确的初始化会加快模型的收敛，从而加快模型的训练速度，而不恰当的初始化可能会导致梯度消失或梯度爆炸，最终导致模型无法训练。如上图所示的一个基本的CNN网络结构，数据在网络结构中流动时，会有如下的公式（默认没有偏置）：在反向传播的过程中，由于是复合函数的求导，根据链式求导法则，会有两组导数，一个是损失函数Cost对Z的导数，一个是损失函数对W的导数， 1、损失函数关于状态Z的梯度： 2、损失函数关于W的梯度：可以看出，

Pytorch卷积层手动初始化权值的实例

09-18

在使用Pytorch时，卷积层的权重通常会被随机初始化，但研究人员和工程师在特定场景下可能需要手动设置这些权重。手动初始化权重能够让我们根据特定的先验知识或实验目的来调整网络参数，可能会带来训练效果上的优化...

[十五]深度学习Pytorch-权值初始化(Xavier和Kaiming)

yanzhiwen2的博客

04-06

3786

深度学习Pytorch-权值初始化(Xavier和Kaiming)

学习笔记：Unet学习及训练自己的数据集

Qingkaii的博客

04-28

1万+

一.语义分割二.上采样和下采样 1.下采样的作用：（1）是减少计算量，防止过拟合。（2）是增大感受野，使得后面的卷积核能够学到更加全局的信息。 2.下采样的方式：（1）采用stride为2的池化层，如Max-pooling和Average-pooling，目前通常使用Max-pooling，因为计算简单而且能够更好的保留纹理特征；（2）采用stride为2的卷积层，下采样的过程是一个信息损失的过程，而池化层是不可学习的，用stride为2的可学习卷积层来代替pooling可以得到更

深度学习——模型的初始化

m0_61796189的博客

05-20

4894

在深度学习模型的训练中，权重的初始值极为重要。一个好的权重值，会使模型收敛速度提高，使模型准确率更精确，因此本文主要介绍torch.nn.init以及如何使用

手撕 CNN 经典网络之 VGGNet（PyTorch实战篇）

红色石头的专栏

03-18

5046

大家好，我是红色石头！在上一篇文章：手撕 CNN 经典网络之 VGGNet（理论篇）详细介绍了 VGGNet 的网络结构，今天我们将使用 PyTorch 来复现VGGNet网络，并用VGG...

从零搭建Pytorch模型教程（二）搭建网络

CV技术指南（微信公众号）

03-23

2603

前言上一篇《从零搭建Pytorch模型教程（一）数据读取》中介绍了classdataset的几个要点，由哪些部分组成，每个部分需要完成哪些事情，如何进行数据增强，如何实现自己设计的数据增强。然后，介绍了分布式训练的数据加载方式，数据读取的整个流程，当面对超大数据集时，内存不足的改进思路。本文介绍了如何搭建神经网络，构建网络的几种方式，前向传播的过程，几种初始化方式，如何加载预训练模型的指定层等内容。本文以CNN为例，下一篇介绍如何搭建Transformer网络。本文来自公众号CV技术指南的.

深度学习参数初始化（一）Xavier初始化含代码

热门推荐

xian0710830114的专栏

06-30

4万+

Xavier初始化也称为Glorot初始化，因为发明人为Xavier Glorot。Xavier initialization是 Glorot 等人为了解决随机初始化的问题提出来的另一种初始化方法，他们的思想就是尽可能的让输入和输出服从相同的分布，这样就能够避免后面层的激活函数的输出值趋向于0。........................

PyTorch 学习笔记（四）：激活函数对比、权重初始化、防止过拟合的方法

h__ang的博客

04-22

5640

一. 激活函数如果不用激活函数，每一层输出都是上层输入的线性函数，无论神经网络有多少层，输出都是输入的线性组合。如果使用的话，激活函数给神经元引入了非线性因素，使得神经网络可以任意逼近任何非线性函数，这样神经网络就可以应用到众多的非线性模型中。 1. Sigmoid Sigmoid非线性函数的数学表达式是σ(x)=11+e−x\sigma (x)=\frac{1}{1+e^{-x}}σ(x)=1...

pytorch中神经网络模型的初始化-保存-加载

北国觅梦

11-18

1926

https://blog.csdn.net/remanented/article/details/89161297 一、打算开始训练自己的模型，希望能够得到较好的training_model，包括了对模型的初始化 第一种 from torch.nn import init #define the initial function to init the layer's parameters for the network def weigth_init(m): if isinstance(m

PyTorch【7】PyTorch网络权重初始化

m0_63462829的博客

09-28

2174

PyTorch网络权重初始化

深度学习训练之卷积核参数初始化（Constant、Random、Xavier、Kaiming）系统详细总结

qq_23022733的博客

04-22

1万+

文章目录1、卷积核Constant参数初始化2、卷积核参数随机（random）初始化2.1 随机分布的参数初始化2.2 正态分布的参数初始化3、卷积核参数Xavier初始化 1、卷积核Constant参数初始化 就是对前向计算卷积核的参数初始化，Constant就是一个简单的初始化，就是把卷积核的参数设置为常数，API（pytorch）如下： torch.nn.init.constant_(tensor, val) # val：自己设置的常数 torch.nn.init.ones_(tensor) #

PyTorch模型训练实战：权值初始化与优化技巧

"PyTorch模型训练实用教程，涵盖权值初始化、损失函数、优化器和学习率调整方法，以及TensorBoardX的使用" 在机器学习和深度学习领域，PyTorch因其易于使用、灵活性高和强大的社区支持而受到广泛欢迎。本教程由余霆...