残差网络（ResNet）解决梯度消失问题

最新推荐文章于 2025-04-06 20:23:26 发布

笑傲NLP江湖

最新推荐文章于 2025-04-06 20:23:26 发布

阅读量4.8k

点赞数 4

文章标签：概率论深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/KaikebaAI/article/details/121404990

版权

残差网络ResNet由何凯明在2015年提出，解决了深度学习中网络退化的难题，尤其是梯度消失问题。通过引入残差块的“短路”机制，ResNet使得深层网络的梯度能直接传递到浅层，避免了梯度消失，从而可以构建更深的网络并提高计算效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、引言

残差网络（ResNet）是何凯明在2015年提出的。可以说该网络模型的提出是CNN图像史上的里程碑事件。它解决了当时传统CNN网络发展所遇到的瓶颈——网络深度问题。当时，人们普遍认为网络的深度越深，网络的效果会越好。但是随着人们的研究发现，更深的网络居然会使得网络效果变差，这也就是网络的退化，而梯度消失则是导致网络退化的一个重要因素。何凯明提出的ResNet正是解决了问题，将14年VGG的19层网络提高到了ResNet惊人的152层，并且获得了更好的网络效果。

二、梯度消失：

当一个深层网络的激活函数全部采用sigmod函数时，会导致梯度消失的出现。可以从数学角度计算一下为什么会出现梯度消失（非严格证明）。

假设一个最简单的网络，如图。

其中， $X_{i}$ ， $X_{i+1}$

最低0.47元/天解锁文章

笑傲NLP江湖

博客等级

码龄4年

52
原创

67
点赞

543
收藏

27
粉丝

关注

私信

热门文章

上一篇：: Flask深度学习模型服务端部署

下一篇：: 关于BERT预训练模型，你想知道的都在这~

最新评论

TextCNN-文本情感分析项目实战
噜啦噜啦嘞。: [code=python] Traceback (most recent call last): File "D:\codePython\textCNN\textcnn.py", line 204, in <module> train(train_iter, test_iter, net, loss, optimizer, device, num_epochs) File "D:\codePython\textCNN\textcnn.py", line 189, in train out = net(X) File "D:\python37\lib\site-packages\torch\nn\modules\module.py", line 489, in __call__ result = self.forward(*input, **kwargs) File "D:\codePython\textCNN\textcnn.py", line 139, in forward encoding = torch.cat([self.pool(F.relu(conv(embeddings))).squeeze(-1) for conv in self.convs], dim=1) File "D:\codePython\textCNN\textcnn.py", line 139, in <listcomp> encoding = torch.cat([self.pool(F.relu(conv(embeddings))).squeeze(-1) for conv in self.convs], dim=1) NameError: name 'F' is not defined [/code]
TextCNN-文本情感分析项目实战
噜啦噜啦嘞。: 博主，出现这个错误怎么破呀 [code=python] [/code][code=python] [/code]
TextCNN-文本情感分析项目实战
噜啦噜啦嘞。: 解决了吗
常用软件的介绍及安装：Python、Jupyter、Pycharm、Pytorch
m0_65777796: 你好，pycharm也可以通过anaconda安装吗，里面pycharm安装包的网址可以提供一下嘛
Flask深度学习模型服务端部署
Yichen.: 您好，你这个实现了吗

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。