Focal Loss理解

最新推荐文章于 2025-04-10 16:22:54 发布

青松愉快

最新推荐文章于 2025-04-10 16:22:54 发布

阅读量5k

点赞数 3

分类专栏：推荐算法文章标签：深度学习人工智能

原文链接：https://www.cnblogs.com/king-lps/p/9497836.html

版权

推荐算法专栏收录该内容

57 篇文章

订阅专栏

1. 总述

Focal loss主要是为了解决one-stage目标检测中正负样本比例严重失衡的问题。该损失函数降低了大量简单负样本在训练中所占的权重，也可理解为一种困难样本挖掘。

2. 损失函数形式

Focal loss是在交叉熵损失函数基础上进行的修改，首先回顾二分类交叉上损失：

是经过激活函数的输出，所以在0-1之间。可见普通的交叉熵对于正样本而言，输出概率越大损失越小。对于负样本而言，输出概率越小则损失越小。此时的损失函数在大量简单样本的迭代过程中比较缓慢且可能无法优化至最优。那么Focal loss是怎么改进的呢？

首先在原有的基础上加了一个因子，其中gamma>0使得减少易分类样本的损失。使得更关注于困难的、错分的样本。

例如gamma为2，对于正类样本而言，预测结果为0.95肯定是简单样本，所以（1-0.95）的gamma次方就会很小，这时损失函数值就变得更小。而预测概率为0.3的样本其损失相对很大。对于负类样本而言同样，预测0.1的结果应当远比预测0.7的样本损失值要小得多。对于预测概率为0.5时，损失只减少了0.25倍，所以更加关注于这种难以区分的样本。这样减少了简单样本的影响，大量预测概率很小的样本叠加起来后的效应才可能比较有效。

此外，加入平衡因子alpha，用来平衡正负样本本身的比例不均：文中alpha取0.25，即正样本要比负样本占比小，这是因为负例易分。

只添加alpha虽然可以平衡正负样本的重要性，但是无法解决简单与困难样本的问题。

gamma调节简单样本权重降低的速率，当gamma为0时即为交叉熵损失函数，当gamma增加时，调整因子的影响也在增加。实验发现gamma为2是最优。

3. 总结

作者认为one-stage和two-stage的表现差异主要原因是大量前景背景类别不平衡导致。作者设计了一个简单密集型网络RetinaNet来训练在保证速度的同时达到了精度最优。在双阶段算法中，在候选框阶段，通过得分和nms筛选过滤掉了大量的负样本，然后在分类回归阶段又固定了正负样本比例，或者通过OHEM在线困难挖掘使得前景和背景相对平衡。而one-stage阶段需要产生约100k的候选位置，虽然有类似的采样，但是训练仍然被大量负样本所主导。

博客等级

码龄12年

14
原创

126
点赞

362
收藏

71
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: PyTorch梯度裁剪避免训练loss nan的操作

下一篇：: Focal Loss

最新评论

Mac OS升级GCC版本
momomomomomomo_: 打扰大佬！我下载的是gcc-12，但是刷新完环境变量后，查看版本显示command not found: gcc-12’，请问是什么原因呀
Mac OS升级GCC版本
qq_54009009: 太可了！！感谢博主！！
GCN源代码注释的解释,源码,解读
Jully_xiaoman: 有帮助到点赞
C++ 值传递、指针传递、引用传递详解
小姜寻码记: 博主：请教下，你在解锁引用传递时说到：在引用传递过程中，被调函数的形式参数虽然也作为局部变量在栈中开辟了空间，想问下引用传递会开辟新的空间吗？
Tensorflow c++ 实践及各种坑
元气少女缘结神: 在输入张量中，一张图像应该像您说的{1, rows, cols, 1}这样设置，如果是一个batch应该是{batch, rows, cols, 1}，然后在预测完毕输出张量中应该也是batch个输出结果如https://blog.csdn.net/wd1603926823/article/details/99406974 中图像分类的确可以如此。但发现如果是图像分割中同样操作却错误，输出张量中却只有1幅图的结果，而非batch个图像的结果？？不知博主是否试过？我看https://github.com/tensorflow/tensorflow/issues/19909 也是同样的问题

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。