DSSD解卷积单阶段检测器核心思想解析与实践

DSSD是一种改进的单阶段目标检测器,通过融合高层语义和低层细节信息提升小物体检测精度。采用Top-Down结构,用反卷积替代传统上采样,结合残差单元优化预测。在训练中,分为两阶段进行,先训练反卷积层,再微调全网络。实验证明,直接训练而非冻结SSD参数效果更佳。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

引言

卷积神经网络在结构上存在固有的问题,高层网络感受野比较大,语义信息表征能力强,但是特征图分辨率低,几何细节信息表征能力弱。低层网络感受野比较小,几何细节信息表征能力强,分辨率高,但语义信息表征能力弱。

SSD采用多尺度的特征图来预测物体,使用具有较大感受野的高层特征信息预测大物体,具有较小感受野的低层特征信息预测小物体。

这样就带来一个问题:使用的低层网络的特征信息预测小物体时,由于缺乏高层语义特征,导致SSD对于小物体的检测效果较差。而解决这个问题的思路就是对高层语意信息和低层细节信息进行融合。

Top-Down融合思想的起源

FPN: Feature Pyramid Networks for Object Detection(以下简称FPN)以及,
Beyond Skip Connections: Top-Down Modulation for Object Detection(以下简称TDM),
等论文中提出了Top-Down融合的思想。

虽然Top Down的方法来丰富特征信息的思想很容易理解,但是大多数论文中所说的特征图金字塔的构造方式各不相同,只是针对于特定的网络结构来做优化。

FPN的网络结构只是针对ResNet做了优化,文章中也没有提及过更换其

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Gallant Hu

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值