Deeplab v3 | Rethinking Atrous Convolution for Semantic Image Segmentation

鉴于之前写过deeplab v1与2, 继续读一读新出的v3

整体来说,这篇文章还是在探究两个大家一直在做的问题:全局信息于多尺度信息。另外作者还强调了BN的使用。

本文在原有的框架下提出了两种框架:
1. 加长版
2. 增强版ASPP(deeplab v3)
两者都使用了Multi-grid的多 hole算法rates。

1. Multigrid

图森的论文也提过类似的方法,

P. Wang, P. Chen, Y. Yuan, D. Liu, Z. Huang, X. Hou, and G. Cottrell. Understanding convolution for semantic segmentation.
arXiv:1702.08502, 2017.

下面简单的说一蛤,
原本一个block内的卷积层,e.g. 三层,都是一个rate,这里将其分别变为不同的rates,比如将 2×(1,1,1) 变为 2×(1,2,1)

2. 加长版

这里写图片描述

这里在原有基础上增加了几个block,增加的效果:

这里写图片描述

加入Multi-Grid的效果

这里写图片描述

3. 增强版ASPP

这里写图片描述

这里和原来的区别在于增加了一个 gloable average pooling,然后所有的concat 并学一个conv
效果如下:
这里写图片描述

4. 其他

BN层是先使用output stride=16训练后锁定的
coco预训练,Multiscale inputs,filp都起到了不错的效果,训练时采用了增加困难样本的策略

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值