还是来自Chunhua Shen组的文章 代码:https://github.com/guosheng/refinenet/
文章:https://arxiv.org/pdf/1611.06612.pdf
一句话总结
作者认为Deconv 不能很好的还原下采样带来的损失,Atrous conv计算量太大而且显存占用多,于是就提出了使用不同size的feature map来融合得到最终high-resolution的feature map的RefineNet。
作者令人发指的刷了7个库
1 RefineNet 结构
首先是多种尺度的feature maps输入,经过两个RCU,RCU的结构如上图,之后各自通过3x3的卷积及上采样求sum,然后跟一个chained residual pooling,这里的chained residual pooling中每个pooling之后都会跟一个卷积,而且保持residual connection,在整个pooling之前先经过一个relu层,作者认为relu可以有利于之后的maxpooling而且对于学习率更加不敏感,网络的最后又经过了一个rcu。
2 multi-path refinement
如上图,多输入即ResNet的多种size的feature的输入,采用级联的形式,下面是三种变种:
3 experiments
作者并没有详细的各部分的ablation结果,试验设置及实施情况,想要了解更多需要看其代码了。